Мы используем файлы cookie и сервисы аналитики. Ознакомьтесь с нашей Политикой сбора данных и выберите, какие типы cookie вы разрешаете:
cookie_policy_accepted — хранит ваш выбор cookiePHPSESSID — сессияkey3 — запоминание входа_ix — единая сессия входа на ixbt.comadminuserskey — вход администратораtopic_add_autosave — автосохранение черновикаls_photoset_target_tmp — временные данные загрузки фотоgeo_country — определяет ваш регион_ga, _ga_*, _ym_uid, _ym_d, _ym_* — статистика посещений__gads, __gpi — таргетирование объявленийВы всегда можете изменить свои предпочтения в настройках.
Потребности наши вызваны эволюцией, создавшей биохимически автоматы, обладающие гомеостазом. Но давайте посмотрим на это со стороны мозга на информационном уровне, где и происходит сохранение знаний. Что такое потребности? Отдельные органы и сами нейроны генерируют какие-то вещества, которые через кровь или ещё как-то, оказывают влияние на нейроны, не только сенсорные, насколько помню. Но мозгу по большому счёту всё равно, что там снаружи — потребности или впрыснули гормоны, или электродами тыкают. Он получает сигнал от «машины для выживания» (по Докинзу), частью которой и сам является. Просто сигнал. Такой же сигнал можно подсовывать и искусственной нейросети. Да, у неё совершенно другой механизм, она крайне поверхностно обучается в процессе, она по-другому обучалась, сразу нагребая все знания. Но вместо потребностей ей можно поставить любую цель, возможно, с помощью другой нейросети контролировать её исполнение. Аналог внутреннего критика. До AGI ещё пока далеко, но вот прямо принципиальных ограничений и отличий от человека я не вижу и уж эмоции и чувства тут по-моему явно не отличительный фактор. Эмоций нейросеть может нагенерировать столько, что ни одна блониднка не повторит.
Механизма планирования действительно нет и всякие AutoGPT пока довольно убого пытаются его имитировать. Тут, думаю, нужен внутренний критик, также копия внешнего мира внутри и рефлексия с прогнозированием ситуации согласно контекста.
«Конечно, Кнут! Вот шутка для тебя:
Знаешь, что случится, если скрестить шприц с теплопроводящей пастой и увеличительное стекло? Получишь настоящего детектива среди компьютерных компонентов, потому что он сможет разглядеть все горячие точки и охладить их!»
Это даже смешно.
Юмор, может и не супермощный, но он явно присутствует и я вот не нашёл ничего в интернете похожего. И она сначала выдавала шутки про программистов, видимо, сопоставив с известным автором книг, потом переключилась на холодные места по ассоциации имени с Норвегией.
====
— Придумай шутку для Кнута Юхансона, который сомневается, что ты умеешь шутить, не используя готовый набор шуток.
— Кнут Юхансон, знаешь, почему норвежский компьютерный программист всегда берет с собой арбуз, когда идет на работу? Потому что он хочет быть уверен, что его работа всегда будет плодотворной!
— давай ещё одну, эта не очень смешная
— Конечно, Кнут Юхансон! Знаешь, почему у компьютерных программистов всегда сбитые пальцы? Потому что они постоянно сталкиваются с ошибками на пути к успеху!
====
Нейросеть это далеко не просто статистика, послушайте что разработчик из OpenAI, Илья Суцкевер рассказывает. Готовые данные используются только на нижних уровнях, далее информация а каждом слое нейросети всё больше абстрагируется, обобщается, сопоставляется, что позволяет генерировать совершенно уникальные вещи.
То есть вы отказываете слепоглухонемым в разуме, в понимании? Таких людей не так уж и мало, они не тупые, их обучают и они через письмо и тактильную связь проявляют себя вполне разумными. Почему вдруг наличие каких-то сенсорных каналов сразу должно добавлять разума? Ну, и мы видим, что у нейросетей такие каналы появляются. Мультимодальные модели работают уже с картинками и текстами, генерируют видео, аудио. Вопрос времени, когда все эти каналы объединятся в полноценное восприятие реальности. Они выделяют в картинке сначала небольшие типичные фрагменты, из них собирают более крупные и создают эмбеддинги — вектора в многомерных смысловых пространствах, через которые могут проводить ассоциации с другими понятиями. Точно так же работает сетчатка, уже на которой производится выделение фрагментов изображения и потом информация передаётся в мозг, где обрабатывается и выделяются объекты более высокого уровня, вплоть до абстракций. Вообще не вижу разницы.
Генеративные языковые модели вроде бы выполняют тупую математическую задачу, основанную на статистике — генерируют следующий токен на основании контекста. Но теперь подумайте, чем занимается человек и любое живое существо. На основании контекста (сигналы от сенсорных нейронов, с учётом гормонального состояния и текущего состояния нейросети, происходит определённая активность мозга, воспринимаемая нами как мысли, и генерируются команды моторным нейронам, а также биохимическим генераторам/выспобождателям гормонов. Всё, больше человек ничего не делает. Так чем он так принципиально отличается от искусственной нейросети?
И ещё по поводу терминов “понимание», «представление». Это крайне субъективные понятия. Никто не может зафиксировать понимания непосредственно, только по косвенным признакам. Так что это можно и не обсуждать. По-моему понимание это удачная привязка некоего нового для нейросети явления к уже существующим в ней, вплетение его в цепь ассоциаций через аналогии и связь с визуальными образами, с идеомоторными ощущениями, к примеру, которые у языковых моделей, на удивление, тоже есть.
Вот казалось бы, как может языковая модель «понимать» как выглядит человек? Ей никто его не скармливал. Но посмотрите отчёт специалиста Майкрософт, где он показывает как нейросеть ему нарисовала единорога, потом меняла его, понимая, где у него голова, к примеру. Я провёл похожую проверку, попросил её нарисовать мне Майкла Джексона и она нарисовала схематически, символами человека, но в широкополой шляпе (федоре). То есть на основании множества текстов, она сформировала некое представление о геометрии объекта, это всё в её эмбеддингах хранится, думаю, в тех же зонах многомерного смыслового пространства, где у человека хранится визуальный образ.
Думаю, следующий прорыв будет именно через мультимодальные сети. Ведь сколько информации можно извлечь даже из одной картинки о структуре, физических свойствах объектов, форме, цвете, взаимодействии. Если добавить к этому анализ видео, можно запросто вывести закон гравитации, например. Вообще было бы интересно сделать нейросеть, не использующую знания человечества, а формирующую все свои знания из видео и тактильного взаимодействия, а язык можно использовать только для общения с ней. И дать ей математический язык. Что она смогла бы тогда вывести?
Насчёт намерений, да, никто не закладывает целевую функцию захватывать человечество и смарт пылесосы вроде вообще неспособны на такое. Но это только простые пылесосы. Допустим, в автономную нейросеть внутри какого-то навороченного робота, находящегося в режиме постоянного обучения заложен просто инстинкт самосохранения, чтобы не прыгал со скалы. В сложной сети мы даже не можем сказать, какие там выстроятся взаимосвязи, но у него где-то явно будет образ человечества, которое способно его выключить, уничтожить, и это явно не согласовывается с заложенным в нём инстинктом. Понятно, что будет множество ограничений, но они могут дать сбой или он сам может «захотеть» их отключить. Конечно, это просто детерменированная программа с большим объёмом данных, выполняющая определённые действия при внешних сигналах. Ну, а человек что, не то же самое? Биологи пока ничего не нашли особого, отличающего от «неживой природы». ДНК это просто молекула, которую можно и химическим образом создавать из компонентов. Поэтому вполне может оказаться, что наше сознанием это просто побочный эффект эволюции и оно неизбежно для сложных систем, а нейронные сети как раз и становятся такими сложными системами, пусть и без биологической основы. Кстати, большая часть нашего мозга отвечает за координацию, управление мышцами, далеко не всё нужно для сознания.
Вот ещё наткнулся на исследования по воссозданию поведения нейрона «Нейросеть обучили имитировать биологический нейрон». Пишут, что на 99% его поведение воспроизводится сетью из 5-8 слоёв. Из этого уже можно оценить насколько близки нейросети к мозгу по сложности.
Теперь про «собаку». Согласен, что каждое понятие это слепок ассоциаций и у человека они будут в виде чувственных, зрительных, слуховых образов и множества переплетений с другими образами. Но ИИ изучает тексты, много текстов, там не просто скармливаются байтики и хранятся в виде байтиков. Там как раз и строятся взаимосвязи. Есть механизм внимания, например, который и продвинул текстовые беседы, системы перевода на новый уровень. Я не скажу, что хорошо его понимаю, но там как раз с каждым понятием связывается вектор ассоциаций. Поскольку сеть многоуровневая, из этих ассоциаций ИИ строит более глобальные ассоциации, формирует свои понятия, логические взаимосвязи, причинно-следственные связи, понятие времени. В итоге проявляется понимание этих вещей. Поглядите ответы системы Palm, в которой 500 млрд. параметров. Она даже шутки понимает и объясняет, логически рассуждает. По поводу визуальных образов, так ИИ их вовсю распознают же, отличают давно собак от кошек. Своей истории, как и памяти происходящего с телом, да, у них нет. Но если заложено запоминать все диалоги, то есть продолжать обучаться, то я не вижу принципиальных прямо отличий от нейросети человека.