Искусственный интеллект – всего лишь иллюзия? Исследование Apple ставит под сомнение способности искусственного интеллекта

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Мнение | Наука и космос

В последние годы стремительное развитие больших языковых моделей (LLM), таких как нашумевший ChatGPT, вызывает неподдельный интерес и восхищение. Их способность связно и грамматически корректно поддерживать диалог, переводить языки и даже писать программный код поражает воображение. В этой связи закономерно возникает вопрос: не являются ли LLM проявлением настоящего искусственного интеллекта, способного мыслить на уровне человека?

Исследователи из компании Apple решили подвергнуть эту гипотезу тщательной проверке, обратившись к фундаментальному атрибуту человеческого разума — способности к логическому мышлению. В своей работе, опубликованной на платформе препринтов arXiv, они представляют результаты исследования, которые ставят под сомнение «интеллектуальность» современных LLM, демонстрируя их уязвимость к простым, на первый взгляд, логическим ловушкам.

Иллюзия интеллекта, иллюстрация
Автор: ИИ Copilot Designer//DALL·E 3 Источник: www.bing.com

В основе исследования лежит предположение о том, что разумное существо обладает способностью дифференцировать информацию, отделяя существенное от второстепенного и концентрируясь на релевантных данных. Эта способность иллюстрируется классическим примером: ребенок спрашивает, сколько яблок в сумке, упоминая, что некоторые из них слишком малы. И ребенок, и взрослый понимают, что размер яблок не влияет на их количество — это элементарное логическое умозаключение, доступное любому человеку.

Исследователи из Apple поставили перед LLM аналогичную задачу. Они задавали им вопросы, которые уже использовались для оценки их способностей, но с добавлением нерелевантной информации, так называемого «информационного шума». Результаты оказались неожиданными: даже небольшое количество лишней информации способно сбить LLM с толку, приводя к неверным или даже абсурдным ответам на вопросы, на которые они ранее отвечали правильно.

Выводы, сделанные исследователями, наводят на мысль о том, что LLM, возможно, не «понимают» смысл задаваемых им вопросов в полной мере. Вместо этого они, вероятно, оперируют на уровне распознавания структуры предложения и генерируют ответ, основываясь на своем «обучении» на огромных массивах текстовых данных, не проводя глубокого семантического анализа.

Более того, исследователи отмечают, что LLM часто генерируют ответы, которые на первый взгляд кажутся правильными и убедительными, но при более внимательном рассмотрении оказываются ошибочными, нелогичными или даже бессмысленными. Например, на вопрос о своих «чувствах» LLM могут дать ответ, который создает иллюзию их эмоциональной осознанности, хотя на самом деле они лишены способности испытывать эмоции.

Иллюзия интеллекта, иллюстрация
Автор: ИИ Copilot Designer//DALL·E 3 Источник: www.bing.com

Работа исследователей Apple призывает нас к более осторожному и критическому осмыслению возможностей современного искусственного интеллекта. Возможно, мы склонны преувеличивать интеллектуальные способности LLM, приписывая им человекоподобные качества мышления и понимания, в то время как их «разум» все еще далек от настоящего понимания и логического мышления, свойственного человеку.

Это исследование представляет собой важный шаг на пути к созданию действительно интеллектуальных машин. Оно подчеркивает необходимость разработки новых подходов к обучению LLM, которые позволят им не только имитировать человеческий язык, но и осмысливать его содержание, строить логические цепочки и делать обоснованные выводы.

63 комментария

Добавить комментарий

Zebr_X
Я бы сказал проще, популяризаторы ИИ — путают (нарочно) теплое с мягким, нейросеть не равна интеллекту. То есть в теории, достаточно большой сетью можно эмулировать хоть мозг мухи, хоть человеческий. Вопрос в том, какой объём этой самой сети нужен для возможного формирования там интеллекта и скорости его работы. Примерно как сильно ограниченный в возможностях «автопилот», принимают за полноценную систему управления. Но нет, пока система не выдерживает отхода за рамки стандартной ситуации.
S
LLM были созданы менее двух лет назад как идея :))
Это только начало, так сказать…
Zebr_X
Ну, про термояд в энергетике тоже всё говорят «Вот, вот!». :)
Вопрос в том, что относительно дешевая планка по производительности вычислений на ватт уже достигнута. Дальше либо дорого, либо очень дорого. Как скоро появится шанс на то, что корпорации будут выбирать не максимум прибыли, а максимум прогресса, да ещё не вставляя друг другу палки в колёса? Когда патенты будут не закапываться, а помогать продвигать идеи?
S
Исследователи незнакомы с научным методом — ибо это черри-пикинг прямо во весь рост.


>>который создает иллюзию их эмоциональной осознанности, хотя на самом деле они лишены способности испытывать эмоции


А это вообще прекрасно :))
Я вот уверен в совершенно обратном — люди на самом деле лишены способности испытывать эмоции и только искусственно создают (тренируют) их иллюзию, тогда как LLM — совершенно наоборот :D
Я тоже умею делать тупорылые безосновательные утверждения ;)
Наверное, я — учёный!
s
Даже учёные могут ошибаться, если ты учёный то ты ошибается в своих утверждениях) уверенно говорить и подавать недоставерную информацию это лишь психологический приём, ему можно научить и машину и любого человека.
S
Ошибаться — это сделать всё согласно научному методу, но ошибиться технически.
Например, в расчете доверительного интервала не учесть влияние на ошибку какого-то фактора.
При построении модели не учесть влияние X на Y.
Высосать из пальца или полового органа какие-то буквы — это не ошибка ;)
Это так задумано, но к науке отношения не имеет.


Но там внизу гражданин полностью раскрыл метод подготовки этой «работы»:
>>кибернетики высокого уровня это и так знали
JM7
Можно разочарую? Вы не учёный))
Просто вы судите об исследовании по журналистской статье. И не знаете, что даже у учёных есть исследования разного уровня строгости и доказательности. Для начала того, что сделано — достаточно. Тем более, что кибернетики высокого уровня это и так знали.
S
Прямо показательный комментарий.


Ты и авторы тупорылой «научной» статьи — одной крови.


У учёных есть научный метод, у «учёных» — «есть исследования разного уровня строгости и доказательности», читай — херота.


>>это и так знали


А вот мы и открыли основы метода этих дебилов! ;)
S
Исключать нельзя :)
В моей практике эппл довольно адекватные ребята, но иногда их заносит в совершенно удивительные … места, скажем так.
H
Нет, вы исследователь!)
S
Это другое (tm) :D
Исследователи могут быть учёными, а могут и не быть — у нас свободная страна!!!
k
С тем же успехом можно ставить под сомнение наличие интеллекта у сотрудников макдачечной))
Или у сотрудников магнита что открыт теперь по 14 часов… то биш народ джобает все 15! за 30к...
Пока оно выполняет поставленные задачи какая разница какие там процессы под капотом условной черепушки идут?
S
Что значит можно?
Там он не ночевал, чисто базовые реакции, какой интеллект :D
HET
Интеллект — это и есть развитие реакций на внешние раздражители.
Просто у нервной системы было пару миллиардов лет, чтобы развиваться и разнообразные отборы, которые лажу ненужную отсекали, а полезное закрепляли.
Вот если бы нейросети электричество получали не по прихоти инвесторов, а за дело, то шансы бы были. А так…
S
>> Интеллект — это и есть развитие реакций на внешние раздражители
Да ты шооо!!!
И как вам там, с чевряками в одной банке не тесно?
HET
Ну конечно, у нас с червяками все шло естественным путем. А Вас сверху одарили сразу интеллектом. Аплодирую… стоя!
S
>>Интеллект — это и есть развитие реакций на внешние раздражители


Сделаем кратенький разбор.
У червей есть реакция на внешние раздражители?
Есть.
Развитие у червей есть?
Есть.
Вот он, оказывается, какой, интеллект согласно вышеприведенному определению.
Бинго.
HET
У пургаториусов тоже мозг был, правда похуже, чем у современной кошки. Внешние раздражители менялись и получились человеки. Но не все, особо одаренным боженька раздал...
Условия ведь не меняются и развиваться они не могут. Все как в ИИ)
S
Так вопросы по твоему определению есть?
Черви обладают интеллектом или ты облажался?
HET
Я облажался?) Интеллект боженька раздал?)
HET
Рефлексы у людей никуда не делись. Вы выдыхаете совсем не задумываясь о том, зачем это делаете. Икаете и даже не понимаете, что это Ваш организм так жабры чистит.
Это никак не отменяет наличие у животных и инстиктов, и экспрессивного поведения. Источник у этого один. Это просто развитие того, что появилось еще у гребневиков и губок. Интеллект обособленно от нервной системы с небес не спустился.
Что нет?
M
У ИИ нет субъектности, во-первых, т. е. сознания. А раз нет сознания, то нет интеллекта. Алгоритм, даже очень сложный, не есть интеллект. Это всего лишь очень сложные счёты.
И кагбэ да, это не открытие, «интеллект» генеративных моделей сильно смещён от, собственно, алгоритма к обобщению статистики. А статистика набирается из Интернета, который на 99% состоит из тупости и ложных стереотипов. Отсюда и…
H
Вот не надо тут субъективность с сознанием смешивать, у субъективности есть определение, а у сознания по факту нет, к тому же у ии по определению не может быть субъективности ведь по определению это свойство человека )
V
Опомнились. У нас об этом давным давно говорят
https://youtu.be/L-eXgIfvW1o?si=B6gPbxyO-htW1e8J
JM7
Ну, собственно, это уже много десятилетий было известно, задолго до появления больших языковых моделей, но только узкому кругу специалистов. А пипл вместе с инвесторами верит сказкам про ИИ.
HET
Я экспертные системы на Прологе писал ещё в 90-х. Не такой уж это и узкий круг.
S
Пролог основан на булевой логике с элементами дискриминантного анализа, а нейросети — булеву логику не используют, «это другое».


В целом, сейчас человечество открыло 3 вида вычислительных систем:
на булевой логике
нейросетевые
квантовые
Первые уже плотно вошли в нашу жизнь, остальное 2 только появились (хотя теория нейросетей появилась лет 100 назад, сами вычислители — 60 лет назад, но вот error backpropagation для обучения только недавно придуман, без него нормально никак).
HET
Ну-ну. Так же задают правила, а потом гоняют их на данных. Просто правила стали посложнее.
S
В нейросетях нет «правил».
Вообще и никаких.


Чем мне нравятся нейросети — это тем, что они 100% копируют людей (а как могло быть иначе? так задумано) и тоже умеют нести полную ересь с совершенно серьезным видом и нисколько не интересуясь настоящим положением вещей.
HET
Ну да, ну да) Там все случайно и это не ересь)
S
Там всё ровно также, как в мозгу.
Сумматоры, умножаторы и компараторы.


Можно запилить самообучающуюся систему, но сейчас процесс обучения, по крайней мере публичных сетей, строго ограничен и потом цифирьки параметров сеть менять уже не может.
Ибо учить дорого, а люди могут плохому научить ;)
HET
Какие сумматоры и умножаторы? Там нет правил. Ну вот и ересь подъехала…
S
>> Какие сумматоры и умножаторы? Там нет правил.


Ты пьян?
HET
Я тут причем, вы несли бред, что правил нет, а потом начали про формализацию.
S
Формализацию сложения?!!!
[ржот как конь]
Оказывается, вот оно что, Михалыч!
Сложение, это у нас теперь алгоритм!!!


Но да, для многих и жопу вытереть — подвиг.
Что поделать.
HET
Ну ясно, сумматоры и умножаторы по приколу. А Вы — потешный)
S
Ну, да, не всем дано узнать, что суммирование, это не алгоритм, а операция, как и зад вытереть.
Это нормально.
HET
Я не виноват, чтп Вам не дано. Зад не вытираете, поэтому?
b
Отчего же, вполне себе существует алгоритм сложения чисел, столбиком, и его каждый изучал в школе ;)
Да и внутри компьютера побитное сложение идёт по разрядам, с движением бита переноса влево, и это тоже вполне себе алгоритм.
S
Это уже реализация ;)
b
Ну да, реализация алгоритма сложения.
S
Операции, она операция, определенная для множества натуральных чисел.
А реализация — это уже про другое.
b
Не зарывайте себя глубже, наберите в поисковике «алгоритм сложения» и удивитесь, как много страниц ссылается на «несуществущее» ;)
S
Специально для тех, у кого бан в гугле:
https://ru.m.wikipedia.org/wiki/Сложение


Ну и остальным читателям треда для выпуклости идиотизма ::D
b
Ну, и что здесь не так? Суммирование и сложение существуют. Алгоритм сложения тоже существует. Вы с чем именно спорите-то? :)
s
Это итак было ясно, нейронные сети это лишь алгоритм вычисления для выдачи результата, который только имитирует мышление человека, он в сотни раз прожорливее и медленнее обычных алгоритмов на патернах. Никакого самосознания или мышления нет. Его даже ии некорректно называть, потому что это не ии.
Pavel_Priluckiy
Нейронные сети это не ИИ, а обычный калькулятор. До ограниченного ИИ ещё пара десятилетий.
s
От создателей «до термояда вот вот уже лет 25 осталось? И так каждые 25 лет повторяют?
Тут ещё есть важный вопрос, а зачем нам ИИ? Вот для чего? Чтобы думал за нас? Я понимаю когда человек перекладывает на роботов там всякие бытовые моменты, производство, но мышление? Чтобы что? Не думать? При таком раскладе через несколько поколений это будет уже не человек разумный, а человек дурак, способный лишь на потребление
У программ изначально была цель, решить ту или иную задачу, нахрена нам ИИ который будет ставить уже перед нами задачи? Такой вот полноценный, по классике нф, на кой он сдался? А главное, мы ему зачем)
Pavel_Priluckiy
Чтобы притворялся осознанной милфой в Skyrim.
https://rutube.ru/video/940cdf18ca4521d61238f2268cb4219e/?&utm_source=embed&utm_medium=referral&utm_campaign=logo&utm_content=940cdf18ca4521d61238f2268cb4219e&utm_term=ixbt.com%2F&referrer=appmetrica_tracking_id%3D1037600761300671389%26ym_tracking_id%3D10540087461457760839
K
А откуда в LLM взяться семантическому анализу, когда их тренируют на массивах бессмысленного текста? Это всё равно, что человеку предоставить бинарный код, оставив на его совести поиск закономерностей.
В любом случае, сейчас и алгоритмы обучения, и алгоритмы работы ИИ далеки от совершенства.
S
>>откуда в LLM взяться семантическому анализу
Интегральное сво-во человеческого мозга и как следствие, нейросетки, прикинь? :))
Называется дискриминантный анализ и кластерный анализ
https://ru.m.wikipedia.org/wiki/Дискриминантный_анализ
Просвещайся.
Собственно, из этого и следуют все достоинства и недостатки, как мозгов, так и нейросетей.
K
Молодец какой, с таким пафосом сумничал. А сам-то эту статью читал? Или можешь хотя бы отличить семантический анализ от статистического, о котором в ней говорится?
На всякий случай напомню, что для последнего не нужен ни разум, как таковой, ни даже интеллект. Для оперирования с корреляциями и вероятностями достаточно всего лишь нейронных весов.
S
Дык.
Именно.
А с привязкой к языку — будет семантический анализ ;)
Языки то разные, но не всем это очевидно, некоторые то не знают про существование других языков.
При этом наблюдаемый мир — удивительно, от языка не зависит.
K
И вот опять. Семантика подразумевает понимание значения слов, их смысла, чем не располагают современные ИИ. Орфография, синтаксис – что угодно, кроме семантики.
S
Семантика всего-лишь подразумевает … дискриминантный анализ.
Потому что это оно и есть — наложенное на язык.
«смысл» — это привязка «слов» (условно, там чутка сложнее) к реальному миру.
K
Твои слова противоречат информации из тобой же предоставленной статьи, это во-первых.
Во-вторых, чат-боты не имеют связи с реальным миром, не имеют нормальной организации памяти, не имеют достаточных вычислительных мощностей… Продолжать можно ещё долго.
S
>> не имеют нормальной организации памяти


Да ладно, это какой они не имеют?
Долговременной?
Кратковременной?
Памяти контекста конкретного разговора?
:D
А то уже больше года есть все три у всех…


С мощностями тоже всё прекрасно, не с убогим же человеческим мозгом ты это сравнил, надеюсь?
Который цифровой до кончика хвоста со своими 2мя состояниями нейрона…


С реальным миром связь все системы тоже имеют ;)
Такую же, как и люди — через телевизор.
Ты вот живьём окапи видел?
А тасманийского дьявола?
А коати?
А небось знаешь, что это, удивительно, да?
(знаешь ты кстати, о них, благодаря встроенному в твой мозг дискриминантному анализу, который автоматом всё классифицирует, а когда видишь что-то новое, то благодаря встроенному в твой мозг кластерному анализу, который разлагает всё на факторы и классифицирует. это интегральное сво-во нейросетей, там не надо ничего специально делать).
И смотри, обошелся как-то без прямой связи с реальным миром, чудо божье, не иначе :D


Надеюсь также, что ты до сих пор уверен, что слепые не обладают интеллектом, ведь у них связь с внешним миром в привычной форме отсутствует :D
105658563982865434353@google
Не пойму, то ли ты особо упёртый, то ли просто упоротый.
Ну тогда начнём по порядку.
Кратковременная память у нынешних ИИ оставляет желать лучшего. В зависимости от модели, они спустя определённое количество текста начинают терять контекст разговора, даже если тот ещё не превышает число токенов. Долговременная тоже пока довольно примитивна. Максимум, что сейчас разработчики могут себе позволить – это натаскать сетку на суммаризацию данных. И при этом возникают множественные ошибки и неточности при извлечении такой информации, на уровне человека со слабой памятью.
Далее, каким ты хреном приплёл сюда ФИЗИЧЕСКУЮ связь с миром и при чём здесь перечисленные животные? Я не могу понять, что ты хотел этим доказать. От себя здесь только могу добавить, что человек в сравнении с любым ИИ даже из фотографии незнакомого животного всё равно способен извлечь куда больше информации.
Но речь вообще не об этом. Речь шла про взаимосвязь слов с понятиями, которые они представляют, которые в свою очередь относятся к объектам, действиям, явлениям и т.п.
Классификация и осознанное восприятие это разные вещи.
А под конец уже никак плотину с говном прорвало...
Пусть зрение и основной способ получения информации, но живой человек располагает не только им. Про слух и осязание забыл? Так вот, а со слепо-глухими с рождения людьми всё уже куда сложнее. Если с ними не проводить очень сложное обучение, основанное на исключительно тактильном взаимодействии, то у них (сюрприз!) разум никогда не разовьётся. И даже у обученных таких людей полноценная разумность будет под вопросом ввиду крайне скудных сенсорных стимулов, всё-таки одним осязанием много информации не передашь.
Что уж тогда говорить о чат-ботах, у которых единственный стимул это алгоритм выстраивания весов и поток ничего не значащего для них текста?
Единственная надежда – на мультимодальные ИИ, но в силу того, что сама архитектура нейросетей сегодня буквально в зачаточном состоянии, а требовательность таких ИИ к вычислительным мощностям несравнимо большая, чем у чат-ботов, то сегодня остаётся только ждать светлого пост-кремниевого будущего и нейроморфных процессоров.
S
Ты даже кратковременную память и память контекста перепутал :))
Жжошь!
105658563982865434353@google
Ну давай, удиви, клоуняра, почему же у тебя кратковременная память не связана с контекстом?
S
Потому что это кратковременная память, она предназначена для временного переобучения :D
У тебя и слепые интеллектом не обладают, чё уж там про память говорить с тобой ;)
105658563982865434353@google
А ничего, что про слепых это только ты придумал? Хотя пофиг, надоело спорить с отсталым фантазёром.

Добавить комментарий

Сейчас на главной

Новости

Публикации

Гибко настраиваемые под себя TWS наушники: обзор Creative AURVANA ACE SXFI

Компания Creative давно известно как пионер компьютерного звука в средне бюджетном диапазоне. Она выпустила линейку наушников AURVANA. Недавно мы рассматривали модель MiMi, а сегодня рассмотрим, на...

Как настроить напоминания о днях рождения на Айфоне

Иногда день рождения вылетает из головы в самый неподходящий момент. Особенно обидно, когда человек ждал хотя бы пару тёплых слов, а вы вспоминаете о празднике только вечером или вообще на...

Обзор тепловизора TOOLTOP T7: Профессиональное разрешение по цене игрушки

Тепловизор — штука, которая большинству людей кажется чем-то из мира военных или промышленных инспекторов. На практике же он нужен гораздо шире: найти утечку тепла в стене,...

Обзор зарядного устройства UGREEN Nexode X759 500W: Единственный в своем роде зарядник способный выдать 48В Type-C

Рынок многопортовых зарядных устройств растёт стремительно — производители наперебой предлагают решения на 200, 300 Вт и выше. Но есть один нюанс, который часто теряется за красивыми...

Обзор аэрогриля Rawmid RMA-04: Вкусно и быстро. И это не просто слова

Всегда хочется кушать вкусно приготовленные блюда, но с минимальным количеством масла и за минимальное количество времени. В обзоре мы рассмотрим и протестируем Аэрогриль RAWMID Modern RMA-04,...