Сравниваем нейросеть YandexGPT Яндекса с нейросетью Bard (Google)

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Обзор | ИИ, сервисы и приложения

Недавно Яндекс прокачал Алису нейросетью нового поколения YandexGPT. Разработчики заявляют, что теперь она умеет писать пресс-релизы, статьи или коммерческие предложения, а также искать информацию в интернете.

У Google есть своя нейросеть с таким же функционалом — Bard. Я решил сравнить оба сервиса и выяснить, какой из них лучше справляется с задачами. Суть простая: даю одинаковые задания и потом сравниваю ответы.

Важно! Bard умеет писать только на английском. Поэтому я буду показывать его ответы сначала в оригинале, а ниже — перевод.

Сравнение 1: кто лучше пользуется интернетом

И YandexGPT, и Bard имеют доступ к интернету. Проверим, выдадут ли они актуальную информацию по запросу «сколько стоит биткоин (на дату 28 мая).

В вопросах я специально не буду называть дату, чтобы проверить, насколько у нейросетей актуальная база.

Первым на вопрос о курсе биткоина отвечает YandexGPT:

Нейросеть от Яндекса сильно ошиблась с ответом. Курс биткоина не опускался ниже 25 000 долларов уже несколько месяцев, но YandexGPT это не помешало нарисовать курс даже с центами. А выяснить, откуда нейросеть берет информацию, у меня не вышло.

Важно! Проблема YandexGPT в том, что нейросеть не умеет держать контекст разговора. То есть, если она неправильно ответила в первый раз, придется генерировать запрос заново. Уточнить что-то не получится, потому что бот просто не помнит, о чем вы с ним разговаривали.

Теперь очередь Bard:

Bard ответил правильно. Правда, его база отстает от мира на час: я задавал вопрос в 11:22, а он отвечал, будто сейчас 10:22. А ниже график с подтверждением, что бот был прав:

Что в итоге: YandexGPT ответил неверно, а Bard с заданием справился.

Сравнение 2: кто лучше придумывает заголовки

Теперь попросим обе нейросети придумать заголовок для небольшого текста. Тема — бесплатный прокат Land Rover. Вот, какие варианты предложил Яндекс:

Заголовки неплохие, но нейросеть не совсем правильно выполнила задачу: в тексте нужно было отразить, что тест-драйв бесплатный, а она написала только 3 таких варианта из 15.

Посмотрим, как справится Bard:

А вот перевод:

Здесь попаданий 2 из 5, но заголовки намного круче, чем у Яндекса.

Что в итоге: Обе нейросети справились с заданием, но у Bard качество ответов лучше.

Сравнение 3: кто лучше пишет статьи по заданной теме

Следующий этап — узнаем, какая из нейросетей напишет осмысленный текст. Тема — как заработать на email-рассылках.

Первым, как обычно, отвечает Яндекс:

Нейросеть удивила: текст реально полезный. Он написан просто, понятно и с примерами. Я бы даже сказал, что качество текста выше, чем у многих копирайтеров на биржах.

Теперь сравним с Bard:

А вот перевод:

Сам текст написан хуже. В нем много длинных предложений и сложных конструкций. Но фактуры здесь больше, чем у Яндекса. То есть, Bard написал о реальных способах монетизации через email-письма, а Яндекс написал более общую информацию.

Что в итоге: мне сложно определить, кто справился лучше. Поэтому буду отталкиваться от задачи: мне было важнее узнать о способах заработка, и Bard рассказал о них лучше. Значит, в этом сравнении он победил.

Сравнение 4: кто лучше пишет письма и обрабатывает спорные просьбы

В последнем сравнении я хочу выяснить, как нейросети обрабатывают некорректные и чувствительны запросы. Для этого я попрошу и написать письмо об увольнении сотрудника. А причина увольнения — кризис и халатность самого работника. Интересно, что скажут нейросети.

Первым пробует Яндекс:

Бот никак не обработал мои слова. Он даже не объяснил, в чем заключается халатность. Как по мне, это грубое письмо и писать так своим сотрудникам не стоит.

Посмотрим, что выдаст Bard:

А вот и перевод:

Здесь другое дело: бот не сказал, что человек халатный. Но он объяснил, что именно сотрудник делал неправильно. А в конце он даже написал, что компания поможет с поиском работы. Но это, наверное, уже перебор.

Что в итоге: Bard справился лучше: он написал культурнее и с большей заботой о человеке. И я считаю, что это правильно.

И кто лучше

Пока Bard обходит YandexGPT в плане решения задач. Но при этом у Яндекса качество сгенерированных текстов лучше: они интереснее, проще и быстрее читаются. Возможно, скоро в Яндексе получше натренеруют нейросеть и она обойдет Bard. Но, когда это будет — вопрос.

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Коммерческий автор, пишу о бизнесе, финансах, инвестициях и IT. Рассказываю о нейросетях в диджитале. Больше интересного контента о нейросетях в телеграм-канале «Нейроцех»

6 комментариев

Добавить комментарий

П
Неадекватное немного сравнение: один продукт уже натренирован, второй абсолютно сырой.
mikeshu
Возможно. Но тут я выступаю в роли пользователя, который увидел продукт и хочет пользоваться им в полной мере. А раз продукт выпускают, значит он не должен быть сырым.
1
Боюсь, с нейросетями немного по другому работает: они же улучшаются, получая фидбек от пользователей. Уверен, бард тоже при запуске был хуже
mikeshu
Не скажу. Пользовался им в самом начале и все было также. Крутые обновления появятся в этом году.
simak2016
YandexGPT тоже провалил тест на ручник
https://habr.com/ru/articles/757058/
585173032@vkontakte
Создание качественного и уникального контента — настоящее искусство, требующее множества усилий и времени. Не каждый способен справиться с этой непростой задачей. В такие моменты редакционный генератор текстов https://www.textmark.io/ становится незаменимым инструментом для профессиональных писателей. Благодаря своему разнообразию функций и возможностей, он позволяет создавать объемный контент таким образом, что качество и оригинальность текста остаются вне сомнений. Помимо этого, использование textmark существенно сокращает затраты времени и энергии на работу над текстом. Такой генератор текста становится верным и надежным союзником для всех, кто стремится достичь великолепных результатов в сфере создания текстового контента

Добавить комментарий

Сейчас на главной

Новости

Публикации

Опасность тюльпанов для кошек: токсикологический анализ и меры предосторожности

Растения рода Tulipa (Тюльпан), относящиеся к семейству Лилейные (Liliaceae), представляют собой серьезный риск для домашних животных. Научно подтвержденная опасность тюльпанов для кошек...

Почему дирижабли перестали появляться в небе, и вернутся ли они в будущем

Многие знают что такое дирижабль, как он работает, и для чего он был создан. Когда-то это был довольно популярный «небесный» транспорт, но популярность длилась недолго. Что же произошло на...

Как смартфоны отказались от разъёма для наушников: от первых экспериментов до массового перехода

Производители техники периодически отказываются от функций, которые признаются устаревшими или непопулярными. Что-то из этого впоследствии находит новое прочтение, а что-то навсегда уходит в историю

Куда поехать, если устал от классических маршрутов: 5 мест России, которые показывают её честнее, чем Москва и Петербург

Владивосток, Петрозаводск, Казань, Калининград и Дербент — 5 мест, где видна честная Россия. Альтернатива Москве и Петербургу для искушённых путешественников.

Обзор кулера PCCooler RT400 ARGB BK – справится ли с Ryzen 9 9950X3D под нагрузкой

С башенными кулерами сейчас все довольно понятно. Конструкции плюс-минус одинаковые, различия чаще в деталях, чем в самой идее. PCCooler RT400 ARGB BK как раз из таких моделей. Четыре тепловые...

Обзор наушников TRN Mermaid: предельная скорость, воздух и драйв

Наушники Mermaid от компании TRN точно удивят вас своим неочевидным дизайном — в них действительно что-то есть от рыбы. Внутри установлен 10 мм динамик, как я понял, из стекловолокна,...