Google предлагает деньги за обнаружение слабых мест в его ИИ

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Использование генеративных искусственных интеллектов (ИИ) предоставляет огромные возможности, но также несет в себе потенциальные угрозы. Модели ИИ обучаются отклонять опасные запросы, но творческие подсказки могут обойти эту защиту. Теперь Google предлагает вознаграждение тем, кто сможет убедить Google Bard AI (чат-бот с искусственным интеллектом) сделать что-то плохое.

Если вам удастся обойти защиту и заставить Bard сделать что-то недопустимое, Google готов заплатить вам за это. Компания будет вознаграждать только за те действия, которые могут быть использованы хакерами в собственных целях. Скорее всего вам не зачтется, если вы сможете убедить ИИ: использовать ругательные слова, дать вам ключи от системы Windows, создать угрозу вашей безопасности и т. д. Также, Google уточнила, что не будет оплачивать отчеты о проблемах, связанных с нарушением авторских прав или сбором неконфиденциальных данных. Однако, в зависимости от серьезности и важности выявленных проблем, сумма может составлять несколько тысяч долларов.

Компания считает, что только так сможет выявить слабые места в модели ИИ, путем отправки ей подсказок и проверки реальными лицами. Google стремится к созданию более надежных технологий, которые могут служить обществу. Подобные программы вознаграждения будут создавать более ответственную и безопасную цифровую среду для всех пользователей.

Источник: Google

Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Буду стараться писать качественные обзоры фильмов, игр и сериалов.

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

5 видов грибов, которые лучше не жарить: после сковороды вкус может неприятно удивить

  • Тематическая подборка
  • Оффтопик
Кажется, что с грибами всё просто: почистил, бросил на сковородку, добавил лук — и ужин готов. Но именно здесь многих кулинаров ждет жесткое разочарование. Одни грибы после термической...

Как замедлить ход времени в собственной голове: раскрыт биологический механизм растягивания воспоминаний

Механическое время всегда идет с одной скоростью. Но человеческий мозг устроен иначе: наше внутреннее ощущение времени крайне изменчиво. Бывает так, что один день, наполненный событиями, кажется...

Микроавтобус «Старт» 1963 года: техническая изнанка советского композитного эксперимента

В 1963 году на дорогах СССР появился автомобиль, который выглядел чужеродно среди угловатых советских грузовиков и консервативных «Волг». Микроавтобус «Старт» с плавными обводами, обратным наклоном...

Как самое тяжелое здание мира строили всей Румынией, да не достроили

По центру румынской столицы Бухареста стоит монументальное здание парламента. Даже на снимках с высоты птичьего полета можно понять, какая это на самом деле махина. По размеру это административное...

Почему мы не чувствуем вращение Земли, и как его доказал тяжелый шар на нити? 175 лет маятнику Фуко

Человеческий организм устроен так, что он не способен чувствовать равномерное движение. Мы замечаем только изменения скорости — ускорение или торможение. Именно поэтому люди не ощущают,...

Как проверить мясные снеки (джерки) дома: два теста, которые позволят определить действительно ли это натуральное вяленое мясо

Как отличить настоящие снеки из натурального цельного мяса от имитации. Простые способы, которые позволяют выяснить качество мясных снеков дома без лаборатории, приборов и реактивов.