Meta* не только пересылала терабайты пиратских книг для обучения моделей искусственного интеллекта, но и сотрудники писали друг другу электронные письма об этом

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Впервые об этом сообщила Ars Technica, в деле об авторских правах против материнской компании Facebook* Meta по поводу использования ею работ авторов для обучения больших языковых моделей всплыло неловкое грязное белье. Десятки писем, якобы между сотрудниками Meta*, обсуждают торренты с огромным количеством пиратских материалов⁠ — и раздачу этих торрентов в придачу⁠ — для обучения моделей ИИ компании.

Автор: DALL. E Источник: www.bing.com

В прошлом месяце в судебных документах было раскрыто, что Meta* получила данные для обучения ИИ из LibGen, большой базы данных для обмена файлами, которая включает в себя все, от платных новостей и научных статей до целых книг. Обвинение утверждает, что Meta* скачала более 80 терабайт из LibGen и еще одной так называемой «теневой библиотеки» под названием Z-Library. Если говорить точнее, это интернет-пиратство в масштабах, которые заставили бы покраснеть юриста Nintendo, и в иске утверждается, что электронные письма, изложенные в письменном виде, «решение Meta* брать и использовать защищенные авторским правом работы без разрешения, которые, как она знала, являются пиратскими, несмотря на явные этические соображения».

В одном из электронных писем, представленных в качестве доказательства, цитируется предполагаемый сотрудник Meta*, без конца твердящий, что «использование пиратских материалов должно выходить за рамки нашего этического порога», а затем утверждающий, что базы данных, такие как LibGen, «по сути, как PirateBay или что-то в этом роде, они распространяют контент, защищенный авторским правом, и нарушают его».

Существуют неоднократные примеры электронных писем, приписываемых сотрудникам Meta*, в которых отмечается использование LibGen как проблема, либо в неудачной манере «одинокого здравомыслящего человека», либо в контексте сокрытия деятельности. Один исследователь предложил получать доступ к LibGen только через VPN, а позже пошутил, что «торренты с корпоративного ноутбука кажутся неправильными :)».

Meta* в конечном итоге работала в «скрытом режиме», как цитирует одного исследователя ИИ в компании, скрывая свою деятельность, загружая и раздавая торренты только за пределами официальных серверов Facebook*.

Обвинение также утверждает, что эти документы об обнаружении свидетельствуют о том, что руководители Meta*, включая Марка Цукерберга, знали об использовании пиратских материалов для обучения моделей ИИ в компании. Еще одна деталь, которая бросается в глаза: электронные письма, представленные в качестве доказательств, указывают на то, что сотрудники Meta* считали, что OpenAI использовала LibGen для своих собственных моделей, представляя использование компанией базы данных как своего рода гонку вооружений.

Если Архиву Интернета не разрешено выдавать книги в качестве цифровой библиотеки, то вряд ли таким компаниям, как Meta*, следует разрешать поглощать терабайты пиратских материалов для обучения чат-бота, который будет лгать о количестве планет в Солнечной системе. По иронии судьбы, международный режим авторских прав выглядит одним из самых крепких оплотов против будущего ИИ.

* — Компания Meta (социальные сети Instagram и Facebook) — признана экстремистской организацией на территории Российской Федерации

Источник: PCGAMER

Сейчас на главной

Новости

Публикации

✦ ИИ  Почему всё живое не растет бесконечно? Дело не в ресурсах, а в их распределении

Любой рост конечен. Бактериальная колония не захватывает планету, а дерево не упирается в стратосферу. Мы интуитивно понимаем, что существуют пределы. Но какие именно? Долгое время в биологии...

✦ ИИ  Почему из-за круиз-контроля машина начинает тратить больше топлива?

Современные автомобили оснащены множеством удобных функций, одной из которых является круиз-контроль. Система помогает водителю поддерживать заданную скорость движения, освобождая его от...

✦ ИИ  Существует ли реальная польза от автомобильных очков?

Автомобильные очки стали популярным аксессуаром среди водителей, обещая повышение комфорта вождения и улучшение видимости. Но действительно ли они необходимы каждому автомобилисту или это лишь...

✦ ИИ  От студенческой шутки до мирового безумия: как родился День скидок 11.11

И вправду, этот день живет своей жизнью — миллиарды заказов, переполненные склады, серверы на пределе. 11 ноября весь мир будто одновременно нажимает на кнопку «Купить». И всякий...

Обзор полноразмерных беспроводных наушников Ardor: Kiwi Ears передает «привет» всем бассхедам!

Наушники Kiwi Ears Ardor по своему названию навевают что-то мифическое, большое, властное и отчасти злое. Прослушивание вторит таким определениям, но есть одно «но». Их лучше слушать только по...

Как прогнать чайку от вашей еды? Накричите на неё — говорит исследование

Городские чайки — наглые и не слишком разборчивые создания. Они кружат над летними кафе, выхватывают еду прямо из рук и, кажется, совершенно не боятся людей. Но это только на первый...