Meta* не только пересылала терабайты пиратских книг для обучения моделей искусственного интеллекта, но и сотрудники писали друг другу электронные письма об этом
Впервые об этом сообщила Ars Technica, в деле об авторских правах против материнской компании Facebook* Meta по поводу использования ею работ авторов для обучения больших языковых моделей всплыло неловкое грязное белье. Десятки писем, якобы между сотрудниками Meta*, обсуждают торренты с огромным количеством пиратских материалов — и раздачу этих торрентов в придачу — для обучения моделей ИИ компании.
В прошлом месяце в судебных документах было раскрыто, что Meta* получила данные для обучения ИИ из LibGen, большой базы данных для обмена файлами, которая включает в себя все, от платных новостей и научных статей до целых книг. Обвинение утверждает, что Meta* скачала более 80 терабайт из LibGen и еще одной так называемой «теневой библиотеки» под названием Z-Library. Если говорить точнее, это интернет-пиратство в масштабах, которые заставили бы покраснеть юриста Nintendo, и в иске утверждается, что электронные письма, изложенные в письменном виде, «решение Meta* брать и использовать защищенные авторским правом работы без разрешения, которые, как она знала, являются пиратскими, несмотря на явные этические соображения».
В одном из электронных писем, представленных в качестве доказательства, цитируется предполагаемый сотрудник Meta*, без конца твердящий, что «использование пиратских материалов должно выходить за рамки нашего этического порога», а затем утверждающий, что базы данных, такие как LibGen, «по сути, как PirateBay или что-то в этом роде, они распространяют контент, защищенный авторским правом, и нарушают его».
Существуют неоднократные примеры электронных писем, приписываемых сотрудникам Meta*, в которых отмечается использование LibGen как проблема, либо в неудачной манере «одинокого здравомыслящего человека», либо в контексте сокрытия деятельности. Один исследователь предложил получать доступ к LibGen только через VPN, а позже пошутил, что «торренты с корпоративного ноутбука кажутся неправильными :)».
Meta* в конечном итоге работала в «скрытом режиме», как цитирует одного исследователя ИИ в компании, скрывая свою деятельность, загружая и раздавая торренты только за пределами официальных серверов Facebook*.
Обвинение также утверждает, что эти документы об обнаружении свидетельствуют о том, что руководители Meta*, включая Марка Цукерберга, знали об использовании пиратских материалов для обучения моделей ИИ в компании. Еще одна деталь, которая бросается в глаза: электронные письма, представленные в качестве доказательств, указывают на то, что сотрудники Meta* считали, что OpenAI использовала LibGen для своих собственных моделей, представляя использование компанией базы данных как своего рода гонку вооружений.
Если Архиву Интернета не разрешено выдавать книги в качестве цифровой библиотеки, то вряд ли таким компаниям, как Meta*, следует разрешать поглощать терабайты пиратских материалов для обучения чат-бота, который будет лгать о количестве планет в Солнечной системе. По иронии судьбы, международный режим авторских прав выглядит одним из самых крепких оплотов против будущего ИИ.
* — Компания Meta (социальные сети Instagram и Facebook) — признана экстремистской организацией на территории Российской Федерации
Источник: PCGAMER





0 комментариев
Добавить комментарий
Добавить комментарий