Нейросети заменяют актёров озвучивания

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Рассуждения | Компьютерные и мобильные игры

Этим летом по многим новостным сайтам, связанным с компьютерными играми, прошла новость, что мододел создал мод для Ведьмака 3, который был озвучен с помощью нейросетей. И тогда множество западных актёров озвучивания прокомментировали эту новость, выразив крайнюю обеспокоенность за свои рабочие места. Итак, что же это был за мод, что за сети там использовались и насколько это всё на самом деле опасно для профессии актёров озвучивания?

Автором мода является россиянин под ником nikich340. И использовал он нейросеть созданную так же российской компанией Mind Simulation Lab. Данная компаний из Краснодара появилась не так давно, в 2018 году. На данный момент в разработке у неё два крупных проекта: CyberMind и CyberVoice.

Первый проект позиционируется как система создания программ поведения для NPC в играх. Пока что на сайте компании об этой системе по существу ничего не написано. Только то, как авторы предлагают её использовать. Никакой информации об используемых технологиях, полном спектре возможностей и технических характеристиках в открытом доступе нет. Как нет и информации о крупных проектах, в которых она на сегодня используется. Судя по всему, сейчас данная система находится лишь на этапе разработки.

Второй проект является той самой нейросетью, которая как раз и была использована для озвучивания Геральта в моде. Данная система уже активно продаётся и позиционируется как система для разработчиков видеоигр и стримеров. Тем не менее информации в открытом доступе о том, какие конкретно модели использует данная система нет. А самым нашумевшим проектом, в котором она была использована, является как раз мод для Ведьмака. 

В силу отсутствия хоть какой-то информации о технологиях, используемых компанией, пока что сложно судить о перспективах конкретно этого проекта. С другой стороны, даже если мы берём в расчёт только Россию, уже существует далеко не одна похожая система. Есть, к примеру, VoxWorker, VoiceBot, TextToSpeech и множество других. Так что можно говорить, что к автоматизации профессии актёров озвучивания подбирается множество компаний со всех сторон.

Насколько возможно в принципе автоматизировать озвучивание в играх? Какие рамки есть у существующих на сегодня систем? Если кого–то интересует техническая сторона вопроса, то я отдельно записал видео с разбором системы созданной разработчиками из Google в 2019 году. 

Данная система уже два года назад была способна обучиться голосу любого человека «прослушав» запись его голоса длинной лишь в 5 секунд. И эти два года работа на месте не стояла. Сейчас нейросети могут и добавлять эмоции в сгенерированные голоса, и генерировать вокал. По сути уже осталось не так много времени, когда можно будет полностью заменить актёров озвучивания на нейросети. Не говоря уже, что того же Козловского уже сейчас можно заменить и разницы никто не заметит.

И с тем, какие это принесёт достоинства в целом всё понятно. Теперь не нужно тратить сотни часов на запись текста для компьютерных игр. Вам достаточно привлечь актёров озвучки на пару часов (возможно дней) для детальной записи его голоса. А всё озвучивание персонажей можно генерировать буквально не лету, без привлечения актёров. Можно сэкономить буквально сотни часов работы. А внесение правок в текст, который проговаривают персонажи, можно будет осуществлять хоть в последний день и это не будет кромешным мраком и авралом для десятков людей. 

Полезно это будет особенно для инди проектов. Которым будет ещё проще и дешевле локализировать свои игры. А у крупных издателей всё меньше останется оправданий для отсутствия этой самой локализации.

Что же по поводу самих актёров озвучивания? Тут стоит вспомнить, в чём сейчас заключается работа фотомоделей. Они приходят на фотосет. На этих фотосетах делают определённый набор фотографий с моделями в разных позах. А потом эти фотографии уже обрабатывают в фотошопе, перенося моделей на всякие курорты, подставляя им в руки разную продукцию и так далее. А сами модели получают отчисления за использования своих фотографий. При этом, им совершенно не нужно мотаться везде и в натуре фотографироваться со всем подряд. То есть, фотошоп автоматизирует работу фотомоделей, а не лишает их её. По сути то же самое светит и профессии актёров озвучивания. Возможно не сразу, но с большой вероятностью всё придёт к тому, что актёры будут продавать права на свой голос. Этот голос будут копировать нейросетями, а дальше, уже без привлечения живых людей, будет создаваться озвучка в различных проектах. А актёры будут получать отчисления за использования своего образа. 

Поэтому, как и во многих других отраслях, в озвучивании нейронные сети будут лишь инструментом автоматизации. Лишать людей работы они не будут. Просто потому, что намного проще и дешевле скопировать голос живого человека, чем вручную с нуля создавать роботизированный голос, добиваясь, во-первых, его естественности, а во-вторых, делать его подходящим под конкретный образ.

Имитатор техникиДругойДругая
Автор не входит в состав редакции iXBT.com (подробнее »)

Сейчас на главной

Новости

Публикации

Топ за свои деньги! Обзор смартфона Infinix Zero 30 5G: изогнутый Amoled на 144Гц, Dimensity 8020 и съемка 4k@60fps

Обзор
Новый Infinix Zero 30 5G собрал в себе флагманские решения, но сохранил демократичный ценник. Так, пользователю доступно: актуальный процессор MediaTek Dimensity 8020, 144Гц Amoled-дисплей со...

Новый планшет Teclast P40HD: отличная камера, хорошая производительность, приемлемый бюджет

Обзор
В этом обзоре мы подробно рассмотрим новую модель планшета от известного китайского бренда Teclast с маркировкой P40HD. Это вполне неплохая модель с хорошими сбалансированными характеристиками и...

Почему у видеорегистратора сбивается время и дата?

Рассуждения
Наверняка вы видели на различных развлекательных и не очень сайтах, а также YouTube всевозможные видеоролики с ДТП или иными интересными событиями, снятыми на видеорегистратор. Часто такие...

Core i7 в офис: обзор 14,1” ноутбука Ninkear N14 Pro

Обзор
Ninkear N14 Pro — относится к компактным ноутбукам, которые всегда будут актуальны, как мобильные и лёгкие машинки. Благодаря последним трем поколениям даже ультракомпактные и лёгкие...

Российский часовой проект: обзор бронзовой механики Морприбор для дайверов

Обзор
Добрый день, уважаемые читатели! Сегодня я познакомлю вас с российскими часами, которые выпущены под брендом «Морприбор»: моделью ЭПРОН 1923. Это любопытная модель. Во-первых, на моей...

Кабель USB-C Essager 100 Вт длиной 1 метр: подробный обзор

Обзор
Type-C кабели уже прочно укоренились в нашу обыденную жизнь, ведь стали настолько универсальным аксессуаром, что без него его использования сложно представить любой современный гаджет максимально...