Проверил 5 нейросетей для генерации музыки: как звучит нейрогитара и сколько стоит в коммерческих целях?
Говорят, современные нейросети способны на многое — от написания сценариев для фильмов до предсказания биржевых трендов. Но ещё недавно искусственный интеллект считался бездарным и неспособным на творчество — как можно научить машину писать музыку?
Оказывается, нейросети поразительно быстро осваиваются в новых областях. Сегодня уже существуют десятки сервисов, готовых за считанные секунды сгенерировать вам музыкальную композицию в любом жанре — от фортепианной сонаты до грайндкора. Причём не просто набор бессмысленных нот, а цельное, осмысленное произведение.
Все эти новые технологии невероятно интригующи и заставляют задаться вопросом: а как же звучит то, что создают нейросети? Я решил изучить эту тему поближе и на собственном опыте протестировал пять сервисов для генерации ИИ-музыки. Готовы ли мы доверить искусственному интеллекту написание музыки для нас?
AIVA: классика жанра
Одним из первопроходцев в области генерации музыки с помощью нейросетей стала AIVA — сервис, который идеально подходит для создания композиций в классических жанрах. Фактически всё, что можно представить как MIDI-музыку — фортепианные пьесы, гитарные наигрыши, оркестровые произведения — здесь выполняется безупречно. А вот тот же рок или металл здесь «рубить» не выйдет, да и «электроника» тоже «в пролёте».
Однако, AIVA существует уже несколько лет и её модели отточены до идеального звучания. Каждая сгенерированная композиция звучит так, будто её написал живой человек — настолько гармоничны и проработаны все музыкальные партии.
AIVA идеально подойдёт, если вы владелец, скажем, небольшого уютного кафе или книжного магазина и хотите крутить в нём приятную фоновую музыку, а платить десятки тысяч за права на трансляцию десятков часов «авторских» композиций или рисковать попасть на крупные штрафы — разумеется, не хочется.
Да, AIVA стоит недёшево для коммерческого использования — 49 евро за полноценную лицензию. Но есть и бесплатный тариф без ограничений для некоммерческих целей. Так что для собственного удовольствия вы можете генерировать бесконечные музыкальные творения совершенно бесплатно — или даже включить местный «режим радио», чтобы работать под приятную музыку.
BeatOven: идеально для ютубера
Следующий сервис носит интригующее название BeatOven (игра слов «beat», «Beethoven» и «oven» — получается нечто вроде «печи для выпекания битов»). Эта платформа задумана как идеальный инструмент для видеоблогеров — с её помощью можно сгенерировать музыкальный трек в любом стиле и жанре буквально нажатием одной кнопки.
В отличие от академичной AIVA, BeatOven умеет писать самую разнообразную современную музыку — от танцевальной электроники до метала и рэпа. А значит, вы без труда сможете создать идеальное музыкальное сопровождение практически для любого своего видео на YouTube, Дзен или ВК.
Управление сервисом предельно простое. Вы задаёте жанр и настроение будущей композиции (или вводите пожелания в строку запроса) — а дальше нейросеть сама генерирует готовый музыкальный трек. При желании можно ещё дополнительно детализировать параметры после генерации, но в целом процесс максимально автоматизирован.
Я решил протестировать BeatOven для создания энергичного трека для музыкального сопровождения видео-урока. И нейросеть выдала просто идеальный результат — ритмичный, драйвовый трек в классическом стиле. Позднее я также попробовал создать нечто в стиде дабстепа — и этот эксперимент также увенчался успехом
Конечно, по сравнению с творениями AIVA, музыка BeatOven звучит более просто и не такая богатая по аранжировкам. Но для большинства задач типа оформления видео её качества более чем достаточно, а сам сервис берёт своё разнообразием и тем, что его музыка куда больше подходит для того, чтобы наложить её фоном на какой-то ролик.
Платные тарифы BeatOven начинаются от $6 за месяц. При этом полностью бесплатно доступна опция записи короткого отрывка композиции прямо на сайте (без возможности скачивания). Идеальный вариант, чтобы протестировать сервис до покупки.
Stable Audio: перспективный аутсайдер
Следующий сервис не выдержал прямого сравнения с конкурентами. Называется он Stable Audio и представляет собой попытку компании Stability AI, известной по своей Stable Diffusion, освоить новые творческие горизонты.
В отличие от остальных продуктов, музыка Stable Audio пока далека от совершенства. Я обратил внимание на множество повторяющихся музыкальных паттернов и мотивов, из-за чего генерируемые композиции звучат достаточно однообразно.
Впрочем, проект ещё молодой и находится в стадии активной разработки. В будущем его создатели планируют полностью открыть исходный код модели и выпустить бесплатную общедоступную версию. Так что однажды Stable Audio может превратиться в новый AudioCraft (о нём ниже) и резко прибавить в качестве усилиями фанатов, как это уже было со Stable Diffusion
Пока же Stable Audio придётся признать аутсайдером в области генерации ИИ-музыки. Но он уже сейчас заслуживает внимания как идея и зарождающийся проект с большими перспективами.
К недостаткам сервиса можно также отнести не самые дружелюбные условия лицензирования. Даже в платных подписках (от $12 до $90 в месяц) есть ограничения на некоторые виды коммерческого использования, а число бесплатных генераций ограничено.
AudioCraft: бесплатный, открытый, open-source
Пока что единственным по-настоящему бесплатным и открытым проектом в области генерации ИИ-музыки является AudioCraft от Meta* (Meta* признана экстремистской организацией на территории РФ). Эта модель распространяется по принципу open-source, а значит, абсолютно никому не нужно платить роялти или покупать лицензии.
Бесплатный сыр, как известно, бывает только в мышеловке. Но в случае с AudioCraft качество генерируемого контента оказалось на удивление высоким. Конечно, до академического совершенства ему ещё далеко, но для бесплатной модели музыка звучит очень неплохо и вполне профессионально.
Единственным недостатком AudioCraft является то, что его придётся устанавливать и настраивать самостоятельно на своём компьютере или в личном облаке. Никакого удобного облачного сервиса или веб-версии пока не предусмотрено. Зато после первоначальной настройки вы получите максимально гибкий инструмент без каких-либо ограничений.
Как нетрудно догадаться, цена вопроса — ноль рублей, ноль копеек… И десяток часов вашей жизни, проведённых в плясках на граблях (инструкция по настройке от доброго дяди с DTF — прилагается).
Suno AI: вокально-песенный монополист
Но если все предыдущие сервисы специализировались исключительно на инструментальной музыке, то проект Suno решил пойти совсем другим путём. Это единственная на сегодняшний день платформа, которая умеет генерировать полноценные песни с вокалом на основе ваших текстовых запросов.
Возможность получить готовую композицию буквально из пары строк делает Suno совершенно эксклюзивным продуктом на рынке нейронной музыки. Фактически это монополист де-факто в сфере ИИ-песен.
Конечно, стоит сразу оговориться — качество синтезированного вокала пока ещё далеко до идеала. Порой вокальные партии звучат весьма искажённо, а иногда компьютерный голос путает ударения: удачной будет где-то каждая вторая генерация. Но в целом нейросеть вполне справляется с задачей, причем — с поддержкой русского языка, на котором ИИ поёт не хуже английского (а вот текст песни на русском, увы, сочинить не может: подгружайте свой).
Я бы сравнил качество музыки Suno с уровнем сельского радио или начинающих любительских коллективов: он умеет всё, но по MTV или региональной «волне» такое крутить не будут. Но даже такой результат невероятно впечатляет, если задуматься, что всего полгода назад подобное казалось фантастикой — а разработчики уже анонсировали работу над следующим поколением модели.
На пробу я попробовал сделать нечто в духе русского рока с авторским текстом, и получилось… Ну, что получается у сети — я описал выше, а послушать это можно в сэмпле по ссылке выше. Да, я знаю, что мои навыки поэта-песенника ниже плинтуса, не надо писать об этом в комментариях.
К преимуществам Suno можно отнести и выгодные условия лицензирования. Любая платная подписка ($10 за квоту на генерацию 500 песен или $30 за 2000) дает вам полные права на коммерческое использование сгенерированного контента без ограничений — хоть на ТВ крути. А бесплатный тариф позволяет генерировать до 5 песен в день и разрешает любое некоммерческое использование — опять же, хоть на ТВ крути, пока не извлекаешь из этого прибыли.
• • •
Кто лидер в области ИИ-музыки?
Подводя итоги своего небольшого исследования в области генерации музыки с помощью нейросетей, я бы выделил три наиболее перспективных проекта из всех протестированных мной.
- AIVA — бесспорный лидер, когда речь идёт об академической музыке, классике и оркестровых произведениях. Благодаря многолетней проработке звучание этого сервиса максимально приближено к человеческому, поэтому AIVA отлично подойдёт для создания больших объёмов фоновой музыки высочайшего качества, которую будет приятно услышать в кафе, ресторане или на выставке.
- BeatOven, напротив, ориентирован на современные жанры и станет отличным помощником для видеоблогеров и создателей визуального контента. Быстрая и удобная генерация музыкальных треков на заказ позволит профессионально оформить любое видео всего за пару кликов.
- Ну, а Suno можно считать пионером в сфере искусственного вокала и песенного творчества. Благодаря возможности генерации полноценных вокальных треков из текстовых запросов, этот сервис будет интересен самому широкому кругу музыкантов и меломанов.
К сожалению, все эти проекты невозможно оплатить из России — пока что они принимают только иностранные карты. Так что, если у вас нет зарубежного платежного средства, то единственно доступным вариантом остается open-source модель AudioCraft.
В любом случае, мир ИИ-музыки стремительно развивается. И я уверен, что уже в ближайшие месяцы эта статья может стать неактуальной — но пока дела обстоят так.
- * — Компания Meta (социальные сети Instagram и Facebook) - признана экстремистской организацией на территории Российской Федерации
Источник: elevenlabs.io
4 комментария
Добавить комментарий
Добавить комментарий