Проверил 5 нейросетей для генерации музыки: как звучит нейрогитара и сколько стоит в коммерческих целях?

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Подборка сервисов | Программы, сервисы и сайты

Говорят, современные нейросети способны на многое — от написания сценариев для фильмов до предсказания биржевых трендов. Но ещё недавно искусственный интеллект считался бездарным и неспособным на творчество — как можно научить машину писать музыку?

Оказывается, нейросети поразительно быстро осваиваются в новых областях. Сегодня уже существуют десятки сервисов, готовых за считанные секунды сгенерировать вам музыкальную композицию в любом жанре — от фортепианной сонаты до грайндкора. Причём не просто набор бессмысленных нот, а цельное, осмысленное произведение.

Все эти новые технологии невероятно интригующи и заставляют задаться вопросом: а как же звучит то, что создают нейросети? Я решил изучить эту тему поближе и на собственном опыте протестировал пять сервисов для генерации ИИ-музыки. Готовы ли мы доверить искусственному интеллекту написание музыки для нас?

AIVA: классика жанра

Автор: AIVA Источник: medium.com

Одним из первопроходцев в области генерации музыки с помощью нейросетей стала AIVA — сервис, который идеально подходит для создания композиций в классических жанрах. Фактически всё, что можно представить как MIDI-музыку — фортепианные пьесы, гитарные наигрыши, оркестровые произведения — здесь выполняется безупречно. А вот тот же рок или металл здесь «рубить» не выйдет, да и «электроника» тоже «в пролёте».

Однако, AIVA существует уже несколько лет и её модели отточены до идеального звучания. Каждая сгенерированная композиция звучит так, будто её написал живой человек — настолько гармоничны и проработаны все музыкальные партии.

AIVA идеально подойдёт, если вы владелец, скажем, небольшого уютного кафе или книжного магазина и хотите крутить в нём приятную фоновую музыку, а платить десятки тысяч за права на трансляцию десятков часов «авторских» композиций или рисковать попасть на крупные штрафы — разумеется, не хочется.

Да, AIVA стоит недёшево для коммерческого использования — 49 евро за полноценную лицензию. Но есть и бесплатный тариф без ограничений для некоммерческих целей. Так что для собственного удовольствия вы можете генерировать бесконечные музыкальные творения совершенно бесплатно — или даже включить местный «режим радио», чтобы работать под приятную музыку.

BeatOven: идеально для ютубера

Автор: BeatOven Источник: www.beatoven.ai

Следующий сервис носит интригующее название BeatOven (игра слов «beat», «Beethoven» и «oven» — получается нечто вроде «печи для выпекания битов»). Эта платформа задумана как идеальный инструмент для видеоблогеров — с её помощью можно сгенерировать музыкальный трек в любом стиле и жанре буквально нажатием одной кнопки.

В отличие от академичной AIVA, BeatOven умеет писать самую разнообразную современную музыку — от танцевальной электроники до метала и рэпа. А значит, вы без труда сможете создать идеальное музыкальное сопровождение практически для любого своего видео на YouTube, Дзен или ВК.

Управление сервисом предельно простое. Вы задаёте жанр и настроение будущей композиции (или вводите пожелания в строку запроса) — а дальше нейросеть сама генерирует готовый музыкальный трек. При желании можно ещё дополнительно детализировать параметры после генерации, но в целом процесс максимально автоматизирован.

Я решил протестировать BeatOven для создания энергичного трека для музыкального сопровождения видео-урока. И нейросеть выдала просто идеальный результат — ритмичный, драйвовый трек в классическом стиле. Позднее я также попробовал создать нечто в стиде дабстепа — и этот эксперимент также увенчался успехом

Конечно, по сравнению с творениями AIVA, музыка BeatOven звучит более просто и не такая богатая по аранжировкам. Но для большинства задач типа оформления видео её качества более чем достаточно, а сам сервис берёт своё разнообразием и тем, что его музыка куда больше подходит для того, чтобы наложить её фоном на какой-то ролик.

Платные тарифы BeatOven начинаются от $6 за месяц. При этом полностью бесплатно доступна опция записи короткого отрывка композиции прямо на сайте (без возможности скачивания). Идеальный вариант, чтобы протестировать сервис до покупки.

Stable Audio: перспективный аутсайдер

Автор: Stability AI Источник: www.tomsguide.com

Следующий сервис не выдержал прямого сравнения с конкурентами. Называется он Stable Audio и представляет собой попытку компании Stability AI, известной по своей Stable Diffusion, освоить новые творческие горизонты.

В отличие от остальных продуктов, музыка Stable Audio пока далека от совершенства. Я обратил внимание на множество повторяющихся музыкальных паттернов и мотивов, из-за чего генерируемые композиции звучат достаточно однообразно.

Впрочем, проект ещё молодой и находится в стадии активной разработки. В будущем его создатели планируют полностью открыть исходный код модели и выпустить бесплатную общедоступную версию. Так что однажды Stable Audio может превратиться в новый AudioCraft (о нём ниже) и резко прибавить в качестве усилиями фанатов, как это уже было со Stable Diffusion

Пока же Stable Audio придётся признать аутсайдером в области генерации ИИ-музыки. Но он уже сейчас заслуживает внимания как идея и зарождающийся проект с большими перспективами.

К недостаткам сервиса можно также отнести не самые дружелюбные условия лицензирования. Даже в платных подписках (от $12 до $90 в месяц) есть ограничения на некоторые виды коммерческого использования, а число бесплатных генераций ограничено.

AudioCraft: бесплатный, открытый, open-source

Meta* признана экстремистской организацией на территории РФ
Автор: Meta*  AI Division (Meta* признана экстремистской организацией на территории РФ) Источник: aibusiness.com

Пока что единственным по-настоящему бесплатным и открытым проектом в области генерации ИИ-музыки является AudioCraft от Meta* (Meta* признана экстремистской организацией на территории РФ). Эта модель распространяется по принципу open-source, а значит, абсолютно никому не нужно платить роялти или покупать лицензии.

Бесплатный сыр, как известно, бывает только в мышеловке. Но в случае с AudioCraft качество генерируемого контента оказалось на удивление высоким. Конечно, до академического совершенства ему ещё далеко, но для бесплатной модели музыка звучит очень неплохо и вполне профессионально.

Единственным недостатком AudioCraft является то, что его придётся устанавливать и настраивать самостоятельно на своём компьютере или в личном облаке. Никакого удобного облачного сервиса или веб-версии пока не предусмотрено. Зато после первоначальной настройки вы получите максимально гибкий инструмент без каких-либо ограничений.

Как нетрудно догадаться, цена вопроса — ноль рублей, ноль копеек… И десяток часов вашей жизни, проведённых в плясках на граблях (инструкция по настройке от доброго дяди с DTF — прилагается).

Suno AI: вокально-песенный монополист

Автор: Suno AI Источник: elevenlabs.io

Но если все предыдущие сервисы специализировались исключительно на инструментальной музыке, то проект Suno решил пойти совсем другим путём. Это единственная на сегодняшний день платформа, которая умеет генерировать полноценные песни с вокалом на основе ваших текстовых запросов.

Возможность получить готовую композицию буквально из пары строк делает Suno совершенно эксклюзивным продуктом на рынке нейронной музыки. Фактически это монополист де-факто в сфере ИИ-песен.

Конечно, стоит сразу оговориться — качество синтезированного вокала пока ещё далеко до идеала. Порой вокальные партии звучат весьма искажённо, а иногда компьютерный голос путает ударения: удачной будет где-то каждая вторая генерация. Но в целом нейросеть вполне справляется с задачей, причем — с поддержкой русского языка, на котором ИИ поёт не хуже английского (а вот текст песни на русском, увы, сочинить не может: подгружайте свой).

Я бы сравнил качество музыки Suno с уровнем сельского радио или начинающих любительских коллективов: он умеет всё, но по MTV или региональной «волне» такое крутить не будут. Но даже такой результат невероятно впечатляет, если задуматься, что всего полгода назад подобное казалось фантастикой — а разработчики уже анонсировали работу над следующим поколением модели.

На пробу я попробовал сделать нечто в духе русского рока с авторским текстом, и получилось… Ну, что получается у сети — я описал выше, а послушать это можно в сэмпле по ссылке выше. Да, я знаю, что мои навыки поэта-песенника ниже плинтуса, не надо писать об этом в комментариях.

К преимуществам Suno можно отнести и выгодные условия лицензирования. Любая платная подписка ($10 за квоту на генерацию 500 песен или $30 за 2000) дает вам полные права на коммерческое использование сгенерированного контента без ограничений — хоть на ТВ крути. А бесплатный тариф позволяет генерировать до 5 песен в день и разрешает любое некоммерческое использование — опять же, хоть на ТВ крути, пока не извлекаешь из этого прибыли.

• • •

Кто лидер в области ИИ-музыки?

Подводя итоги своего небольшого исследования в области генерации музыки с помощью нейросетей, я бы выделил три наиболее перспективных проекта из всех протестированных мной.

  • AIVA — бесспорный лидер, когда речь идёт об академической музыке, классике и оркестровых произведениях. Благодаря многолетней проработке звучание этого сервиса максимально приближено к человеческому, поэтому AIVA отлично подойдёт для создания больших объёмов фоновой музыки высочайшего качества, которую будет приятно услышать в кафе, ресторане или на выставке.
  • BeatOven, напротив, ориентирован на современные жанры и станет отличным помощником для видеоблогеров и создателей визуального контента. Быстрая и удобная генерация музыкальных треков на заказ позволит профессионально оформить любое видео всего за пару кликов.
  • Ну, а Suno можно считать пионером в сфере искусственного вокала и песенного творчества. Благодаря возможности генерации полноценных вокальных треков из текстовых запросов, этот сервис будет интересен самому широкому кругу музыкантов и меломанов.

К сожалению, все эти проекты невозможно оплатить из России — пока что они принимают только иностранные карты. Так что, если у вас нет зарубежного платежного средства, то единственно доступным вариантом остается open-source модель AudioCraft.

В любом случае, мир ИИ-музыки стремительно развивается. И я уверен, что уже в ближайшие месяцы эта статья может стать неактуальной — но пока дела обстоят так.

  • * — Компания Meta (социальные сети Instagram и Facebook) - признана экстремистской организацией на территории Российской Федерации
Изображение в превью:
Автор: Suno AI
Источник: elevenlabs.io
Автор не входит в состав редакции iXBT.com (подробнее »)
Об авторе
Играю в игры, читаю о них — а теперь и пишу, чтобы разбавить жизнь копирайтера для китайских (ой, простите, *тюменских*) товаров. Несколько лет проработал компьютерным мастером, так что, порой, и о «железе» могу написать, если вдруг что в руки попадёт. Всегда мечтал быть игровым журналистом — и, как знать, может быть однажды эта мечта сбудется?

4 комментария

Е
Знакомый прислал песню, сгенерированную Suno, очень натурально получилось. Закладываешь стихи — на выходе песня. Не всегда идеально, но как прикол — вполне. С другими дел не имел.
367108326@vkontakte
Про самую крутую нейронку Udio забыли. А ведь она на голову круче, чем монополист (нет) Suno.
Veselyi_kot
Рестриктивная лицензия плюс технологическое ограничение в 30 секунд без возможности продлить плюс не лучшее качество. Где «крутость»?
c
кто сказал что нельзя продлевать? вот целый альбом созданный udio https://soundcloud.com/world-without-humans/sets/paris

Добавить комментарий

Сейчас на главной

Новости

Публикации

Обзор Atvel Zorro Z5 slim: тонкий робот-мойщик окон. Моет даже на окнах с решеткой

Источник: bestrobot.info Atvel Zorro Z5 Slim — оригинальный мойщик квадратного типа. После установки на окно Г-образная ручка складывается в углубление на корпусе, в результате толщина...

Как наточить ножницы в домашних условиях

Ножницы — это незаменимый инструмент в любом доме. Будь то обычные канцелярские ножницы, кухонные, или даже по металлу, в любом доме можно найти этот инструмент. Со временем ножницы, как...

Почему производители так любят «дробные» размеры: 15.67 сантиметра, дюймы и хитрые китайцы

Давайте проведём небольшой эксперимент. Прислоните линейку к любому техническому устройству — скажем, материнской плате, видеокарте, монитору или даже крышке багажника старого «Жигуля»....

Хаотичное обучение: новый подход к развитию интеллекта у машин

Забудьте о строгих алгоритмах и бесконечных циклах проб и ошибок. Будущее робототехники приходит из неожиданного источника — из хаоса. Инженеры Северо-Западного университета совершили...

Обзор IO Nova & Nova Pro: лучшие мыши с Российской гарантией?

Перед Новым Годом IO представила свою линейку игровых мышек, в которой с момента выпуска и по сей день лишь 2 модели: IO Nova и IO Nova Pro. IO — это Российская компания,...

Обзор FiiO Jade Audio JT1: полноразмерные наушники с теплым и атмосферным звучанием и гарнитурным кабелем

Модель FiiO JT1 вышла примерно пол года назад. Это не первые полноразмерные наушники уже достаточно известного производителя аудиотехники FiiO, но первые в бюджетном сегменте. И судя по тому, что...