Создан новый ИИ генератор изображений KOALA, и он в 8 раз быстрее лучшего инструмента от OpenAI

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com
| Новость | ИИ, сервисы и приложения

Новый инструмент искусственного интеллекта (ИИ) может генерировать изображения менее чем за две секунды, и для его работы не требуется дорогостоящее оборудование. При его разработке ученые из Южной Кореи использовали методику, известную как «дистилляция знаний», т. е. перенос данных из большой модели в меньшую, что практически не повлияло на производительность.

Изображение созданное «KOALA» по запросу «картина астронавта, читающего книгу под луной на Марсе»
Источник: koala.sh

С её помощью удалось сжать размер огромной модели генерации изображений под названием Stable Diffusion XL, содержащей 2,56 миллиарда параметров, до 700 миллионов. Преимущество уменьшенной модели заключается в том, что на выполнение вычислений и генерацию ответа уходит меньше времени.

Так как в новой версии модели под названием «KOALA» удалось значительно повысить скорость работы, это позволило запускать ее даже на недорогом оборудовании. Теперь для обработки запросов требуется всего лишь около 8 ГБ оперативной памяти.

Проведенные тесты продемонстрировали отличную эффективность новой модели. Например, «KOALA» справилась с созданием изображения по запросу «картина астронавта, читающего книгу под луной на Марсе» за всего лишь 1,6 секунды. В то время как другим моделям, таким как DALL·E 2 и DALL·E 3 от OpenAI, потребовалось 12,3 и 13,7 секунд соответственно.

Институт электроники и телекоммуникаций (ETRI), который стоит за этими разработками, уже представил несколько версий нового инструмента. Он включает в себя как генератор изображений «KOALA», работающий на основе текстового ввода, так и «Ko-LLaVA», способный отвечать на текстовые вопросы с использованием изображений или видео.

Теперь ученые планируют интегрировать эту технологию в различные сервисы, такие как сервисы генерации изображений, образовательные платформы и производство контента. Это открывает новые перспективы для использования искусственного интеллекта в повседневной жизни и деловой сфере.

Ознакомиться с генератором изображений можно бесплатно на сайте https://koala.sh/tools/free-ai-stock-image-generator

Источник: livescience

Автор не входит в состав редакции iXBT.com (подробнее »)

0 комментариев

Добавить комментарий

Сейчас на главной

Новости

Публикации

Почему в американских школах оценки ставят буквами, но там нет буквы E

Система оценивания в американских школах, основанная на буквенных обозначениях (A, B, C, D, F), является одной из самых узнаваемых особенностей образовательной системы США. Это контрастирует с...

WD-40: что скрывает цифра 40 и почему состав не могут повторить 70 лет

Стив Брасс, генеральный директор WD-40 Company, ждал более тридцати лет, чтобы увидеть то, из-за чего его компания стоит сотни миллионов долларов — рукописную формулу легендарной смазки...

Новые смартфоны на российском рынке, май 2026: «флагман» с итальянским дизайном и камерофон от Vivo

Пришло поговорить о новых смартфонах на российском рынке. В мае компании решили одарить россиян новыми моделями среднего класса, а также парочкой флагманов. Один из них предлагает универсальное...

Светит неожиданно ярко и помещается в ладони. Обзор EDC-фонарика Acebeam UC03A

900 люменов яркости и 95м дальнобойности, боковой белый, красный и RGB-свет, встроенный магнит. Acebeam выпустили необычный компактный EDC-фонарик с питанием от литий-ионного аккумулятора размером...

✦ ИИ  Стандарты электрических розеток: почему в мире до сих пор нет единого формата

Любой, кто брал с собой технику в поездку, сталкивался с простой проблемой: вилка не подходит к местной розетке. В России обычно используются типы C и F (Schuko), в Великобритании — тип...

✦ ИИ  Камера снимает хуже, чем должна — какие настройки реально портят фото

Фото получаются мутными и тёмными? Проверьте настройки камеры: простые параметры, которые часто отключены, могут кардинально улучшить качество снимков.