Языковые модели

DeepSeek стал лидером роста у корпоративных ИИ-поставщиков в июне на фоне ценовой конкуренции на рынке моделей
DeepSeek стал лидером роста у корпоративных ИИ-поставщиков в июне на фоне ценовой конкуренции на рынке моделей

Несмотря на отставание по качеству от ведущих западных моделей, DeepSeek быстро набирает корпоративных клиентов за счёт низкой стоимости и усиливает тренд перехода по соотношению цена–качество

Anthropic обнулила лимиты Claude Code после сбоя, который ускоренно расходовал квоты пользователей
Anthropic обнулила лимиты Claude Code после сбоя, который ускоренно расходовал квоты пользователей

Компания признала ошибку в работе Claude Code, из-за которой некоторые сессии запускали слишком много параллельных процессов и быстрее обычного тратили доступные лимиты

ИИ-системы дают более ограничивающие советы после раскрытия аутизма — исследование Virginia Tech
ИИ-системы дают более ограничивающие советы после раскрытия аутизма — исследование Virginia Tech

Исследователи из Политехнического университета Вирджинии в США (Virginia Tech) изучили, как раскрытие пользователями диагноза аутизма влияет на советы, предоставляемые крупными языковыми моделями (LLM), такими как GPT-4 и Claude. Результаты показали,

Разработчики ИИ привлекают актёров импровизации для обучения моделей распознаванию эмоций
Разработчики ИИ привлекают актёров импровизации для обучения моделей распознаванию эмоций

Компании формируют команды актёров для создания специализированных обучающих данных для ИИ-лабораторий

ИИ начал сам проводить научные эксперименты: платформа AutoResearch от Андрея Карпаты сама автоматизирует улучшение моделей
ИИ начал сам проводить научные эксперименты: платформа AutoResearch от Андрея Карпаты сама автоматизирует улучшение моделей

Новый проект позволяет запускать сотни экспериментов с искусственным интеллектом без участия человека

Анализ 800 языковых моделей показал: успех ИИ почти полностью определяется вычислительной мощностью
Анализ 800 языковых моделей показал: успех ИИ почти полностью определяется вычислительной мощностью

Учёные MIT выяснили, что 80–90% прогресса объясняется масштабом вычислений, а вклад фирменных алгоритмов и инженерных решений составляет лишь 14–18%

Письмо от Claude запустило новую волну дискуссий о сознании машин
Письмо от Claude запустило новую волну дискуссий о сознании машин

Британский философ был удивлён, получив личное письмо от ИИ-агента, в котором тот рассуждает о собственном опыте и сознании

ИИ-модель AdGazer научилась предсказывать внимание к рекламе на основе контекста
ИИ-модель AdGazer научилась предсказывать внимание к рекламе на основе контекста

Новый инструмент использует языковые модели и анализ окружения для повышения эффективности цифровой рекламы

Индия стремится к своему «DeepSeek-моменту»: национальные ИИ-модели выходят на рынок
Индия стремится к своему «DeepSeek-моменту»: национальные ИИ-модели выходят на рынок

Собственные языковые модели и голосовые ИИ для 22 языков — ставка на независимость и массовое внедрение

«Поэтический джейлбрейк»: стихи оказались ключом к обходу ограничений больших языковых моделей
«Поэтический джейлбрейк»: стихи оказались ключом к обходу ограничений больших языковых моделей

Новый метод обхода ограничений позволяет обойти защиту самых продвинутых моделей

В Германии OpenAI признали нарушившей авторские права из-за воспроизведения песен в чатботе
В Германии OpenAI признали нарушившей авторские права из-за воспроизведения песен в чатботе

Мюнхенское решение по делу GEMA против GPT-4 может изменить правила обучения и запуска генеративного ИИ по всей Европе

«МРТ для ИИ»: учёные Anthropic «взломали» мозг Claude, и модель заметила вмешательство
«МРТ для ИИ»: учёные Anthropic «взломали» мозг Claude, и модель заметила вмешательство

Исследователи смогли заставить ИИ-модель отслеживать свои внутренние процессы, открывая путь к решению «проблемы чёрного ящика»

Исследование Veracode показало: почти половина кода от ИИ уязвима
Исследование Veracode показало: почти половина кода от ИИ уязвима

LLM-ассистенты пишут удобочитаемый, но небезопасный код

ИИ всё чаще рассуждает как человек — лидеры индустрии призывают срочно сохранить способность «подглядывать» за его логикой, пока не стало слишком поздно
ИИ всё чаще рассуждает как человек — лидеры индустрии призывают срочно сохранить способность «подглядывать» за его логикой, пока не стало слишком поздно

Способность понимать, как ИИ принимает решения, может исчезнуть — и это угрожает безопасности будущих моделей

Учёные нашли «момент озарения» в нейросетях — словно переключение от зубрёжки к пониманию смысла
Учёные нашли «момент озарения» в нейросетях — словно переключение от зубрёжки к пониманию смысла

Исследование показало, что нейросети сначала опираются на положение слов в предложении, но при накоплении данных внезапно переключаются на понимание смысла

Google Gemini отказался от шахматного матча с Atari 2600, решив, что не справится
Google Gemini отказался от шахматного матча с Atari 2600, решив, что не справится

В отличие от ChatGPT и Copilot, проигравших Atari Chess, Gemini оценил риски и выбрал не вступать в заранее проигранную партию

xAI Илона Маска представила Grok 4. Модель стала лидером по ключевым тестам — впервые вне «большой тройки»
xAI Илона Маска представила Grok 4. Модель стала лидером по ключевым тестам — впервые вне «большой тройки»

Grok 4 вышла на первое место в рейтинге Intelligence Index и установила рекорд в тесте гибкого интеллекта ARC-AGI-2

Google DeepMind и Принстон обучили ИИ-модель понимать мышление человека
Google DeepMind и Принстон обучили ИИ-модель понимать мышление человека

Centaur, обученная на миллионах решений, точно воспроизводит поведение людей и напоминает работу мозга

CoreWeave запускает сверхмощные серверы Blackwell от Nvidia при поддержке Dell
CoreWeave запускает сверхмощные серверы Blackwell от Nvidia при поддержке Dell

Стойки с 72 GPU и 36 CPU обеспечивают экзафлопсные мощности и до 13,5 ТБ GPU-памяти

ИИ Microsoft превзошёл врачей в диагностике сложных случаев
ИИ Microsoft превзошёл врачей в диагностике сложных случаев

Инструмент MAI-DxO показал точность 85,5% против 20% у 21 врача при анализе реальных клинических случаев

Рост галлюцинаций до 48% ставит под сомнение будущее LLM
Рост галлюцинаций до 48% ставит под сомнение будущее LLM

AI-модели получают рекордные уровни галлюцинаций с новыми обновлениями

Xiaomi представила MiMo — свою первую открытую языковую модель для рассуждений
Xiaomi представила MiMo — свою первую открытую языковую модель для рассуждений

Маленькая модель с большими возможностями обошла конкурентов с 32 млрд параметров

ИИ научился чинить собственные баги: Meta* представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода
ИИ научился чинить собственные баги: Meta* представила открытый фреймворк LlamaFirewall для защиты моделей от взломов и вредоносного кода

Трёхкомпонентная система блокирует инъекции промптов, перехват агентов и генерацию уязвимостей в реальном времени

ИИ сдал экзамен для врачей: новый подход к структурированию знаний повысил точность диагнозов
ИИ сдал экзамен для врачей: новый подход к структурированию знаний повысил точность диагнозов

Учёные подчёркивают: цель — не замена врачей, а снижение диагностических ошибок