LLM

Anthropic выпустила Claude Sonnet 5: новая модель почти догнала Opus 4.8, сохранив низкую цену
Anthropic выпустила Claude Sonnet 5: новая модель почти догнала Opus 4.8, сохранив низкую цену

Claude Sonnet 5 лучше планирует, работает с браузером и терминалом, а также выполняет длительные многошаговые задачи практически без участия человека

Meituan представила LongCat-2.0: первую LLM с триллионным масштабом, полностью обученную на китайских чипах
Meituan представила LongCat-2.0: первую LLM с триллионным масштабом, полностью обученную на китайских чипах

Модель с 1,6 трлн параметров и контекстом 1 млн токенов прошла полный цикл обучения и инференса на кластере из 50 тыс отечественных ASIC

Китайская Zhipu AI выпустила открытую модель GLM-5.2, сопоставимую с западными ИИ в задачах поиска уязвимостей
Китайская Zhipu AI выпустила открытую модель GLM-5.2, сопоставимую с западными ИИ в задачах поиска уязвимостей

Новая открытая модель приблизилась к уровню Anthropic и OpenAI в кибербезопасности, усилив опасения США о распространении мощных ИИ-технологий

Microsoft столкнулась с иском акционеров из-за миллиардных расходов на ИИ и Copilot
Microsoft столкнулась с иском акционеров из-за миллиардных расходов на ИИ и Copilot

Инвесторы утверждают, что компания не раскрыла реальные последствия ИИ-стратегии, включая рост капитальных затрат до десятков миллиардов долларов и нагрузку на инфраструктуру Azure

Память ИИ оказалась почти бесполезной: новый проект Tenure заявил о 95% ошибок у популярных систем хранения знаний
Память ИИ оказалась почти бесполезной: новый проект Tenure заявил о 95% ошибок у популярных систем хранения знаний

Исследователь из Техасского университета предложил отказаться от модного векторного поиска и хранить память ИИ как управляемое состояние. В тестах новая система показала идеальную точность там, где известные решения ошибались почти всегда

MIT научил ИИ понимать графики: компактные модели превзошли коммерческих гигантов
MIT научил ИИ понимать графики: компактные модели превзошли коммерческих гигантов

Новый датасет ChartNet с миллионом диаграмм позволил небольшим открытым моделям лучше извлекать данные, отвечать на вопросы и анализировать графики, чем гораздо более крупным коммерческим ИИ-системам

Nvidia представила Nemotron 3 Ultra: ИИ-модель для автономных агентов стала быстрее в пять раз и дешевле на 30%
Nvidia представила Nemotron 3 Ultra: ИИ-модель для автономных агентов стала быстрее в пять раз и дешевле на 30%

Новая модель с 550 млрд параметров уже внедряют Perplexity, Palantir, ServiceNow и другие компании для создания ИИ-агентов, способных самостоятельно выполнять сложные многоэтапные задачи

Google представила Gemma 4 12B — мультимодальную ИИ-модель с 12 млрд параметров с нативной поддержкой аудио и работы без энкодеров
Google представила Gemma 4 12B — мультимодальную ИИ-модель с 12 млрд параметров с нативной поддержкой аудио и работы без энкодеров

Новая открытая модель обеспечивает производительность уровня более крупных систем при снижении требований к памяти и может работать локально на устройствах с 16 ГБ VRAM

Китайский ИИ-феномен: Moonshot AI привлекла $2 млрд и достигла оценки в $20 млрд на фоне взрывного роста выручки
Китайский ИИ-феномен: Moonshot AI привлекла $2 млрд и достигла оценки в $20 млрд на фоне взрывного роста выручки

Всего за полгода оценка компании выросла почти в 5 раз, что подтверждает статус Moonshot AI как главного конкурента западных гигантов вроде OpenAI

ИИ в ряде случаев точнее врачей поставил диагноз в приёмном отделении — исследование Гарвардской медицинской школы
ИИ в ряде случаев точнее врачей поставил диагноз в приёмном отделении — исследование Гарвардской медицинской школы

Модели OpenAI o1 и GPT-4o в тестах на реальных пациентах показали более высокую точность первичной диагностики в условиях нехватки данных

ИИ перестанет «забывать»: Андрей Карпаты предложил новый способ работы с LLM вместо RAG
ИИ перестанет «забывать»: Андрей Карпаты предложил новый способ работы с LLM вместо RAG

Подход LLM Knowledge Bases превращает Markdown-файлы в «живую» базу знаний, которую модель сама обновляет и связывает без сложных векторных баз

Google представила TurboQuant — новый алгоритм сжатия памяти для ИИ
Google представила TurboQuant — новый алгоритм сжатия памяти для ИИ

Алгоритм сохраняет точность моделей и может радикально снизить требования к инфраструктуре — от дата-центров до пользовательских устройств

Почему ИИ-агенты ошибаются без причины: одинаковый запрос — разные решения
Почему ИИ-агенты ошибаются без причины: одинаковый запрос — разные решения

Исследование показало, что агенты могут радикально менять стратегию даже при идентичном вводе — и это напрямую снижает точность их работы

Microsoft представила инструменты для защиты конфиденциальности в больших языковых моделях
Microsoft представила инструменты для защиты конфиденциальности в больших языковых моделях

Модели оценивают уместность раскрытия информации в зависимости от контекста, снижая риск утечки личных данных

«Поэтический джейлбрейк»: стихи оказались ключом к обходу ограничений больших языковых моделей
«Поэтический джейлбрейк»: стихи оказались ключом к обходу ограничений больших языковых моделей

Новый метод обхода ограничений позволяет обойти защиту самых продвинутых моделей

Китайская модель MiniMax-M2 — новый лидер среди открытых языковых моделей
Китайская модель MiniMax-M2 — новый лидер среди открытых языковых моделей

Модель с 230 млрд параметров и архитектурой Mixture-of-Experts демонстрирует производительность уровня GPT-5

xAI представила Grok 4 Fast — сверхбыструю и дешёвую версию модели
xAI представила Grok 4 Fast — сверхбыструю и дешёвую версию модели

Grok 4 Fast использует на 40% меньше вычислительных токенов и снижает цену запросов на 98% при сохранении аналогичной точности

Федеральная торговая комиссия США расследует влияние чат-ботов на несовершеннолетних
Федеральная торговая комиссия США расследует влияние чат-ботов на несовершеннолетних

Управление изучает безопасность и монетизацию детских чат-ботов семи крупных технологических компаний

Alibaba совершила прорыв в обработке больших текстов: модель QwenLong-L1 способна на анализ документов любой длины за секунды
Alibaba совершила прорыв в обработке больших текстов: модель QwenLong-L1 способна на анализ документов любой длины за секунды

Новая архитектура больших языковых моделей позволяет анализировать документы любой длины, открывая новые горизонты для бизнеса и науки

Amazon выпустила «самый умный» ИИ Nova Premier: что он умеет и с кем соревнуется?
Amazon выпустила «самый умный» ИИ Nova Premier: что он умеет и с кем соревнуется?

Миллион токенов контекста модель читает как целую книгу за один раз

Модель DolphinGemma на базе Google Gemini — новый инструмент в изучении сложной системы коммуникации дельфинов
Модель DolphinGemma на базе Google Gemini — новый инструмент в изучении сложной системы коммуникации дельфинов

Google и Wild Dolphin Project работают вместе, чтобы разгадать секреты дельфиньего общения

«Авито» инвестирует 12 млрд рублей в генеративный ИИ и уже заработал 670 млн на первых решениях
«Авито» инвестирует 12 млрд рублей в генеративный ИИ и уже заработал 670 млн на первых решениях

Модель с 7 млрд параметров помогает покупателям и продавцам договориться быстрее

Microsoft и Чикагский университет создали новый математический язык для повышения эффективности LLM
Microsoft и Чикагский университет создали новый математический язык для повышения эффективности LLM

Английский язык — не самый эффективный способ коммуникации для LLM