LLM

Claude Sonnet 5 лучше планирует, работает с браузером и терминалом, а также выполняет длительные многошаговые задачи практически без участия человека

Модель с 1,6 трлн параметров и контекстом 1 млн токенов прошла полный цикл обучения и инференса на кластере из 50 тыс отечественных ASIC

Новая открытая модель приблизилась к уровню Anthropic и OpenAI в кибербезопасности, усилив опасения США о распространении мощных ИИ-технологий

Независимых доказательств пока недостаточно и эксперты расходятся в оценках

Инвесторы утверждают, что компания не раскрыла реальные последствия ИИ-стратегии, включая рост капитальных затрат до десятков миллиардов долларов и нагрузку на инфраструктуру Azure

Исследователь из Техасского университета предложил отказаться от модного векторного поиска и хранить память ИИ как управляемое состояние. В тестах новая система показала идеальную точность там, где известные решения ошибались почти всегда

Новый датасет ChartNet с миллионом диаграмм позволил небольшим открытым моделям лучше извлекать данные, отвечать на вопросы и анализировать графики, чем гораздо более крупным коммерческим ИИ-системам

Новая модель с 550 млрд параметров уже внедряют Perplexity, Palantir, ServiceNow и другие компании для создания ИИ-агентов, способных самостоятельно выполнять сложные многоэтапные задачи

Новая открытая модель обеспечивает производительность уровня более крупных систем при снижении требований к памяти и может работать локально на устройствах с 16 ГБ VRAM

Всего за полгода оценка компании выросла почти в 5 раз, что подтверждает статус Moonshot AI как главного конкурента западных гигантов вроде OpenAI

Модели OpenAI o1 и GPT-4o в тестах на реальных пациентах показали более высокую точность первичной диагностики в условиях нехватки данных

Подход LLM Knowledge Bases превращает Markdown-файлы в «живую» базу знаний, которую модель сама обновляет и связывает без сложных векторных баз

Алгоритм сохраняет точность моделей и может радикально снизить требования к инфраструктуре — от дата-центров до пользовательских устройств

Исследование показало, что агенты могут радикально менять стратегию даже при идентичном вводе — и это напрямую снижает точность их работы

Анализ 200 000+ диалогов Microsoft и Salesforce показал, что LLM «запоминают ошибки»

Модели оценивают уместность раскрытия информации в зависимости от контекста, снижая риск утечки личных данных

Новый метод обхода ограничений позволяет обойти защиту самых продвинутых моделей

И снижает задержку первого токена благодаря интеграции

Модель с 230 млрд параметров и архитектурой Mixture-of-Experts демонстрирует производительность уровня GPT-5

Grok 4 Fast использует на 40% меньше вычислительных токенов и снижает цену запросов на 98% при сохранении аналогичной точности

Ошибка в ИИ может стоить очень дорого

Управление изучает безопасность и монетизацию детских чат-ботов семи крупных технологических компаний

«Цепочка мыслей» – всего лишь трюк?

Новая архитектура больших языковых моделей позволяет анализировать документы любой длины, открывая новые горизонты для бизнеса и науки

Миллион токенов контекста модель читает как целую книгу за один раз

Google и Wild Dolphin Project работают вместе, чтобы разгадать секреты дельфиньего общения

Модель с 7 млрд параметров помогает покупателям и продавцам договориться быстрее

Техника Bad Likert Judge может увеличить успех атаки на 60%

Английский язык — не самый эффективный способ коммуникации для LLM
