Для работы проектов iXBT.com нужны файлы cookie и сервисы аналитики. Продолжая посещать сайты проектов вы соглашаетесь с нашей Политикой в отношении файлов cookie

Архитектурный аскетизм 90-х: как работали первые нейросети под MS-DOS

Пост опубликован в блогах iXBT.com, его автор не имеет отношения к редакции iXBT.com

Сегодня в 09:48 | Статья | ИИ, сервисы и приложения

Нынешний бум генеративного искусственного интеллекта, оперирующий огромными кластерами GPU и датасетами на сотни терабайт, часто создаёт иллюзию, будто нейросетевые технологии начались только сейчас. Однако математический базис глубокого обучения был реализован задолго до появления современных вычислительных мощностей. В первой половине 1990-х годов, в эпоху доминирования операционной системы MS-DOS (и её альтернатив PC-DOS и DR-DOS), исследователи и энтузиасты создавали и успешно обучали многослойные архитектуры на персональных компьютерах того времени. Код писался на Turbo Pascal, Borland C++ или ассемблере (MASM/TASM), а в качестве целевого железа выступали машины уровня IBM PC AT 286 и 386.

Анализ этих программ показывает, что алгоритмическая база современного ИИ была готова давно. Но инженерам прошлого пришлось столкнуться с жесткими аппаратными ограничениями, из-за чего большинство их наработок осталось на гибких магнитных дискетах, уступив место коммерческим системам более поздних эпох.

Автор: Suspiciouscelery / Общественное достояние Источник: commons.wikimedia.org

Архитектурные ограничения: барьер 640 Кб и оптимизация вычислений

Главной проблемой разработки под DOS была сегментированная модель памяти процессоров Intel x86 и классический барьер обычной памяти (Conventional Memory) в 640 килобайт. В то время как современные фреймворки вроде PyTorch по умолчанию выделяют гигабайты под тензоры, разработчикам 90-х приходилось вручную проектировать структуры данных, чтобы уместить матрицы весов и код самой программы в базовую оперативную память.

Использование стандартных типов данных с плавающей запятой (например, 64-битного Real/Double или 80-битного Extended в Pascal) быстро истощало доступные ресурсы даже при небольшом количестве синаптических связей. Для преодоления этого барьера применялось несколько инженерных решений:

Целочисленная арифметика (Fixed-Point): Вместо стандартных операций с плавающей точкой значения весов и функций активации масштабировались (например, умножались на 256 или 65536) и обрабатывались как целые числа (Integer или Longint). Это экономило память и критически ускоряло вычисления на процессорах Intel 80286 и 80386SX, у которых отсутствовал аппаратный математический сопроцессор (FPU i80287/i80387).
Оверлейная структура программ (Overlays): Исполняемый код разбивался на динамически подгружаемые модули. В памяти одновременно находилось только то, что нужно в данный момент. Например, после инициализации интерфейса и загрузки обучающей выборки этот код выгружался, а на его место с жесткого диска или дискеты считывался исполняемый блок прямого прохода (Forward Pass) или обратного распространения ошибки (Backpropagation).
Менеджеры EMS/XMS и DOS-экстендеры: Чтобы выйти за пределы первого мегабайта для хранения больших обучающих выборок, программисты использовали спецификации EMS (переключение банков памяти через прерывание INT 67h и драйвер EMM386) или XMS (через функции HIMEM. SYS). Ближе к середине 90-х ситуация упростилась с появлением DOS-экстендеров (таких как DOS/4GW), которые позволяли переводить процессоры 386/486 в 32-битный защищенный режим с линейной адресацией памяти, но это требовало полного переписывания старых 16-битных программных ядер.

Практическое применение: задачи и софт

Несмотря на дефицит ресурсов, DOS-нейросети использовались для решения вполне конкретных прикладных задач узкого ИИ (Narrow AI).

Одним из главных направлений было оптическое распознавание символов (OCR). Именно в первой половине 90-х закладывались алгоритмы для DOS-версий систем CuneiForm (Cognitive Technologies) и ранних прототипов FineReader (BIT Software / ABBYY). Архитектура часто представляла собой перцептрон с одним скрытым слоем. На вход подавалась бинарная матрица знака размером 16 на 16 пикселей (256 входов). Чтобы обойти медленное вычисление сигмоидальной функции активации, которая требует вычисления экспоненты (f(x) = 1 / (1 + e^-x)), инженеры применяли Look-Up Tables (LUT). Все значения функции заранее просчитывались и зашивались в сегмент данных в виде статического массива, а во время работы сеть просто брала готовый результат по индексу.

Второе популярное направление — анализ временных рядов и прогнозирование рынков. Профессиональным стандартом того времени был американский нейропакет BrainMaker от California Scientific Software. В СНГ также создавались собственные программные комплексы, например, пакет «NeuralNet» А. Ежова и Л. Чечеткина. Эти программы применялись для попыток краткосрочного прогнозирования курсов валют на ММВБ или результатов приватизационных аукционов. На вход подавалось скользящее окно из котировок за предыдущие периоды. Однако из-за малого объема качественных исторических данных и высокой зашумленности рядов модели часто сталкивались с проблемой переобучения (overfitting).

Распространение и смена технологического стека

Автор: Blake Patterson / Лицензия: CC BY 2.0 Источник: commons.wikimedia.org

Нейросетевой софт под DOS распространялся в основном по модели Shareware через сеть Фидонет (FidoNet), электронные доски объявлений (BBS) и ранний сегмент Интернета. Демо-версии обычно имели ограничение на количество нейронов в скрытом слое или не позволяли сохранять весовые коэффициенты обученной сети в файл конфигурации. Коммерческие версии заказывались напрямую у авторов и доставлялись на дискетах.

Развитие этой ветки низкоуровневой оптимизации прекратилось с выходом Windows 95 и переходом на Win32 API. Доступ к мегабайтам линейной оперативной памяти «из коробки» избавил программистов от необходимости использовать оверлеи и страничную адресацию. Одновременно с этим процессоры семейства Intel Pentium получили производительные блоки работы с плавающей точкой (FPU), что сделало оптимизированные целочисленные ассемблерные движки нерентабельными в разработке.

Большая часть исходных кодов тех лет была утеряна из-за недолговечности магнитных носителей и отсутствия централизованных репозиториев вроде GitHub. Тем не менее, математические принципы современных моделей остались прежними: это все та же подстройка весовых коэффициентов и градиентный спуск. Изменился лишь масштаб аппаратных ресурсов, который позволил перейти от побайтовой экономии к экстенсивному росту вычислений.

Изображение в превью:

Автор: Blake Patterson / Лицензия: CC BY 2.0
Источник: commons.wikimedia.org

9 комментариев

Добавить комментарий

Lisp появился в 1958м году.

Ответить

Лисп-то здесь каким боком? Статья совсем про другое.
Да и вообще Лисп — это чисто академический язык, то есть красивый язык с околонулевой практической ценностью. Много их в 60-70-е напридумывали — Алгол 68 очень яркий пример.
Да, я знаю, что есть приложения, написанные на Лиспе, но их по пальцам пересчитать можно. И это за 70 лет! Сравните с количеством приложений, написанных за это время на С (который с академической точки зрения есть уродливое убожество).

Ответить

Ну как бы язык создан специально для ИИ моделей. «Лисп, созданный Джоном Маккарти для исследований в области искусственного интеллекта, долгое время играл ключевую роль в этой сфере.» Так что говорить, что ИИ начал развиваться в 90е — это как бы неверно.

Ответить

С картинки прям молодостью повеяло: MS-DOS, AutoCAD на дискетах, Turbo Pascal, оверлеи, Фидо, BBS…
Алгоритмы старые, да. С обучающими матрицами нас познакомили курсе на втором. Сейчас всё это заработало, потому что стала доступна достаточно мощная аппаратная часть.
Неправда, что код утерян. Я свой диплом сначала с дискет переписал на NAS, а потом в облако.

Ответить

Где-то году в 1998 на BBS-ках была мода на разговорных роботов. Которые, конечно, представляли собой тупо сборник ключевых слов и вариантов ответов. Я их раскусывал мгновенно по скорости ответа и тупости. Но это не мешало отдельным гениям трепаться с ними всю ночь и в этот момент я начал терять веру в человечество. Ладно, не про это сейчас
Так вот, один погромист из новосибирского академгородка сделал реального «чатбота» (до изобретения термина оставалось 20+ лет) на нейросети, который реально вдумывался в ответ собеседника и сочинял уникальный ответ. Он заметно тормозил и такая задержка делала его ответ более похожим на человеческий.
Я его тоже довольно быстро раскусил и он даже ответил мне что-то вроде «надо же, догадался!». Потом автор показывал мне его код на Lisp-е (и я там нихрена не понял, конечно).
Сейчас я понимаю, что он написал его не с нуля сам, конечно, а просто спёр с работы (НИИ ВЦ или как он там назывался) уже готовый, натренированный на русском языке, проект

Ответить

Голь на выдумку хитра. Почитайте еще, как создавался Prince Of Persia (или на ютубе есть хороший ролик на эту тему).

Ответить

хорошая история, жалко что ложь

Ответить

А какже биоритмы?

Ответить

Там же тупо синусоида

Ответить

Добавить комментарий

Сейчас на главной

Новости

9 функций вместили в одной ручке: представлена VEXTAKI

Компания Panasonic разработала электрический велосипед Xealt L3 2026, продается только в Японии

Авто и транспорт
1 час назад
0

Бета-версия iOS 26.6 вышла раньше обычного графика Apple

Arturia выпустила эмулятор синтезатора Memorymoog под названием Memory V

Аудио и звук
2 часа назад
0

Xiaomi готовит к выходу колонку Sound Play с защитой IP68 и Bluetooth 6.0

Аудио и звук
2 часа назад
0

Публикации

Стоит ли покупать Xiaomi 15 в 2026 году: обзор и опыт использования компактного флагмана

Обзор
2 часа назад
Смартфоны и телефоны

Если вы ищете смартфон за 40-50 тысяч рублей, то лучшим вариантом может стать прошлогодний флагман. Одним из таких является Xiaomi 15. Мощный аппарат с компактным корпусом, тройной камерой...

Озеро Утренней Славы: как туристы превратили чудо природы в разноцветную лужу

Статья
3 часа назад
Путешествия и туризм

В Йеллоустоне находится одно из самых красивых озер мира — небольшая по диаметру воронка с водой такого насыщенного синего цвета, что кажется, будто на землю упал кусочек неба. Жена...

Обзор корпуса Formula V Line Air Power G8

Обзор
5 часов назад
Платформа ПК

Привет, друзья! Компания Formula V Line сейчас предлагает отличные цены на маркетплейсах и представила множество интересных новинок, поэтому неудивительно, что количество сборок ПК на их...

✦ ИИ Как понять, что клубника сладкая, еще до покупки? 5 признаков спелости по запаху, цвету и хвостику

Тематическая подборка
5 часов назад
Оффтопик

Каждый сезон мы попадаем в одну и ту же ловушку: покупаем огромную ярко-красную клубнику, которая на вкус оказывается «пластиковой» и водянистой. Красивый внешний вид часто...

Низкоуровневая безопасность 80-х: как инженеры защищали картриджи на уровне кремния и логики мапперов

Статья
5 часов назад
Оффтопик

Защита интеллектуальной собственности в игровой индустрии всегда развивалась как гонка технологий. Сегодня борьба с копированием сместилась на уровень операционных систем и облачных проверок:...

Закрытые наушники с ANC, 140 часов музыки, два динамика 40мм и 10мм: обзор Kiwi Ears Ardor

Обзор
5 часов назад
Аудио и звук

Компания Linsoul выпустила любопытные наушники, которые за свою стоимость удивили наличием гибридного активного шумоподавления, любопытного дизайна, современного чипа Bluetooth 5.4, двух динамиков...