Voodoo Scalable Architecture от 3dfx



Итак, это свершилось. 15 ноября 1999 года компания 3dfx официально анонсировала свою новую технологию VSA (Voodoo Scalable Architecture), ранее известную под кодовым именем Napalm, а также первые графические процессоры и карты, реализующие эту технологию.

В последние полгода только ленивый пользователь или обозреватель не пинал компанию 3dfx. В принципе, было за что пинать, однако компания не сдалась, а продолжала упорно работать над своим новым детищем. Прежде всего, перед 3dfx стояла проблема правильного выбора стратегии. Руководителям компании вместе с инженерным персоналом нужно было решить, какими функциональными возможностями должны обладать новые продукты 3dfx. Новые продукты должны сочетать в себе такие качества, которые смогут обеспечить популярность среди потребителей и сохранить за 3dfx место среди ведущих игроков массового рынка 3D-графики. В связи с тем, что продукты конкурентов обладают определенным набором новых функциональных возможностей, инженерам 3dfx нужно было создать продукт, по крайней мере, не уступающий по параметрам. Но этого было бы достаточно лишь для того, чтобы остаться на рынке. Если же 3dfx хочет вернуть себе место лидера, новый продукт должен обладать тем, чего нет у конкурентов, но что очень понравится пользователям, или обладать всем тем, что есть передового и нового у конкурентов, но вместе с тем быть лучше. Подготовку к премьере новой технологии и продуктов, воплощающих ее, компания 3dfx начала еще этим летом. Сначала нам рассказали о новой технологии T-Buffer от 3dfx, затем о новой технологии компрессии текстур FXT1 от той же 3dfx. Плюс ко всему, по сети еще с прошлого года ходили слухи о том, что в лабораториях 3dfx готовится какой-то новый чудо-продукт с невероятными возможностями. Так или иначе, но интерес к новому продукту от 3dfx существует довольно давно, и очень устойчивый. Одни с нетерпением и надеждой ждут нового продукта от любимой компании, другие ждут тоже с нетерпением, в тайне надеясь, что 3dfx облажается и компания исчезнет с рынка, расчистив дорогу более сильным конкурентам. Примерно за пару недель до 15 ноября на сайте 3dfx можно было увидеть следующее:

Нас приглашали заглянуть на сайт 3dfx в 19:00 по московскому времени и узнать, что же нового нам приготовила компания 3dfx. Идея NVIDIA с нагнетанием таинственности и привлечения всеобщего внимания явно прижилась. В этом нет ничего плохого, так как все самые удачные идеи конкуренты всегда перенимают. Самое интересное, что уже в 14:00 по Московскому времени любознательные пользователи раскопали на европейском сайте 3dfx секретный пресс-релиз со всей информацией о грядущем пятью часами позже событии. К слову, в первые 30 минут после времени "Ч" сайт 3dfx был явно перегружен обращениями страждущих, немного позднее ситуация улучшилась. Видимо, положительную роль сыграло то, что на многих сайтах, посвященных компьютерным новостям, заранее было все рассказано, что и снизило поток желающих попасть на сайт 3dfx именно в 19:00. На мой взгляд, событие с представлением новой архитектуры VSA и новых графических акселераторов ничуть не потускнело из-за утечки информации. Стало ли это событие новой вехой в развитии массового рынка 3D графики, покажет только время. Сейчас мы можем лишь констатировать, что многие наши прогнозы вновь оправдались, и посмотреть более внимательно на то, что предлагает нам 3dfx. Тем не менее, любой желающий может отметить этот день для себя, как праздник, или просто, хмыкнув, проигнорировать.

Практически все конкурирующие продукты в области 3D-графики поддерживают отображение трехмерной графики при 32-битной глубине представления цвета, поддерживают AGP-текстурирование и текстуры большого размера, а также еще набор некоторых функций, ставший как минимум стандартом де факто. С этими и другими, ставшими уже стандартными параметрами для современных графических акселераторов, в принципе, все ясно. Можно вести споры о том, что часть из функциональных возможностей не поддерживаются в приложениях, а значит, не особо и нужны, но эти споры бессмысленны. Если сложилось мнение, что то-то и то-то — необходимая функциональная черта, значит, любой продукт должен обладать это чертой, иначе asta la vista, baby. Новый продукт от 3dfx просто обязан соответствовать установленным стандартам на рынке. Но вот что предложить покупателям, кроме стандартного набора возможностей? Заметим, что наличие интегрированного геометрического сопроцессора мы пока относим к новейшим, или нестандартным функциональным возможностям графических процессоров для массового рынка. Можно пойти по пути конкурентов и также предложить в своих новых продуктах аппаратную поддержку расчетов T&L. Известно, что NVIDIA и S3 пошли как раз по пути интеграции геометрических сопроцессоров в свои чипы и сделали это первыми в решениях для массового рынка 3D-графики. Этот путь развития, безусловно, верен, и есть все основания предполагать, что через полгода год мы увидим массу игр, которые будут требовать наличия аппаратного расчета преобразования координат полигонов и установки освещения. Тем не менее, правильных путей развития может быть несколько. После анонса технологии T-Buffer стало совершенно очевидно, что в будущих новых продуктах от 3dfx будет реализована аппаратная поддержка T-Buffer. Напомним вкратце, в чем суть технологии T-Buffer.

Суть технологии T-Buffer состоит в обеспечении возможности управления несколькими кадровыми буферами, что позволяет использовать ряд специальных эффектов. Самый важный цифровой эффект — это full scene spatial anti-aliasing (или просто FSAA). Кроме того, уже сейчас разработаны техники использования таких эффектов, как motion blur, depth of field, soft shadows и soft reflectance. Технология T-Buffer — это, прежде всего, инструментарий. Имея возможность управлять рендерингом сразу в нескольких кадровых буферах, разработчик приложений может создавать свои собственные специальные эффекты. Для реализации эффекта full-scene spatial anti-aliasing не нужно каких-либо специальных интерфейсов, для всех других эффектов, которые можно накладывать с помощью T-Buffer, потребуется поддержка через интерфейсы, которая, впрочем, может быть реализована через расширения к OpenGL или Direct3D. Главная идея T-Buffer состоит в обеспечении визуализации более качественной 3D-графики. Более подробно о технологии T-Buffer можно прочитать в этом материале.

После анонса новой технологии от 3dfx, получившей замысловатое имя VSA-100 стало ясно, что упор сделан на скорость и качество, а ключевым термином стало слово Scalable (масштабируемость). Поддержка аппаратного расчета T&L пока отложена на неопределенный срок.

В принципе, идею инженеров 3dfx легко понять. Зачем делать продукт, часть функциональных возможностей которого будет использоваться лишь через полгода, а то и через год? Если компании NVIDIA и S3 хотят быть локомотивами, которые будут проталкивать идею аппаратной реализации расчетов T&L среди разработчиков игр, то пусть этим и занимаются. К тому же они еще и между собой будут конкурировать. Кроме того, весной и NVIDIA и S3 все равно выпустят следующее поколение своих GPU, а тогда к конкурентной борьбе может подключиться и компания 3dfx. Конечно, если картина с поддержкой аппаратной реализации T&L в играх станет очевидной. Если весной все еще будет не ясно, нужны ли на массовом рынке графические карты с геометрическими сопроцессорами на борту, никто не мешает отложить 3dfx анонс поддержки аппаратного расчета T&L до осени 2000 года. Если же уже весной 2000 станет очевидно, что аппаратная поддержка T&L является необходимой функциональной чертой графических акселераторов для массового рынка, никто не мешает 3dfx установить на свои карты внешний геометрический сопроцессор. Замечу, что, на мой взгляд, пока логичнее вести речь именно о внешнем геометрическом сопроцессоре на платах от 3dfx. Причин тому несколько. Во-первых, если верить неподтвержденной официальными источниками информации, 3dfx уже ведет работы по использованию в своих продуктах внешнего геометрического сопроцессора IMPAC-GE от Mitsubishi. Основная проблема с такой реализацией это поддержка в драйверах. Главный плюс - минимальные затраты на разработку, т.к. чип IMPAC-GE существует и присутствует на профессиональном графическом рынке уже более года, т.е. это отлаженное решение. Во-вторых, можно пересмотреть дизайн продуктов сери VSA и интегрировать в них геометрический сопроцессор. Главный минус такого решения — это большие затраты на разработку, дизайн и отладку, т.к. все нужно фактически делать с нуля (если, конечно, эти работы уже не ведутся). Плюсом такого решения является его потенциальная вычислительная мощность, читай производительность. Дело в том, что ключевой особенностью архитектуры VSA является масштабируемость, т.е. подразумевается, что на одной плате может быть установлено параллельно несколько графических процессоров. Если в каждом процессоре будет интегрированным свой геометрический сопроцессор, то в итоге мы получим суперкомпьютер в формате AGP карты. С другой стороны, никто не мешает установить на одной PCB несколько геометрических сопроцессоров, главное, чтобы хватило электропитания и места на карте. При этом идеология технологии SLI может быть применена и к параллельным вычислениям, выполняемым сразу несколькими геометрическими сопроцессорами. Какой путь на самом деле выберет 3dfx, покажет только время. Тем не менее, приведу высказывание CTO компании 3dfx Скотта Селлерса (Scott Sellers): "3dfx will have HW T&L when it matters in the market". Проще говоря, когда аппаратная поддержка T&L будет необходима на рынке, мы ее реализуем.

Архитектура VSA

VSA расшифровывается как Voodoo Scalable Architecture, что по-русски звучит как масштабируемая архитектура Voodoo. Сразу можно отметить, что 3dfx не отказалась от хорошо раскрученной марки Voodoo. Это вполне логичное и ожидаемое решение. По крайней мере, это экономит деньги на рекламу, а режим экономии сейчас очень необходим для 3dfx, особенно в свете того, что продажи карт серии Voodoo3 не обеспечивают достаточных доходов, а новые карты появятся на рынке лишь весной 2000 года, уже после новогоднего пика продаж на массовом рынке. Первый чип, реализующий архитектуру VSA, получил имя VSA-100. Простое, незамысловатое название.

Итак, в чем же заключается масштабируемость новой архитектуры? Масштабируемость VSA заключается в возможности параллельной работы от 2 до 32 графических процессоров. При этом параллельная работа графических процессоров может использоваться двумя методами.

Первый метод подразумевает использование технологии SLI (scan line interleave), хорошо известной со времен классического чипсета Voodoo2. Во времена Voodoo2 технология SLI представляла собой следующее: два графических процессора осуществляют рендеринг разных строк одного кадра, формирующих конечное изображение. При этом все чипы используют один общий кадровый буфер. Затем сформированный кадр выводится из общего кадрового буфера на экран монитора. Архитектура VSA поддерживает новую реализацию технологии SLI, в которой устранены такие ограничения старого варианта SLI, как использование только двух графических чипсетов параллельно и отсутствие поддержки разрешений более чем 1024х768 (теперь поддерживаются разрешения вплоть до 1600х1200). Более того, новая версия технологии SLI представляет собой совершенно другую идеологию. В силу того, что современные графические ускорители ориентированы на использование AGP-интерфейса, а по заявлению 3dfx чип VSA-100 специально оптимизирован на работу с AGP, теперь режим SLI ориентирован на реализацию протокола взаимодействия нескольких графических процессоров, расположенных на одной PCB. В случае с VSA-100 новая версия технологии SLI позволяет обеспечить совместную работу в параллельном режиме до 32 графических процессоров. Теперь каждый чип, работающий в режиме SLI, может заниматься формированием определенной последовательности или полосы из строк одного кадра, а каждая такая последовательность может содержать от 1 до 128 строк. При этом число строк в последовательности или полос может динамически изменяться. Речь идет о том, что каждый чип формирует строки, которые идут подряд и составляют полосу, а из набора полос формируется полный кадр. Например, если мы имеем четыре чипа, работающих в режиме SLI, то каждый чип может формировать полосы из 40 строк каждая, которые все вместе сформируют кадр. Разумеется, можно использовать и режим чередования строк, а не последовательностей строк. Например, в случае 4 процессоров в режиме SLI присвоим каждому чипу индекс CN, где N=1, 2, 3, 4. Тогда чип C1 будет формировать строку S=1, 5, 9 и т.д. или S=4*M+N, где M=[0...1200], а N соответствует номеру графического процессора.

Зачем понадобилось использовать именно полосы с возможностью изменения количество строк, содержащихся в них? В зависимости от глубины представления цвета, числа полигонов в сцене и их расположения возможность изменять число строк, составляющих полосы, позволяет оптимальным образом загружать и использовать технику SLI. При этом возможна ситуация, когда формирование маленького полигона может выполняться полностью одним графическим чипом и в пределах одной полосы строк. В такой ситуации использование SLI будет неэффективным. С другой стороны, если графический чип формирует больше одной строки сразу, т.е. полосу, это позволяет загружать более равномерно всю систему и эффективно использовать текстурный кэш. В итоге было решено использовать полосы, в которых число строк динамично изменяется от 1 до 128, что обеспечивает равномерную загрузку системы работающей в режиме SLI.

Замечу, что каждый из чипов VSA-100, используемых в режиме SLI, имеет собственный кадровый буфер, в котором осуществляется рендеринг строк или последовательностей строк (полос), после чего данные из разных кадровых буферов передаются в общий кадровый буфер, где формируется полный кадр и уже оттуда происходит вывод на экран монитора. При этом каждый чип VSA-100 имеет собственную шину памяти и собственный локальный кадровый буфер. Напомню, что каждый чип VSA-100 поддерживает работу с локальной видеопамятью объемом до 64 Мб. Часть доступной для каждого чипа памяти используется под кадровый буфер (с двойной или даже тройной буферизацией), а остальная память используется для хранения текстур и Z-буферизации. На тот случай, если доступных объемов памяти окажется мало, 3dfx рекомендует использовать один из двух поддерживаемых методов компрессии текстур: DXTC или FXT1. Такая организация работы графических процессоров способствует более равномерному распределению нагрузки на полосу пропускания шины памяти. Кстати, благодаря такому решению, когда потоки данных равномерно распределяются между графическими процессорами, работающими в режиме SLI, суммарная ширина полосы пропускания памяти существенно возрастает. Именно поэтому вполне допустим вариант использования стандартной памяти SDRAM/SGRAM, как, вероятно, и будет на самом деле.

Второй метод подразумевает использование технологии T-Buffer. В этом случае каждый графический процессор формирует полностью один кадр изображения в собственном кадровом буфере. После чего T-Buffer производит совмещение содержимого нескольких кадровых буферов и выводит полученный результат на экран монитора в виде единого кадра. Не буду повторять, какие возможности предоставляет использование T-Buffer , просто напомню, что главное это улучшение качества и восприятия графики. Улучшение качества достигается за счет аппаратной реализации сглаживания всей сцены (full scene anti-aliasing), а восприятие улучшается за счет применения специальных эффектов типа depth of field, soft shadows и т.д.

Остается один важный, на мой взгляд, вопрос. Будет ли возможность одновременно использовать T-Buffer и режим SLI? Судя по всему да, такая возможность будет, но работать все это будет по-разному в конфигурациях с двумя и четырьмя (и более) чипами VSA-100. И вот почему. Для реализации аппаратного эффекта full scene anti-aliasing для формирования конечного пикселя изображения используется четыре пиксельных семпла. В случае, когда на карте используется только два чипа VSA-100, за один такт они могут сформировать как раз 4 пиксельных семпла, но не более, т.е. использовать чередование строк или полос из строк это просто лишняя потеря времени. С другой стороны, действие эффектов T-Buffer может применяться не к полному кадру, а лишь к его определенной части. В этом случае, видимо, допустимо использование техники чередования строк для оптимизации нагрузки на шину памяти, а значит, можно одновременно использовать T-Buffer и режим SLI. Если все эти предположения верны, то для оптимальной работы T-Buffer, а значит аппаратного применения эффекта FSAA (full scene anti-aliasing) и других специальных эффектов без ощутимого урона общей производительности, т.е. с применением техники SLI, требуется использование не менее четырех процессоров VSA-100 одновременно. В случае использования лишь двух процессоров VSA-100 техника SLI будет применяться ограниченным образом, либо вообще не применяться, если задействован T-Buffer, либо будет применять только режим SLI для достижения максимальной производительности и при этом полностью не будет задействован T-Buffer.

Если все эти идеи верны, то пользователь получит возможность выбирать между высокой производительностью и высоким качеством и реалистичностью изображения. Косвенно это подтверждается тем, что, по заявлению3dfx, у пользователя будет возможность отключения T-Buffer (а значит, отключения аппаратной реализации эффекта FSAA), чтобы получить максимальную величину fillrate, а значит, максимальные значения fps. Поясню важную деталь. Если пользователь выберет для себя режим наивысшего качества графики и наилучшего восприятия изображений на мониторе, читай: решит использовать технологию T-Buffer, это вовсе не означает, что он проиграет в скорости. По крайней мере, 3dfx обещает, что высокое качество графики и реализм изображений при использовании специальных эффектов типа motion blur, depth of field и т.д. не скажется на величине fillrate. Проще говоря, наряду с высоким качеством графики и использованием специальных эффектов пользователь получит высокую частоту смены кадров на экране, например, 60 fps при разрешении 1024х768 и с использованием T-Buffer. Если пользователю плевать на специальные эффекты и его устраивает обычное качество графики, которое обеспечивают продукты от NVIDIA, Matrox или ATI, но не хватает скорости и хочется получить сумасшедшие значения fps, то достаточно отключить T-Buffer и включить режим SLI.

Отметим один важный момент. По сравнению с технологией MAXX от ATI у технологии SLI от 3dfx нет такой проблемы, как возможное возникновение лага. Отсутствие проблемы связано с тем, что в случае с режимом SLI графические процессоры каждый раз занимаются формированием текущего кадра, не выполняя работы впрок.

Теперь уместно рассмотреть параметры первого чипа, реализующего архитектуру VSA.

Общие данные VSA-100

  • Интегрированный 128-разрядный 2D/3D/Video ускоритель
  • Чип содержит 14 млн. транзисторов, изготавливается по 0.25 мкм технологическому процессу с использованием шестислойной технологии
  • Частота графического ядра — 66 — 183 MHz (в зависимости от типа используемой памяти)
  • 2 конвейера рендеринга с 2 блоками текстурирования на каждом (вопрос спорный, есть мнение, что каждый конвейер имеет лишь один блок текстурирования)
  • Fillrate 333 — 367 млн. пикселей в секунду (включая режим мультитекстурирования)
  • Интегрированный 350 MHz RAMDAC (возможно, будет использоваться 400 Мгц RAMDAC)
  • Рендеринг при 32-битной глубине представления цвета
  • 24-бит Z & W-буферы,
  • 8-битный стенсель буфер
  • Текстуры с 32-битной точностью представления данных и размером вплоть до 2040x2048 пикселей
  • Предположительно 128-разрядный интерфейс памяти
  • Один чип VSA-100 поддерживает до 64 Мб локальной видеопамяти типа SDRAM/SGRAM и, возможно, DDR SDRAM/SGRAM
  • PCI 2.2 и AGP x2/4x с SBA и DME
  • Максимальное разрешение 2048x1536@85Hz

3D-часть

Поддерживается весь набор функций как у серии Voodoo3 и плюс к этому:

  • Мультитекстурирование за один проход и один такт
  • Рельефное текстурирование за один проход и один такт
  • Трилинейная фильтрация за один проход и один такт
  • Попиксельный mip-mapping и режим альфа смешивания
  • Поддержка 8-битных палетизированных текстур (гарантирует высокую совместимость с играми и не снижает общей производительности)
  • Наложение табличного и попиксельного тумана
  • Поддерживается "triangle strips and fans" (При наличии смежных треугольников не требуется передавать информацию о всех трех вершинах каждого из них, а просто передаются данные сразу о последовательность треугольников, для каждого из которых определяется лишь одна вершина. В результате снижаются требования к ширине полосы пропускания шины памяти)
  • Динамичное наложение текстур окружающей среды
  • Поддерживаются все режимы смешивания текстурных цветов описанные в DX6, DX7 и OpenGL 1.2
  • Поддерживаются технологии компрессии текстур DXTC и FXT1

Программная часть

  • Драйверы с поддержкой интерфейсов DirectX, OpenGL и Glide (обещается, что новый ICD OpenGL позволит работать с профессиональными графическими приложениями)
  • Поддерживаются ОС Windows 95, 98, NT4.0 и Windows 2000

Первое, что вызывает вопросы — это тот факт, что чип VSA-100 будет производиться по 0.25 мкм процессу, и это в первом квартале 2000 года, когда конкуренты собираются переходить на 0.18 мкм процесс. Уже сейчас S3 использует 0.18 мкм технологию при производстве своих чипов Savage2000, а GPU GeForce 256 от NVIDIA производится по 0.22 мкм технологическому процессу. Ответ на этот вопрос дал Скотт Селлерс в интервью сайту "Thresh's FiringSquad". Вот что сказал Скотт: "NVIDIA использует пятислойный металлический 0.22 мкм процесс, что обеспечивает меньшие размеры кристалла и более низкое энергопотребление. Мы используем шестислойный дизайн и улучшенный 0.25 мкм технологический процесс, что позволяет уменьшить размер кристалла по сравнению с обычным 0.25 мкм технологическим процессом и таким же количеством транзисторов, а главное в результате всего этого количество годных кристаллов на выходе существенно увеличивается". Остается принять все это на веру и успокаивать себя мыслью о том, что 3dfx знает, что делает.

Интересно, а почему в VSA-100 используется 14 млн. транзисторов? Чип Savage2000 от S3 содержит 12 млн. транзисторов. При этом Savage2000, как и VSA-100, имеет два конвейера и по два текстурных блока на каждом. Однако Savage2000 имеет интегрированный геометрический сопроцессор, а в VSA-100 его нет. Или есть, но нам об этом не говорят? Представляете ситуацию, когда в марте 2000 года 3dfx вдруг заявит, что VSA-100 имеет геометрический сопроцессор, просто раньше об этом молчали из-за недоработок в программном обеспечении. Но это все мечты, не имеющие ничего в основе.

Отметим, что в дизайне чипа VSA-100 использовались разработки, которые применялись во всех предыдущих сериях графических процессоров от 3dfx, что должно обеспечить полную совместимость со всеми существующими приложениями, оптимизированными под них. Хотя, все это, на мой взгляд, не исключает ситуации, когда придется вновь ждать патчи для игр, рассчитанных под предыдущие версии Glide, чтобы насладиться старыми играми на новой графической карте.

Один важный момент пока не имеет четкого объяснения. Это ширина полосы пропускания локальной видеопамяти и интерфейс памяти. Дело в том, что чип VSA-100 обеспечивает довольно высокие показатели fillrate, а если на карте установлено 2 или более чипов VSA-100, то величина fillrate возрастает еще больше. При этом с ростом fillrate возрастает нагрузка на шину памяти. Если пропускной способности шины локальной видеопамяти будет недостаточно, то потенциальный fillrate так и останется потенциальным. Память может просто не успеть передать необходимое количество данных, следствием чего станет падение производительности, а пользователь не получит в высоких разрешениях ожидаемых значений fps. Особую критичность вопрос о типе локальной видеопамяти становится при воспроизведении 3D-графики при 32-битной глубине представления цвета, тем более что этот режим поддерживается VSA-100. Тем не менее, использование новой версии технологии SLI позволяет довольно изящным образом решить проблему с нагрузкой на шину памяти. Шина памяти разгружается за счет того, что каждый чип VSA-100 формирует лишь часть строк, из которых состоит полный кадр. В результате каждому чипу VSA-100 вполне достаточно иметь 128-битную шину памяти.

Кроме того, пока нет никакой ясности с поддержкой памяти типа DDR SGRAM/SDRAM. На наш взгляд, ничто не мешает реализации такой поддержки, например, с прицелом на будущее. К тому же никак нельзя назвать низкой объявленную цену карт на базе VSA-100, особенно учитывая, что карты должны попасть на рынок лишь в первом квартале 2000 года. Зато если за объявленную цену будут предложены платы с локальной видеопамятью типа DDR SGRAM на борту, привлекательность новых продуктов от 3dfx существенно возрастет. С другой стороны, 3dfx может просто снизить цену, не прибегая к изменению параметров своих карт.

Отметим, что частота шины памяти вновь будет синхронизирована с частотой графического ядра, как это было у продуктов серии Voodoo3.

Как и ожидалось, чип VSA-100 поддерживает воспроизведение 3D-графики при 32-битной глубине представления цвета и при 24-битной Z-буферизации и при использовании 8-битного стенсель буфера. Та функциональная возможность, за отсутствие которой так ругали 3dfx в последний год, наконец поддерживается. Открытым остается вопрос о том, каким будет качество 3D-графики при 32-битной глубине представления цвета, т.к. это первый опыт 3dfx. В принципе, поддержка таких функций, как однопроходная трилинейная фильтрация, режимы смешивания цветов с использование альфа-канала, рельефное текстурирование и мультитекстурирование способствует обеспечению очень высокого качества графических моделей. Будем надеяться, что качество нас действительно не разочарует.

К слову, когда речь идет о работе с 32-битной глубиной представления цвета, сразу встает вопрос о том, как сильно пострадает от этого производительность видеоподсистемы. 3dfx обещает, что при работе с 32-битным цветом пользователь все равно сможет играть при средних значениях fps, соответствующих 60 кадрам в секунду. Чего, по мнению 3dfx, более чем достаточно для комфортной игры. При этом уже не важно, какая величина fps при том же разрешении и в том же приложении достигается при 16-битной глубине цвета. В принципе, все логично. Если вас устраивает скорость и качество, то и проблемы нет. Посмотрим, как все будет обстоять на самом деле.

Отметим, что VSA-100 поддерживает 32-битные текстуры с разрешением до 2040х2048 пикселей и AGP-текстурирование. Это тоже две функциональные особенности, поддержку которых так долго ждали от 3dfx. Остается проверить на практике, как все это будет работать.

Чип VSA-100 поддерживает две технологии компрессии текстур DXTC и FXT1. Первая технология является вариантом S3TC, лицензированным Microsoft и включенным в состав DirectX, вторая технология разработана самой компанией 3dfx и является полностью открытой. Интересно то, что, поскольку FXT1 поддерживается чипом VSA-100, это гарантирует, что и DXTC также будет поддерживаться аппаратно. Дело в том, что для DXTC используется один алгоритм компрессии, а для FXT1 — четыре алгоритма. FXT1 поддерживается на аппаратном уровне, и было бы логично встроить аппаратную поддержку алгоритма DXTC, тем более, что общая привлекательность продукта от этого только выигрывает. Остается надеяться, что все так и обстоит на самом деле.

Совершенно неясно обстоит дело с тем, какой именно метод или методы рельефного текстурирования поддерживаются чипом VSA-100, можно только предположить, что наверняка поддерживаются методы Embossing и Dot Product. Опять же ждем разъяснений от 3dfx.

Отдельно стоит упомянуть поддержку декодирования MPEG2 видео. К сожалению, тут нет ничего хорошего. Есть аппаратная поддержка преобразования данных из планарного вида в упакованный. Все. Больше ничего не заявлено. Нет ни слова об оверлеях и о компенсации движения. Остается надеяться, что хотя бы оверлеи поддерживаются в необходимом объеме.


Карты на базе чипа VSA-100

Компания 3dfx решила более четко разделить решения для массового рынка и профессионального рынка. Для массового рынка 3dfx предполагает выпустить целую серию карт, использующих чип VSA-100:


Voodoo4 4500 PCI/AGP:

  • Один чип VSA-100
  • RAM 32 Mb
  • Fillrate 333-367 млн. пикселей в секунду, включая режим мультитекстурирования
  • Поддержки T-Buffer нет со всеми вытекающими (нет FSAA и спец. эффектов)
  • Ориентировочная цена — $179

По сути, Voodoo4 — это карта серии Voodoo3, но с поддержкой AGP-текстурирования, больших текстур, 32-битной глубины представления цвета в 3D-графике и 24-битной Z-буферизацией и 8-битного буфера шаблонов. Если бы эта карта появилась на рынке весной 1999 года или хотя бы осенью 1999, ее перспективы были бы вполне ясны. По крайней мере, она бы конкурировала с платами на базе чипов NVIDIA RIVA TNT2 Ultra и Matrox G400 Max. Продажи ее были бы очень успешными, и свое положение на рынке 3dfx как минимум не потеряла бы. Но карты Voodoo4 должны попасть на рынок лишь в первом квартале 2000 года, и единственным их неоспоримым преимуществам над конкурентами, присутствующими на рынке уже почти год, является лишь native-поддержка API Glide. На мой взгляд, карты Voodoo4 просто опоздали на рынок. Кто будет покупать эти карты при цене в $179, мне не понятно. Если цена будет менее $100, то свою нишу эта карта захватит.

Voodoo5 5000 PCI:

  • Два чипа VSA-100
  • RAM 32 Mb
  • Fillrate 667-733 млн. пикселей в секунду, включая режим мультитекстурирования
  • Поддержки T-Buffer есть, т.е. есть аппаратный FSAA и спец. эффекты
  • Ориентировочная цена — $229

Интересно, а почему заявлен только PCI-вариант? Что мешает сделать AGP-вариант? Может быть, оптимизация под AGP какая-то особенная? Странная карта. 3dfx заявляет, что очень заботится о пользователях старых систем без AGP-порта. При этом сама же 3dfx позиционирует свои новые карты для систем на базе 700 МГц процессоров. Покажите мне систему только с PCI слотами, в которой установлен процессор Athlon или Pentium III EB.

Если не будет AGP-варианта, то, на мой взгляд, ее ниша на рынке будет очень ограниченной. К тому же цена выглядит несколько завышенной. При такой стоимости карта будет конкурировать с продуктами в ценовой категории до $200, и вряд ли кто-то захочет переплачивать за аппаратную поддержку FSAA и специальных эффектов при прочих равных функциональных возможностях и параметрах. Никто не захочет переплачивать за Voodoo5 5000, если подтвердится гипотеза о том, что использование T-Buffer (в частности, использование FSAA) существенно повлияет на общую производительность данной карты. С другой стороны, если в разрешения вплоть до 1024х768 при 32-битной глубине представления цвета пользователь при использовании T-Buffer получит среднюю величину 60 fps в своих любимых приложениях, то привлекательность карты сразу существенно возрастет. Большинство пользователей все равно играют в разрешениях вплоть до 1024х768, так что остается лишь проверить все гипотезы на практике и принять самостоятельное решение.

Voodoo5 5500 AGP:

  • Два чипа VSA-100
  • RAM 64 Mb
  • Fillrate 667-733 млн. пикселей в секунду, включая режим мультитекстурирования
  • Поддержки T-Buffer есть, т.е. есть аппаратный FSAA и спец. эффекты
  • Ориентировочная цена — $299


Это модернизированный вариант карты Voodoo5 5000: добавили памяти 32 Мб, задействовали AGP-интерфейс и подняли цену на $70. Если для нормальной работы карты в AGP-варианте требуется, чтобы для каждого чипа VSA-100 было установлено по 32 Мб памяти, то тогда непонятно, почему в PCI-версии обошлись лишь по 16 Мб локальной видеопамяти. Обратите внимание на фотографию карты Voodoo5 5500, видите в верхнем правом углу разъем белого цвета? Это стандартный разъем для электропитания внутренних периферийных устройств компьютера. Нечто похожее мы уже видели у карты Canopus Spectra 7400 на базе GPU GeForce 256. В принципе, ничего удивительного в таком решении 3dfx нет. Два графических чипа VSA-100 потребляют около 25 Ватт в сумме. Использование питания напрямую от блока питания должно обеспечить надежное снабжение энергией, а значит, и стабильную работу карты Voodoo5 5500. Скорее всего, именно эта плата будет пользоваться наибольшим спросом среди желающих получить в играх эффект FSAA и другие специальные эффекты, обеспечиваемые T-Buffer. Если 3dfx снизит цену карту, то успех у нее на рынке определенно будет.

Voodoo5 6000 AGP:

  • Четыре чипа VSA-100
  • RAM 128 Mb
  • Fillrate 1.32 — 1.47 млн. пикселей в секунду, включая режим мультитекстурирования
  • Поддержки T-Buffer есть, т.е. есть аппаратный FSAA и спец. эффекты
  • Ориентировочная цена $599


Самая мощная из объявленных карт. Имеет четыре чипа VSA-100, 128 Мб локальной видеопамяти и невероятно высокую стоимость. Судя по всему, только карта Voodoo5 6000 сможет в полной мере продемонстрировать все прелести аппаратной реализации FSAA без существенного ущерба общей производительности видеоподсистемы. Прежде всего, это станет возможно из-за использования четырех чипов VSA-100 в режиме SLI. Скорее всего, ощутить разницу между Voodoo5 5500 и Voodoo5 6000 можно будет только в высоких разрешениях, например, 3dfx обещает, что можно будет играть в разрешении 1600х1200 при 32-битной глубине представления цвета при 60 fps с использованием всех эффектов T-Buffer, включая аппаратный FSAA. Большие объемы локальной видеопамяти объясняются тем, что память распределяется между четырьмя чипами VSA-100 и не является общей. Наличие же 32 Мб доступной памяти под буферизацию и текстуры для каждого графического процессора вполне достаточно для нормального функционирования. Тем не менее, за такие немалые деньги нам предлагается карта с невероятными показателями fillrate. Фактически, если не случится чуда в виде релиза от какой-либо "темной лошадки", вроде BitBoys, то плата Voodoo5 6000 AGP станет первым акселератором с возможностью вывода более 1 Гигапикселя в секунду на экран монитора, рассчитанной на массовый рынок. Посмотрим, как все это будет выглядеть на практике.

К слову, на фотографии карты Voodoo5 6000 AGP отчетливо виден чип с маркировкой Intel. Судя по всему, это Non-transparent PCI-to-PCI bridge. Зачем нужен этот непрозрачный мост на видеокарте? Если посмотреть на описание Non-transparent PCI-to-PCI bridge, то мы узнаем, что этот мост позволяет представить некую подсистему в качестве одного единственного устройства для CPU компьютера. При этом непрозрачный мост еще и скрывает все ресурсы подсистемы от CPU. В результате за непрозрачным мостом можно расположить очень мощную графическую подсистему, состоящую из нескольких работающих параллельно чипов. Означает ли использование этого моста, что карта Voodoo5 6000 не будет поддерживать AGP-текстурирование? Вряд ли. Мне кажется, что данный непрозрачный мост применяется только для представления карты, представляющей собой целую графическую подсистему, в виде одного устройства. Было бы совершенно нелогично отказываться от использования всех возможностей AGP лишь для того, чтобы позволить работать параллельно четырем чипам VSA-100. В любом случае, будем ждать разъяснений от 3dfx.

Замечу, что есть неподтвержденная информация о том, что микросхема от Intel — это не что иное, как процессор i960, который в силу своей универсальности, может выполнять роль как AGP-to-AGP bridge, так и выступать в какой-либо другой специфической роли.

На картах серии Voodoo5 5000 не применяется аналогичный мост (по крайней мере, его не видно на иллюстрациях), видимо из-за того, что при использовании лишь двух чипов VSA-100 нет проблем с взаимодействием графической подсистемы с CPU. При этом разделить доступ к AGP-памяти можно чисто программными методами, т.е. через драйвер. По крайней мере, ATI в своей технологии MAXX использует именно программный метод разделения доступа к AGP-памяти двух графических чипов, установленных на одной карте, и никаких мостов ATI не использует.

Теперь уместно перейти к вопросу с электропитанием. Если картам серии Voodoo5 5000 с двумя чипами VSA-100 потребовалось дополнительное питание, то как обстоит дело у карты с четырьмя чипами VSA-100? Каждый чип VSA-100 потребляет от 12 до 13 Ватт электроэнергии, что примерно на 30% больше, чем потреблял чип Voodoo3. На карте Voodoo5 6000 расположено сразу четыре чипа VSA-100, а кроме того еще и 128 Мб локальной видеопамяти и дополнительный мост от Intel. В итоге 3dfx решила применить очень оригинальное решение проблемы с электропитанием. Карта Voodoo5 6000 будет иметь собственный источник электропитания под названием "Voodoo Volts" и мощностью 100 Вт. Причем это действительно отдельный источник питания, который будет подключаться непосредственно к стандартной розетке 220 или 110 Вольт, и обеспечивать работоспособность карты Voodoo5 6000. По внешнему виду этот источник питания очень похож на те, которые используются с ноутбуками. К карте Voodoo5 6000 внешний источник питания будет подключаться через разъем рядом с VGA-выходом платы. Такое решение обеспечит надежную работу карты и гарантирует работоспособность в любом компьютере.

Несмотря на огромную мощность карты и внешний источник питания, цена в $599 выглядит завышенной. Если 3dfx снизит цену хотя бы до $499, то перспективы продать некоторое количество таких карт для hardcore gamers вполне реальны.

Для профессионального применения 3dfx рекомендует использовать решения от Quantum3D под общим названием AAlchemy. AAlchemy — это новое семейство мощных систем 3D-графического моделирования в реальном времени. Каждая графическая подсистема AAlchemy состоит из одного, двух или четырех карт, на каждой из которых установлено 4 или 8 чипов VSA-100 и по 32 или 64 Мб локальной видеопамяти для каждого чипа. Графическая система AAlchemy потенциально может обеспечить величину fillrate более 3 Гигапикселей в секунду! Графические подсистемы AAlchemy рассчитаны на использование в системах серии Heavy Metal. Правда, и стоимость таких систем измеряется четырех и пятизначными суммами в долларах.

Выводы

Итак, попробуем подвести черту. Компания 3dfx анонсировала не просто новый графический чип VSA-100, она анонсировала новую идеологию создания высокопроизводительных графических решений. Сама по себе идея параллельной обработки данных очень интересная и перспективная. Пока сложно прогнозировать, как отнесется рынок к новым решениям от 3dfx. Особенно в свете того, что есть ряд неясных моментов и вопросов. Не вызывает споров только одно: пока мы не увидим все обещанное в действии, делать какие-либо выводы преждевременно.

Фактически в первом квартале 2000 года пользователям придется сделать выбор между T-Buffer (включая эффект FSAA) и аппаратным расчетом T&L. Очень сильно на принятие решения повлияет ситуация с поддержкой в приложениях геометрических сопроцессоров. При этом нужно понимать один нюанс. Недостаточно простого заявления о том, что такая-то игра рассчитана на аппаратную реализацию вычислений T&L. Только в том случае, если эта игра при использовании графической карты с геометрическим сопроцессором будет выглядеть на экране монитора пользователя однозначно лучше, чем при использовании карт серии Voodoo5, пользователь выберет продукты конкурентов, а не 3dfx. Если окажется, что большинство игр с заявленной поддержкой аппаратного расчета T&L не используют в полной мере этих аппаратных возможностей графических карт, читай: используют в сцене точно такое же количество полигонов, как при запуске на системе без поддержки геометрического сопроцессора, тогда никакого смысла покупать карты с геометрическими сопроцессорами не будет. Действительно, зачем покупать карту с геометрическим сопроцессором, если уже осенью 2000 года нам предложат новое поколение подобных карт. В таком случае на передний план действительно выйдут карты серии Voodoo5, так как они предлагают пользователю возможности, которые он сможет использовать немедленно, причем как в новых, так и в старых играх. Речь идет о T-Buffer, точнее, о главном его эффекте — full scene anti-aliasing (FSAA). При этом одним эффектом FSAA все не исчерпывается. T-Buffer позволяет также на аппаратном уровне реализовать массу специальных эффектов, которые широко используются в киноиндустрии. Применение этих эффектов требует поддержки в интерфейсах, в то время как аппаратная реализация FSAA совершенно прозрачна для приложений и API. В общем, нас ждет интересное время, когда придется делать выбор и расплачиваться за него из собственного кармана.

К слову, если бы 3dfx анонсировала поддержку в своих новых продуктах аппаратного расчета T&L ситуация с поддержкой геометрических сопроцессоров в приложениях могла бы существенно изменится. Причем изменится ситуация могла бы в сторону ускорения поддержки геометрических сопроцессоров. Пока же остается надеяться на то, что у NVIDIA и S3 хватит сил и красноречия убеждать разработчиков и издателей игр использовать возможности некоторых новых акселераторов по аппаратному расчету T&L.

Что касается расплаты, то еще раз подчеркну свою мысль о том, что пока заявленные цены на карты Voodoo5 выглядят несколько завышенными и немного пугают. С другой стороны, вспомните цены на карты Obsidian2 X-24 от Quantum3D, на которых использовалось два чипсета Voodoo2 в режиме SLI. Эта карта стоила $650, а ведь на ней было всего 24 Мб локальной видеопамяти и всего два чипсета Voodoo2. Кстати, эти карты неплохо покупали даже в Москве, в то время как две карты на базе Voodoo2 обходились тогда в $480, т.е. по $240 каждая. Так что, если карты сери Voodoo5 будет стоить своих денег, их будут покупать. Тем более, что никто не мешает 3dfx снизить цену.

Пока нам остается искать ответы на вопросы, копить деньги и ждать появления на рынке первых реальных карт на базе VSA-100.

[ Технология VSA (Voodoo Scalable Architecture): ответы на вопросы ]





Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.