Технология MAXX

Все хотят иметь самую производительную видеокарту. Существует два традиционных метода получить желаемое. Самый простой и действительно традиционный способ — это просто пойти и купить новейшую видеокарту с самым мощным 3D-акселератором на борту. Метод, надо сказать, не совсем оптимальный, особенно для нашего кошелька. При современных темпах развития технологий такую операцию придется проделывать раз в 6-8 месяцев. Причем это удовольствие совсем не из дешевых, особенно в российских условиях. Выложить от 200 до 300 настоящих американских долларов за плату, которая может устареть уже через 3-6 месяцев, может позволить себе не каждый. Второй метод получил от меня ярлык "традиционный" в силу того, что он реально использовался в жизни, по крайней мере, частью пользователей, а все остальные точно знают, что это такое: я имею в виду технологию SLI от 3dfx. Почувствовали магию этой аббревиатуры? Вспомнили прошлое или похлопали по любимому корпусу типа minitower? Да, даже истинные ненавистники
3dfx знают, что такое режим SLI и какое отношение все это имеет к классическим картам на базе чипсета Voodoo2.

Если говорить кратко, то технология SLI (Scan Line Interleave) позволяет установить параллельно две карты на чипсете Voodoo2 (или просто два чипсета Voodoo2 на одной PCB). Каждая из карт на базе Voodoo2 рассчитывает либо четные, либо нечетные линии кадра, выводимого на экран монитора, в результате чего производительность видеоподсистемы увеличивается более, чем в полтора раза, и появляется возможность играть в разрешении 1024х768 с z-буфером.

У технологии SLI есть недостатки:

  • Требуется аппаратная поддержка этой технологии в графических чипсетах
  • Нет поддержки интерфейса AGP, по крайней мере, в текущей реализации
  • На синхронизацию выводимых разными чипсетами строк одного кадра требуется дополнительное время
  • В режиме SLI чипсеты рассчитывают только текущий кадр и не могут работать на будущее, рассчитывая следующий кадр
  • Возможна несогласованная работа DAC, т.к. не предусмотрена их калибровка

На самом деле, правильнее назвать второй традиционный метод модернизации все-таки не именем SLI, а методом использования двух или более одинаковых (или разных) графических чипсетов совместно. Ниже я поясню это несколько туманное высказывание.

Лавры 3dfx, предоставившей пользователям возможность подобной модернизации видеоподсистемы, не давали покоя конкурентами. Первую публичную попытку сделать нечто в том же духе предприняла компания Metabyte (в лице подразделения Wicked 3D), создав технологию PGC (Parallel Graphics Configuration). Вкратце суть технологии PGC в том, что в системе устанавливаются две разные или одинаковые видеокарты, каждая из которых формирует и отображает лишь часть конечного изображения, точнее, одна карта формирует верхнюю половину кадра, а вторая — нижнюю. В результате, появлялась возможность установить в пару к вашему AGP-видеоакселератору еще и PCI-ускоритель, и в результате получить прирост производительности.

Решение PGC имеет ряд недостатков:

  • Из-за того, что используются карты с разными интерфейсами (AGP и PCI), возникает разбалансировка их совместной работы, т.к. пропускная способность шин различна. Например, если используется пара из PCI и AGP, то нагрузка, скорее, всего не будет распределяться равномерно 50 на 50, в итоге AGP-карта будет постоянно ждать момента, когда PCI-карта закончит работу по выводу своей половины кадра на мониторе. Конечно, можно использовать две PCI карты, но тут уже другие проблемы. Для того, чтобы использовать возможности современных графических акселераторов по полной программе, нужно использовать именно AGP-интерфейс. К сожалению, AGP-порт предусмотрен в единственном экземпляре. Карты с PCI-интерфейсом сейчас не часто встретишь, и спрос на них существенно ниже среди продвинутых пользователей, а ведь именно они тратят деньги на самые мощные решения. В результате, связка "AGP-карта + PCI-карта" становится самым распространенным решением при использовании PGC. Но это и минус этого решения.
  • Из-за того, что одна из карт имеет ограничения в виде отсутствия AGP-текстурирования, страдает качество части конечного изображения, т.к. из-за нехватки данных снижается детализация.
  • Оба графических процессора работают только по расчету текущего кадра и не могут работать на будущее, заранее рассчитывая следующий кадр.
  • Возможно возникновение разрывов (image tearing) между частями изображения.
  • Возможна ситуация несогласованной работы DAC у разных карт, хотя Metabyte потратили много сил на реализацию такого механизма.

Отмечу, что технология PGC, при всей своей привлекательности, так и не попала на рынок, даже несмотря на то, что компания Alienware лицензировала ее.

Компания ATI пошла своим путем, двигаясь одновременно по двум направлениям. Что касается первого метода повышения производительности, то тут все просто и понятно: это выпуск новых графических чипов. Недавно был анонсирован чип Rage128 Pro, который превосходит по многим параметрам, а главное — по производительности, своих предшественников. В качестве решения по второму методу была предложена технология с кодовым именем Aurora, которая впоследствии получила имя MAXX (Multiple ASIC Technology). Напомню, что ASIC
расшифровывается как Application Specific Integrated Circuit, или, говоря по-русски, микросхема специального назначения.

Можно найти массу поводов поиздеваться над фантазией маркетологов из ATI, которые выбрали имя MAXX для новой технологии. Сразу на ум приходит пара аналогий в виде стиральной машины от BOSCH и журнала непристойного содержания. На мой взгляд, это как раз тот случай, когда кодовое имя было гораздо интереснее того, которое было в итоге выбрано для выхода на рынок. Однако, мы тут говорим не об именах и не о способах рекламы, а о технологии как таковой. Итак, что же собой представляет технология MAXX?

Прежде всего, технология MAXX — это чисто программное решение, которое позволяет задействовать два графических процессора для выполнения общей работы. Фактически, воплощается в жизнь идея параллельной обработки данных. Каждый из графических процессоров полностью формирует один кадр, а затем готовые кадры поочередно выводятся на монитор. В принципе, вероятно, технология MAXX может поддерживать одновременную работу более чем двух графических процессоров, однако вряд ли в ближайшее время будет целесообразно реализовывать такие конфигурации на практике. Техника, которая позволяет двум графическим чипам, установленным на одной карте, поочередно выводить на экран готовые кадры изображения, называется Alternate Frame Rendering (AFR).

Мы дали довольно упрощенное объяснение технологии MAXX, теперь поговорим об этом интересном решении более подробно, выбрав в качестве примера первую карту, которая реализует эту технологию — ATI Rage Fury MAXX

По сути, карта Rage Fury MAXX представляет собой две платы Rage Fury Pro, размещенные на одной PCB.

    
Иллюстрации предоставлены сайтом Thresh's FiringSquad

Как видно из иллюстрации, на карте размещены два чипа Rage 128 Pro. Далее, на плате установлено 64 Мб локальной видео памяти, плата имеет AGP x2/x4 форм-фактор и стандартный VGA выход. На самом деле, эти 64 Мб локальной видеопамяти типа SDRAM представляют собой два кадровых буфера по 32 Мб для каждого из двух чипов Rage128 Pro. Разумеется, локальная видеопамять используется не только для кадрового буфера. Правильнее сказать, что лишь часть локальной видеопамяти используется под кадровый буфер (с двойной или тройной буферизацией). Основная же часть локальной видеопамяти используется для хранения текстур.

Тут есть интересный вопрос. Так как фактически карта Rage Fury MAXX — это две полноценные карты Rage Fury Pro на одной PCB, то возможно ли развести второй разъем VGA и получить поддержку двух мониторов, правда, исходя из особенностей технологии MAXX, поддерживаться два монитора будут только в режиме 2D-графики. По крайне мере, карты Rage Fury MAXX с двумя VGA-выходами существуют, и, по слухам, компания ATI планирует ввести поддержку двух мониторов в будущем. Остается вопрос, как все это будет работать, в каких режимах и будет ли работать в принципе. Будем надеяться, что мы получим ответы.


Иллюстрация предоставлена журналом Maximum PC


Теперь сделаем небольшое отступление от сути статьи. Обратите внимание на два проводка, которые напаяны на PCB над VGA разъемом. В принципе, наличие таких проводов у не серийной карты, а у т.н. "семпла" не является чем-то из ряда вон выходящим. На то это и семпл, чтобы отработать разводку и работоспособность карты. Однако, судя по всему, именно из-за этих проводов нам не разрешили не то что протестировать карту Rage Fury MAXX, но даже нормально сфотографировать ее. Ну что же, понять действия представителей ATI можно, только вот непонятно, почему ATI относится к различным представителям прессы по-разному? На практике выяснилось, что есть представители прессы "более симпатичные" ATI, чем все остальные. Нельзя тестировать и фотографировать карту Rage Fury MAXX? Нет проблем, только соблюдайте правила игры. Если нельзя, то нельзя всем без исключения. На практике, нельзя оказалось только российской прессе. Зато представителям некоторых зарубежных сайтов, оказывается, можно. Это мы и называем "грамотной маркетинговой политикой". Действительно, зачем уделять России какое-то особое внимание, если объемы продаж продуктов ATI тут очень маленькие? Если Российский рынок не интересен для ATI, то все понятно. Если наш рынок представляет интерес, то тогда ATI выбрала абсолютно верную маркетинговую стратегию. Нужно не давать информацию российской прессе, не предоставлять образцы продуктов для тестирования, много всего обещать, выполнять как можно меньше из обещанного, и тогда скоро у всех российских пользователей будут установлены в компьютерах продукты от ATI. Можно только посочувствовать конкурентам ATI, которые выбрали совершенно иную стратегию и скоро потеряют свои позиции в России.

Хватит сарказма, вернемся к теме нашей статьи. Я не буду приводить спецификацию чипа Rage 128 Pro, желающие могут просто почитать обзор карты Rage Fury Pro, где приведены все параметры и масса цифр. Мы же займемся рассмотрением вопроса о том, как работает технология MAXX на практике.

2D-графика

В этом режиме работает только один чип Rage128 Pro, второй бездействует. Никаких отличий в этом случае от стандартной карты Rage Fury Pro нет. Говорить, что поддержка работы только одного графического процессора в режиме 2D-графики — это минус или ограничение, мы не считаем правильным. Одного чипа Rage 128 Pro для работы в 2D-графике вполне достаточно. Впрочем, ATI позиционирует свою карту Rage Fury MAXX именно для продвинутых любителей поиграть. Так что, если вы купили карту для игр, то для этих целей ее и используйте.

ATI рекомендует покупать карту Rage Fury MAXX тем любителям игр,
которые имеют мониторы с большой диагональю и играют в разрешениях 1024х768 и выше. И действительно, если посмотреть на обзоры с результатами тестирования разных видео акселераторов, нетрудно заметить, что в высоких разрешениях узким местом, влияющим на снижение производительности, является ширина полосы пропускания локальной видеопамяти. Даже в режиме 16-битного представления глубины цвета объемы данных, которые необходимо передать через шину локальной видеопамяти, просто огромны. Итак, посмотрим, как работает Rage Fury MAXX в 3D графике.

3D-графика

Фактически, каждый из чипов Rage 128 Pro, установленных на карте Rage Fury MAXX занимается своей непосредственной работой, а именно: формирует пиксели, из которых состоит конечное изображение, отображаемое на экране монитора. Технология MAXX позволяет каждому из графических чипов, используемых в паре, полностью задействовать механизм установки вершин полигонов в пространстве (triangle setup engine) и текстурные кэши в двух независимых кадровых буферах. Это способствует оптимальной работе карты при формировании изображений на экране монитора.

Отметим одну важную деталь. Применение технологии MAXX в текущей реализации (Rage Fury MAXX) позволяет решить проблему с нехваткой пропускной способности шины локальной видеопамяти, и как следствие, нехватки fillrate. Однако, эта проблема возникает только в высоких разрешениях. Это означает, что при работе в разрешениях ниже 1024х768 технология MAXX не даст никакого выигрыша в производительности.

У каждого чипа Rage 128 Pro есть своей кадровый буфер, в котором и происходит рендеринг каждого кадра изображения. При этом каждый из чипов Rage 128 Pro имеет собственный интегрированный RAMDAC. Программное обеспечение, а точнее, управляющий драйвер определяет, из какого кадрового буфера будет выводиться готовый кадр на экран монитора. При этом кадры из одного буфера могут выводиться подряд несколько штук (максимум три), а лишь затем происходит переключение на другой кадровый буфер.

Заметим, что, в силу необходимости переключаться между разными кадровыми буферами, возникают неизбежные задержки по времени, вследствие чего возможно возникновение лага. Лаг — это временная задержка между действием пользователя и реакции графического процессора на эти действия. В случае с Rage Fury MAXX между действием пользователя и реакцией на это действие может пройти время, необходимое на завершение вывода полного кадра и следующего за ним. Это в лучшем случае. Возможна ситуация, когда задержка может составлять время на вывод четырех и даже шести кадров (при тройной буферизации). Дело в том, что когда выводится уже готовый кадр на экран монитора, следующий за ним уже либо готов, либо готовится. Соответственно, реакция на действия пользователя может произойти только во вновь формируемом кадре, т.е. третьем по счету. Так ли все обстоит на самом деле или нет, мы надеемся проверить на практике.

Кроме переключения между кадровыми буферами и синхронизацией работы RAMDAC, управляющий драйвер осуществляет и управление шиной AGP, чтобы соответствующий чип Rage 128 Pro смог получить необходимые данные из AGP памяти. Понятно, что на необходимые переключения требуется время, т.е. возникают задержки. Поэтому не будет наблюдаться удвоения производительности. Тем не менее, ATI предполагает, что производительность Rage Fury MAXX будет в 1.5-1.8 раз больше, чем производительность обычной карты на базе чипа Rage 128 Pro.

Если исходить из того, что тактовая частота чипа Rage 128 Pro равна 140 Мгц, то в режиме мультитекстурирования карта Rage Fury MAXX будет способна формировать до 210-252 млн. пикселей в секунду. Несмотря на то, что игр без поддержки режима мультитекстурирования сегодня почти не производят, в маркетинговых целях все разработчики графических чипов указывают потенциальную производительность своих продуктов в режиме без мультитекстурирования. Тогда потенциальная производительность Rage Fury MAXX будет на уровне 420-504 млн. пикселей в секунду, а в рекламе указывается значение в 500 млн. пикселей в секунду. Все сходится. Упрекнуть ATI в использовании именно таких цифр нельзя, т.к. именно таким образом поступают абсолютно все. Зато у нас всегда будет повод, о чем написать.

Отметим, что мы использовали частотные характеристики реальных чипов Rage 128 Pro и тактовую частоту работы шины локальной видеопамяти, исходя из фактических параметров той платы Rage Fury Pro, которая побывала у нас на испытаниях. Карты Rage Fury MAXX, которые попали на испытания нашим зарубежным коллегам, имеют несколько меньшие тактовые частоты: 125 МГц у графического ядра и 143 МГц у шины локальной памяти. Мы не знаем, будут ли такие же частоты у тех плат Rage Fury MAXX, которые поступят в продажу. Единственной причиной того, что ATI снизит частоты, могут быть только технические сложности, однако мы не видим пока никаких оснований для подобного решения. Пока мы придерживаемся мнения, что в финальной версии карты Rage Fury MAXX будут иметь частоты, не уступающие тем, которые имеют карты Rage Fury Pro.

Ну, хорошо, будем считать, что в режиме мультитекстурирования карта Rage Fury MAXX имеет потенциальную величину fillrate 250 млн. пикселей в секунду. Много это или мало? Посмотрим на конкурентов. GPU GeForce 256 от NVIDIA в режиме мультитекстурирования обладает потенциальной величиной fillrate, равной 240 млн. пикселей в секунду (при частоте графического ядра в 120 МГц), другой конкурент — чип Savage2000 от S3 — обладает потенциальной величиной fillrate в 250 млн. пикселей в секунду (при частоте ядра в 125 Мгц). Нетрудно заметить, что Rage Fury MAXX по величине fillrate ничуть не уступает конкурентам. Но есть еще один важный момент. Чипы GeForce 256 и Savage2000 используют при работе только одну имеющуюся шину локальной видеопамяти, ширина которой у обоих GPU 128 бит при использовании памяти типа SDR SDRAM. В случае с Rage Fury MAXX мы имеем несколько иную ситуацию.

Фактически, на плате Rage Fury MAXX две шины локальной видеопамяти, каждая шириной в 128 бит и пропускной способностью, равной 2.5 Гб в секунду (при частоте в 159 МГц), т.е. с суммарной пиковой пропускной способностью до 5 Гб в секунду. Замечу, что сама ATI называет величину суммарной пропускной способности шины памяти 4 Гб в секунду: видимо, подсчет велся исходя из частоты шины памяти в 143 МГц. Попробуем показать все это на цифрах.

Предположим, мы хотим играть в разрешении 1600х1200 при 32-битной глубине представления цвета, с 32-битной z-буферизацией, в режиме мультитекстурирования (при наложении двух текстур с 32-битной точностью каждая), средней величине overdraw, равной 4, частоте смены кадров, равной 30 fps. В итоге получаем, что для формирования каждого пикселя нам нужно передать по локальной шине памяти 16 байт данных. Проведем несложные вычисления. При таком разрешении и частоте смены кадров в наших условиях графический процессор должен сформировать 1600х1200х4х30=230400000 пикселей в секунду. Для этого по локальной шине памяти нужно передать 230400000х16=3686400000 или около 3.7 Гб в секунду.

При этом каждый из чипов Rage 128 Pro должен создать лишь половину требуемых кадров; в нашем случае достаточно, чтобы каждый чип сформировал лишь 15 кадров. Значит, нагрузка на шины памяти, а их у нас две по 128 бит, тоже будет вполовину требуемой. В итоге 3.7 Гб данных в секунду нужно прокачать не по одной шине, а по двум, т.е. по 1.85 Гб в секунду по каждой шине. Передать такой объем данных по силам каждой 128 бит шине у обоих чипов Rage 128 Pro. Вот это ключевой момент, в результате которого и получается выигрыш в производительности над конкурентами.

Конечно, наши подсчеты несколько грубы в виду того, что мы не учитываем временные задержки для переключения между RAMDAC и при разделении доступа к шине AGP, но общая картина вполне различима для того, чтобы понять, как работает технология MAXX и за счет чего происходит общее увеличение производительности.

К несомненному плюсу технологии MAXX можно отнести полную прозрачность, как для приложений, так и для интерфейсов Direct3D и OpenGL. На практике это означает, что пользователю не нужно задумываться о том, поддерживается ли эта технология игрой или API. Решением всех этих проблем занимается программное обеспечение, по сути, сама технология MAXX.

В силу особенности работы технологии MAXX локальная видео
память разделена на две части, которые фактически никак не связаны. Понятно, что если бы была возможность использовать всю доступную локальную память в виде единого хранилища текстур, это могло быть востребовано. Нельзя сказать, что это полноценный минус, т.к. ограничение накладывается самой технологией. С другой стороны, для таких ситуаций, когда имеются ограничения по размерам текстурной памяти, и была создана технология компрессии текстур. Так что, если не хватает объемов доступной памяти, — используйте компрессию текстур. Правда, с этим вопросом не все ясно. В спецификациях чипов Rage 128 Pro упоминается поддержка DXTC, на практике при текущих версиях драйверов этой поддержки на аппаратном уровне нет.

К сожалению, у нас пока нет возможности провести самостоятельные испытания карты Rage Fury MAXX, однако наш английский друг Alex "Sharky" Ross (www.sharkyextreme.com) уже провел тестирование, и его результаты подтверждают наши теоретические выкладки.

Видно, что, благодаря раздельным кадровым буферам и раздельным шинам локальной видеопамяти, карте Rage Fury MAXX удалось показать высокую производительность в таком большом разрешении при экстремальной
нагрузке на шину памяти.

Отметим также и тот факт, что чипы Rage 128 Pro, которые используются в паре на карте Rage Fury MAXX, специально оптимизированы для работы в режиме 32-битной глубины представления цвета. Подтверждения этому факту можно найти в нашем обзоре карты Rage Fury Pro.

Итак, можно констатировать, что ATI нашла хороший способ достижения высоких показателей fillrate. При этом несомненным плюсом технологии MAXX является ее универсальность, т.к. это чисто программное решение. Не важно, какие два графических чипа будут установлены на одной карте, технология будет работать, а пользователь увидит реальный прирост производительности. Важно отметить и тот факт, что прирост производительности будет заметен во всех уже существующих приложениях, причем для этого пользователю нужно будет лишь купить карту Rage Fury MAXX, установить ее в компьютер и запускать игры в разрешениях 1024х768 и выше. Если у вас монитор с маленькой диагональю, и вы играете в разрешении 800х600, то нет никакого смысла покупать Rage Fury MAXX. Вы не получите никаких преимуществ.

Подчеркну еще раз, если у вас монитор с диагональю 15" и менее, то карта Rage Fury MAXX вам совершенно не нужна. Далее, с точки зрения fillrate, карта Rage Fury MAXX выигрывает у карт на базе GPU GeForce 256 с локальной памятью тира SDR SDRAM на борту. Но GeForce 256 имеет интегрированный геометрический сопроцессор, а Rage 128 Pro не имеет поддержки аппаратного расчета T&L. Ну что же, тут есть о чем поговорить. Ожидается, что цена карты Rage Fury MAXX с 64 Мб локальной видеопамяти на борту будет в районе $250. Это примерно на уровне карт c чипом NVIDIA GeForce 256 и с 32 Мб локальной видеопамяти типа SDR SDRAM на борту. Как же выбрать между этими двумя картами?

На сегодняшний день реально не существует игр, которые могли бы в
полной мере использовать аппаратный расчет трансформаций и освещения. Да, нам обещают, что эти игры появятся уже к концу декабря. Предположим, что это правда. В любом случае, уже весной игр, рассчитанных на аппаратную поддержку T&L будет более 30. В итоге, тот, кто купит или уже купил карту на базе GPU GeForce 256 с памятью типа SDR SDRAM, получит преимущества над обладателями карт Rage Fury MAXX. Карты Rage Fury MAXX должны появиться на рынке лишь в декабре. Если принять во внимание тот факт, что ATI, возможно, не удастся создать в срок нормальные драйверы (а такое уже случалось, и не раз), выход карт Rage Fury MAXX может отложиться до января следующего года или даже до весны. Примерно в это же время на рынке должны появится карты на базе GeForce 256 с локальной памятью типа DDR SGRAM на борту, а также уже будут продаваться карты на базе Savage2000. Заметим, что цена на карты с GPU GeForce 256 и локальной видеопамятью типа DDR SGRAM на борту будут предлагаться по цене от $250 до $300 за 32 Мб версию (возможно, и дешевле). Сразу возникает вопрос, кто предпочтет купить карту Rage Fury MAXX, единственным несомненным преимуществом которой являются высокие показатели fillrate? Сама ATI называет срок жизни карты Rage Fury MAXX — 8-12 месяцев, хотя, мне кажется, более реальным сроком являются 6-8 месяцев.

Если бы Rage Fury MAXX появилась на рынке весной этого года, тогда — да, карта бы имела несомненный успех на рынке, так как напрямую конкурировала бы с платами на базе TNT2 Ultra. Сейчас складывается ситуация, когда карта Rage Fury MAXX будет конкурировать с графическими акселераторами, обладающими не только высокими показателями fillrate, но и такой особенностью, как интегрированный геометрический сопроцессор, чего нет у чипов Rage 128 Pro. Примерно за одинаковые деньги нам предлагают выбирать между картами с геометрическими сопроцессорами и без. Лично я не вижу никакого смысла покупать карту Rage Fury MAXX , по крайней мере, за сумму в $250. При всем моем негативном отношении к картам на базе GeForce 256 с памятью типа SDR SDRAM на борту, при необходимости выбрать что-то одно я предпочту именно карты с GeForce 256. Если вместо карты Rage Fury MAXX за те же деньги купите карту на базе GeForce 256, то вы может быть уверены, что эта карта прослужит вам не менее года, пока совсем не устареет морально.

Можно в очередной раз констатировать, что ATI опоздала к разделу пирога. Если ATI выберет очень агрессивную ценовую политику, только тогда появится шанс, что карты Rage Fury MAXX захватят свою нишу на рынке, по крайней мере, до того момента, когда количество игр, оптимизированных под аппаратный расчет T&L, не превысит критическую массу, и наличие геометрического сопроцессора на борту станет "must have". По самым пессимистическим прогнозам, это может случиться уже к концу 2000 года, а по более оптимистическим — уже к середине 2000 года. Причем прогнозы эти строят сами разработчики игр, а, значит, у них есть основания для таких оценок.

К слову, в сети есть мнение, что отсутствие аппаратной поддержки расчета T&L у чипов Rage 128 Pro, а значит, и у карт Rage Fury MAXX, может быть компенсировано использованием мощного CPU. Я не согласен с такой идеей. Даже не буду долго распространяться на эту тему, просто не хочется повторяться. Вкратце, наличие геометрического сопроцессора не только разгружает CPU системы, но также разгружает шину системной памяти. Если игра оптимизирована на аппаратную поддержку T&L, то можно заявить с большой уверенностью, что CPU не придется прохлаждаться. Разработчики игр всегда найдут работу для центрального процессора. Так что, если запустить игру, рассчитанную на аппаратную поддержку T&L на системе
с картой Rage Fury MAXX в расчете на то, что всю работу по преобразованию координат и установке освещения возьмет на себя мощный CPU, то, будьте уверены, начнет тормозить AI, и не будет поддержки реальной физики моделируемого мира, например. Кстати, мощный CPU все равно потребуется, если вы решите использовать карту Rage Fury MAXX. Дело в том, что производительность чипа Rage 128 Pro сильно зависит от вычислительной мощности CPU системы, и наши тесты карты Rage Fury Pro это подтверждают.

И еще одна мысль по теме. ATI любит упирать на то, что ее чипы поддерживают аппаратный расчет компенсации движения (motion compensation) и обратное преобразование Фурье (iDCT). Это обеспечивает высокое качество изображения при просмотре DVD-видео, и при этом CPU загружается менее, чем на 50%. Мое мнение таково: для просмотра DVD-видео совсем не обязательно покупать Rage Fury MAXX, сгодится обычная карта Rage Fury Pro. Так что, как аргумент к покупке именно MAXX это не подходит. К слову, тот же плеер Cinemaster'99, но в режиме полного программного декодирования DVD-видео, т.е. полностью за счет CPU, на системе с процессором Celeron 366 MHz, обеспечивает идеальное воспроизведение DVD-видео, ничуть ни хуже воспроизведения такого же MPEG2 видео с аппаратной поддержкой (полной или частичной). Разница только в проценте загрузки CPU, но, с другой стороны, трудно представить ситуацию, когда вы смотрите DVD-фильм и играете в Quake3 по сети.

Подведем итоги

Технология MAXX, безусловно, очень интересна в качестве решения по увеличению производительности. Вся прелесть MAXX в аппаратной независимости, т.е. можно производить карты с любыми двумя графическими процессорами на борту, каждый из которых занимается формированием полного кадра изображения. Готовые кадры поочередно выводятся на экран монитора. Отметим, что каждый графический процессор может подряд выводить не более трех кадров (в случае тройной буферизации), зато в то время, пока один чип выводит готовые кадры, второй в это время создает следующие. Все управляется полностью программным путем. В принципе, нет препятствий на пути использования более двух графических процессоров на одной плате в рамках технологии MAXX, однако это нецелесообразно по нескольким причинам. Во-первых, максимальный прирост производительности достигается только при использовании двух чипов. Третий чип усложнит и удорожит систему, однако прирост производительности будет неоправданно низок. Во-вторых, могут возникнуть серьезные проблемы с электропитанием и тепловыделением.

Есть ли у MAXX будущее? Вероятно, есть. Очень интересно было бы посмотреть на работы в паре двух графических чипов с интегрированными геометрическими сопроцессорами. Кроме того, не исключено, что ATI будет развивать технологию MAXX и дальше. В качестве возможного пути развития можно выбрать идеи, заложенные в технологии T-Buffer. Фактически, технология MAXX позволяет формировать сцены в разных кадровых буферах, осталось реализовать механизм комбинирования содержимого разных кадровых буферов и вывод получаемого результата на экран монитора. Вот и путь к наложению специальных эффектов. Но это всего лишь наши предположения.

Осталось подождать появления реальных карт Rage Fury MAXX на рынке и посмотреть на них в деле, обратив пристальное внимание на качество драйверов. Только после этого можно будет реально оценить рыночные перспективы Rage Fury MAXX и узнать, своевременно ли появился этот продукт или все же опоздал.

Если вы истинный поклонник марки ATI и обладаете монитором с большой диагональю, то вы, конечно же, можете купить карту Rage Fury MAXX. Скорее всего, вы будете довольны покупкой, ее скоростными показателями и качеством изображения в 32-битном цвете. Однако будьте готовы к тому, что карта может устареть уже через 6 месяцев, когда новые игры потребуют наличие на борту вашего видеоакселератора геометрического сопроцессора. Если вы твердо решили купить новый видеоакселератор и не знаете, что выбрать, то можно дать еще несколько рекомендаций.

Во-первых, стоит подождать появления карт на Savage2000 от S3 и посмотреть на них в деле.

Во-вторых, можно дождаться появления на рынке карт на базе GeForce 256 с памятью типа DDR SGRAM на борту, что должно произойти также в декабре, и посмотреть на то, какие установятся на них цены. Если такая карта будет стоить на уровне Rage Fury MAXX, то предпочтительнее будет купить все-таки карту на базе GeForce 256.

Наконец, можно просто плюнуть на все и подождать появления на рынке новых решений от 3dfx, ATI, Matrox или NVIDIA.

Чего можно ожидать от 3dfx, мы приблизительно знаем, но, в любом случае, 15 ноября мы узнаем почти все подробности. От NVIDIA весной 2000 года мы, скорее всего, получим новый вариант GeForce 256, выполненный по 0.18 мкм технологическому процессу и с увеличенной производительностью. Готовит ли для нас что-то новое ATI? Да, готовит, причем давно. Это чип с кодовым именем Rage5. Можно предположить, что он будет содержать интегрированный геометрический сопроцессор. Но главный вопрос, который определит судьбу нового детища ATI, это опять же своевременность. Если ATI не хочет потерять свои позиции на рынке, ей придется приложить максимум усилий, чтобы выпустить графический акселератор нового поколения не позднее весны 2000, чтобы этот новый продукт изначально обладал качественными драйверами и по своим параметрам, как минимум, не уступал конкурентам. Так или иначе, время покажет, умеет ли ATI учиться на своих и чужих ошибках.

Использованы материалы компании ATI Technologies, Inc.




11 ноября 1999 Г.

Технология MAXX от ATI

Технология MAXX

Все хотят иметь самую производительную видеокарту. Существует два традиционных метода получить желаемое. Самый простой и действительно традиционный способ — это просто пойти и купить новейшую видеокарту с самым мощным 3D-акселератором на борту. Метод, надо сказать, не совсем оптимальный, особенно для нашего кошелька. При современных темпах развития технологий такую операцию придется проделывать раз в 6-8 месяцев. Причем это удовольствие совсем не из дешевых, особенно в российских условиях. Выложить от 200 до 300 настоящих американских долларов за плату, которая может устареть уже через 3-6 месяцев, может позволить себе не каждый. Второй метод получил от меня ярлык "традиционный" в силу того, что он реально использовался в жизни, по крайней мере, частью пользователей, а все остальные точно знают, что это такое: я имею в виду технологию SLI от 3dfx. Почувствовали магию этой аббревиатуры? Вспомнили прошлое или похлопали по любимому корпусу типа minitower? Да, даже истинные ненавистники
3dfx знают, что такое режим SLI и какое отношение все это имеет к классическим картам на базе чипсета Voodoo2.

Если говорить кратко, то технология SLI (Scan Line Interleave) позволяет установить параллельно две карты на чипсете Voodoo2 (или просто два чипсета Voodoo2 на одной PCB). Каждая из карт на базе Voodoo2 рассчитывает либо четные, либо нечетные линии кадра, выводимого на экран монитора, в результате чего производительность видеоподсистемы увеличивается более, чем в полтора раза, и появляется возможность играть в разрешении 1024х768 с z-буфером.

У технологии SLI есть недостатки:

  • Требуется аппаратная поддержка этой технологии в графических чипсетах
  • Нет поддержки интерфейса AGP, по крайней мере, в текущей реализации
  • На синхронизацию выводимых разными чипсетами строк одного кадра требуется дополнительное время
  • В режиме SLI чипсеты рассчитывают только текущий кадр и не могут работать на будущее, рассчитывая следующий кадр
  • Возможна несогласованная работа DAC, т.к. не предусмотрена их калибровка

На самом деле, правильнее назвать второй традиционный метод модернизации все-таки не именем SLI, а методом использования двух или более одинаковых (или разных) графических чипсетов совместно. Ниже я поясню это несколько туманное высказывание.

Лавры 3dfx, предоставившей пользователям возможность подобной модернизации видеоподсистемы, не давали покоя конкурентами. Первую публичную попытку сделать нечто в том же духе предприняла компания Metabyte (в лице подразделения Wicked 3D), создав технологию PGC (Parallel Graphics Configuration). Вкратце суть технологии PGC в том, что в системе устанавливаются две разные или одинаковые видеокарты, каждая из которых формирует и отображает лишь часть конечного изображения, точнее, одна карта формирует верхнюю половину кадра, а вторая — нижнюю. В результате, появлялась возможность установить в пару к вашему AGP-видеоакселератору еще и PCI-ускоритель, и в результате получить прирост производительности.

Решение PGC имеет ряд недостатков:

  • Из-за того, что используются карты с разными интерфейсами (AGP и PCI), возникает разбалансировка их совместной работы, т.к. пропускная способность шин различна. Например, если используется пара из PCI и AGP, то нагрузка, скорее, всего не будет распределяться равномерно 50 на 50, в итоге AGP-карта будет постоянно ждать момента, когда PCI-карта закончит работу по выводу своей половины кадра на мониторе. Конечно, можно использовать две PCI карты, но тут уже другие проблемы. Для того, чтобы использовать возможности современных графических акселераторов по полной программе, нужно использовать именно AGP-интерфейс. К сожалению, AGP-порт предусмотрен в единственном экземпляре. Карты с PCI-интерфейсом сейчас не часто встретишь, и спрос на них существенно ниже среди продвинутых пользователей, а ведь именно они тратят деньги на самые мощные решения. В результате, связка "AGP-карта + PCI-карта" становится самым распространенным решением при использовании PGC. Но это и минус этого решения.
  • Из-за того, что одна из карт имеет ограничения в виде отсутствия AGP-текстурирования, страдает качество части конечного изображения, т.к. из-за нехватки данных снижается детализация.
  • Оба графических процессора работают только по расчету текущего кадра и не могут работать на будущее, заранее рассчитывая следующий кадр.
  • Возможно возникновение разрывов (image tearing) между частями изображения.
  • Возможна ситуация несогласованной работы DAC у разных карт, хотя Metabyte потратили много сил на реализацию такого механизма.

Отмечу, что технология PGC, при всей своей привлекательности, так и не попала на рынок, даже несмотря на то, что компания Alienware лицензировала ее.

Компания ATI пошла своим путем, двигаясь одновременно по двум направлениям. Что касается первого метода повышения производительности, то тут все просто и понятно: это выпуск новых графических чипов. Недавно был анонсирован чип Rage128 Pro, который превосходит по многим параметрам, а главное — по производительности, своих предшественников. В качестве решения по второму методу была предложена технология с кодовым именем Aurora, которая впоследствии получила имя MAXX (Multiple ASIC Technology). Напомню, что ASIC
расшифровывается как Application Specific Integrated Circuit, или, говоря по-русски, микросхема специального назначения.

Можно найти массу поводов поиздеваться над фантазией маркетологов из ATI, которые выбрали имя MAXX для новой технологии. Сразу на ум приходит пара аналогий в виде стиральной машины от BOSCH и журнала непристойного содержания. На мой взгляд, это как раз тот случай, когда кодовое имя было гораздо интереснее того, которое было в итоге выбрано для выхода на рынок. Однако, мы тут говорим не об именах и не о способах рекламы, а о технологии как таковой. Итак, что же собой представляет технология MAXX?

Прежде всего, технология MAXX — это чисто программное решение, которое позволяет задействовать два графических процессора для выполнения общей работы. Фактически, воплощается в жизнь идея параллельной обработки данных. Каждый из графических процессоров полностью формирует один кадр, а затем готовые кадры поочередно выводятся на монитор. В принципе, вероятно, технология MAXX может поддерживать одновременную работу более чем двух графических процессоров, однако вряд ли в ближайшее время будет целесообразно реализовывать такие конфигурации на практике. Техника, которая позволяет двум графическим чипам, установленным на одной карте, поочередно выводить на экран готовые кадры изображения, называется Alternate Frame Rendering (AFR).

Мы дали довольно упрощенное объяснение технологии MAXX, теперь поговорим об этом интересном решении более подробно, выбрав в качестве примера первую карту, которая реализует эту технологию — ATI Rage Fury MAXX

По сути, карта Rage Fury MAXX представляет собой две платы Rage Fury Pro, размещенные на одной PCB.

    
Иллюстрации предоставлены сайтом Thresh's FiringSquad

Как видно из иллюстрации, на карте размещены два чипа Rage 128 Pro. Далее, на плате установлено 64 Мб локальной видео памяти, плата имеет AGP x2/x4 форм-фактор и стандартный VGA выход. На самом деле, эти 64 Мб локальной видеопамяти типа SDRAM представляют собой два кадровых буфера по 32 Мб для каждого из двух чипов Rage128 Pro. Разумеется, локальная видеопамять используется не только для кадрового буфера. Правильнее сказать, что лишь часть локальной видеопамяти используется под кадровый буфер (с двойной или тройной буферизацией). Основная же часть локальной видеопамяти используется для хранения текстур.

Тут есть интересный вопрос. Так как фактически карта Rage Fury MAXX — это две полноценные карты Rage Fury Pro на одной PCB, то возможно ли развести второй разъем VGA и получить поддержку двух мониторов, правда, исходя из особенностей технологии MAXX, поддерживаться два монитора будут только в режиме 2D-графики. По крайне мере, карты Rage Fury MAXX с двумя VGA-выходами существуют, и, по слухам, компания ATI планирует ввести поддержку двух мониторов в будущем. Остается вопрос, как все это будет работать, в каких режимах и будет ли работать в принципе. Будем надеяться, что мы получим ответы.


Иллюстрация предоставлена журналом Maximum PC


Теперь сделаем небольшое отступление от сути статьи. Обратите внимание на два проводка, которые напаяны на PCB над VGA разъемом. В принципе, наличие таких проводов у не серийной карты, а у т.н. "семпла" не является чем-то из ряда вон выходящим. На то это и семпл, чтобы отработать разводку и работоспособность карты. Однако, судя по всему, именно из-за этих проводов нам не разрешили не то что протестировать карту Rage Fury MAXX, но даже нормально сфотографировать ее. Ну что же, понять действия представителей ATI можно, только вот непонятно, почему ATI относится к различным представителям прессы по-разному? На практике выяснилось, что есть представители прессы "более симпатичные" ATI, чем все остальные. Нельзя тестировать и фотографировать карту Rage Fury MAXX? Нет проблем, только соблюдайте правила игры. Если нельзя, то нельзя всем без исключения. На практике, нельзя оказалось только российской прессе. Зато представителям некоторых зарубежных сайтов, оказывается, можно. Это мы и называем "грамотной маркетинговой политикой". Действительно, зачем уделять России какое-то особое внимание, если объемы продаж продуктов ATI тут очень маленькие? Если Российский рынок не интересен для ATI, то все понятно. Если наш рынок представляет интерес, то тогда ATI выбрала абсолютно верную маркетинговую стратегию. Нужно не давать информацию российской прессе, не предоставлять образцы продуктов для тестирования, много всего обещать, выполнять как можно меньше из обещанного, и тогда скоро у всех российских пользователей будут установлены в компьютерах продукты от ATI. Можно только посочувствовать конкурентам ATI, которые выбрали совершенно иную стратегию и скоро потеряют свои позиции в России.

Хватит сарказма, вернемся к теме нашей статьи. Я не буду приводить спецификацию чипа Rage 128 Pro, желающие могут просто почитать обзор карты Rage Fury Pro, где приведены все параметры и масса цифр. Мы же займемся рассмотрением вопроса о том, как работает технология MAXX на практике.

2D-графика

В этом режиме работает только один чип Rage128 Pro, второй бездействует. Никаких отличий в этом случае от стандартной карты Rage Fury Pro нет. Говорить, что поддержка работы только одного графического процессора в режиме 2D-графики — это минус или ограничение, мы не считаем правильным. Одного чипа Rage 128 Pro для работы в 2D-графике вполне достаточно. Впрочем, ATI позиционирует свою карту Rage Fury MAXX именно для продвинутых любителей поиграть. Так что, если вы купили карту для игр, то для этих целей ее и используйте.

ATI рекомендует покупать карту Rage Fury MAXX тем любителям игр,
которые имеют мониторы с большой диагональю и играют в разрешениях 1024х768 и выше. И действительно, если посмотреть на обзоры с результатами тестирования разных видео акселераторов, нетрудно заметить, что в высоких разрешениях узким местом, влияющим на снижение производительности, является ширина полосы пропускания локальной видеопамяти. Даже в режиме 16-битного представления глубины цвета объемы данных, которые необходимо передать через шину локальной видеопамяти, просто огромны. Итак, посмотрим, как работает Rage Fury MAXX в 3D графике.

3D-графика

Фактически, каждый из чипов Rage 128 Pro, установленных на карте Rage Fury MAXX занимается своей непосредственной работой, а именно: формирует пиксели, из которых состоит конечное изображение, отображаемое на экране монитора. Технология MAXX позволяет каждому из графических чипов, используемых в паре, полностью задействовать механизм установки вершин полигонов в пространстве (triangle setup engine) и текстурные кэши в двух независимых кадровых буферах. Это способствует оптимальной работе карты при формировании изображений на экране монитора.

Отметим одну важную деталь. Применение технологии MAXX в текущей реализации (Rage Fury MAXX) позволяет решить проблему с нехваткой пропускной способности шины локальной видеопамяти, и как следствие, нехватки fillrate. Однако, эта проблема возникает только в высоких разрешениях. Это означает, что при работе в разрешениях ниже 1024х768 технология MAXX не даст никакого выигрыша в производительности.

У каждого чипа Rage 128 Pro есть своей кадровый буфер, в котором и происходит рендеринг каждого кадра изображения. При этом каждый из чипов Rage 128 Pro имеет собственный интегрированный RAMDAC. Программное обеспечение, а точнее, управляющий драйвер определяет, из какого кадрового буфера будет выводиться готовый кадр на экран монитора. При этом кадры из одного буфера могут выводиться подряд несколько штук (максимум три), а лишь затем происходит переключение на другой кадровый буфер.

Заметим, что, в силу необходимости переключаться между разными кадровыми буферами, возникают неизбежные задержки по времени, вследствие чего возможно возникновение лага. Лаг — это временная задержка между действием пользователя и реакции графического процессора на эти действия. В случае с Rage Fury MAXX между действием пользователя и реакцией на это действие может пройти время, необходимое на завершение вывода полного кадра и следующего за ним. Это в лучшем случае. Возможна ситуация, когда задержка может составлять время на вывод четырех и даже шести кадров (при тройной буферизации). Дело в том, что когда выводится уже готовый кадр на экран монитора, следующий за ним уже либо готов, либо готовится. Соответственно, реакция на действия пользователя может произойти только во вновь формируемом кадре, т.е. третьем по счету. Так ли все обстоит на самом деле или нет, мы надеемся проверить на практике.

Кроме переключения между кадровыми буферами и синхронизацией работы RAMDAC, управляющий драйвер осуществляет и управление шиной AGP, чтобы соответствующий чип Rage 128 Pro смог получить необходимые данные из AGP памяти. Понятно, что на необходимые переключения требуется время, т.е. возникают задержки. Поэтому не будет наблюдаться удвоения производительности. Тем не менее, ATI предполагает, что производительность Rage Fury MAXX будет в 1.5-1.8 раз больше, чем производительность обычной карты на базе чипа Rage 128 Pro.

Если исходить из того, что тактовая частота чипа Rage 128 Pro равна 140 Мгц, то в режиме мультитекстурирования карта Rage Fury MAXX будет способна формировать до 210-252 млн. пикселей в секунду. Несмотря на то, что игр без поддержки режима мультитекстурирования сегодня почти не производят, в маркетинговых целях все разработчики графических чипов указывают потенциальную производительность своих продуктов в режиме без мультитекстурирования. Тогда потенциальная производительность Rage Fury MAXX будет на уровне 420-504 млн. пикселей в секунду, а в рекламе указывается значение в 500 млн. пикселей в секунду. Все сходится. Упрекнуть ATI в использовании именно таких цифр нельзя, т.к. именно таким образом поступают абсолютно все. Зато у нас всегда будет повод, о чем написать.

Отметим, что мы использовали частотные характеристики реальных чипов Rage 128 Pro и тактовую частоту работы шины локальной видеопамяти, исходя из фактических параметров той платы Rage Fury Pro, которая побывала у нас на испытаниях. Карты Rage Fury MAXX, которые попали на испытания нашим зарубежным коллегам, имеют несколько меньшие тактовые частоты: 125 МГц у графического ядра и 143 МГц у шины локальной памяти. Мы не знаем, будут ли такие же частоты у тех плат Rage Fury MAXX, которые поступят в продажу. Единственной причиной того, что ATI снизит частоты, могут быть только технические сложности, однако мы не видим пока никаких оснований для подобного решения. Пока мы придерживаемся мнения, что в финальной версии карты Rage Fury MAXX будут иметь частоты, не уступающие тем, которые имеют карты Rage Fury Pro.

Ну, хорошо, будем считать, что в режиме мультитекстурирования карта Rage Fury MAXX имеет потенциальную величину fillrate 250 млн. пикселей в секунду. Много это или мало? Посмотрим на конкурентов. GPU GeForce 256 от NVIDIA в режиме мультитекстурирования обладает потенциальной величиной fillrate, равной 240 млн. пикселей в секунду (при частоте графического ядра в 120 МГц), другой конкурент — чип Savage2000 от S3 — обладает потенциальной величиной fillrate в 250 млн. пикселей в секунду (при частоте ядра в 125 Мгц). Нетрудно заметить, что Rage Fury MAXX по величине fillrate ничуть не уступает конкурентам. Но есть еще один важный момент. Чипы GeForce 256 и Savage2000 используют при работе только одну имеющуюся шину локальной видеопамяти, ширина которой у обоих GPU 128 бит при использовании памяти типа SDR SDRAM. В случае с Rage Fury MAXX мы имеем несколько иную ситуацию.

Фактически, на плате Rage Fury MAXX две шины локальной видеопамяти, каждая шириной в 128 бит и пропускной способностью, равной 2.5 Гб в секунду (при частоте в 159 МГц), т.е. с суммарной пиковой пропускной способностью до 5 Гб в секунду. Замечу, что сама ATI называет величину суммарной пропускной способности шины памяти 4 Гб в секунду: видимо, подсчет велся исходя из частоты шины памяти в 143 МГц. Попробуем показать все это на цифрах.

Предположим, мы хотим играть в разрешении 1600х1200 при 32-битной глубине представления цвета, с 32-битной z-буферизацией, в режиме мультитекстурирования (при наложении двух текстур с 32-битной точностью каждая), средней величине overdraw, равной 4, частоте смены кадров, равной 30 fps. В итоге получаем, что для формирования каждого пикселя нам нужно передать по локальной шине памяти 16 байт данных. Проведем несложные вычисления. При таком разрешении и частоте смены кадров в наших условиях графический процессор должен сформировать 1600х1200х4х30=230400000 пикселей в секунду. Для этого по локальной шине памяти нужно передать 230400000х16=3686400000 или около 3.7 Гб в секунду.

При этом каждый из чипов Rage 128 Pro должен создать лишь половину требуемых кадров; в нашем случае достаточно, чтобы каждый чип сформировал лишь 15 кадров. Значит, нагрузка на шины памяти, а их у нас две по 128 бит, тоже будет вполовину требуемой. В итоге 3.7 Гб данных в секунду нужно прокачать не по одной шине, а по двум, т.е. по 1.85 Гб в секунду по каждой шине. Передать такой объем данных по силам каждой 128 бит шине у обоих чипов Rage 128 Pro. Вот это ключевой момент, в результате которого и получается выигрыш в производительности над конкурентами.

Конечно, наши подсчеты несколько грубы в виду того, что мы не учитываем временные задержки для переключения между RAMDAC и при разделении доступа к шине AGP, но общая картина вполне различима для того, чтобы понять, как работает технология MAXX и за счет чего происходит общее увеличение производительности.

К несомненному плюсу технологии MAXX можно отнести полную прозрачность, как для приложений, так и для интерфейсов Direct3D и OpenGL. На практике это означает, что пользователю не нужно задумываться о том, поддерживается ли эта технология игрой или API. Решением всех этих проблем занимается программное обеспечение, по сути, сама технология MAXX.

В силу особенности работы технологии MAXX локальная видео
память разделена на две части, которые фактически никак не связаны. Понятно, что если бы была возможность использовать всю доступную локальную память в виде единого хранилища текстур, это могло быть востребовано. Нельзя сказать, что это полноценный минус, т.к. ограничение накладывается самой технологией. С другой стороны, для таких ситуаций, когда имеются ограничения по размерам текстурной памяти, и была создана технология компрессии текстур. Так что, если не хватает объемов доступной памяти, — используйте компрессию текстур. Правда, с этим вопросом не все ясно. В спецификациях чипов Rage 128 Pro упоминается поддержка DXTC, на практике при текущих версиях драйверов этой поддержки на аппаратном уровне нет.

К сожалению, у нас пока нет возможности провести самостоятельные испытания карты Rage Fury MAXX, однако наш английский друг Alex "Sharky" Ross (www.sharkyextreme.com) уже провел тестирование, и его результаты подтверждают наши теоретические выкладки.

Видно, что, благодаря раздельным кадровым буферам и раздельным шинам локальной видеопамяти, карте Rage Fury MAXX удалось показать высокую производительность в таком большом разрешении при экстремальной
нагрузке на шину памяти.

Отметим также и тот факт, что чипы Rage 128 Pro, которые используются в паре на карте Rage Fury MAXX, специально оптимизированы для работы в режиме 32-битной глубины представления цвета. Подтверждения этому факту можно найти в нашем обзоре карты Rage Fury Pro.

Итак, можно констатировать, что ATI нашла хороший способ достижения высоких показателей fillrate. При этом несомненным плюсом технологии MAXX является ее универсальность, т.к. это чисто программное решение. Не важно, какие два графических чипа будут установлены на одной карте, технология будет работать, а пользователь увидит реальный прирост производительности. Важно отметить и тот факт, что прирост производительности будет заметен во всех уже существующих приложениях, причем для этого пользователю нужно будет лишь купить карту Rage Fury MAXX, установить ее в компьютер и запускать игры в разрешениях 1024х768 и выше. Если у вас монитор с маленькой диагональю, и вы играете в разрешении 800х600, то нет никакого смысла покупать Rage Fury MAXX. Вы не получите никаких преимуществ.

Подчеркну еще раз, если у вас монитор с диагональю 15" и менее, то карта Rage Fury MAXX вам совершенно не нужна. Далее, с точки зрения fillrate, карта Rage Fury MAXX выигрывает у карт на базе GPU GeForce 256 с локальной памятью тира SDR SDRAM на борту. Но GeForce 256 имеет интегрированный геометрический сопроцессор, а Rage 128 Pro не имеет поддержки аппаратного расчета T&L. Ну что же, тут есть о чем поговорить. Ожидается, что цена карты Rage Fury MAXX с 64 Мб локальной видеопамяти на борту будет в районе $250. Это примерно на уровне карт c чипом NVIDIA GeForce 256 и с 32 Мб локальной видеопамяти типа SDR SDRAM на борту. Как же выбрать между этими двумя картами?

На сегодняшний день реально не существует игр, которые могли бы в
полной мере использовать аппаратный расчет трансформаций и освещения. Да, нам обещают, что эти игры появятся уже к концу декабря. Предположим, что это правда. В любом случае, уже весной игр, рассчитанных на аппаратную поддержку T&L будет более 30. В итоге, тот, кто купит или уже купил карту на базе GPU GeForce 256 с памятью типа SDR SDRAM, получит преимущества над обладателями карт Rage Fury MAXX. Карты Rage Fury MAXX должны появиться на рынке лишь в декабре. Если принять во внимание тот факт, что ATI, возможно, не удастся создать в срок нормальные драйверы (а такое уже случалось, и не раз), выход карт Rage Fury MAXX может отложиться до января следующего года или даже до весны. Примерно в это же время на рынке должны появится карты на базе GeForce 256 с локальной памятью типа DDR SGRAM на борту, а также уже будут продаваться карты на базе Savage2000. Заметим, что цена на карты с GPU GeForce 256 и локальной видеопамятью типа DDR SGRAM на борту будут предлагаться по цене от $250 до $300 за 32 Мб версию (возможно, и дешевле). Сразу возникает вопрос, кто предпочтет купить карту Rage Fury MAXX, единственным несомненным преимуществом которой являются высокие показатели fillrate? Сама ATI называет срок жизни карты Rage Fury MAXX — 8-12 месяцев, хотя, мне кажется, более реальным сроком являются 6-8 месяцев.

Если бы Rage Fury MAXX появилась на рынке весной этого года, тогда — да, карта бы имела несомненный успех на рынке, так как напрямую конкурировала бы с платами на базе TNT2 Ultra. Сейчас складывается ситуация, когда карта Rage Fury MAXX будет конкурировать с графическими акселераторами, обладающими не только высокими показателями fillrate, но и такой особенностью, как интегрированный геометрический сопроцессор, чего нет у чипов Rage 128 Pro. Примерно за одинаковые деньги нам предлагают выбирать между картами с геометрическими сопроцессорами и без. Лично я не вижу никакого смысла покупать карту Rage Fury MAXX , по крайней мере, за сумму в $250. При всем моем негативном отношении к картам на базе GeForce 256 с памятью типа SDR SDRAM на борту, при необходимости выбрать что-то одно я предпочту именно карты с GeForce 256. Если вместо карты Rage Fury MAXX за те же деньги купите карту на базе GeForce 256, то вы может быть уверены, что эта карта прослужит вам не менее года, пока совсем не устареет морально.

Можно в очередной раз констатировать, что ATI опоздала к разделу пирога. Если ATI выберет очень агрессивную ценовую политику, только тогда появится шанс, что карты Rage Fury MAXX захватят свою нишу на рынке, по крайней мере, до того момента, когда количество игр, оптимизированных под аппаратный расчет T&L, не превысит критическую массу, и наличие геометрического сопроцессора на борту станет "must have". По самым пессимистическим прогнозам, это может случиться уже к концу 2000 года, а по более оптимистическим — уже к середине 2000 года. Причем прогнозы эти строят сами разработчики игр, а, значит, у них есть основания для таких оценок.

К слову, в сети есть мнение, что отсутствие аппаратной поддержки расчета T&L у чипов Rage 128 Pro, а значит, и у карт Rage Fury MAXX, может быть компенсировано использованием мощного CPU. Я не согласен с такой идеей. Даже не буду долго распространяться на эту тему, просто не хочется повторяться. Вкратце, наличие геометрического сопроцессора не только разгружает CPU системы, но также разгружает шину системной памяти. Если игра оптимизирована на аппаратную поддержку T&L, то можно заявить с большой уверенностью, что CPU не придется прохлаждаться. Разработчики игр всегда найдут работу для центрального процессора. Так что, если запустить игру, рассчитанную на аппаратную поддержку T&L на системе
с картой Rage Fury MAXX в расчете на то, что всю работу по преобразованию координат и установке освещения возьмет на себя мощный CPU, то, будьте уверены, начнет тормозить AI, и не будет поддержки реальной физики моделируемого мира, например. Кстати, мощный CPU все равно потребуется, если вы решите использовать карту Rage Fury MAXX. Дело в том, что производительность чипа Rage 128 Pro сильно зависит от вычислительной мощности CPU системы, и наши тесты карты Rage Fury Pro это подтверждают.

И еще одна мысль по теме. ATI любит упирать на то, что ее чипы поддерживают аппаратный расчет компенсации движения (motion compensation) и обратное преобразование Фурье (iDCT). Это обеспечивает высокое качество изображения при просмотре DVD-видео, и при этом CPU загружается менее, чем на 50%. Мое мнение таково: для просмотра DVD-видео совсем не обязательно покупать Rage Fury MAXX, сгодится обычная карта Rage Fury Pro. Так что, как аргумент к покупке именно MAXX это не подходит. К слову, тот же плеер Cinemaster'99, но в режиме полного программного декодирования DVD-видео, т.е. полностью за счет CPU, на системе с процессором Celeron 366 MHz, обеспечивает идеальное воспроизведение DVD-видео, ничуть ни хуже воспроизведения такого же MPEG2 видео с аппаратной поддержкой (полной или частичной). Разница только в проценте загрузки CPU, но, с другой стороны, трудно представить ситуацию, когда вы смотрите DVD-фильм и играете в Quake3 по сети.

Подведем итоги

Технология MAXX, безусловно, очень интересна в качестве решения по увеличению производительности. Вся прелесть MAXX в аппаратной независимости, т.е. можно производить карты с любыми двумя графическими процессорами на борту, каждый из которых занимается формированием полного кадра изображения. Готовые кадры поочередно выводятся на экран монитора. Отметим, что каждый графический процессор может подряд выводить не более трех кадров (в случае тройной буферизации), зато в то время, пока один чип выводит готовые кадры, второй в это время создает следующие. Все управляется полностью программным путем. В принципе, нет препятствий на пути использования более двух графических процессоров на одной плате в рамках технологии MAXX, однако это нецелесообразно по нескольким причинам. Во-первых, максимальный прирост производительности достигается только при использовании двух чипов. Третий чип усложнит и удорожит систему, однако прирост производительности будет неоправданно низок. Во-вторых, могут возникнуть серьезные проблемы с электропитанием и тепловыделением.

Есть ли у MAXX будущее? Вероятно, есть. Очень интересно было бы посмотреть на работы в паре двух графических чипов с интегрированными геометрическими сопроцессорами. Кроме того, не исключено, что ATI будет развивать технологию MAXX и дальше. В качестве возможного пути развития можно выбрать идеи, заложенные в технологии T-Buffer. Фактически, технология MAXX позволяет формировать сцены в разных кадровых буферах, осталось реализовать механизм комбинирования содержимого разных кадровых буферов и вывод получаемого результата на экран монитора. Вот и путь к наложению специальных эффектов. Но это всего лишь наши предположения.

Осталось подождать появления реальных карт Rage Fury MAXX на рынке и посмотреть на них в деле, обратив пристальное внимание на качество драйверов. Только после этого можно будет реально оценить рыночные перспективы Rage Fury MAXX и узнать, своевременно ли появился этот продукт или все же опоздал.

Если вы истинный поклонник марки ATI и обладаете монитором с большой диагональю, то вы, конечно же, можете купить карту Rage Fury MAXX. Скорее всего, вы будете довольны покупкой, ее скоростными показателями и качеством изображения в 32-битном цвете. Однако будьте готовы к тому, что карта может устареть уже через 6 месяцев, когда новые игры потребуют наличие на борту вашего видеоакселератора геометрического сопроцессора. Если вы твердо решили купить новый видеоакселератор и не знаете, что выбрать, то можно дать еще несколько рекомендаций.

Во-первых, стоит подождать появления карт на Savage2000 от S3 и посмотреть на них в деле.

Во-вторых, можно дождаться появления на рынке карт на базе GeForce 256 с памятью типа DDR SGRAM на борту, что должно произойти также в декабре, и посмотреть на то, какие установятся на них цены. Если такая карта будет стоить на уровне Rage Fury MAXX, то предпочтительнее будет купить все-таки карту на базе GeForce 256.

Наконец, можно просто плюнуть на все и подождать появления на рынке новых решений от 3dfx, ATI, Matrox или NVIDIA.

Чего можно ожидать от 3dfx, мы приблизительно знаем, но, в любом случае, 15 ноября мы узнаем почти все подробности. От NVIDIA весной 2000 года мы, скорее всего, получим новый вариант GeForce 256, выполненный по 0.18 мкм технологическому процессу и с увеличенной производительностью. Готовит ли для нас что-то новое ATI? Да, готовит, причем давно. Это чип с кодовым именем Rage5. Можно предположить, что он будет содержать интегрированный геометрический сопроцессор. Но главный вопрос, который определит судьбу нового детища ATI, это опять же своевременность. Если ATI не хочет потерять свои позиции на рынке, ей придется приложить максимум усилий, чтобы выпустить графический акселератор нового поколения не позднее весны 2000, чтобы этот новый продукт изначально обладал качественными драйверами и по своим параметрам, как минимум, не уступал конкурентам. Так или иначе, время покажет, умеет ли ATI учиться на своих и чужих ошибках.

Использованы материалы компании ATI Technologies, Inc.