Последний шанс или новые решения от ATI

NVIDIA – несомненный лидер. Так уж получилось: драйвера хорошие писали, чипы продавали удачно, в срок выпускали обещанное, не гнались за сомнительными технологиями да и просто везло. Хотя, как известно, "удача улыбается подготовленным". Теперь, когда NVIDIA несомненный лидер, гораздо интереснее задаваться вопросами "насколько долго" и "к чему это приведет", нежели "почему так вышло". А мы, пожалуй, выберем себе более нетривиальный вопрос:

Есть ли еще конкуренты?

Споры на эту тему – дело неблагодарное: вон, наша Конференция регулярно полыхает подобными темами, и все участники, как правило, остаются при своем мнении. Я ни в коей мере не собираюсь оспаривать мнение (ни "То", ни "Это"), а просто приведу несколько фактов относительно новых чипов ATI, которые только что были официально представлены. Судя по всему, эти чипы – последний шанс для ATI "высунуть голову из-под воды". А вот что будет далее – покажет время: либо находящаяся на плаву NVIDIA мощным ударом весла "сносит" эту самую голову (в роли весла выступает неотвратимо приближающийся NV25), либо ATI нащупывает ногами твердое дно и неуверенно начинает выбираться на берег. Последний же этот шанс потому, что любая ошибка способна загнать ATI в угол, в котором уже успешно оказалась вторая канадская фирма (да, Matrox Graphics). Время покажет, ждать осталось совсем недолго.

Семейство R200

Для начала взглянем на общую картину:

Итак, первые чипы уже официально представлены – это R200 и RV200. Позже, через полгода, появится (вместе с новым семейством R300) RV250 – массовый ("mainstream") чип, снабженный всем спектром возможностей R200.

Кстати, если внимательно взглянуть на диаграмму, становится ясно, что деление секторов рынка в понимании ATI и NVIDIA не совпадает – чипы, которые ATI обозначает как "performance", в данный момент вынуждены конкурировать и с "mainstream" NVIDIA (GeForce2 MX). Разделив GeForce2 MX на три "подсектора", NVIDIA существенно расширила понятие "mainstream", и это не преминуло благотворно сказаться на объемах прибыли, получаемой этой фирмой. Дабы не возникло путаницы в терминологии, будем называть "performance"-сектором все, что не является "mainstream" или профессиональными картами, а термин "enthusiast" не будем употреблять вообще – согласитесь, это не столько сектор рынка, сколько привычка покупать "топовые" на данный момент карты потребительской линейки любимой фирмы.

Приведем сравнительную таблицу известных на данный момент характеристик:

Кодовое имя	R100	NV20	R200	RV200	RV250
Название	Radeon	GeForce3	Radeon 8XXX	Radeon 7XXX	?
Технология, мкм	0.18	0.15	0.15	0.15	0.15 (0.13?)
Частота ядра, МГц	145-183 (1)	200 (3)	250	275	300
Частота памяти, МГц	145-183 (2)	240 (3)	275	230	250-300
Шина памяти	128	128	128	128/64	128
Тип памяти	SDR/DDR	SDR/DDR	SDR/DDR	SDR/DDR	SDR/DDR
RAMDAC	350 МГц	350 МГц	400 МГц	2 * 350 МГц	2 * 350 МГц
Интегрированный TV Out	Нет	Нет	Есть	Есть	Есть
Версия DirectX	7+ (4)	8	8.1	7+ (4)	8.1
Пиксельных конвейеров	2	4	4	2	4
Текстурных блоков	3	2	2	3	2
Текстур за проход.	3	4 (5)	6 (5)	3	6 (5)
Закраска (мегапикселей/cек)	366	800	1000	460	1200
Закраска (мегатекселей/cек), максимум	1098	1600	2000	1380	2400
Pixel Shaders	Нет (6)	1.0-1.3	1.0-1.4	Нет (6)	1.0-1.4
Vertex Shaders	Нет	1.1	1.1	Нет	1.1
Объемные текстуры	Да	Нет (7)	Да	Да	Да
HOS	Нет	RT-Patches	N-Patches (Truform)	Нет	N-Patches (Truform)
Сжатие текстур	Да	Да	Да	Да	Да
Сжатие Z	Иерархический тайловый буфер глубины (HyperZ)	Тайловый буфер глубины	Иерархический тайловый буфер глубины (HyperZ II)	Иерархический тайловый буфер глубины (HyperZ)	Иерархический тайловый буфер глубины (HyperZ)
HSR	Иерархический тайловый буфер глубины (HyperZ)	Тайловый буфер глубины	Иерархический тайловый буфер глубины (HyperZ II)	Иерархический тайловый буфер глубины (HyperZ)	Иерархический тайловый буфер глубины (HyperZ)
FSAA	SSAA	MSAA	Adaptive AA	SSAA	SSAA

(1) – как известно, этот параметр для ATI не является жестко фиксированным и может меняться от партии к партии. Для первого Radeon – 166 у OEM и 183 у коробочных карт, 145 у дешевого LE. Позже по ходу выпуска, с появлением оптимизированной версии чипа, даже OEM-карты начали работать на 183 МГц. Для новых чипов мы приводим "стартовые" характеристики.
(2) – по умолчанию, частота памяти совпадает с частотой ядра, но на практике может быть установлена в другое значение (с помощью программ-"твикеров").
(3) – приведена рекомендуемая частота, которую производители карт порой изменяют, впрочем, как правило, в небольших пределах.
(4) – некоторые возможности DirectX 8, но не включая шейдеры.
(5) – текстурные модули могут быть использованы трижды за один проход, доводя, таким образом, число одновременно задействованных текстур до 6. Расплата – два дополнительных такта задержки.
(6) – нестандартные шейдеры, т.н. "версия 0.5".
(7) – на данный момент поддержка объемных текстур для GeForce 3 заблокирована в DirectX, но доступна в OpenGL.

R200

Наследник первого Radeon. Вероятно, в пику NVIDIA не названный "Radeon 2". Как удачно заметил один из наших редакторов, названия новых продуктов мучительно напоминают последние продукты 3dfx, перед тем как компания была куплена NVIDIA. Этот чип и карта на его основе (64 Мб Radeon 8500) нацелены на так называемый "performace" сектор рынка – сектор максимально производительных (но, тем не менее, предназначенных для обычных покупателей) решений.

Хочу сразу отметить, что, даже имея схожую или превосходящую профессиональные карты от NVIDIA и 3Dlabs скорость, карты на базе этого чипа не могут (пока) сами по себе претендовать на профессиональный рынок. Дело в обязательном атрибуте для профессиональных карт – необходимости сертификации драйверов под конкретные профессиональные пакеты и под конкретное, не менее профессиональное, железо. Отметим, что в скором времени одна из основаных на R200 карт от ATI вполне может стать участником именно профессионального рынка в свете недавнего приобретения канадцами всего, связанного с профессиональным семейством FireGL. И профессиональные драйверы, и даже торговая марка останутся теми же. Но в самое ближайшее время ожидать сертифицированную профессиональную карту не стоит (скорее всего, это будет вариант Radeon 8500 без активного охлаждения и с иным PNP идентификатором, дабы профессиональные драйверы не "вставали" на обычные пользовательские карты).

Итак, чип производится по 0.15-микронной технологии; по сложности, потреблению энергии и тепловыделению он очень близок к GeForce3 (NV20). Даже чуть сложнее – около 60 миллионов транзисторов. Если на первом Radeon вентилятор и даже радиатор играли скорее декоративную роль (у нас в лаборатории давно и стабильно работает Radeon 183 МГц без радиатора вообще!), то на этот раз карты будут снабжаться серьезным охлаждением, очень похожим на то, что мы видим у GeForce3. Первые результаты тестов показали, что R200 не только содержит множество технологических новшеств, но и в большинстве тестов сравним или превосходит GeForce3. Такое положение дел не могло оставить NVIDIA спокойной – и соответствующие выводы были сделаны, но об этом чуть позже. А сейчас, небрежно уроним занавес со структурной схемы R200:

Первое, что бросается в глаза – в чип интегрирована уже знакомая нам по Radeon VE (кодовое имя RV100) технология HydraVision. И хотя второй встроенный RAMDAC отсутствует, в наличии два независимых контроллера отображения, способные выдавать различные разрешения и частоты развертки на:

Встроенный в чип 400 МГц RAMDAC
Встроенный в чип DVI-интерфейс
Встроенный в чип TV-Out кодер сигнала.
Дополнительный внешний цифровой интерфейс (например, для реализации еще одного DVI-интерфейса с помощью внешнего чипа)
Дополнительный внешний RAMDAC (для поддержки второго CRT монитора).

Таким образом, нам доступны следующие независимые конфигурации выходов:

CRT+CRT (требуется внешний RAMDAC)
CRT+DVI
DVI+DVI (требуется внешний DVI интерфейс)
CRT+TV
DVI+TV

А также дублирование любого выхода на TV:

CRT+CRT+TV (требуется внешний RAMDAC)
CRT+DVI+TV
DVI+DVI+TV (требуется внешний DVI интерфейс)

Переключение режимов вывода может происходить динамически, и ничто не помешало выпустить плату, способную, как и Radeon LE, использовать в различных комбинациях два CRT-монитора, DVI-монитор и TV-выход. Кроме того, была улучшена поддержка "двухголовости" на программном уровне – теперь доступна независимая конфигурация режимов и независимая установка частоты вертикальной развертки для семейства Windows NT/2000/XP, и стала возможной работа Direct3D-приложений сразу на двух мониторах.

В чип интегрирован аппаратный HDTV-декодер и знаменитая аппаратная поддержка (iDCT) для декодирования MPEG-подобных алгоритмов. Кстати, сама по себе вполне достаточная для аппаратного "вспоможения" в вопросах декодирования MPEG4 (и DivX), дело здесь только за соответствующей программной поддержкой, которая для MPEG4 в скором времени вполне возможна, а для DivX маловероятна по юридическим соображениям. Появление некоммерческого MPEG4 или бесплатно распространяемого коммерческого кодека способно достаточно быстро вытеснить DivX-кодеки, отличающиеся зачастую от истинного формата MPEG4 только идентификационными и реализационными деталями.

В наличии полная аппаратная поддержка GDI, в том числе и новых функций, необходимых для оптимального 2D ускорения Windows XP – AlphaBlt, AlphaCursor, GradientFill.

Теперь об архитектурных новшествах. Несомненно, самое главное – аппаратная реализация DirectX 8 технологии (N-патчи), названная ATI громким маркетинговым именем Truform. Об этой технологии я уже писал, а сейчас хочу лишь отметить, что в отличие от GeForce3, эмулирующей N-патчи с помощью аппаратно поддерживаемых ею RT-патчей (по сути дела, эта эмуляция сделана "для галочки" и обладает меньшей производительностью, нежели чисто программная реализация N-патчей), в R200 все выполняется на 100% аппаратно. Насколько реализация эффективна – покажут тесты, насколько эта технология станет популярна – время и игры. По предварительным данным, при среднем уровне детализации включение N-патчей практически не затормаживает современные игры, существенно улучшая визуальное качество моделей. Кстати, в сети уже появилась переделка Quake I, способная использовать N-патчи. Даже столь незатейливая адаптация игры (без какого-либо учета прямых углов на моделях) выглядит очень симпатично. Кроме того, ультрапопулярная игра CounterStrike в ближайшее время получит поддержку Truform.

Второе по важности новшество – поддержка вершинных и пиксельных шейдеров. Причем, здесь ATI не ограничилась первыми редакциями пиксельных шейдеров (1.0 и 1.1), а круто взяла быка за рога, продвинув новый стандарт – так называемые шейдеры версии 1.4. С номерами версий, кстати, до сих пор есть некая неясность – ATI называет свои шейдеры 2.0 (вероятно, чтобы показать степень их отличия от реализованных NVIDIA), а Microsoft в DirectX 8.1 предпочел использовать более скромную цифру 1.4. Но давайте обратимся к сути – в чем же разница между версиями шейдеров:

Версия шейдеров	1.0 – 1.3	1.4
Число задаваемых (комбинируемых) текстур	4	6
Число операций адресации текстур	Нет	8
Число операций комбинирования	8	8
Максимальное число инструкций шейдера	12	22

Фактически, в R200 появилась не только возможность использовать одновременно до шести (!) текстур (разумеется, с расплатой в два такта задержки, если число текстур превышает две, и еще в два такта, если оно превышает четыре), но и гибкое программирование того, какие именно данные и откуда из этих текстур будут выбираться. И если раньше был доступен только жесткий набор режимов адресации текстур, то теперь мы можем сами определять эти режимы. Это приведет к появлению еще более реалистичных моделей освещения поверхности и наконец-то позволит создавать действительно сложные процедурные текстуры. Последний факт очень интересен: представьте себе алгоритмически генерируемую объемную текстуру с практически неограниченной детализацией, задаваемую как специальная программа (шейдер) и небольшой набор "константных" параметров (в том числе и 1D/2D-массивов, оформленных в виде текстур). С момента появления подобных новшеств уже неоднократно вставал вопрос о поддержке всего этого многообразия технологий со стороны конечных приложений и игр. Более или менее полноценная поддержка осуществляется, как правило, только для возможностей, заложенных в "mainstream"-карты. Т.е. только появление "GeForce3 MX", а в случае шейдеров-1.4 – RV250, способно широко распространить эти технологии. Впрочем, не будем столь пессимистичны, остается еще реальная надежда насладиться пиксельными шейдерами версии 1.4 – в неотвратимо приближающейся игре Doom III. По заявлению ее главного разработчика (имя которого и так всем известно), построение изображения с использованием R200 потребует вдвое, а то и втрое меньшее число проходов, нежели в случае GeForce3.

Разумеется, NVIDIA не может просто опустить руки и смириться с таким положением дел на ближайшие полгода. По их просьбе были приняты и включены в спецификацию DirectX 8.1 два дополнительных стандарта – шейдеры версии 1.2/1.3, реализующие незначительные дополнительные возможности, присущие GeForce3-семейству чипов. Несмотря на не столь существенные, как в случае версии 1.4, изменения, этот ход конем позволил NVIDIA также заявить о полной совместимости ее продуктов с DirectX 8.1 шейдерами. Более того, возможно, NVIDIA все-таки успела встроить совместимый с шейдерами-1.4 комбинационный конвейер в свой следующий чип, имеющий кодовое имя NV25. Судя по всему, именно факт технологического и скоростного превосходства Radeon 8500 заставил NVIDIA сделать ответный шаг и как по мановению волшебной палочки появилось четвертое поколение детонаторов (20.XX в общепринятой терминологии), увеличившее производительность GeForce3 в высоких разрешениях на 10 и более процентов за счет более оптимального размещения данных в локальной памяти карты и других, менее существенных, оптимизаций. Более всего возросла валовая скорость закраски в 32-битном цвете в высоких разрешениях, и именно это позволило GeForce3 не только идти на равных с R200 в нынешних приложениях, но и, как правило, опережать более высокочастотный чип ATI! Разумеется, драйверы R200 еще далеки от совершенства, да и финальная версия чипа еще не вышла, так что говорить об однозначном преимуществе GeForce3 рано, но если учесть, что GeForce3 стоит дешевле и появилась на полгода раньше, перспективы ATI начинают мрачнеть. А что, если NV25 добавит NVIDIA 30% производительности?

Впрочем, точно известно, что ни поддержки N-патчей, ни адаптивного AA в NV25 еще не будет – это прерогатива следующего поколения (NV30), которое мы при успешном стечении обстоятельств увидим сразу после появления R300 и RV250.

Следующее новшество, которое никак нельзя обойти стороной – адаптивное сглаживание (AAA – Adaptive Anti-Aliasing). Суть технологии – в динамическом (по ходу закраски) определении, сколько исходных значений рассчитывать для каждого результирующего пикселя сглаженного изображения. Фактически, эта технология приближается к истинно стохастическому сглаживанию, широко используемому в программной фотореалистичной графике. Во-первых, используется некий набор масок сглаживания, эмулирующих полностью случайный стохастический выбор, во-вторых, размер маски зависит от того, какой участок изображения мы строим. Насколько успешно реализована эта технология на практике, мы узнаем в скором времени, а пока отмечу, что чем больше полигонов содержит сцена, тем МЕНЬШЕ преимущество от использования данной технологии. Кроме того, она требует некоей доработки приложений. Но как бы там ни было, при эквивалентном (или чуть-чуть превосходящем) Quinqunx визуальном качестве падение производительности должно быть либо меньше, либо (в самых сложных ситуациях) эквивалентно оному. NV30, как уже сказано выше, также будет содержать некую технологию адаптивного сглаживания.

Прекрасная технология сжатия буфера глубины на основе иерархического представления (HyperZ) получила в R200 второе рождение – говорится о 20% приросте эффективной пропускной полосы памяти при использовании этой технологии. Кроме того, иерархический буфер глубины позволяет быстро очищать буфер кадра и осуществлять эффективный HSR (более эффективный, чем в случае GeForce3), особенно для выводимых в определенном порядке сцен (Front-to-Back – "вглубь"). Фактически, улучшение заключается в использовании тайлов меньшего размера (вдвое по обеим координатам), что позволяет более оптимально работать с современными и будущими приложениями.

Последний пункт, который мы затронем – шина, использованная в R200. Фактически, это знакомый нам по Radeon контроллер памяти, 128-бит шина и более широкая (256 против 128 бит) строка обмена с кэшем. В то время, как NVIDIA уменьшает этот параметр, применяя четырехканальную кроссбар-архитектуру, ATI, наоборот, стремится оптимизировать чип под большие пакеты передачи данных. Оба подхода имеют равное право на жизнь: их цель – оптимально соответствовать внутренней архитектуре чипа. Отметим, что именно кроссбар-контроллер позволил NVIDIA получить столь существенный прирост производительности в новых драйверах, оптимизировав размещение данных в памяти. И это при ее более низкой пропускной способности! Впрочем, большие внутренние кэши R200 сглаживают это преимущество (в R200 есть раздельные кэши вершин, текстур и буфера кадра, кроме того, есть специальный иерархический кэш для не менее иерархического Z-буфера). Правда, сглаживание преимуществ за счет кэшей достигается лишь в малых и средних разрешениях.

Стартовая цена базовой карты (Radeon 8500) – $400. Какая-либо конкуренция с NVIDIA в данный момент возможна только при выполнении двух условий: снижении цены до уровня $300 и появлении существенно оптимизированных драйверов, с которыми R200 сможет показать себя во всех приложениях как минимум равным GeForce3. Кстати, интересно, что в тесте 3DMark2001 R200 выступает очень хорошо, по количеству треугольников и спрайтов, а также по производительности шейдеров опережая GeForce3 как минимум вдвое. Но это преимущество будет реализовано только с повальным распространением способных использовать эти возможности приложений, т.е. уже ближе к моменту выхода R300. Фактически, на данный момент связка R200+драйверы показывает себя слабо, особенно учитывая высокую тактовую частоту памяти и чипа. Согласитесь, что имея полгода преимущества во времени, ATI могла выступить значительно лучше.

RV200

Как известно, наибольшие объемы продаж, а значит, и доминирование на всем рынке, осуществимы, в основном, в "mainstream"-секторе. И сюда позиционируются сразу два представителя нового семейства чипов от ATI: RV200 (сейчас) и RV250 (весной 2002 года). Фактически, RV200 – лишь несколько усовершенствованный вариант первого Radeon, снабженный более эффективным контроллером памяти от R200, выполненный по технологии 0.15 и с прекрасной поддержкой "двухголовости", видимо доставшейся ему в наследство от Radeon VE. Давайте взглянем на структурную схему этого мичуринского гибрида:

Технологически – ничего нового: все это мы уже видели в Radeon и Radeon VE. А вот производственная норма 0.15 позволит не только уменьшить себестоимость, но и увеличить тактовую частоту. Этот чип способен успешно конкурировать с семейством GeForce2 MX, существенно опережая его как по производительности, так и по набору возможностей (но пока, к сожалению, столь же явно опережая его по абсолютному значению стоимости).

Радует второй 350 МГц RAMDAC, интегрированный в чип. Не надо переживать по поводу ограничений внешнего RAMDAC (как это обычно происходит с Matrox G450/G550 или NVIDIA GeForce2 MX), особенно если у вас в наличии два полноценных 19 или более дюймовых монитора. Вновь в наличии встроенный TV-выход, требующий от независимых восточных производителей только мизерных капиталовложений в S-Video разъем; вновь нам доступно множество дуальных конфигураций (см. выше по тексту) и новые возможности (программная поддержка HydraVision новой версии) по управлению несколькими десктопами. Пока не ясно, какие еще типовые конфигурации памяти будут применяться с картами на базе этого чипа – судя по всему, весьма различные, т.к. именно RV200 вначале должен стать наиболее популярным у независимых производителей. За сим, собственно говоря, все.

Стартовая цена базовой карты с 64 Мб DDR памяти – $180; несомненно, она будет стремительно снижаться, особенно с появлением карт на базе RV200 от сторонних производителей. Реальная конкуренция с NVIDIA в этом сегменте рынка возможна лишь при цене ниже $140, даже несмотря на то, что по производительности этот чип зачастую опережает аж GeForce2 Pro.

RV250

А вот это "mainstream"-решение уже более интересно, хотя, к сожалению, и не столь близко к нам по времени – ждать этого чипа еще как минимум полгода. Фактически, это R200, но с двумя интегрированными RAMDAC 350 МГц (скорее всего, они ничем не отличаются от 400 МГц R200, но позиционирование чипа требует более "скромных" характеристик). Что интересно, планируется более высокая тактовая частота (300 МГц), что, вопреки приведенной в самом начале статьи диаграмме, наводит на мысли о технологии 0.13 мкм. Только тогда можно будет обеспечить приемлемое для "mainstream" снижение себестоимости чипа и увеличить до 300 МГц рабочую частоту ядра, эквивалентного по сложности R200. Можно, конечно, надеяться и на обкатку 0.15 техпроцесса, увеличение выхода годных чипов, но куда девать дополнительно рассеиваемую мощь? Сравнимое с "performance" энергопотребление не к лицу "mainstream"-нише.

R300

На этом чипе будет основано следующее поколение решений от ATI. Не будем преждевременно спекулировать на тему запланированного DirectX 9 монстра, да еще и с профессиональными замашками, отметим лишь обещанное аппаратное декодирование и, что самое главное, кодирование не только всего семейства MPEG1/2/4, но и DV (!). А также, 8 пиксельных конвейеров по 4 текстурных блока на каждом (до 8 текстур за проход и, как следствие, вероятно, новую технологию экономии пропускной или эффективной полосы памяти, способную худо-бедно обеспечить пожираемый таким "взводом" объем текстур).

Да, пожалуй, вновь усомнимся в реальности приведенной на диаграмме 0.15 технологии (при частоте ядра 350 МГц и памяти более 400 МГц и чип, и карта просто превратятся в печку, если технологические нормы и вольтаж останутся такими же, как и у R200).

Отметим наличие двух RAMDAC, интегрированного TV-Out. Вдвое большую по сравнению с R200 производительность по треугольникам. Заявлено 150 миллионов в секунду против 75 у R200, но опыт Radeon и GeForce3 показывает, что приводимые ATI цифры необходимо делить как минимум в 4 раза, а приводимые NVIDIA – вдвое. Впрочем, чтобы судить об этом чипе, необходимо сперва увидеть финальную спецификацию DirectX 9 – именно тогда многое станет ясно. Что ж, ждать не так долго – темпы развития этой области хайтека не позволяют нам быстро состариться в ожидании лучшего.

Заключение

И все же, никакое технологическое преимущество и никакие прекрасные чипы не исправят плохой маркетинг или неэффективные и неряшливо написанные драйверы. Я надеюсь, что в предверии предстоящего запуска серии R200 в ATI наконец-то сделают схожий вывод. Пока же, чип выглядит технологически интересным, но совершенно невостребованным.