RADEON 256 — новый GPU от ATI

Еще в марте мы опубликовали раннее превью нового графического процессора от ATI, носившего кодовое имя Rage6. Сегодня маски сняты, и мы знакомим вас с подробностями о новом детище известной канадской компании ATI.

Как и ожидалось, новый чип от ATI получил новое имя — RADEON 256. Да, ATI отказалась от марки Rage и правильно сделала. Уж больно много удачных и не очень чипов было выпущено под этой маркой, кроме того, в RADEON 256 реализовано много новых идей и решений, так что смена марки абсолютно оправдана. Можно долго спорить насчет того, удачно или нет выбрано имя RADEON 256, можно долго издеваться над созданным логотипом, но имя выбрано, логотип нарисован, так что мы к ним все равно рано или поздно привыкнем.

Мы специально решили оставить без изменений наше раннее превью RADEON 256 (Rage6), чтобы у вас была возможность сравнить данные, которые мы публикуем сегодня, с теми данными, которые мы публиковали в марте. Кроме того, такой подход позволит нам не делать повторений, а сосредоточить внимание на деталях, которые того стоят.

Понятно, что все мы хотим купить современный графичекий акселератор, который прослужит нам верой и правдой не менее года. Для этого современный графический процессор должен обладать определенным набором свойств, некоторые из которых сегодня просто обязательны. Прежде всего — это высокая скорость при использовании 32-битной глубины представления цвета в сегодняшних играх и в тех играх, которые только находятся в разработке. К чему требовательны современные (и будущие) игры, известно — это огромное число полигонов при тесселяции (представлении сложных фигур набором полигонов; чем больше полигонов, тем более точно передается форма объекта), сложные сцены с большим числом перекрытий одних объектов другими (depth complexity), широкое применение мультитекстурирования и различных методов освещения. Чтобы успешно справляться со своими обязанностями, в чипе RADEON 256 реализована поддержка ряда технологических решений. Прежде всего, это движок рендеринга Charisma Engine и архитектура рендеринга Pixel Tapestry. Кроме графической части в RADEON 256 уделено внимание воспроизведению видео и подключению модных сегодня цифровых мониторов. RADEON 256 имеет встроенный TMDS трансмиттер, что позволяет без проблем подключать мониторы с цифровым интерфейсом. В области видео, наряду с поддержкой воспроизведения HDTV форматов, в RADEON 256 реализована уникальная пока технология улучшения видеоизображений — Adaptive de-interlacing.

Итак, посмотрим на ключевые характеристики GPU RADEON 256:

  • 256-разрядное графическое ядро, состоящее из двух 128-разрядных блоков
  • Технологический процесс: 0.18 мкм, позднее, по нашей информации, ожидается переход на 0.15 и 0.13 мкм
  • Площадь ядра: 100 мм2
  • Количество транзисторов: 30 млн.
  • Число конвейеров рендеринга: два, с тремя блоками текстурирования на каждом
  • Частота ядра: 200 МГц (по нашей информации, архитектура ядра рассчитана на частоты вплоть до 400 МГц)
  • Частота работы шины памяти: до 200 Мгц
  • Поддерживаемые типы памяти: DDR SDRAM (в будущем возможно использование памяти типа DDR FCDRAM) и стандартная SDR SDRAM/SGRAM
  • Объем локальной видеопамяти: от 8 Мб до 128 Мб
  • Поддерживается технология HyperZ, которая позволяет увеличить эффективность ширины полосы пропускания видеопамяти более, чем на 20%. HyperZ — Color/Depth Mixed mode 16/32 — возможность выбора разрядности буфера глубины независимо от глубины представления цвета, например, при 32-битном цвете можно использовать 16 бит Z-буфер. Способствует увеличению производительности.
  • Ширина полосы пропускания памяти: 6.4 Гб в сек. . (пиковая при частоте работы памяти 200 МГц), при использовании технологии HyperZ — до 8 Гб в сек.
  • Pixel Fillrate: 400 млн. пикселей в секунду
  • Texel Fillrate:
    • 1 texel per 1 Pixel 400 млн. текселей в секунду
    • 2 texel per 1 Pixel 800 млн. текселей в секунду
    • 3 texel per 1 Pixel 1200 млн. текселей в секунду
  • В чипе имеются кэши: текстурный, пиксельный и координат вершин (vertex cache)
  • RAMDAC: 350 МГц, интегрирован в графическое ядро
  • Максимальное разрешение: 2048x1536@75Hz
  • Интегрированный в чип TMDS трансмиттер позволяет подключать цифровые мониторы и поддерживает разрешение вплоть до 1600x1200
  • Поддерживается технология MAXX, т.е. допускается установка двух чипов RADEON 256 на одной карте
  • Интерфейс внешней шины: полная поддержка AGP x2/x4 (включая SBA, DME и Fast Writes) и PCI 2.2 (включая Bus mastering). Режим AGP x4 Fast Writes позволяет использовать метод прямого обмена данными CPU и GPU, миную системную память компьютера со скоростью до 1 Гб/сек, что должно положительно сказываться на общей производительности и разгружать шину системной памяти.

3D-графика:

  • Геометрический движок Charisma Engine — аппаратная реализация преобразования координат, установка освещения, clipping (отсечение полигонов, не входящих в конечный кадр), vertex skinning, keyframe interpolation (интерполяция между ключевыми кадрами), perspective devide, triangle setup
  • Поддержка до четырех skinning матриц, применяемых для интерполяции вершин полигонов (vertex blending)
  • Производительность HW TCL: 30 млн. текстурированных полигонов в секунду (пиковая)
  • Аппаратная установка 8 источников света для всей сцены (directional aka infinite и point Lights aka local)
  • Полная поддержка OpenGL и DX7 — Tranform & Lighting, Cube environment mapping (кубического текстурирования картами окружения), projective textures (проекция текстур) и компрессия текстур
  • Движок рендеринга Pixel Tapestry, позволяющий использовать три блока текстурирования на каждом конвейере рендеринга пикселей
  • Поддерживаются следующие методы наложения текстур: Сubic, Spherical и Dual-Paraboloid
  • Рендеринг при 16- и 32-битной глубине представления цвета
  • Аппаратная поддержка рельефного текстурирования следующих типов: Embosing, Dot Product3, EMBM
  • Поддерживаются текстуры вплоть до 2048x2048 @ 32 bit
  • Программируемые режимы смешивания нескольких текстур
  • Поддерживаются 3D-текстуры, это позволяет воспроизводить объемные эффекты, например, туман или динамично изменяемый источник света, например, огонь в камине
  • Поддержка реализации аппаратных эффектов типа Motion Blur, Depth of Field, сглаживания всей сцены (FSAA) и т.д. через D3D8
  • Буфер шаблонов (стенсель): 8 бит
  • Z-буфер: 16/24/32 бит
  • Наложение теней для каждого индивидуального источника света, для этого в чипе реализован специалный Priority Buffer
  • Полная поддержка Direct3D модели освещения
  • Поддержка табличного и вершинного тумана

Видео:

  • Поддерживается аппаратное декодирование всех форматов HDTV
  • Поддерживаются все разрешения ATSC, включая 1080i
  • Благодаря поддержке формата YPrPb имеется возможность прямого подключения HDTV-дисплеев
  • Поддерживается технология Adaptive de-interlacing — уникальная технология от ATI, позволяющая воспроизводить видео с высокой четкостью без артефактов или размытия
  • Поддерживается 8-bit режим альфа-смешивания видео и графики (например, это используется для наложения субтитров или анимационных меню)
  • Полная совместимость с чипом-компаньоном Rage Theater от ATI

Теперь поговорим более подробно о некоторых деталях нового чипа и новых решениях от ATI. Для начала посмотрим на схематичное представление архитектуры RADEON 256:

Из приведенной схемы при желании можно почерпнуть дополнительную информацию, которую мы могли пропустить.

Charisma Engine

Геометрический движок Charisma Engine имеет следующие возможности:

Аппаратная поддержка установки вершинного освещения. Ожидается, что при использовании более одного источника света типа Directional Lights (направленное освещение, aka Infinite; в этом случае источник света трактуется как точка, расположенная на бесконечном расстоянии от видимых объектов сцены) падение производительности будет менее существенным по сравнению с GeForce256.

Аппаратное преобразование координат вершин полигонов из 3D-координат моделируемой сцены в 2D-координаты экрана монитора с учетом коррекции расстояний, т.н. операция трансформации перспективы.

На аппаратном уровне поддерживается процесс отсечения невидимых в конечной сцене полигонов — Clipping.

Несмотря на то, что GeForce 256 поддерживает Clipping на аппаратном уровне, его геометрический сопроцессор обычно называют сокращенным именем HW T&L. Сейчас же все чаще блок геометрических операций и установки вершинного освещения называют сокращенно HW TCL, подчеркивая наличие аппаратного Clipping, хотя и старое сокращение "HW T&L" ничем не хуже.

Заявленная производительность HW TCL у RADEON 256 — 30 млн. полигонов в секунду. Если учесть, что для GeForce 2 GTS заявлена производительность в 25 млн. полигонов в секунду, то блок геометрических операций у RADEON 256 будет до осени самым быстрым в индустрии (по крайней мере, в теории).

На аппаратном уровне могут выполняться ряд специальных операций, поддержка которых реализована в Charisma Engine: Vertex Skinning и Keyframe Interpolation.

Аппаратная поддержка Triangle Setup, т.е. процесс преобразования плавающих координат вершин треугольников к целочисленным координатам в кадровом буфере и установки прочих параметров, связанных с вершинами, например, привязки текстур.

Vertex Skinning

Это метод правильной трансформации вершин геометрической сетки в местах сгиба модели, т.е. работа идет только с геометрией, а не с текстурами. Текстуры на корректно трансформированную геометрию натянутся правильно. Чтобы геометрия была трансформирована корректно, особенно на сгибах и сочленениях (например, все суставы при моделировании тела человека), применяется техника vertex skinning (single-skin effect). Заметим, что vertex skinning является подмножеством метода интерполяции вершин (vertex blending). По сути, vertex blending — это как alpha blending, только для вершин, а не для пикселов (V = V1*alpha + V2*(1-alpha)). Метод vertex skinning — это vertex blending для вершин, обработанных разными матрицами (V = V1*M1*alpha + V2*M2*(1-alpha)). Подчеркнем: корректность наложения текстур на сгибах является следствием правильного расположения вершин, которое и достигается при помощи vertex skinning. Применяется Vertex Skinning для того, чтобы на стыках текстур были плавные, естественные переходы, особенно во время движения. Интерполяция вершин осуществляется с помощью матриц, называемых Skinning Matrices.

В D3D есть поддержка для 2-, 3- и 4-матричной интерполяции вершин. В большинстве случаев хватает 2-матричной интерполяции. Однако на стыке туловища с шеей и руками предпочтительнее использовать 4-матричную интерполяцию, а на стыке туловища и двух ног — 3-матричную интерполяцию. Тем не менее, улучшение от 3- и 4-матричной интерполяции вершин видны только при долгом рассмотрении персонажа размером во весь экран. В GeForce 256 поддерживается на аппаратном уровне только 2-матричная интерполяция. Пример 2-матричной интерполяции — это вся живность в демо DMZG, там этот эффект используется по полной программе.

Keyframe Interpolation

Интерполяция по ключевым кадрам позволяет реализовать на аппаратном уровне изменение внешнего вида отображаемого объекта за счет задания только начального изображения, конечного изображения и ключевых промежуточных кадров, все остальные преобразования выполняются автоматически. Иными словами, Charisma Engine вставляет необходимое число интерполированных кадров между "ключевыми", и в результате, например, можно довольно просто реализовать изменение мимики на лице персонажа игры. Обратите внимание на анимированную картинку справа, это пример использования интерполяции по ключевым кадрам.

Эти скриншоты были сделаны в специальной демонстрационной программе. Параметры изменения мимики задаются в обычном текстовом файле, и с этими параметрами можно долго экспериментировать. В качестве исходного изображения используется обычная картинка с наборами фрагментов лица в формате TGA. В общем, использование интерполяции по ключевым кадрам — довольная простая в использовании технология, так что есть все основания надеяться в скором времени увидеть ее применение в реальных играх.

Понятно, что выполнение операций TCL, а также Vertex Skinning и Keyframe Interpolation требует мощных вычислительных ресурсов. У RADEON 256, судя по всему, с этим нет никаких проблем. В результате, разработчики игр смогут использовать большее число полигонов при тесселяции и применять различные специальные эффекты, что сделает 3D-мир в игре более реальным.

Высвободившиеся ресурсы CPU разработчики игр могут использовать, например, для обсчёта AI. Для сравнения: в играх, не ориентированных на использование HW TCL, на обсчет AI обычно отводится до 5% ресурсов CPU, зато в новых играх, ориентированных на использование возможностей HW TCL, на обсчет AI можно уже будет отвести до 30-40% ресурсов CPU, а это значит, что ваши виртуальные противники станут коварнее и хитрее (по крайней мере, можно на это надеяться). Кроме того, высвобождаемые ресурсы CPU можно использовать для расчета физических эффектов повышенной сложности, например, гравитация, атмосферные эффекты. Стоит заметить, что если в игре используются возможности HW TCL, но не используются высвобождаемые ресурсы CPU, то пользователь все равно получит великолепную по качеству и очень быструю графику, хотя не заметит никаких других плюсов.

Pixel Tapestry

Кроме возможности аппаратно ускорять геометрическую стадию при рендеринге изображения, RADEON 256, разумеется, умеет аппаратно ускорять стадию растеризации. Именно для этой цели и была создана архитектура рендеринга пикселей и движок с таким же названием — Pixel Tapestry. Этот движок рендеринга встроен в RADEON 256 и был специально создан для реализации работы трех текстурных блоков на каждом из имеющихся конвейеров рендеринга. В RADEON 256 имеется два конвейера рендеринга, на каждом из которых имеется по три блока текстурирования. Это позволяет:

  • смешивать и фильтровать до трех текстур на пиксель без потерь в скорости
  • аппаратно реализовать различные методы трансформации текстур (cubic environment mapping, projective texturing и т.д)
  • реализовать однопроходное наложение рельефных текстур с помощью методов Emboss, Dot Product 3 и Environment Mapped Bump Mapping (EMBM)
  • точно моделировать отражающие свойства материалов (вода, металл, дерево и т.д)

Кроме того, с помощью движка Pixel Tapestry реализована поддержка:

  • Priority Buffer, который используется для наложения реалистичных теней shadow mapping от индивидуальных источников света
  • 3D Textures (трехмерные текстуры), что позволяет создавать сложные, динамические источники освещения, а также объемный туман, дым, жидкости, и упрощает обращение с объектами с изменяемой геометрией

Не секрет, что чем больше текстур можно наложить на пиксель за такт, тем реалистичнее и детальнее получается конечное изображение без потерь в общей производительности. Текстуры применяются для наложения карт освещенности, карт теней, моделирования отражений и зеркальных поверхностей, рельефа (bump maps) и т.д.

Особо стоит отметить поддержку рельефного текстурирования EMBM, который пока поддерживается только чипами серии G400 от Matrox, но зато используется в нескольких десятках игр.

Положительным моментом является поддержка RADEON 256 метода кубического наложения карт среды, поддерживаемого в D3D 7.0. В этом методе нет зависимости от точки обзора, но зато используется 6 текстур. Кроме этого метода RADEON 256 поддерживает еще и сферический метод (1 текстура, есть зависимость от точки обзора), двойной параболоидный метод (2 текстуры, зависимость от точки обзора).

Чтобы сцена в игре выглядела реалистично и имела глубину, применяют моделирование теней. Для наложения естественных теней, отбрасываемых объектами сцены в зависимости от удаленности от каждого источника света, в RADEON 256 реализована поддержка специального Priority Buffer (приоритетный буфер). Этот буфер формируется за счет ресурсов локальной видеопамяти и позволяет накапливать информации по объектам, отбрасывающим тени. С помощью Priority Buffer определяется порядок использования данных, в результате первым начинает формироваться тень от объекта, наиболее приближенного к наблюдателю. Наложение теней осуществляется за счет трансформации текстур. Этот метод проще и эффективнее, чем использование традиционного буфера шаблонов.

RADEON 256 имеет поддержку Range-Based Fog, т.е. наложения тумана, плотность которого зависит от удаленности объектов от игрока.

Одна из новых функциональных особенностей RADEON 256 — это поддержка 3D texures (трехмерные текстуры). 3D Texture — это текстура, представляющая собой 3D-массив пикселей, а не 2D, как в обычном случае. Это нововведение в OpenGL1.2. До недавнего времени поддержка трехмерных текстур имелась только в Permedia3 от 3Dlabs. Этот тип текстур можно использовать для работы с вокселями (объемные пиксели), наложения сферических текстур для моделирования объемных источников света. Трехмерные текстуры упрощают использование деформируемой геометрии, например, можно отрезать или отщипнуть часть объекта без необходимости обновления текстуры.

В RADEON 256 уже заложена поддержка ряда новшеств, которые будут реализованы в грядущем D3D8 из состава DirectX 8.0, анонс которого ожидается к концу лета. Среди этих новшеств нужно отметить поддержку эффектов Motion Blur и Depth of Field, а также full-scene Anti-aliasing. Знакомые термины? Конечно! В API D3D8.0 будет введена поддержка эффектов T-Buffer от 3dfx.

Вообще, про FSAA в пресс-релизе RADEON 256 говорится следующее: "Comprehensive support for full scene, order-independent anti-aliasing", что означает полную поддержку полносценного, независмого от порядка применения, сглаживания. Вполне логично ожидать существенного падения производительности (до 2 раз) при применении FSAA. Применять или не применять FSAA, решать все равно пользователю.

Пока неясна ситуация с поддержкой Pixel Shaders. Pixel Shaders — это такой метод создания мультитекстурных эффектов "вручную", поддержка которого будет в DirectX 8.0. Суть в том, что раньше можно было смешивать текстуры только по нескольким заранее заданным формулам (как правило, состоящим из 1-2х операций), зато теперь Pixel Shader — это как бы "программа" смешивания текстур, заданная вручную (туда входят операции +, -, /, * и ещё несколько более экзотических, и это можно комбинировать в любом количестве).

Pixel Shaders подразумевает работу на уровне пикселей при моделировании 3D-графики, а не на уровне вершин полигонов. Судя по всему, никакого специального блока для применения программируемых и заранее заданных мультитекстурных эффектов на уровне пикселей в RADEON 256 нет, но есть возможность управлять процессом смешивания результатов работы тексельных блоков. Этого вполне достаточно для заявления в в пресс-релизе буквально следующего: "First with advanced DX8 pixel shader effects".

Кроме графической части, которая, безусловно, важна, в RADEON 256 есть и встроенные дополнительные возможности, которые можно отнести к сфере видео и которые имеют общее название Video Immersion. Прежде всего, это традиционная для ATI прекрасная поддержка декодирования DVD-видео (аппаратная реализвация motion compensation и iDCT). RADEON 256 вобрал в себя все лучшие наработки ATI, ориентированные на приставки set-top box и бытовую электронику. Поэтому RADEON 256 будет легко использовать для просмотра DVD, DTV, цифровых видеомагнитофонов и т.д. в повседневной жизни. Возможность декодирования всех типов HDTV форматов и подключения как аналоговых, так и цифровых дисплеев делают RADEON 256 очень привлекательным решением для просмотра HDTV с помощью настольного компьютера.

Но это не все. В RADEON 256 реализована поддержка уникальной технологии Adaptive de-interlacing от ATI, позволяющей воспроизводить видео с высокой четкостью без артефактов или размытия. Чтобы не писать лишних слов, просто приведем иллюстрации:

         
Слева направо: Bob De-interlacing (текст смазан), Add Field De-interlacing ("перистое" изображение) и, наконец, Adaptive De-interlacing (четкий текст, четкое изображение)

Впечатляет, не правда ли? Остается дождаться карт и соответствующего DVD-плеера от ATI и все проверить на практике.

Кроме того, при установке на карту с RADEON 256 чипа-компаньона Rage Theater у пользователей появится возможность не только выводить видеосигнал, но и осуществлять его захват с одновременным кодированием в различные видеоформаты.

Из приятных дополнительных возможностей RADEON 256 стоит отметить наличие встроенного TMDS-трансмиттера, что позволяет без установки дополнительных внешних чипов подключать к плате на RADEON 256 цифровые мониторы.

По имеющейся у нас информации, платы на базе RADEON 256 будут анонсированы уже летом, и сразу же начнутся их массовые продажи. Причем не исключен анонс сразу целой линейки плат, возможно, будет сразу объявлена и плата с двумя чипами RADEON 256 на борту. Почему анонс плат будет позже? По нашему мнению, главной причиной задержки является отсутствие отлаженных драйверов, а не аппаратные проблемы. Возможно, руководство ATI здраво рассудило, что анонс карт и начало их продаж лишь, скажем, через пару месяцев хуже, чем анонс карт на пару месяцев позже анонса чипа, но зато этот анонс совпадет с началом реальных массовых продаж карт на базе RADEON 256. Видимо, все-таки ATI научилась извлекать уроки из собственных ошибок.

На иллюстрации справа можно посмотреть на вариант комплектации карты на базе RADEON 256. Обратите внимание, что на карте уже установлен чип-компаньон Rage Theater, соответственно, в наличии видеовходы и выходы. Кроме того, можно заметить наличие двух трансформаторов — они должны обеспечить стабильное электропитание и оградить пользователей от проблем, которые бывают из-за некачественно сделанных системных плат. Также нетрудно рассмотреть маркировку чипов памяти — это память типа DDR SDRAM (4Mx16) от Hyundai. Эта память расчитана на частоту в 183 МГц. Тем не менее, не будем забывать, что официальные спецификации плат на RADEON 256 еще не объявлены.

Разумеется, всем интересно узнать о том, сколько будут стоить карты на базе RADEON 256 и какова будет их производительность в играх. О ценах можно лишь гадать. Одно ясно: к моменту начала массовых продаж карт на базе RADEON 256 карты на базе GeForce 2 GTS уже успеют подешеветь. Тем не менее, можно прогнозировать агрессивную ценовую политику ATI, что только на руку нам — потребителям.

Что касается производительности, то, если судить по предыдущим продуктам от ATI, есть все основания ожидать великолепные результаты при использовании 32-битной глубины представления цвета, и 60 fps при разрешении 1024x768 нам практически гарантированы.

Выводы

Ну что же, можно подвести черту. Новый GPU RADEON 256 от ATI обладает массой интересных функциональных возможностей, некоторые из которых пока просто уникальны. Отметим заявленную высокую производительность Charisma Engine на геометрических операциях. Если учесть, что, по прогнозам, примерно 50% самых интересных игр 2000 года будут поддерживать HW TCL, то вычислительную мощь RADEON 256 будет, где применить. Использование высокоскоростной памяти типа DDR SDRAM позволит картам на базе RADEON 256 составить серьезную конкуренцию, в смысле производительности в играх, на рынке. Архитектура Pixel Tapestry позволяет добиться высокого качества 3D-графики. Особо отметим поддержку рельефного текстурирования типа EMBM, так как благодаря Matrox на рынке уже довольно много игр, где применяется эта техника. В общем, с качеством 3D-графики не должно быть проблем, главное, чтобы не подкачали драйверописатели. Фактически, RADEON 256 обладает всеми свойствами, которые потребуются для комфортной игры в игры 2000 года.

По нашей информации, архитектура ядра RADEON 256 рассчитана на тактовые частоты вплоть до 400 МГц (очень вероятно, что поднять частоту ядра выше 300 МГц можно будет только при переходе на 0.15 или даже на 0.13 мкм технологический процесс), что позволит ATI без особых усилий выпустить к концу года новую версию чипа. Не будем забывать и о поддержке технологии MAXX, в общем, заделы на будущее есть, и неплохие. Компании ATI будет, что производить в этом году.

Прекрасная поддержка декодирования DVD-видео и возможность установки чипа-компаньона Rage Theater позволит превратить карты на базе RADEON 256 в универсальные мультимедиа комбайны. В конце концов, не каждый играет в игры типа Quake3. Некоторые увлекаются процессом создания собственного домашнего видеоархива.

Итак, на наш взгляд, чип RADEON 256 выглядит, как прекрасно сбалансированное решение для игр 2000 года. Главное, чтобы платы на базе RADEON 256 появились в продаже уже этим летом и в достаточных количествах, чтобы любой трудящийся мог без проблем купить себе современную карту от ATI. Разумеется, цена карт на RADEON 256 должна быть, как минимум, привлекательной. Если же ATI хочет потеснить NVIDIA, то придется вести агрессивную ценовую и рекламную политику, но главное: ATI просто обязана обеспечить достаточные объемы производства карт на базе RADEON 256.

Мы же запасемся терпением и будем ждать карту на базе RADEON 256 для испытаний в реальной жизни.




25 апреля 2000 Г.

Первый взгляд на новый GPU RADEON 256 от ATI

RADEON 256 — новый GPU от ATI

Еще в марте мы опубликовали раннее превью нового графического процессора от ATI, носившего кодовое имя Rage6. Сегодня маски сняты, и мы знакомим вас с подробностями о новом детище известной канадской компании ATI.

Как и ожидалось, новый чип от ATI получил новое имя — RADEON 256. Да, ATI отказалась от марки Rage и правильно сделала. Уж больно много удачных и не очень чипов было выпущено под этой маркой, кроме того, в RADEON 256 реализовано много новых идей и решений, так что смена марки абсолютно оправдана. Можно долго спорить насчет того, удачно или нет выбрано имя RADEON 256, можно долго издеваться над созданным логотипом, но имя выбрано, логотип нарисован, так что мы к ним все равно рано или поздно привыкнем.

Мы специально решили оставить без изменений наше раннее превью RADEON 256 (Rage6), чтобы у вас была возможность сравнить данные, которые мы публикуем сегодня, с теми данными, которые мы публиковали в марте. Кроме того, такой подход позволит нам не делать повторений, а сосредоточить внимание на деталях, которые того стоят.

Понятно, что все мы хотим купить современный графичекий акселератор, который прослужит нам верой и правдой не менее года. Для этого современный графический процессор должен обладать определенным набором свойств, некоторые из которых сегодня просто обязательны. Прежде всего — это высокая скорость при использовании 32-битной глубины представления цвета в сегодняшних играх и в тех играх, которые только находятся в разработке. К чему требовательны современные (и будущие) игры, известно — это огромное число полигонов при тесселяции (представлении сложных фигур набором полигонов; чем больше полигонов, тем более точно передается форма объекта), сложные сцены с большим числом перекрытий одних объектов другими (depth complexity), широкое применение мультитекстурирования и различных методов освещения. Чтобы успешно справляться со своими обязанностями, в чипе RADEON 256 реализована поддержка ряда технологических решений. Прежде всего, это движок рендеринга Charisma Engine и архитектура рендеринга Pixel Tapestry. Кроме графической части в RADEON 256 уделено внимание воспроизведению видео и подключению модных сегодня цифровых мониторов. RADEON 256 имеет встроенный TMDS трансмиттер, что позволяет без проблем подключать мониторы с цифровым интерфейсом. В области видео, наряду с поддержкой воспроизведения HDTV форматов, в RADEON 256 реализована уникальная пока технология улучшения видеоизображений — Adaptive de-interlacing.

Итак, посмотрим на ключевые характеристики GPU RADEON 256:

  • 256-разрядное графическое ядро, состоящее из двух 128-разрядных блоков
  • Технологический процесс: 0.18 мкм, позднее, по нашей информации, ожидается переход на 0.15 и 0.13 мкм
  • Площадь ядра: 100 мм2
  • Количество транзисторов: 30 млн.
  • Число конвейеров рендеринга: два, с тремя блоками текстурирования на каждом
  • Частота ядра: 200 МГц (по нашей информации, архитектура ядра рассчитана на частоты вплоть до 400 МГц)
  • Частота работы шины памяти: до 200 Мгц
  • Поддерживаемые типы памяти: DDR SDRAM (в будущем возможно использование памяти типа DDR FCDRAM) и стандартная SDR SDRAM/SGRAM
  • Объем локальной видеопамяти: от 8 Мб до 128 Мб
  • Поддерживается технология HyperZ, которая позволяет увеличить эффективность ширины полосы пропускания видеопамяти более, чем на 20%. HyperZ — Color/Depth Mixed mode 16/32 — возможность выбора разрядности буфера глубины независимо от глубины представления цвета, например, при 32-битном цвете можно использовать 16 бит Z-буфер. Способствует увеличению производительности.
  • Ширина полосы пропускания памяти: 6.4 Гб в сек. . (пиковая при частоте работы памяти 200 МГц), при использовании технологии HyperZ — до 8 Гб в сек.
  • Pixel Fillrate: 400 млн. пикселей в секунду
  • Texel Fillrate:
    • 1 texel per 1 Pixel 400 млн. текселей в секунду
    • 2 texel per 1 Pixel 800 млн. текселей в секунду
    • 3 texel per 1 Pixel 1200 млн. текселей в секунду
  • В чипе имеются кэши: текстурный, пиксельный и координат вершин (vertex cache)
  • RAMDAC: 350 МГц, интегрирован в графическое ядро
  • Максимальное разрешение: 2048x1536@75Hz
  • Интегрированный в чип TMDS трансмиттер позволяет подключать цифровые мониторы и поддерживает разрешение вплоть до 1600x1200
  • Поддерживается технология MAXX, т.е. допускается установка двух чипов RADEON 256 на одной карте
  • Интерфейс внешней шины: полная поддержка AGP x2/x4 (включая SBA, DME и Fast Writes) и PCI 2.2 (включая Bus mastering). Режим AGP x4 Fast Writes позволяет использовать метод прямого обмена данными CPU и GPU, миную системную память компьютера со скоростью до 1 Гб/сек, что должно положительно сказываться на общей производительности и разгружать шину системной памяти.

3D-графика:

  • Геометрический движок Charisma Engine — аппаратная реализация преобразования координат, установка освещения, clipping (отсечение полигонов, не входящих в конечный кадр), vertex skinning, keyframe interpolation (интерполяция между ключевыми кадрами), perspective devide, triangle setup
  • Поддержка до четырех skinning матриц, применяемых для интерполяции вершин полигонов (vertex blending)
  • Производительность HW TCL: 30 млн. текстурированных полигонов в секунду (пиковая)
  • Аппаратная установка 8 источников света для всей сцены (directional aka infinite и point Lights aka local)
  • Полная поддержка OpenGL и DX7 — Tranform & Lighting, Cube environment mapping (кубического текстурирования картами окружения), projective textures (проекция текстур) и компрессия текстур
  • Движок рендеринга Pixel Tapestry, позволяющий использовать три блока текстурирования на каждом конвейере рендеринга пикселей
  • Поддерживаются следующие методы наложения текстур: Сubic, Spherical и Dual-Paraboloid
  • Рендеринг при 16- и 32-битной глубине представления цвета
  • Аппаратная поддержка рельефного текстурирования следующих типов: Embosing, Dot Product3, EMBM
  • Поддерживаются текстуры вплоть до 2048x2048 @ 32 bit
  • Программируемые режимы смешивания нескольких текстур
  • Поддерживаются 3D-текстуры, это позволяет воспроизводить объемные эффекты, например, туман или динамично изменяемый источник света, например, огонь в камине
  • Поддержка реализации аппаратных эффектов типа Motion Blur, Depth of Field, сглаживания всей сцены (FSAA) и т.д. через D3D8
  • Буфер шаблонов (стенсель): 8 бит
  • Z-буфер: 16/24/32 бит
  • Наложение теней для каждого индивидуального источника света, для этого в чипе реализован специалный Priority Buffer
  • Полная поддержка Direct3D модели освещения
  • Поддержка табличного и вершинного тумана

Видео:

  • Поддерживается аппаратное декодирование всех форматов HDTV
  • Поддерживаются все разрешения ATSC, включая 1080i
  • Благодаря поддержке формата YPrPb имеется возможность прямого подключения HDTV-дисплеев
  • Поддерживается технология Adaptive de-interlacing — уникальная технология от ATI, позволяющая воспроизводить видео с высокой четкостью без артефактов или размытия
  • Поддерживается 8-bit режим альфа-смешивания видео и графики (например, это используется для наложения субтитров или анимационных меню)
  • Полная совместимость с чипом-компаньоном Rage Theater от ATI

Теперь поговорим более подробно о некоторых деталях нового чипа и новых решениях от ATI. Для начала посмотрим на схематичное представление архитектуры RADEON 256:

Из приведенной схемы при желании можно почерпнуть дополнительную информацию, которую мы могли пропустить.

Charisma Engine

Геометрический движок Charisma Engine имеет следующие возможности:

Аппаратная поддержка установки вершинного освещения. Ожидается, что при использовании более одного источника света типа Directional Lights (направленное освещение, aka Infinite; в этом случае источник света трактуется как точка, расположенная на бесконечном расстоянии от видимых объектов сцены) падение производительности будет менее существенным по сравнению с GeForce256.

Аппаратное преобразование координат вершин полигонов из 3D-координат моделируемой сцены в 2D-координаты экрана монитора с учетом коррекции расстояний, т.н. операция трансформации перспективы.

На аппаратном уровне поддерживается процесс отсечения невидимых в конечной сцене полигонов — Clipping.

Несмотря на то, что GeForce 256 поддерживает Clipping на аппаратном уровне, его геометрический сопроцессор обычно называют сокращенным именем HW T&L. Сейчас же все чаще блок геометрических операций и установки вершинного освещения называют сокращенно HW TCL, подчеркивая наличие аппаратного Clipping, хотя и старое сокращение "HW T&L" ничем не хуже.

Заявленная производительность HW TCL у RADEON 256 — 30 млн. полигонов в секунду. Если учесть, что для GeForce 2 GTS заявлена производительность в 25 млн. полигонов в секунду, то блок геометрических операций у RADEON 256 будет до осени самым быстрым в индустрии (по крайней мере, в теории).

На аппаратном уровне могут выполняться ряд специальных операций, поддержка которых реализована в Charisma Engine: Vertex Skinning и Keyframe Interpolation.

Аппаратная поддержка Triangle Setup, т.е. процесс преобразования плавающих координат вершин треугольников к целочисленным координатам в кадровом буфере и установки прочих параметров, связанных с вершинами, например, привязки текстур.

Vertex Skinning

Это метод правильной трансформации вершин геометрической сетки в местах сгиба модели, т.е. работа идет только с геометрией, а не с текстурами. Текстуры на корректно трансформированную геометрию натянутся правильно. Чтобы геометрия была трансформирована корректно, особенно на сгибах и сочленениях (например, все суставы при моделировании тела человека), применяется техника vertex skinning (single-skin effect). Заметим, что vertex skinning является подмножеством метода интерполяции вершин (vertex blending). По сути, vertex blending — это как alpha blending, только для вершин, а не для пикселов (V = V1*alpha + V2*(1-alpha)). Метод vertex skinning — это vertex blending для вершин, обработанных разными матрицами (V = V1*M1*alpha + V2*M2*(1-alpha)). Подчеркнем: корректность наложения текстур на сгибах является следствием правильного расположения вершин, которое и достигается при помощи vertex skinning. Применяется Vertex Skinning для того, чтобы на стыках текстур были плавные, естественные переходы, особенно во время движения. Интерполяция вершин осуществляется с помощью матриц, называемых Skinning Matrices.

В D3D есть поддержка для 2-, 3- и 4-матричной интерполяции вершин. В большинстве случаев хватает 2-матричной интерполяции. Однако на стыке туловища с шеей и руками предпочтительнее использовать 4-матричную интерполяцию, а на стыке туловища и двух ног — 3-матричную интерполяцию. Тем не менее, улучшение от 3- и 4-матричной интерполяции вершин видны только при долгом рассмотрении персонажа размером во весь экран. В GeForce 256 поддерживается на аппаратном уровне только 2-матричная интерполяция. Пример 2-матричной интерполяции — это вся живность в демо DMZG, там этот эффект используется по полной программе.

Keyframe Interpolation

Интерполяция по ключевым кадрам позволяет реализовать на аппаратном уровне изменение внешнего вида отображаемого объекта за счет задания только начального изображения, конечного изображения и ключевых промежуточных кадров, все остальные преобразования выполняются автоматически. Иными словами, Charisma Engine вставляет необходимое число интерполированных кадров между "ключевыми", и в результате, например, можно довольно просто реализовать изменение мимики на лице персонажа игры. Обратите внимание на анимированную картинку справа, это пример использования интерполяции по ключевым кадрам.

Эти скриншоты были сделаны в специальной демонстрационной программе. Параметры изменения мимики задаются в обычном текстовом файле, и с этими параметрами можно долго экспериментировать. В качестве исходного изображения используется обычная картинка с наборами фрагментов лица в формате TGA. В общем, использование интерполяции по ключевым кадрам — довольная простая в использовании технология, так что есть все основания надеяться в скором времени увидеть ее применение в реальных играх.

Понятно, что выполнение операций TCL, а также Vertex Skinning и Keyframe Interpolation требует мощных вычислительных ресурсов. У RADEON 256, судя по всему, с этим нет никаких проблем. В результате, разработчики игр смогут использовать большее число полигонов при тесселяции и применять различные специальные эффекты, что сделает 3D-мир в игре более реальным.

Высвободившиеся ресурсы CPU разработчики игр могут использовать, например, для обсчёта AI. Для сравнения: в играх, не ориентированных на использование HW TCL, на обсчет AI обычно отводится до 5% ресурсов CPU, зато в новых играх, ориентированных на использование возможностей HW TCL, на обсчет AI можно уже будет отвести до 30-40% ресурсов CPU, а это значит, что ваши виртуальные противники станут коварнее и хитрее (по крайней мере, можно на это надеяться). Кроме того, высвобождаемые ресурсы CPU можно использовать для расчета физических эффектов повышенной сложности, например, гравитация, атмосферные эффекты. Стоит заметить, что если в игре используются возможности HW TCL, но не используются высвобождаемые ресурсы CPU, то пользователь все равно получит великолепную по качеству и очень быструю графику, хотя не заметит никаких других плюсов.

Pixel Tapestry

Кроме возможности аппаратно ускорять геометрическую стадию при рендеринге изображения, RADEON 256, разумеется, умеет аппаратно ускорять стадию растеризации. Именно для этой цели и была создана архитектура рендеринга пикселей и движок с таким же названием — Pixel Tapestry. Этот движок рендеринга встроен в RADEON 256 и был специально создан для реализации работы трех текстурных блоков на каждом из имеющихся конвейеров рендеринга. В RADEON 256 имеется два конвейера рендеринга, на каждом из которых имеется по три блока текстурирования. Это позволяет:

  • смешивать и фильтровать до трех текстур на пиксель без потерь в скорости
  • аппаратно реализовать различные методы трансформации текстур (cubic environment mapping, projective texturing и т.д)
  • реализовать однопроходное наложение рельефных текстур с помощью методов Emboss, Dot Product 3 и Environment Mapped Bump Mapping (EMBM)
  • точно моделировать отражающие свойства материалов (вода, металл, дерево и т.д)

Кроме того, с помощью движка Pixel Tapestry реализована поддержка:

  • Priority Buffer, который используется для наложения реалистичных теней shadow mapping от индивидуальных источников света
  • 3D Textures (трехмерные текстуры), что позволяет создавать сложные, динамические источники освещения, а также объемный туман, дым, жидкости, и упрощает обращение с объектами с изменяемой геометрией

Не секрет, что чем больше текстур можно наложить на пиксель за такт, тем реалистичнее и детальнее получается конечное изображение без потерь в общей производительности. Текстуры применяются для наложения карт освещенности, карт теней, моделирования отражений и зеркальных поверхностей, рельефа (bump maps) и т.д.

Особо стоит отметить поддержку рельефного текстурирования EMBM, который пока поддерживается только чипами серии G400 от Matrox, но зато используется в нескольких десятках игр.

Положительным моментом является поддержка RADEON 256 метода кубического наложения карт среды, поддерживаемого в D3D 7.0. В этом методе нет зависимости от точки обзора, но зато используется 6 текстур. Кроме этого метода RADEON 256 поддерживает еще и сферический метод (1 текстура, есть зависимость от точки обзора), двойной параболоидный метод (2 текстуры, зависимость от точки обзора).

Чтобы сцена в игре выглядела реалистично и имела глубину, применяют моделирование теней. Для наложения естественных теней, отбрасываемых объектами сцены в зависимости от удаленности от каждого источника света, в RADEON 256 реализована поддержка специального Priority Buffer (приоритетный буфер). Этот буфер формируется за счет ресурсов локальной видеопамяти и позволяет накапливать информации по объектам, отбрасывающим тени. С помощью Priority Buffer определяется порядок использования данных, в результате первым начинает формироваться тень от объекта, наиболее приближенного к наблюдателю. Наложение теней осуществляется за счет трансформации текстур. Этот метод проще и эффективнее, чем использование традиционного буфера шаблонов.

RADEON 256 имеет поддержку Range-Based Fog, т.е. наложения тумана, плотность которого зависит от удаленности объектов от игрока.

Одна из новых функциональных особенностей RADEON 256 — это поддержка 3D texures (трехмерные текстуры). 3D Texture — это текстура, представляющая собой 3D-массив пикселей, а не 2D, как в обычном случае. Это нововведение в OpenGL1.2. До недавнего времени поддержка трехмерных текстур имелась только в Permedia3 от 3Dlabs. Этот тип текстур можно использовать для работы с вокселями (объемные пиксели), наложения сферических текстур для моделирования объемных источников света. Трехмерные текстуры упрощают использование деформируемой геометрии, например, можно отрезать или отщипнуть часть объекта без необходимости обновления текстуры.

В RADEON 256 уже заложена поддержка ряда новшеств, которые будут реализованы в грядущем D3D8 из состава DirectX 8.0, анонс которого ожидается к концу лета. Среди этих новшеств нужно отметить поддержку эффектов Motion Blur и Depth of Field, а также full-scene Anti-aliasing. Знакомые термины? Конечно! В API D3D8.0 будет введена поддержка эффектов T-Buffer от 3dfx.

Вообще, про FSAA в пресс-релизе RADEON 256 говорится следующее: "Comprehensive support for full scene, order-independent anti-aliasing", что означает полную поддержку полносценного, независмого от порядка применения, сглаживания. Вполне логично ожидать существенного падения производительности (до 2 раз) при применении FSAA. Применять или не применять FSAA, решать все равно пользователю.

Пока неясна ситуация с поддержкой Pixel Shaders. Pixel Shaders — это такой метод создания мультитекстурных эффектов "вручную", поддержка которого будет в DirectX 8.0. Суть в том, что раньше можно было смешивать текстуры только по нескольким заранее заданным формулам (как правило, состоящим из 1-2х операций), зато теперь Pixel Shader — это как бы "программа" смешивания текстур, заданная вручную (туда входят операции +, -, /, * и ещё несколько более экзотических, и это можно комбинировать в любом количестве).

Pixel Shaders подразумевает работу на уровне пикселей при моделировании 3D-графики, а не на уровне вершин полигонов. Судя по всему, никакого специального блока для применения программируемых и заранее заданных мультитекстурных эффектов на уровне пикселей в RADEON 256 нет, но есть возможность управлять процессом смешивания результатов работы тексельных блоков. Этого вполне достаточно для заявления в в пресс-релизе буквально следующего: "First with advanced DX8 pixel shader effects".

Кроме графической части, которая, безусловно, важна, в RADEON 256 есть и встроенные дополнительные возможности, которые можно отнести к сфере видео и которые имеют общее название Video Immersion. Прежде всего, это традиционная для ATI прекрасная поддержка декодирования DVD-видео (аппаратная реализвация motion compensation и iDCT). RADEON 256 вобрал в себя все лучшие наработки ATI, ориентированные на приставки set-top box и бытовую электронику. Поэтому RADEON 256 будет легко использовать для просмотра DVD, DTV, цифровых видеомагнитофонов и т.д. в повседневной жизни. Возможность декодирования всех типов HDTV форматов и подключения как аналоговых, так и цифровых дисплеев делают RADEON 256 очень привлекательным решением для просмотра HDTV с помощью настольного компьютера.

Но это не все. В RADEON 256 реализована поддержка уникальной технологии Adaptive de-interlacing от ATI, позволяющей воспроизводить видео с высокой четкостью без артефактов или размытия. Чтобы не писать лишних слов, просто приведем иллюстрации:

         
Слева направо: Bob De-interlacing (текст смазан), Add Field De-interlacing ("перистое" изображение) и, наконец, Adaptive De-interlacing (четкий текст, четкое изображение)

Впечатляет, не правда ли? Остается дождаться карт и соответствующего DVD-плеера от ATI и все проверить на практике.

Кроме того, при установке на карту с RADEON 256 чипа-компаньона Rage Theater у пользователей появится возможность не только выводить видеосигнал, но и осуществлять его захват с одновременным кодированием в различные видеоформаты.

Из приятных дополнительных возможностей RADEON 256 стоит отметить наличие встроенного TMDS-трансмиттера, что позволяет без установки дополнительных внешних чипов подключать к плате на RADEON 256 цифровые мониторы.

По имеющейся у нас информации, платы на базе RADEON 256 будут анонсированы уже летом, и сразу же начнутся их массовые продажи. Причем не исключен анонс сразу целой линейки плат, возможно, будет сразу объявлена и плата с двумя чипами RADEON 256 на борту. Почему анонс плат будет позже? По нашему мнению, главной причиной задержки является отсутствие отлаженных драйверов, а не аппаратные проблемы. Возможно, руководство ATI здраво рассудило, что анонс карт и начало их продаж лишь, скажем, через пару месяцев хуже, чем анонс карт на пару месяцев позже анонса чипа, но зато этот анонс совпадет с началом реальных массовых продаж карт на базе RADEON 256. Видимо, все-таки ATI научилась извлекать уроки из собственных ошибок.

На иллюстрации справа можно посмотреть на вариант комплектации карты на базе RADEON 256. Обратите внимание, что на карте уже установлен чип-компаньон Rage Theater, соответственно, в наличии видеовходы и выходы. Кроме того, можно заметить наличие двух трансформаторов — они должны обеспечить стабильное электропитание и оградить пользователей от проблем, которые бывают из-за некачественно сделанных системных плат. Также нетрудно рассмотреть маркировку чипов памяти — это память типа DDR SDRAM (4Mx16) от Hyundai. Эта память расчитана на частоту в 183 МГц. Тем не менее, не будем забывать, что официальные спецификации плат на RADEON 256 еще не объявлены.

Разумеется, всем интересно узнать о том, сколько будут стоить карты на базе RADEON 256 и какова будет их производительность в играх. О ценах можно лишь гадать. Одно ясно: к моменту начала массовых продаж карт на базе RADEON 256 карты на базе GeForce 2 GTS уже успеют подешеветь. Тем не менее, можно прогнозировать агрессивную ценовую политику ATI, что только на руку нам — потребителям.

Что касается производительности, то, если судить по предыдущим продуктам от ATI, есть все основания ожидать великолепные результаты при использовании 32-битной глубины представления цвета, и 60 fps при разрешении 1024x768 нам практически гарантированы.

Выводы

Ну что же, можно подвести черту. Новый GPU RADEON 256 от ATI обладает массой интересных функциональных возможностей, некоторые из которых пока просто уникальны. Отметим заявленную высокую производительность Charisma Engine на геометрических операциях. Если учесть, что, по прогнозам, примерно 50% самых интересных игр 2000 года будут поддерживать HW TCL, то вычислительную мощь RADEON 256 будет, где применить. Использование высокоскоростной памяти типа DDR SDRAM позволит картам на базе RADEON 256 составить серьезную конкуренцию, в смысле производительности в играх, на рынке. Архитектура Pixel Tapestry позволяет добиться высокого качества 3D-графики. Особо отметим поддержку рельефного текстурирования типа EMBM, так как благодаря Matrox на рынке уже довольно много игр, где применяется эта техника. В общем, с качеством 3D-графики не должно быть проблем, главное, чтобы не подкачали драйверописатели. Фактически, RADEON 256 обладает всеми свойствами, которые потребуются для комфортной игры в игры 2000 года.

По нашей информации, архитектура ядра RADEON 256 рассчитана на тактовые частоты вплоть до 400 МГц (очень вероятно, что поднять частоту ядра выше 300 МГц можно будет только при переходе на 0.15 или даже на 0.13 мкм технологический процесс), что позволит ATI без особых усилий выпустить к концу года новую версию чипа. Не будем забывать и о поддержке технологии MAXX, в общем, заделы на будущее есть, и неплохие. Компании ATI будет, что производить в этом году.

Прекрасная поддержка декодирования DVD-видео и возможность установки чипа-компаньона Rage Theater позволит превратить карты на базе RADEON 256 в универсальные мультимедиа комбайны. В конце концов, не каждый играет в игры типа Quake3. Некоторые увлекаются процессом создания собственного домашнего видеоархива.

Итак, на наш взгляд, чип RADEON 256 выглядит, как прекрасно сбалансированное решение для игр 2000 года. Главное, чтобы платы на базе RADEON 256 появились в продаже уже этим летом и в достаточных количествах, чтобы любой трудящийся мог без проблем купить себе современную карту от ATI. Разумеется, цена карт на RADEON 256 должна быть, как минимум, привлекательной. Если же ATI хочет потеснить NVIDIA, то придется вести агрессивную ценовую и рекламную политику, но главное: ATI просто обязана обеспечить достаточные объемы производства карт на базе RADEON 256.

Мы же запасемся терпением и будем ждать карту на базе RADEON 256 для испытаний в реальной жизни.