ATI RADEON 8500: Восхождение на восьмитысячник


"Глупец тот, кто побывал в Японии
и не совершил восхождения на гору Фуджи.
Но тот, кто полез на нее дважды — дважды глуп."
(японская поговорка)


Итак, начинаем наше восхождение на RADEON 8500. Экспедиция обещает быть не только рискованной (так как мы имеем дело с новой, неизведанной ранее вершиной), но и тяжелой. По ходу подъема, от синтетических тестов к реальным приложениям, нам предстоит исследовать множество закоулков и особенностей горы. А пока мы находимся у ее подножья, необходимо провести предварительную теоретическую рекогносцировку. Неопытных альпинистов мы отсылаем к нашим предыдущим исследованиям. Кроме того, всем участникам экспедиции рекомендуем еще раз бросить взгляд на схематическую карту, очерченную в нашем превью R200.

Тактико-технические характеристики

Для начала приведем сравнительную таблицу общих характеристик чипов и доступных в текущих драйверах DirectX 8.1 возможностей, дабы опытные альпинисты сразу могли понять, с чем мы имеем дело:

Кто есть кто
КартаGeForce3 Ti 500RADEON 8500
ЧипNV20R200
Ревизия чипаA05A13
Основные параметры
Число конвейеров44
Число текстурных блоков22
Текстур за проход46
Частота ядра, МГц240275
Филрейт (млн. пикселей)9601100
Филрейт (млн. текселей)19202200
RAMDAC, МГц350400 (+ внешний 240)
Память
Частота памяти, МГц250275
Шина памяти, бит128 (DDR)128 (DDR)
Технология, мкм0.150.15
Объем памяти, МБ6464
Скорость памяти, нс3.53.6
API
Версия OpenGL1.31.2 (1.3?)
Версия DirectX8.18.1
Наличие GDI+ДаДа
Пиксельный конвейер
Пиксельные шейдеры1.0, 1.11.0, 1.1, 1.4
Максимальное значение цвета в регистрах пиксельного шейдера1.08.0
Число стадий выборки текстур48
Число стадий комбинатора88
Вершинный конвейер
Вершинные шейдеры1.0, 1.11.0, 1.1
Число потоков вершин168
Число констант вершинного шейдера96192
Прочее
Максимальный размер текстур2048х2048 (4096x4096?)2048х2048
Максимум матриц для блендинга44
Индексированный блендингНетдо 57 матриц
Масштабирование спрайтов до6464
Число источников света88
Число плоскостей отсечения0 (6?)6
Pure DeviceДаДа
N-PatchesНетДа
RT-PatchesНет (!) Нет
Multisampling2, 3, 4Нет
3D текстурыДаДа (без MIPMAP)
Карты отражения (среды)ДаДа (без MIPMAP)
Анизотропная фильтрацияДа (без MIPMAP)Да (без MIPMAP)
Степень анизотропии до816
ТуманFOGVERTEX FOGRANGE FOGTABLEFOGVERTEX FOGRANGE
Буфер кадра
Форматы буфера рендерингаA8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5A8R8G8B8 X8R8G8B8 R5G6B5 A1R5G5B5 A4R4G4B4 R3G3B2
Форматы буфера глубиныD32 D24S8 D16 D24X8 D32 D24S8 D16 D24X8
Форматы текстур
Форматы 2D текстурA8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5 A1R5G5B5 A4R4G4B4 DXT1 DXT2 DXT3 DXT4 DXT5 V8U8 L6V5U5 X8L8V8U8 Q8W8V8U8 P8 D32 D24S8 D16 D24X8 A8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5 A1R5G5B5 A4R4G4B4 DXT1 DXT2 DXT3 DXT4 DXT5 V8U8 L6V5U5 X8L8V8U8 Q8W8V8U8 L8 R3G3B2 A8L8 V16U16 W11V11U10
Форматы 3D текстурA8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5 A1R5G5B5 A4R4G4B4 P8 A8R8G8B8 X8R8G8B8 R5G6B5 X1R5G5B5 A1R5G5B5 A4R4G4B4 R3G3B2 L8 A8L8 DXT1 DXT2 DXT3 DXT4 DXT5

Заострим наше внимание на некоторых пунктах:

  1. Более высокая тактовая частота ядра и памяти RADEON 8500;
  2. Более высокая предельная частота первичного RAMDAC R200 — 400 МГц, а также наличие на карте вторичного, внешнего RAMDAC c частотой 240 МГц, что дает хорошие возможности по выводу видеосигнала на два приемника;
  3. Схожая с NV20 организация внутренней архитектуры чипа — 4 конвейера закраски, по два текстурных блока на каждом. Однако у R200 результаты их работы могут накапливаться два раза, в результате чего мы получаем возможность комбинировать до 6 текстур за один проход. Разумеется, с двумя штрафными тактами для 6 и одним для 4 текстур как минимум (так же как и у NV20);
  4. Поддержка пиксельных шейдеров 1.4 (подробнее см. в превью R200) и, следовательно, более гибкий механизм выборки значений текстур. Так как реально шейдеры транслируются в настройки конвейеров выборки и комбинации, это выразилось в увеличении до 8 числа стадий конвейера выборки текстур и расширении его возможностей;
  5. Комбинационные конвейеры обоих чипов имеют 8 стадий и поддерживают все декларированные DirectX 8.1 операции;
  6. Увеличено число констант, которые можно задействовать в вершинных шейдерах — до 192 против 96 у NV20. Это несомненно позволит реализовывать более сложные алгоритмы блендинга и обработки вершин;
  7. Несмотря на более скромные характеристики времени доступа (3.6 нс против 3.5 нс у GeForce3 Ti 500), память RADEON 8500 успешно работает на более высокой частоте, причем без радиаторов. Само по себе это еще не говорит о более "грамотной" или "скоростной" организации работы с памятью — подходы R200 и NV20 в вопросах работы с памятью существенно разнятся. NV20 предпочитает мелкие блоки и эффективный кроссбар контроллер, R200 — крупные блоки и интенсивное кеширование. Какой из подходов оказался более жизнеспособен в современных тестах и приложениях, мы увидим далее, а пока отметим, что R200 поступает с памятью более "гуманно", и это может вылиться в дополнительный потенциал для разгона последней. Опять же: далее мы проверим это предположение;
  8. R200 опережает NV20 в наборе реализованных возможностей DirectX 8.1, но, в свою очередь, NV20 имеет прекрасный OpenGL 1.3 драйвер. Текущий же OpenGL драйвер R200 рапортует о версии 1.2 и, по результатам тестов, не столь эффективен, как творение программистов NVIDIA;
  9. R200 имеет возможность задать 6 произвольных плоскостей отсечения, а у NV20 ситуация в этой области сложилась достаточно интересная. По той или иной причине текущие драйверы рапортуют, что плоскостей отсечения нет, хотя на поверку оказывается, что они прекрасно работают, как это и было в предыдущих драйверах! Но если подходить к этому вопросу формально, они отсутствуют, так как решение о поддержке подобных возможностей, как правило, принимается программами но основе рапортуемой драйверами информации. Надеемся, что NVIDIA не забудет вернуть потерявшиеся плоскости отсечения в ближайших версиях драйверов;
  10. R200 имеет аппаратную поддержку N-Patches, а NV20 — нет;
  11. По непонятной причине текущие драйверы NV20 перестали поддерживать аппаратную тесселяцию гладких поверхностей (RT-Patches);
  12. R200 может осуществлять индексированный матричный блендинг, используя палитру из 57 матриц (одновременно по-прежнему задействуются 4). Впрочем, при наличии вершинных шейдеров это преимущество не столь важно - шейдеры позволяют организовать любые схемы блендинга со значительно большим числом одновременно используемых матриц. Но при этом остается открытым вопрос производительности: так ли быстр блендинг с помощью шейдеров, как обычный аппаратный? Далее мы исследуем этот аспект;
  13. R200 не поддерживает Multisampling (!);
  14. R200 не поддерживает Mip-mapping (а следовательно и трилинейную фильтрацию) для карт отражения и объемных текстур;
  15. В DirectX оба ускорителя не позволяют делать Mip-mapping и анизотропную фильтрацию одновременно, то есть трилинейная + анизотропная фильтрация невозможна. С другой стороны, NV20 поддерживает этот режим в OpenGL, а DirectX приложения пока не особенно балуют нас возможностью включать в них трилинейную фильтрацию;
  16. Максимальная степень анизотропии у R200 вдвое выше;
  17. Пиксельные шейдеры R200 могут оперировать значениями, превышающими 1.0 (т.е. 255) — а именно: от 0 до 8.0. Это так называемый OverBright подход. Сложные вычисления могут иметь дополнительный запас точности, можно реализовать накопление каких-либо величин, например, для более адекватной передачи яркого освещения;
  18. Поддерживается примерно одинаковый джентельменский набор форматов текстур, однако если R200 имеет поддержку нескольких экзотических форматов для использования в шейдерах дополнительных данных (карт нормалей и смещений) с повышенной точностью передачи компонент (11 и 16 бит — V16U16, W11V11U10), то NV20, в свою очередь, позволяет использовать текстуры с форматом буфера глубины (D32, D24S8, D16, D24X8), необходимые для реализации алгоритмов класса буфера теней (Shadow Buffer);
  19. Поддерживаются все форматы сжатых текстур, однако если R200 позволяет сжимать теми же форматами и 3D-текстуры, то NV20 — нет! Учитывая существенные размеры 3D-текстур, это можно смело считать заметным недостатком драйверов или чипа. По крайней мере, можно будет считать, когда эти пресловутые объемные текстуры наконец начнут применяться :-). А вот в OpenGL NVIDIA успешно использует свой собственный формат сжатия 3D-текстур;
  20. В DirectX R200 поддерживает все разновидности тумана, кроме табличного;

Приведем также список расширений OpenGL, поддерживаемых текущими драйверами Radeon 8500:

GL_VENDOR: ATI Technologies Inc.
GL_RENDERER: Radeon 8500 DDR x86/SSE
GL_VERSION: 1.2.2357 Win9x Release
GL_EXTENSIONS:
GL_ARB_multitexture
GL_ARB_texture_border_clamp
GL_ARB_texture_compression
GL_ARB_texture_cube_map
GL_ARB_texture_env_add
GL_EXT_texture_env_add
GL_ARB_texture_env_combine
GL_ARB_texture_env_crossbar
GL_ARB_texture_env_dot3
GL_ARB_transpose_matrix
GL_ARB_vertex_blend
GL_S3_s3tc
GL_ATI_element_array
GL_ATI_envmap_bumpmap
GL_ATI_fragment_shader
GL_ATI_pn_triangles
GL_ATI_texture_mirror_once
GL_ATI_vertex_array_object
GL_EXT_vertex_shader
GL_ATI_vertex_streams
GL_ATIX_texture_env_combine3
GL_ATIX_texture_env_route
GL_ATIX_vertex_shader_output_point_size
GL_EXT_abgr
GL_EXT_bgra
GL_EXT_blend_color
GL_EXT_blend_func_separate
GL_EXT_blend_minmax
GL_EXT_blend_subtract
GL_EXT_clip_volume_hint
GL_EXT_compiled_vertex_array
GL_EXT_draw_range_elements
GL_EXT_fog_coord
GL_EXT_packed_pixels
GL_EXT_point_parameters
GL_ARB_point_parameters
GL_EXT_rescale_normal
GL_EXT_secondary_color
GL_EXT_separate_specular_color
GL_EXT_stencil_wrap
GL_EXT_texgen_reflection
GL_EXT_texture3D
GL_EXT_texture_compression_s3tc
GL_EXT_texture_cub
GL_MAX_TEXTURE_SIZE: 1024
GL_MAX_ACTIVE_TEXTURES_ARB: 6

Как видите, текущие драйверы рапортуют о 1.2 версии OpenGL, а не 1.3, о которой говорят спецификации на сайте и сотрудники ATI. Возможно, в ближайшее время будут доступны для скачивания полноценные, рапортующие о версии 1.3 драйверы.

Не будем судить о перспективности тех или иных возможностей — только через существенное время появятся продукты, которые позволят определить популярность каждой "фичи" в реальных применениях. Да и то, только если карта получит широкое распространение — программисты, как известно, народ консервативный и зачастую не видят смысла в поддержке новых или нераспространенных возможностей.

Итак, подведем итог. Картина несколько отличается от той, что мы видели год назад, в момент выхода R100. Технологическое преимущество по-прежнему налицо, но оно не столь подавляюще, как это было в случае R100 и NV15 (GeForce2). Зато налицо преимущество иного рода — при сходной конфигурации конвейеров потенциальная производительность чипа должна быть выше, чем у его конкурента, вследствие более высокой тактовой частоты. Посмотрим, что покажет практика.

Теперь, когда подготовка окончена, настало время штурмовать нашу вершину. Для начала окинем ее взглядом, рассмотрев саму видеокарту ATI RADEON 8500.

Карта

Самая старшая модель игровой карты ATI имеет то же название, что и графический процессор (возможно, продукты на базе RADEON 8500 от партнеров компании ATI будут иметь иные наименования).

Плата имеет AGP x2/x4 интерфейс, 64 МБ DDR SDRAM памяти, размещенной в 8-ми микросхемах на лицевой и оборотной сторонах PCB. В целом компоновка очень схожа с той, что мы встречали ранее у RADEON 64MB DDR.

       

Микросхемы памяти произведены компанией Hynix (бывшая Hyundai Semiconductor) и имеют время выборки 3.6 ns, т.е. чипы памяти рассчитаны на рабочую частоту 277 (554) МГц.

Память функционирует на частоте 275 (550) МГц, что практически совпадает с номинальным режимом. Конечно, сразу бросается в глаза тот факт, что работающие на столь высоких частотах микросхемы лишены всякого охлаждения. Я подчеркну, что мы рассматриваем не опытный образец, а серийную карту, соответствующий номер которой можно увидеть на оборотной стороне PCB. Поэтому отсутствие охлаждения модулей памяти — это особенность всей серии RADEON 7500/8500. Если видеокарты на базе процессоров последнего поколения от NVIDIA требуют обязательного охлаждения микросхем памяти, а также понижения частоты работы памяти заметно ниже номинальных значений (вспомним про частоту 230 МГц при наличии памяти со временем выборки 3.8ns, штатная частота которой равняется 263 МГц), то инженеры ATI Technologies решили этот вопрос качественно и обстоятельно — следует признать, что чип снабжен прекрасным и "экологичным" контроллером памяти.

Я могу напомнить, что видеокарта ATI RADEON 7500, о которой мы недавно рассказывали, также снабжена быстрой 4ns памятью. Есть информация, что контроллер памяти RADEON 7500 совершенно аналогичен (перенят от) RADEON 8500. И хотя частота работы памяти снижена с 250 до 230 МГц, оптимизация работы с ней за счет применения этого контроллера и качественной разводки налицо — RADEON 7500 также не требует охлаждения памяти (вспомним GeForce2 Ultra, видеокарты на базе которого имеют обязательное охлаждение очень сильно греющихся микросхем памяти). Более того, разгон по памяти на RADEON 7500 возможен на большую величину, чем у пресловутой GeForce2 Ultra.

Раз уж мы заговорили о RADEON 7500, нелишне будет сравнить дизайн обеих карт (слева 7500-й, справа 8500-й RADEON):

       


На первый взгляд обе платы похожи, особенно в правой части. Тем не менее, при одинаковом размере PCB отличия есть, и весьма существенные. Прежде всего мы можем заметить, что расположение гнезд DVI и VGA у плат разное. Плюс, наличие у RADEON 8500 модуля RAGE THEATER, который, как известно владельцам видеокарт последнего поколения от ATI, отвечает за VIVO (Video In Video Out). В данном случае задействована только Video Out возможность. Видимо, ATI отказалась от монтажа полноценного набора мультимедийных функций на 3D-акселератор, четко отделив возможности своих карт семейства All-In-Wonder ото всех прочих (в самом деле, навороченный комбайн "Все-В-Чуде" отличается от простой видеокарты с VIVO только наличием ТВ-тюнера, что делает производство первого маловыгодным). Теперь полные возможности VIVO будут доступны только в видеокартах All-In-Wonder (появление последнего на базе RADEON 8500 мы с нетерпением ожидаем). Что касается TV-out — мы коснемся этого вопроса чуть позже.

Вернемся к рассмотрению самой карты RADEON 8500. По сложившейся традиции проектировщики видеокарт фирмы ATI обеспечивают охлаждение видеопроцессора посредством наклеивания на него кулера, а не крепежа оного к PCB. На всех платах от ATI нет никаких отверстий для крепления кулеров, поэтому в случае поломки вентилятора пользователю ничего не остается, кроме как отламывать кулер от чипа (с риском для последнего и карты в целом) и искать не только новый кулер, но и термоклей, а также тщательно зачищать поверхность чипа от остатков прежнего клея, что, кстати, вполне может привести к стиранию всех надписей с GPU. В данном случае обошлось без происшествий (ацетон помог убрать остатки клея):

После снятия кулера нам предстал чип во всей своей красе. Можно увидеть полную маркировку, в том числе и ревизию A13. Впрочем, ревизия и так была ясна, даже без снятия клеевого нароста: утилита PowerStrip сообщила, как и ожидалось, о А13-м степпинге.

Как я уже говорил ранее, RADEON 8500 комплектуется сопроцессором RAGE THEATER, отвечающим за мультимедийные функции. В данном случае у этого чипсета необычная роль. Прежде всего, как можно догадаться по наличию DVI, да и по схожести PCB с PCB RADEON 7500, исследуемая карта полноценно поддерживает мультимониторность, то есть предоставляет все возможности, имеющиеся у 7500-го, в том числе и TV-out, полноценно работающий отдельно от монитора. Однако если младшая карта реализует эту функцию с помощью самого графического процессора, то у RADEON 8500 за ТВ-выход отвечает RAGE THEATER.

Как известно, большинство видеопотоков записано в Interlaced режиме, то есть вначале четные, а затем нечетные строки. На мониторах и телевизорах с интерлейсингом сперва рисуется первая часть, а потом, во время второго прохода развертки — вторая. Но на современных мониторах никто так не делает, отсюда нужда в деинтерлейсинге — перегоне в обычное нечередующееся изображение.

Стандартно для этого используются два метода — BOB и Weave. Первый метод предусматривает выполнение двух кадров: один из нечетных, второй из четных. При этом приходится тупо копировать каждую строку два раза. Этод метод хорош для видеозаписей, в которых присутствует интенсивное движение. Пример метода BOB:

Второй, Weave, пригоден для остановленных кадров. В нем берут и честно чередуют строки. Получается только один кадр, но с реальным удвоенным вертикальным разрешением. Пример Weave:

ATI нам предлагает свой метод попиксельного деинтерлейсинга, который предусматривает серьезное улучшение качества картинки:

Надо отметить, что хотя ATI и преувеличивает свои заслуги в этой области (вроде заявлений, что эта компания первой придумала такой метод и т.д.), качество ТВ-выхода и воспроизведения видео у RADEON 8500 действительно одно из лучших.

Но на этом особенности RADEON 8500 по работе с 2D-графикой не заканчиваются. Как и RADEON 7500, карта может выводить изображение на два приемника, поскольку чип имеет два интегрированных в него CRTC модуля (плюс трансмиттер для цифровых мониторов). Насчет наличия на чипе второго RAMDAC возник вопрос. В некоторых материалах ATI значится, что RADEON 8500 имеет два интегрированных 400 МГц RAMDAC, однако в числе шумно рекламируемых особенностей этого чипа такая сенсационная, казалось бы, новость не упоминается. На поверку оказалось, что второй RAMDAC является внешним (на фотографии карты его можно увидеть между GPU и RAGE THEATER) 10-битным чипом с максимальной частотой 240 МГц. Да, это не два полноценных RAMDAC по 350 МГц, как у RADEON 7500, однако и такая частота работы второго RAMDAC весьма велика и дает возможность на втором мониторе получить разрешение 1600х1200 при 100Гц. Поэтому мы можем смело говорить, что "двухмониторность" у RADEON 8500 полноценная. Всеми особенностями работы RADEON 7500, в том числе и технологией HydraVision, 8500-й обладает; желающие могут почитать наш обзор по RADEON 7500 и получить сведения о тонкостях вывода картинки на два приемника.

Видеокарта поставляется как в ОЕМ, так и в Retail-поставке, что традиционно для ATI. В поставку входят:

  • Руководство пользователя;
  • Диск с программным обеспечением (драйверы и утилиты);
  • Диски с играми и демо-продуктами;
  • Переходник S-Video-to-RCA;
  • Переходник DVI-to-VGA;
  • Кабели S-Video, RCA.

Разгон

При наличии дополнительного охлаждения данный экземпляр карты стабильно работал при частотах ядра и памяти 310/295(590) МГц соответственно. Я полагаю, что новый чип ATI имеет очень хороший потенциал в этом плане. Разгон памяти, уже работающей на своем номинале, разумеется, оказался не столь велик по сравнению с полученными ранее приростами по частотам у схожей по времени выборки памяти. Тем не менее, учитывая хорошую сбалансированность карты, увеличение частоты GPU является наиболее приоритетным.

Установка и драйверы

Перед рассмотрением работы программного обеспечения и результатов тестирования следует ознакомить читателя с конфигурацией тестовых стендов:

  • Компьютер на базе Athlon:
    • процессор AMD Athlon 1400 MHz;
    • системная плата Chaintech 7KJD (AMD760);
    • оперативная память 512 MB DDR SDRAM PC2100;
    • жесткий диск IBM DTLA 45GB;
    • операционная система Windows 98 SE.
  • Компьютер на базе Pentium 4:
    • процессор Intel Pentium 4 1500 MHz;
    • системная плата ASUS P4T (i850);
    • оперативная память 512 MB RDRAM PC800;
    • жесткий диск Quantum FB AS 20GB;
    • операционная система Windows 98 SE.

На стендах использовались мониторы ViewSonic P810 (21") и ViewSonic P817 (21").

Тестирование проводилось на версии 7.191 драйверов от ATI, для сравнительного анализа были использованы тесты видеокарт на базе процессоров от NVIDIA, полученные на драйверах NVIDIA версии 21.85. А состязались с RADEON 8500 следующие карты:

  • NVIDIA GeForce3 Ti 500 (240/250 (500) MHz, 64MB DDR;
  • NVIDIA GeForce3 Ti 200 (175/200 (400) MHz, 64MB DDR);
  • ABIT Siluro GF3 VIO (GeForce3, 200/230 (460) MHz, 64MB DDR).

При снятии результатов тестов VSync был отключен в драйверах у всех карт.

Внимание!!! Всем известно, что столь мощные видеокарты изначально рассчитаны на полноценную работу в 32-битном цвете, так что мы опускаем анализ результатов, полученных в 16-битном цвете, полагая, что последнее поколение (GeForce3/RADEON 8500) поставило "крест" на "хай-колоре", а будущее, разумеется , за 32(и даже более)-битным цветом.





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.