Контрнаступление ATI Technologies:

семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515)



Часть 2: Особенности видеокарт, синтетические тесты

СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурации стендов, список тестовых инструментов
  5. Результаты синтетических тестов

Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515): Часть 1: Теоретические сведения


Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515): Часть 2: Особенности видеокарт и синтетические тесты (РАЗБИТО НА СТРАНИЦЫ)

Когда занимаешься трехмерной графикой (не программированием, а именно оценкой готовых решений и их исследованием), то постепенно волей-неволей подчас начинают смываться границы между настоящей жизнью и тем, что мы видим в играх или демо-программах. Иногда идешь и видишь красивое дерево, и если раньше просто любовался им, и могли возникнуть вопросы о том, что за дерево, почему оно такое; то теперь плюс к этому еще и думаешь, а сколько полигонов оно слопало бы, если все отображать «честно», то есть каждый листик как отдельный объект (а то частями, ведь лист от ветра тоже гнется). И сколько объектов было бы в таком дереве, и какие процессоры бы потребовались, чтобы рассчитать движение каждого листа, ветки в случае ветра… Разумеется, даже одно такое дерево было бы не по плечу самым мощным настольным компьютерам, оснащенным по последнему слову техники.

Вот и на острове Ибица (Ибиса, или Еивисса — кому как нравится, все называют его по-разному), где мы провели два дня на ATI Technology Days, во время прогулок время от времени возникали «трехмерные» мысли:

«Какая потрясающая анизотропия при отображении этой стены!»



«Слабо такой бамп-маппинг сделать, чтобы камни были как живые?»



« Ну, наверное, эти два цветка скушали миллиона два полигонов, как минимум, и даже X1800XT покажет от силы 10 fps »



«А вот и пресловутая шейдерная вода… Но сколько же шейдеров тут? Ведь почти не одного повторения! А то смотришь на Far Cry, восхищаешься водой, а как включишь анизотропию, и все, поверхность моря стала геометрически правильно расчерченной. Тьфу!»



«А вот сделать не еле колышущуюся воду, а реальные волны с таким пенистым прибоем — пока никто не смог! Да, снова даже мощнейшие SLI-решения окажутся бессильными…»



Да, жаль, конечно, что крики о фотореализме, которые раздавались из маркетинговых служб еще 6 лет назад, так и остались мечтами. Слава Богу, что хоть игры начали как-то догонять развитие аппаратной части 3D-графики, и сейчас почти исчезли в небытие заоблачные скорости выше 150 fps, какие мы наблюдали еще года два-три назад на тамошних популярных игровых тайтлах. Графика становится все более сложной, как и настройки в играх (издатели ведь по-прежнему требуют от разработчиков, чтобы игра шла и на старых видеокартах или новых, но бюджетного сектора, хотя сильные подвижки и тут случились: в связи с тем, что DirectX 9.0 видеокарты уже прочно заняли и Low-End сектор, издатели сняли свой прессинг на девелоперов «Чтобы оно бегало и на МХ-ах». Поэтому уже не надо игру, делая с поддержкой DX9, подгонять и под DX7).

Почти полтора года прошло с того момента, как NVIDIA вышла на рынок с новыми продуктами, по своим возможностям охватывающими практически все, что было предоставлено Microsoft с их DirectX 9.0c: поддержка шейдеров 3.0, динамические ветвления, текстурная выборка вершинными процессорами и т.д.

Конкурент калифорнийской компании канадская ATI Technologies рассудила тогда же иначе: зачем спешить и тратить транзисторы на эти новые блоки, когда лучше расширить чип по конвейерам, используя новый техпроцесс, и поднять частоты до невиданных ранее значений. А шейдерную часть слегка усилить, доведя до версии 2.0b (по сути лишь позволить работать с длинными шейдерами). И по традиции ввести новую технику, которую потом почти никто не будет использовать (мы помним TruForm, который даже самими программистами ATI в драйверах сейчас по умолчанию выключен, поскольку так и не стал востребованным), речь идет о 3Dc.

Правильным ли было решение игнорировать SM 3.0 на то время, оставив лишь NVIDIA развивать и внедрять это среди разработчиков игр? — Спорный вопрос. С одной стороны, раз локомотив технологий — NVIDIA это внедрила, то уже опыт ее работы с девелоперами подсказывает, что не мытьем, так катаньем она добьется признания новых идей и даже крупные компании-игрописатели начнут внедрять SM 3.0 в свои движки. И канадцам потом останется лишь подхватить направление, укрепив введением 3.0 в свои продукты. Это верный с точки зрения банального бизнеса подход, но смотрящийся крайне плохо с этической точки зрения (почему одни должны толкать новое, получая синяки и шишки, а другие приходят уже, когда путь готов и расчищен?).

С другой стороны, какой бы NVIDIA ни была всесильной, ее ресурсы ограничены, и когда 55% рынка графических плат в настольных компьютерах принадлежат чипам от ATI, то разработчики игр (а прежде всего, издатели!) вынуждены это учитывать, поэтому тормозят приход SM 3.0 в реальные движки и игры. И то, что 3.0 только сейчас начинает появляться в стане красно-белых, сделало свое негативное дело. Надо было бы все же как-то совместно выступать с инновациями и не вводить девелоперов в сомнения.

Но это было, оно случилось, вписано в скрижали истории, и уже не вырубить. Теперь, когда канадцы перешли на новый техпроцесс, и решили все же выделить место среди транзисторной массы и на блок SM 3.0 в том числе, уже близок момент, когда DX9.0с в полном объеме будет массово внедряться в новых играх. ATI взяла новый курс, и считает его единственно правильным! (о нем свидетельствует на фото ниже Николай Радовский, представитель ATI в России, показывая рукой на новые горизонты движения. :-) Просто Ленин местного масштаба :-))

А нам… нам остается лишь снова грызть гранит науки тестирования, стенды, карты и все что попадется под руку, особенно когда что-то глючит или не получается… (на снимке Павел Пиларчик из PCLab.pl (Польша), усиленно бьется над тестами R520 на Ибице).

Итак, подводя итог сказанному, отмечу еще раз, что канадская компания выступила с новыми решениями от Low- до Hign-End класса, унифицировано поддерживающими новые одинаковые технологии, основной из которых является SM 3.0 (и AVIVO, мы о ней поговорим позже). Все подробности в этом плане уже освещены Александром Медведевым в первой части материала.

На ATI Technology Days мы получили комплект из сэмплов, в который входят 4 видеокарты, призванные внедриться в большинство ценовых ниш рынка.

  • ATI RADEON X1800XT 512MB GDDR3, 625/1500 MHz, 16 pixel/8 vertex pipes/16 TMUs — $549 ($499 для 256-мегового варианта);
  • ATI RADEON X1800XL 256MB GDDR3, 500/1000 MHz, 16 pixel/8 vertex pipes/16 TMUs — $449;
  • ATI RADEON X1600XT 256MB GDDR3, 590/1380 MHz, 12 pixel/5 vertex pipes/4 TMUs — $249 ($199 для 128-мегового варианта);
  • ATI RADEON X1300PRO 256MB GDDR2, 600/800 MHz, 4 pixel/2 vertex pipes/4 TMUs — $149 ($99 для 128-мегового варианта);

Предлагаем видеоролики, которые в краткой форме, но более красочно «расскажут» о новинках.

Платы

ATI RADEON X1800 XT 512MB PCI-E
Интерфейс: PCI-Express x16

Частоты (чип/физическая по памяти (эффективная по памяти): 625/750 (1500) MHz (номинал — 625/750 (1500) МГц)

Ширина шины обмена с памятью: 256bit

Число вершинных конвейеров: 8

Число пиксельных конвейеров: 16

Размеры: 205x100x32mm (последняя величина — максимальная толщина видеокарты).

Цвет текстолита: красный.

Выходные гнезда: 2xDVI, S-Video.

VIVO: есть (RAGE Theater)

TV-out: интегрирован в GPU.

ATI RADEON X1800 XL 256MB PCI-E
Интерфейс: PCI-Express x16

Частоты (чип/физическая по памяти (эффективная по памяти): 500/500 (1000) MHz (номинал — 500/500 (1000) МГц)

Ширина шины обмена с памятью: 256bit

Число вершинных конвейеров: 8

Число пиксельных конвейеров: 16

Размеры: 205x100x15mm (последняя величина — максимальная толщина видеокарты).

Цвет текстолита: красный.

Выходные гнезда: 2xDVI, S-Video.

VIVO: есть (RAGE Theater)

TV-out: интегрирован в GPU.

ATI RADEON X1600 XT 256MB PCI-E
Интерфейс: PCI-Express x16

Частоты (чип/физическая по памяти (эффективная по памяти): 590/690 (1380) MHz (номинал — 590/690 (1380) МГц)

Ширина шины обмена с памятью: 128bit

Число вершинных конвейеров: 5

Число пиксельных конвейеров: 12 (4 TMU!)

Размеры: 160x100x15mm (последняя величина — максимальная толщина видеокарты).

Цвет текстолита: красный.

Выходные гнезда: 2xDVI, S-Video.

VIVO: нет

TV-out: интегрирован в GPU.

ATI RADEON X1300 PRO 256MB PCI-E
Интерфейс: PCI-Express x16

Частоты (чип/физическая по памяти (эффективная по памяти): 600/400 (800) MHz (номинал — 600/400 (800) МГц)

Ширина шины обмена с памятью: 128bit

Число вершинных конвейеров: 2

Число пиксельных конвейеров: 4

Размеры: 160x100x15mm (последняя величина — максимальная толщина видеокарты).

Цвет текстолита: красный.

Выходные гнезда: 2xDVI, S-Video.

VIVO: нет

TV-out: интегрирован в GPU.

ATI RADEON X1800 XT 512MB PCI-E; ATI RADEON X1600 XT 256MB PCI-E
ATI RADEON X1800 XT 512MB PCI-E имеет 512 МБ памяти GDDR3 SDRAM (а ATI RADEON X1600 XT 256MB PCI-E — 256MБ), размещенной в 8-ми (у ATI RADEON X1600 XT 256MB PCI-E — в 4-х) микросхемах на лицевой стороне PCB.

Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 1,26 ns, что соответствует частоте работы 800 (1600) МГц.

ATI RADEON X1800 XL 256MB PCI-E
Карта имеет 256 МБ памяти GDDR3 SDRAM, размещенной в 8-ми микросхемах на лицевой стороне PCB.

Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 1,4 ns, что соответствует частоте работы 700 (1400) МГц.

ATI RADEON X1300 PRO 256MB PCI-E
Карта имеет 256 МБ памяти GDDR2 SDRAM, размещенной в 8-ми микросхемах на лицевой и оборотной сторонах PCB.

Микросхемы памяти Infineon. Время выборки у микросхем памяти 2,5 ns, что соответствует частоте работы 400 (800) МГц.

Сравнение с эталонным дизайном, вид спереди
ATI RADEON X1800 XT 512MB PCI-E Reference card ATI RADEON X850 XT 256MB PCI-E
ATI RADEON X1800 XL 256MB PCI-E Reference card NVIDIA GeForce 7800GTX 256MB PCI-E
ATI RADEON X1600 XT 256MB PCI-E Reference card ATI RADEON X700 XT 256MB PCI-E
ATI RADEON X1300 PRO 256MB PCI-E Reference card ATI RADEON X600 XT 256MB PCI-E
Сравнение с эталонным дизайном, вид сзади
ATI RADEON X1800 XT 512MB PCI-E Reference card ATI RADEON X850 XT 256MB PCI-E
ATI RADEON X1800 XL 256MB PCI-E Reference card NVIDIA GeForce 7800GTX 256MB PCI-E
ATI RADEON X1600 XT 256MB PCI-E Reference card ATI RADEON X700 XT 256MB PCI-E
ATI RADEON X1300 PRO 256MB PCI-E Reference card ATI RADEON X600 XT 256MB PCI-E

Прекрасно видно, что в серии X1800 разработчики из Канады использовали принципиально новый для них дизайн видеокарт. До сих пор мы все же имели дело с картами, чей дизайн был тем или иным развитием RADEON 9700 PRO (по 4 микросхемы на каждой стороне, всего их 8, платы короткие, силовой блок распределен по PCB). Когда дизайн продуктов от NVIDIA кардинально отличался и также шел в своем развитии еще от GeForce4 Ti (силовой блок находится в конце PCB). Начиная с NV35 и до последней поры, разработчики из США используют круговой способ расположения микросхем памяти вокруг ядра, при этом стараясь расположить их с одной стороны PCB. Лишь 7800GTX нарушил эту традицию, где, несмотря на то, что число посадочных мест предусматривает установку 16-ти микросхем памяти для образования 512 мегабайт ОЗУ, на 256-мегабайтных картах микросхемы памяти расположены через одну, занимая места как на лицевой, так и на оборотной сторонах PCB (на платах серии FX5900 128-меговые карты имели память только на лицевой стороне, а 256-меговые по обеим сторонам).

И вот мы видим, что к примерно аналогичному дизайну пришли и специалисты из ATI, сделав карту более длинной (кстати, она полностью равна по размерам GeForce 7800GTX, это демонстрируется в нашем видеоролике — ссылки в начале статьи). Микросхемы памяти расположены также полукругом вокруг ядра, силовой блок — в хвосте платы.

Подчеркну еще раз, что и X1800XT и X1800XL имеют одинаковые PCB, то есть по дизайну идентичны, да и ядро одно и то же, лишь работающее на разных частотах (кстати, обратите внимание на то, какой огромный разрыв между 500 и 625 МГц. Я уверен, что впоследствии появится некое промежуточное решение по мере надобности).

Также стоит упомянуть, что три карты из четырех снабжены парой гнезд DVI. Причем, Dual link DVI, что позволяет по цифровому каналу получать разрешения выше 1600х1200 (неоднократно уже возникали недовольства таким ограничением со стороны владельцев огромных цифровых мониторов).

Теперь рассмотрим системы охлаждения. Прежде всего, у X1800XT.





Кулер явно заимствован у X850XT. По сути это он же, но только радиатор внутри медный, и его размеры увеличены. Турбина, выдувающая воздух изнутри наружу, точно такая же, и при старте в течение 10-15 секунд мы можем слушать неприятно громкий вой, но затем обороты падают, и устройство уже почти не шумит. Даже при самой большой нагрузке карты я не сталкивался с тем, чтобы кулер поднимал обороты в процессе работы.

Минусов два: размеры (из-за кулера карта вынуждена занимать два слота в системной плате) и стартовый шум. Плюс один, но большой: горячий воздух выносится за пределы системного блока, что очень важно при работе таких горячих элементов внутри него. А карта греется очень сильно! Подчеркну особо, что наши измерения показали, что энергопотребление у X1800XT выше, чем у 7800GTX (порядка 100-110Вт против 80). Хотя я видел работу такой карты внутри баребона с 350Вт БП.

Теперь система охлаждения у X1800XL.





Несмотря на то, что размеры устройства явно меньше, особенно по толщине, удачным это решение назвать трудно, так как в процессе работы под нагрузкой в 3D вентилятор периодически меняет обороты (сказывается перегрев), что отнюдь не комфортно для ушей. Кулер также имеет медный радиатор, помещенный в кожух, но в данном случае турбина гонит воздух уже в обратную сторону — во внутрь системного блока. Для более низкочастотного ядра это приемлемо, хотя думаю, что нагрев карты в целом все равно достаточно велик.

Теперь система охлаждения у X1600XT и X1300PRO. Обе карты имеют одинаковый кулер.





Устройство хоть и небольшого размера, но весьма шумное. Оно очень напомнило кулер от X700 XT, когда при наличии даже медного радиатора вентилятор работал на бешеной скорости, и узкие просветы радиатора создавали шумы. Что повторяется и в данном случае. Надеемся, что партнеры ATI найдут возможности установить свои системы охлаждения, более тихие и не менее эффективные.

Теперь посмотрим на сами процессоры.

X1800XT — R520 изготовлен в сентябре сего года, то есть, чипу нет и месяца



X1800XL — R520 аналогично, выпуск в сентябре



X1600XT — RV530 также выпущен в сентябре



X1300 PRO — RV515 тоже выпущен в сентябре



При сравнении R520 c G70 видно сразу, что продукты исполнены по разному техпроцессу, несмотря на примерное равенство по числу транзисторов, G70 имеет ощутимо бОльшую площадь. Также как и RV530 с его намного большим количеством транзисторов имеет равную с X700 XT площадь чипа. И аналогично RV515 по площади примерно равен RV380, хотя объем в транзисторах сильно больше.







Установка и драйверы

Конфигурации тестовых стендов:

  • Компьютер на базе Athlon 64 (939Socket)
    • процессор AMD Athlon 4000+ (2400MHz) (L2=1024K);
    • системная плата ASUS A8N SLI Deluxe на чипсете NVIDIA nForce4 SLI;
    • оперативная память 1 GB DDR SDRAM 400MHz (CAS (tCL)=2.5; RAS to CAS delay (tRCD)=3; Row Precharge (tRP)=3; tRAS=6);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
  • RADEON X850 XT PE (PowerColor RX850XT PE, PCI-E, 256MB GDDR3, 540/1180 MHz);
  • GeForce 7800 GTX (ASUS EN7800GTX TOP, PCI-E, 256MB GDDR3, 486/1350 MHz);
  • GeForce 7800 GTX (Leadtek WinFast PX7800GTX, PCI-E, 256MB GDDR3, 430/1200 MHz);
  • GeForce 7800 GTX (Gainward PowerPack Ultra/3400 GS, PCI-E, 256MB GDDR3, 459/1250 MHz);
  • GeForce 7800 GT (Gainward PowerPack Ultra/2400 GS, PCI-E, 256MB GDDR3, 450/1100 MHz);
  • GeForce 7800 GT (Palit, PCI-E, 256MB GDDR3, 400/1000 MHz);
  • операционная система Windows XP SP2; DirectX 9.0c;
  • мониторы ViewSonic P810 (21") и Mitsubishi Diamond Pro 2070sb (21").
  • драйверы ATI версии 6.571beta (CATALYST 5.10beta); NVIDIA версии 81.84.

VSync отключен.










По сути, контрольная панель драйверов особых изменений не претерпела, добавилось лишь меню по AVIVO (о нем в пятой части материала), в 3D-настройках появились новые опции для Adaptive AA и HQ Aniso. Надо отметить, что улучшена работа карт с TV-out, есть режим вывода на ТВ (или второй приемник) полноэкранного изображения фильма или иного видеоролика (вне зависимости от выставленного на нем разрешения).

Напомню, что для совместной работы X1800-карт с TV и монитором последний надо подключать к нижнему гнезду на видеокарте.

Синтетические тесты

Использованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступна на сайте 3d.rightmark.org.

Параметры D3D вы можете посмотреть и сравнить здесь:

D3D RightMark: X1800 XT, G70
DX Caps: X1800 XT, G70

Тесты проводились:

  • На GeForce 7800 GTX, 6600, 6600 GT со стандартными параметрами;
  • На оригинальном RADEON X850 XT
  • На новых картах RADEON X1300, X1600 XT, X1800 XL, X1800 XT.

Тест Pixel Filling

Пиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:



В случае старших карт (первый график) ATI одерживает четкую победу. Дает себя знать более эффективная работа с памятью, в том числе благодаря ее скорости и сжатию данных до кэширования, даже большее число конвейеров не спасает 7800 GTX (хотя и проигрыш его не настолько силен, чтобы говорить о каком-либо поражении NVIDIA). Зато в случае среднего сегмента, картина не столь удачная для ATI — сказывается перекос в числе текстурных модулей RV530 — их всего 4, и это явно недостаточно в данном случае. Этот факт уравнивает RV515 и RV530 в этом тесте, и назвать это нормальным мы никак не можем — цена этих решений отличается почти вдвое. Возникает подозрение, что 4 текстурных блока у RV530 — вынужденная мера, а изначально их планировалось все-таки большее число. В реальных приложениях этот неприятный эффект будет сглажен, но, и дальше вы это увидите, не настолько, чтобы о нем забыть или даже считать его оправданным.

А сейчас — скорость закраски буфера кадра (fillrate, pixelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:

В старшем сегменте в случае с 1 текстурой (и с фиксированным цветом) заметно лидирует ATI. Далее лидерство сохраняется, но оно уже не столь велико. Однако, учитывая лишь 16 конвейеров R520, можно говорить о более успешной, в этом плане, архитектуре и прогнозировать ещё большую величину отрыва с выходом R580. В среднем классе опять сказывается печальный эффект четырех текстурных модулей — только в случае 1-2 текстур ATI обыгрывает противопоставленные карты NVIDIA, а вот по мере роста числа текстур RV530 заметно сдает свои позиции. Шутка ли — двукратная разница в числе текстурных блоков.

Посмотрим, как скорость закраски зависит от наличия шейдеров (2.0):

та же картина для среднего класса:

Итак, можно констатировать, что ничего не изменилось — как FFP, так и шейдеры работают совершенно одинаково с точки зрения железа (FFP эмулируется шейдером) и показывают одинаковые результаты. Все та же хорошо заметная проблема с небольшим числом текстурных блоков RV530 и все то же преимущество R520 в грубой закраске, несмотря на меньшее число пиксельных конвейеров. Тест Geometry Processing Speed

Тест Geometry Processing Speed

Самый простой шейдер — предельная пропускная способность по треугольникам:



Итак, G70 по-прежнему несомненный лидер, a X1800 не далеко ушла в плане пиковой скорости геометрии от X850 XT. В среднем классе ATI задает жару — NVIDIA заметно проигрывает. Значит у ATI более эффективный и широкий блок установки и отбрасывания треугольников.

Более сложный шейдер — один смешанный источник света:

Усложняем задачу и для среднего класса:

Как мы видим, везде FFP чуть быстрее — сказывается наличие специальных аппаратных блоков для его эмуляции (было время когда ATI манкировали этой возможностью, но теперь это не так). А теперь самая сложная задача, три источника света, причем, для сравнения в вариантах без переходов, со статическим и динамическим управлением исполнением:



Вот здесь ATI впереди во всех случаях. С ростом сложности задачи преимущество 7800 в обработке простых треугольников пропало, а частота ядра X1800 XT дает развернуться его геометрическим возможностям. Интересно, что если шейдеры с динамическими переходами на новых продуктах ATI заработали, то такие же шейдеры с указанием модели 3.0 почему то исполняются неверно — судя по всему, мы наткнулись на ошибку в драйверах или странности при его взаимодействии с нашим тестом. Но, как бы там ни было — переходы, что в 2.X динамическом профиле, что в 3.0 у нас одинаковые и мы можем оценить эффективность реализации динамических переходов у ATI. Она ниже, чем статическая версия, как и у NVIDIA, и накладные расходы чуть выше, но больше в абсолюте, из-за более мощного геометрического блока вообще. Напомним, что, к сожалению, новые продукты ATI не поддерживают доступ к текстурам из вершинных шейдеров.

Итак, если не считать отсутствие доступа к текстурам и странности с компиляцией и исполнением шейдеров 3.0, вершинные блоки продуктов ATI заслуживают похвалу — всё на уровне!

Тест Pixel Shaders

Первая группа шейдеров — достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:



В старшей группе царит примерный паритет 7800 и X1800 XT — с одной стороны эффективные конвейеры и частота, с другой — 24 пиксельных конвейера. Победила дружба, точнее противостояние. А вот в средней группе мы опять замечаем досадное поведение RV530 — нехорошо. 4 текстурных модуля снова «портят нам малину» и даже 12 пиксельных конвейеров не спасают X1600. Он ЗАМЕТНО проигрывает 6600 GT. Плохо!

Интересно, что NVIDIA в силу наличия карусели квадов и весьма бережного отношения ко временным регистрам до сих пор получает преимущество от использования 16 битных регистров, во время обработки промежуточных данных в шейдере! А вот архитектура ATI свободна от этой зависимости — она построена по иному принципу и не зависит так сильно от числа и размера временных переменных при компиляции шейдера. Это похвально! И должно заметно сказаться на эффективности сложных шейдеров с вычислениями. Итак, посмотрим, изменится ли что-либо для более сложных шейдеров:



В старшем классе в режиме 16 бит выигрывает 7800. Но это 16 бит со всеми потенциальными артефактами. В режиме FP32 мы наблюдаем паритет. Интересно, что в среднем классе ATI безоговорочно выигрывает. Даже, несмотря на 4 текстурных блока. Правильно — много вычислений, меньше доступов к текстурам. Но в реальных играх такие сложные шейдеры редки и не стоит об этом забывать. Эх, если бы текстурников было 12 — как бы развернулся этот чип и во всех остальных тестах. 6600 GT был бы просто сметен X1600 XT, но этого не случилось. Досадный промах или досадные обстоятельства…

Тест HSR

Пиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:







Эффективность HSR топового решения ATI традиционно выше, как и ранее. Хотя, из-за более низкой латентности работы с текстурами NVIDIA заметно лучше выглядит в случае тестирования HSR совместно с текстурированием. А вот в среднем классе все не так просто — с текстурами ATI выглядит даже чуть хуже 6600/GT, особенно RV515 — там HyperZ очевидно слабее, чем в старших чипах ATI.

Тест Point Sprites







Все, как и раньше — NVIDIA лучше справляется с маленькими спрайтами, а ATI с большими. В случае освещения ATI получает еще немного преимущества — вершинные блоки там сильнее.

Выводы по синтетическим тестам

  1. Самая досадная проблема — 4 текстурных блока RV530. Не надо быть провидцем, чтобы предсказать, что она напомнит о себе и в реальных игровых тестах. Если бы их было 8 или 12 — 6600 GT заметно проиграл бы X1600 XT, но при текущей ситуации можно говорить о паритете с переменным успехом. В чем же всё-таки дело — в ТАКОЙ просчет архитекторов слабо верится, неужели проблемы с реализацией и производством?
  2. В верхнем классе R520 опережает или равен 7800 в зависимости от теста и параметров. Что очень неплохо, учитывая его 16 конвейеров. Это говорит о крайне эффективной архитектуре пиксельной части, которая только выиграет в случае последующего масштабирования (R580). Пока что нет явного превосходства над 7800, но есть факт доминирования во многих предельных синтетических тестах. Это не победа, это, разумеется, и не поражение, это хороший задел.
  3. Эффективность вычислительной части пиксельных процессоров ATI на высоте. Хороший задел для будущего и будущих архитектур с поддержкой WGF 2.0 — которые будет не сложно развить из текущей архитектуры, в силу ее особенностей.
  4. Вершинная производительность ATI на высоте (хотя и есть небольшие выше упомянутые «но»).

Впереди еще будут части по тестам в играх и по изучению AVIVO. Оставайтесь с нами!

Контрнаступление ATI Technologies: семейство RADEON X1800 (R520), X1600 (RV530) и X1300 (RV515) — Часть 3: Игровые тесты (производительность)






Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.