В тонкости — сила!
Калибр 0.09, залп из Калифорнии:
NVIDIA GeForce 7900 GTX/GT (G71),
GeForce 7600 GT (G73)


Часть 2: Особенности видеокарт, синтетические тесты



Какая тонкая работа -
Чтоб шейдер виртуозно донести!
У ускорителя забота -
Всех геймеров в восторг ввести!





СОДЕРЖАНИЕ

  1. Часть 1 — Теория и архитектура
  2. Часть 2 — Практическое знакомство
  3. Особенности видеокарт
  4. Конфигурация стенда, список тестовых инструментов
  5. Результаты синтетических тестов
  6. Результаты игровых тестов (производительность)
  7. NVIDIA Editor's Day


NVIDIA GeForce 7900 GTX/GT (G71), GeForce 7600 GT (G73): Часть 1: Теоретические сведения


NVIDIA GeForce 7900 GTX/GT (G71), GeForce 7600 GT (G73): Часть 2: Особенности видеокарты и синтетические тесты



Все подробности особенностей архитектуры новинок уже освещены Александром Медведевым в первой части материала.

Итак, новая линейка NVIDIA на сегодня состоит из следующих карт:

  • NVIDIA GeForce 7900 GTX 512MB GDDR3, 650/1600 MHz, 24 pixel/8 vertex pipes/24 TMUs/16 ROPs — $499;
  • NVIDIA GeForce 7900 GT 256MB GDDR3, 450/1320 MHz, 24 pixel/8 vertex pipes/24 TMUs/16 ROPs — $299;
  • NVIDIA GeForce 7600 GT 256MB GDDR3, 560/1400 MHz, 12 pixel/5 vertex pipes/12 TMUs/8 ROPs — $199;

Подчеркну, что рекомендованная цена указывается всегда для североамериканского рынка, и поэтому не надо ждать подобных цен в России, или в Европе. Надо учитывать специфику налоговых систем и таможенных правил в той или иной стране. Поэтому указанные цены — не более чем ориентир. Полагаю, что 7900 GTX в России появится по цене около 750 долларов, 7900 GT — за 450-500, 7600 GT — по 250. Увы, но такова специфика российского рынка: глупейшие новые таможенные правила (составлял их, наверно, человек, который видеокарту в руках не держал, но называет себя специалистом в этой области), а также желание торговых организаций на новинках получить сверхприбыли (впрочем, цену рождает спрос: если и за 850 долларов 7800 GTX 512MB уходили «на ура», то почему должны снижать цены? — Логичный шаг).

На NVIDIA Editor's Day (о нем будет рассказано в четвертой части нашего повествования) мы получили два комплекта вышеуказанных карт (второй комплект попросили специально для исследования работы режима SLI этих карт). Все три продукта выполнены на разных дизайнах и разных PCB, поэтому рассмотрим внимательно каждый из них.

Платы


NVIDIA GeForce 7900 GTX 512MB PCI-E
GPU: GeForce 7900 GTX (G71)

Интерфейс: PCI-Express x16

Частоты работы GPU:: 650/650/700 MHz (номинал — 650/650/700 МГц)

Частоты работы памяти (физическая (эффективная)):: 800 (1600) MHz (номинал — 800 (1600) МГц)

Ширина шины обмена с памятью: 256bit

Число вершинных конвейеров: 8

Число пиксельных конвейеров: 24

Число текстурных процессоров: 24

Число ROPs: 16

Размеры: 205x100x32 мм (последняя величина — максимальная толщина видеокарты).

Цвет текстолита: зеленый.

Выходные гнезда: 2хDVI, TV-выход.

VIVO: нет

TV-out: интегрирован в GPU.

NVIDIA GeForce 7900 GT 256MB PCI-E
GPU: GeForce 7900 GT (G71)

Интерфейс: PCI-Express x16

Частоты работы GPU:: 450/450/470 MHz (номинал — 450/450/470 МГц)

Частоты работы памяти (физическая (эффективная)):: 660 (1320) MHz (номинал — 660 (1320) МГц)

Ширина шины обмена с памятью: 256bit

Число вершинных конвейеров: 8

Число пиксельных конвейеров: 24

Число текстурных процессоров: 24

Число ROPs: 16

Размеры: 195x100x15 мм (последняя величина — максимальная толщина видеокарты).

Цвет текстолита: зеленый.

Выходные гнезда: 2хDVI, TV-выход.

VIVO: нет

TV-out: интегрирован в GPU.

NVIDIA GeForce 7600 GT 256MB PCI-E
GPU: GeForce 7600 GT (G73)

Интерфейс: PCI-Express x16

Частоты работы GPU:: 560/560/560 MHz (номинал — 560/560/560 МГц)

Частоты работы памяти (физическая (эффективная)):: 700 (1400) MHz (номинал — 700 (1400) МГц)

Ширина шины обмена с памятью: 128bit

Число вершинных конвейеров: 5

Число пиксельных конвейеров: 12

Число текстурных процессоров: 12

Число ROPs: 8

Размеры: 170x100x15 мм (последняя величина — максимальная толщина видеокарты).

Цвет текстолита: зеленый.

Выходные гнезда: 2хDVI, TV-выход.

VIVO: есть (Philips 7115)

TV-out: интегрирован в GPU.


NVIDIA GeForce 7900 GTX 512MB PCI-E
Карта имеет 512 МБ памяти GDDR3 SDRAM, размещенной в 8-ми микросхемах на лицевой стороне PCB.

Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 1.1ns, что соответствует частоте работы 900 (1800) МГц.

NVIDIA GeForce 7900 GT 256MB PCI-E
Карта имеет 256 МБ памяти GDDR3 SDRAM, размещенной в 8-ми микросхемах на лицевой стороне PCB.

Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 1.4ns, что соответствует частоте работы 700 (1400) МГц.

NVIDIA GeForce 7600 GT 256MB PCI-E
Карта имеет 256 МБ памяти GDDR3 SDRAM, размещенной в 4-х микросхемах на лицевой стороне PCB.

Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 1.4ns, что соответствует частоте работы 700 (1400) МГц.


Сравнение с эталонным дизайном, вид спереди
NVIDIA GeForce 7900 GTX 512MB PCI-E Reference card NVIDIA GeForce 7800 GTX 512MB PCI-E
NVIDIA GeForce 7900 GT 256MB PCI-E Reference card NVIDIA GeForce 7800 GT 256MB PCI-E
NVIDIA GeForce 7600 GT 256MB PCI-E Reference card NVIDIA GeForce 6600 GT 128MB PCI-E

Сравнение с эталонным дизайном, вид сзади
NVIDIA GeForce 7900 GTX 512MB PCI-E Reference card NVIDIA GeForce 7800 GTX 512MB PCI-E
NVIDIA GeForce 7900 GT 256MB PCI-E Reference card NVIDIA GeForce 7800 GT 256MB PCI-E
NVIDIA GeForce 7600 GT 256MB PCI-E Reference card NVIDIA GeForce 6600 GT 128MB PCI-E

Как хорошо видно из фотографий, только дизайн карты на базе 7900 GTX, по сути, повторяет своего предшественника 7800 GTX 512MB. Остальные PCB уникальны. Плата для 7900 GT стала более компактной, сильно упростилась даже в сравнении с PСB от 7800 GT. Хотя основные моменты — взаимное расположение микросхем памяти и ядра — остались почти неизменными. Разводка учла новые форм-факторы памяти (136-пиновые микросхемы вместо прежних 144-пиновых). Что касается 7600 GT, то мы видим, что опять-таки, только новые микросхемы памяти повлияли на изменения в разводке платы. Все остальное почти то же самое.

Надо отметить то, что карта 7900 GTX оснащена несколько чрезмерно быстрой памятью 1,1 нс. При частоте в 1600 МГц достаточно и 1,2 нс. Хотя с точки зрения надежности и т.п. наверно, это правильное решение. К тому же цены на такую память примерно схожи.

У карт имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуется специальный адаптер-переходник, (обычно поставляемый вместе с картой). Он же обеспечивает и подключение Video-In для оцифровки аналогового видеопотока (если таковое имеется. К сожалению, кодек Philips 7115 был установлен только на одной карте 7600 GT). Более подробно о Video-In можно почитать здесь. А по ТВ-выходу — здесь.

Продолжая изучать карты, мы видим, что все три снабжены парой гнезд DVI. Причем, Dual link DVI (у 7600 GT одно гнездо Single-, второе Dual-Link), что позволяет по цифровому каналу получать разрешения выше 1600х1200. Подключение к аналоговым мониторам с d-Sub (VGA) интерфейсам производится через специальные адаптеры-переходники DVI-to-d-Sub. Максимальные разрешения и частоты:

  • 240 Hz Max Refresh Rate
  • 2048 × 1536 × 32bit x85Hz Max — по аналоговому интерфейсу
  • 2560 × 1600 / 1600 × 1200 @ 60Hz Max — по цифровому интерфейсу

Отдельно надо сказать насчет частот ядер. У почти всех ранее нами исследуемых GT/GTX все три частоты ядра выставлялись с шагом 27 МГц, и частота геометрического блока была выше остальных на 40 МГц. Об этом подробно мы уже писали ранее.

Однако в данном случае эта самая разница в 40 МГц у 7600 GT была убрана, а вместе с ней и шаг в 27 МГц. Теперь все три частоты могут меняться как угодно с шагом до 1-2 МГц, причем на 7600 GT они равны друг другу и меняются синхронно. А у 7900 GTX разница между частотой геометрического блока и остальными частотами блоков ядра даже выросла до 50 МГц. При этом шаг в 27 МГц также был убран. У 7900 GT разница — 20 МГц, и шага в 27 МГц также нет. Поэтому выше приведенные частоты ядер являются фактическими, а не приводятся к одному из значений из ряда 432-459-486-513 МГц.

NVIDIA GeForce 7900 GTX 512MB PCI-E

Система охлаждения полностью заимствована от 7800 GTX 512MB. И это очень правильное решение, ибо кулер прекрасен во всех отношениях.

Несмотря на свои размеры и кажущуюся сложность конструкции, устройство работает просто: большой вентилятор прогоняет воздух через левый и правый радиаторы, к которым подведены тепловые трубки, несущие тепло от платформы, прижимающейся к ядру и микросхемам памяти. Прижим к последним производится через текстильные термоэлементы, пропитанные специальной пастой. Для соприкосновения с GPU имеется медная площадка с хорошо отполированной поверхностью. Не надо стараться мысленно затыкать уши, предвкушая шум такого кулера! Вентилятор вращается на частоте всего 1000 оборотов в минуту! И потому шума просто нет! Да, при старте компьютера кулер раскручивается примерно на 4000-5000 оборотов и создает шум, но это всего на 5-6 секунд. Да и рева, как, например, у кулера от RADEON X1900, нет.

Система охлаждения имеет большие размеры и занимает ближайший к видеокарте слот, но, думаю, что на сегодня это уже не злободневная проблема.

Главное, что кулер пусть хоть и частично, но все же выносит теплый воздух за пределы системного блока.

NVIDIA GeForce 7900 GT 256MB PCI-E; NVIDIA GeForce 7600 GT 256MB PCI-E

Резким контрастом к предыдущему устройству охлаждения является этот кулер. Перед нами все тот же простой «а-ля GeForce4».

То бишь небольшой закрытый радиатор, через который прогоняется воздух с помощью смещенного относительно центра ядра вентилятора.

Отличия от устройства тех времен, конечно, есть. Прежде всего, это немного увеличенные размеры радиатора, а также материал, из которого он сделан, — медный сплав. Да и расположен на карте он как бы вверх ногами, наоборот, то есть, выдув идет не к «хвосту» карты, а к ее «голове», поэтому нелишне будет под картой иметь свободный слот и вынуть заглушку этого слота в системном блоке.

Что касается шума, то на 7900 GT кулер работает от силы на 2000 оборотов в минуту, поэтому тихий. А на 7600 GT первые минуты 2-3 сильно шумит, затем обороты падают. Однако при запуске 3D-приложения снова возрастают. Но не все так плохо: бета-версия 16 нового RivaTuner-а позволяет управлять вентилятором на 7600 GT, и поэтому проблем с шумом нет.


Теперь посмотрим на сами процессоры.

7900 GTX — G71 изготовлен на 6-й неделе 2006 года, это в феврале, то есть, чипу всего 1 месяц



Сравнение ядер: X1900 XTX (слева); 7800 GTX (посредине); 7900 GTX (справа)



Интрига дня! Вы посмотрите, как резко уменьшилась площадь кристалла G71 по сравнению с G70! Подсчеты показали, что это уменьшение составило 1.44 раза! К тому же мы уже знаем, что число транзисторов в ядре уменьшилось с 305 до 279 млн. Специалисты из NVIDIA прекрасно поработали над дизайном чипа, и в результаты мы получили столь же эффективный, работающий на более высокой частоте, но очень дешевый кристалл, который к тому же имеет более низкое энергопотребление.

7900 GT — G71 изготовлен на 3-й неделе 2006 года, это в январе

Думаю, что нет смысла описывать этот GPU, так как это копия предыдущего. По сути, тот же чип, только работающий на более низких частотах. Всем понятно, что сюда пойдут отбраковки от 7900 GTX (по частотам).

7600 GT — G73 изготовлен на 1-й неделе 2006 года



Сравнение ядер: 6600 GT (слева); 7600 GT (справа)



Видим, что несмотря на то, что G73 обладает 12-ю пиксельными конвейерами и 5-ю вершинными против 8-ми пиксельных и 3-х вершинных у 6600 GT, площадь ядра, за счет уменьшения техпроцесса и грамотного дизайна, уменьшилась. Более того, GPU работает на гораздо более высоких частотах относительно 6600 GT.

С помощью бета-версии нового RivaTuner-а мы смогли установить, что внутри G73 не три, а четыре квада (16 конвейеров)! Просто один квад выключен (заблокирован аппаратно без возможности программного включения). Это говорит о том, что в будущем по мере отлаживания производства, возможен выход и что-то типа 7600 GTX уже с 16-ю пиксельными конвейерами. Конечно, тут станет вопрос о том, хватит ли ПСП для обеспечения такого ядра (все же шина 128-битная). Но, во-первых, это всего лишь предположение, может, никогда не будет выпущено такого GPU; во-вторых, по мере падения цен на память можно на такие карты ставить и самую быструю память, что как-то компенсирует узость шины. В-третьих, выходят все более новые игры, которым нужно, прежде всего, быстродействие GPU, а не возможности ПСП. В-четвертых, все же есть риск того, что разработчики намудрили что-то с регистрами, и потому зафиксирован лишний квад, которого там может и не быть (это маловероятно, но будем допускать, что все могут ошибаться).

Установка и драйверы

Конфигурация тестового стенда:

  • Компьютер на базе Athlon 64 (939Socket)
    • процессор AMD Athlon 4000+ (2400MHz) (L2=1024K);
    • системная плата ASUS A8N32 SLI Deluxe на чипсете NVIDIA nForce4 SLI X16;
    • для CrossFire системная плата ASUS A8R32-MVP Deluxe на чипсете ATI RADEON Xpress 3200 CrossFire;
    • оперативная память 2 GB DDR SDRAM 400MHz (CAS (tCL)=2.5; RAS to CAS delay (tRCD)=3; Row Precharge (tRP)=3; tRAS=6);
    • жесткий диск WD Caviar SE WD1600JD 160GB SATA.
  • RADEON X1800 XT (HIS, PCI-E, 512MB GDDR3, 625/1500 MHz);
  • GeForce 7800 GTX (ASUS EN7800GTX TOP, PCI-E, 256MB GDDR3, 486/1350 MHz);
  • GeForce 7800 GTX (reference, PCI-E, 512MB GDDR3, 550/1700 MHz);
  • RADEON X1900 XTX/XT (reference, PCI-E, 512MB GDDR3, 650/1550 MHz (625/1450));
  • GeForce 7800 GTX 512MB (reference, PCI-E, 512MB GDDR3, 550/1700 MHz);
  • GeForce 7800 GT (reference, PCI-E, 256MB GDDR3, 400/1000 MHz);
  • RADEON X1600 XT (reference, PCI-E, 256MB GDDR3, 590/1380 MHz);
  • GeForce 6600 GT (Galaxy, PCI-E, 128MB GDDR3, 500/1000 MHz);
  • GeForce 6800 GS (reference, PCI-E, 256MB GDDR3, 425/1000 MHz);
  • операционная система Windows XP SP2; DirectX 9.0c;
  • мониторы ViewSonic P810 (21") и Mitsubishi Diamond Pro 2070sb (21").
  • драйверы ATI версии CATALYST 6.2; NVIDIA версии 84.11/84.17.

VSync отключен.

Для оценки эффективности нового ядра мы провели также тесты на 7900 GTX на пониженных до 7800 GTX 512 частотах 550/1700 МГц.

Как я уже отмечал выше, после некоторой доработки автором Алексеем Николайчуком последняя бета-версия RivaTuner стала поддерживать и эти три новинки.

NVIDIA GeForce 7900 GTX 512MB PCI-E





Обратите внимание на то, что с помощью RivaTuner-а и без того низкие обороты кулера были сведены к 25% от номинала! И даже при всего лишь 500 с лишним оборотах в минуту нагрев ядра не превысил под нагрузкой 70 градусов! Отменный результат! И по ощущениям карта стала заметно меньше греться относительно 7800 GTX (после работы ее можно спокойно вытащить, не обжигаясь об PCB — плата просто теплая).

NVIDIA GeForce 7900 GT 256MB PCI-E





К сожалению, частота вращения вентилятора не определяется микросхемой мониторинга, поэтому показать ее мы не сможем. Как мы видим, даже при таком не очень большом кулере (сравним с тем, что на 7800 GTX, а ведь, по сути, перед нами это самое и есть, только в новом исполнении), нагрев под нагрузкой не выше 65 градусов (замечу, что обороты вентилятора не велики, и шума нет).

NVIDIA GeForce 7600 GT 256MB PCI-E





Здесь аналогичная ситуация с мониторингом, но кулер при включении 3D-приложений резко поднимает обороты. Как я уже сказал, это не проблема. С помощью RivaTuner-а можно снизить их до 25% от номинала, и шум прекратится. И даже при этом температура ядра не выше 70 градусов (подчеркну, что показания сняты при заблокировании частоты вращения вентилятора до 25% от максимальной).

В начале этой части я написал, что мы получили два комплекта карт. Поэтому смогли исследовать и режим SLI у каждой.





Синтетические тесты

Мы использовали новые, усложненные и перекликающиеся с адекватными сейчас задачами тесты пиксельных шейдеров версии 2.0 — D3D RightMark Pixel Shading 2 и нацеленные на будущее тесты D3D RightMark Pixel Shading 3. Сейчас эти тесты находятся в стадии бета-тестирования и уже доступны для скачивания здесь:

Тесты топовых карт проводились:

  • На GeForce 7800 GTX 512MB со стандартными параметрами (далее G70);
  • На GeForce 7900 GTX 512MB со стандартными параметрами (далее G71);
  • На GeForce 7900 GTX 512MB на частоте G70 (далее G71-70);
  • На GeForce 7900 GT 256MB со стандартными параметрами (далее G71 GT);
  • На RADEON X1900 XTX (далее R580);

Тесты карт среднего сегмента проводились:

  • На GeForce 7600 GT 256MB со стандартными параметрами (далее G73);
  • На GeForce 6600 GT 256MB со стандартными параметрами (далее 6600 GT)
  • На RADEON X1600 XT (далее X1600);

Тест Pixel Filling

Пиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:





Если повышенная частота ядра новой карты на базе G70 позволяла нам говорить о паритете, то G71 заявляет твердо — он новый лидер. В этом тесте. Никаких новшеств относительно взаимного поведения ATI и NVIDIA или намеков на архитектурные изменения G71 по сравнению с G70 нет (мы проверили эти чипы на одинаковой частоте и обнаружили полную идентичность во всем, кроме скорости геометрических тестов, но последний пункт объяснился банально — небольшой фактической разницей в тактовой частоте геометрического блока G71 относительно G70 при прочих равных частотах). Итак, архитектурных отличий нет, но разница в тактовой частоте обеспечивает новому чипу лидерство.





Та же самая картина, но уже в координатах количества записанных в буфер кадра пикселей. В пиковых случаях – 0, 1 и 2 текстуры G71 заметно впереди.

Проверим ту же задачу, но в исполнении PS 2.0 шейдера:





Итак, можно констатировать, что ничего не изменилось — как FFP, так и шейдеры работают совершенно одинаково (с точки зрения железа FFP эмулируется шейдером) и показывают одинаковые результаты. Более высокая тактовая частота G70 позволяет ему доминировать.

Теперь посмотрим, как обстоят дела в среднем сегменте:









В этом сегменте дела обстоят для NVIDIA еще лучше, новый герой среднего ценового диапазона — G73 вне конкуренции. Двукратное преимущество без исключений, это сильно! ATI придется очень туго — решения на базе R520 или R580 в этом ценовом диапазоне будут смотреться неуклюже и не принесут компании много прибыли, а конкурентоспособность RV530, как мы видим, под вопросом (который мы и исследуем подробно).

Тест Geometry Processing Speed

Самый простой шейдер — предельная пропускная способность по треугольникам:



Все согласно тактовым частотам и числу вершинных блоков. R580 по-прежнему чуть впереди по пиковой ПСП, но как мы знаем, она не решает чего-либо в современных играх. Смотрим далее: более сложный шейдер — один смешанный источник света:



Картина закономерностей прежняя, но теперь, повышенные тактовые частоты G71 позволяют говорить о паритете. Усложняем задачу далее:



На смешанном источнике света проявляется наличие аппаратной оптимизации эмуляции FFP – в этом поколении она есть как у NVIDIA, так и у ATI. Между собой карты вновь распределились сугубо по частотам. Видно, что вершинная архитектура G71 не претерпела никаких изменений, но скорость вершинного блока возросла. Очевиден паритет.

Еще более сложная задача, включая переходы:



Здесь мы опять видим, что переходы – слабое место вершинного блока ATI, и в сумме с повышенной частотой ядра G71 мы наблюдаем некий проигрыш на грани паритета. В сложных вершинных тестах ATI уже не спасает высокая прямая ПСП по треугольникам. Как и в случае G70, для G71 динамические переходы предпочтительнее статических.

Выводы по геометрическим тестам: картина не сильно изменилась качественно, но количественная разница между G71 и G70 свела на нет все преимущества R580, которые мы могли отмечать в прошлом сравнении. Никаких архитектурных новшеств или изменений не наблюдается. Все то же самое, но лучше — вспомним эпиграф первой части.

А теперь среднее звено:









В общем, и целом можно говорить о паритете G73 и X1600 (RV530). В области абсолютной ПСП по треугольникам G73 впереди, однако в остальных тестах на лицо достаточно четкое равновесие. Все соображения относительно архитектурных особенностей остаются прежними — блоки RV530 и G73 наследованы от старших товарищей. Отметим только, что в среднем сегменте геометрическая производительность сказывается на результатах реальных игровых приложений еще меньше — 128 битные шины локальной памяти дают себя знать и чаще служат узким звеном в процессе рендеринга.

Похвальным фактом является двукратный прирост G73 по сравнению с NV43 — этот чип заметно проигрывал ATI, а теперь паритет восстановлен. Этот факт скажется на профессиональных картах (традиционно успешная для NVIDIA вотчина) на базе G73 — там геометрическая мощь важна.

Тест Pixel Shaders

Первая группа шейдеров — достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:



Картина не изменилась по отношению к предыдущему обзору X1900 — просто G71 стал еще немного быстрее согласно росту тактовой частоты.

Посмотрим далее, более длинные шейдеры:



Здесь ситуация повторяет прежний обзор — NVIDIA получает преимущество от 16 битной точности представления (не забываем, что интенсивные промежуточные вычисления в такой точности могут привести к заметному ухудшению качества рендеринга, и сейчас стандартом де-факто и требованиями всех будущих API являются внутренние вычисления в формате FP32). На сложной модели вычислений R580 заметно обыгрывает NVIDIA, особенно если не учитывать FP16 вариант. Это похвально.

В любом случае, расстановка сил в области пиксельных шейдеров не изменилась, и все будет зависеть от приложений. R580 действительно может считаться королем шейдерной мощи и по-прежнему превосходит G71 на многих, не упирающихся в выборку текстур, вычислениях.

А теперь средний сегмент:



Несмотря на продвинутую архитектуру X1600, 12 ПОЛНОЦЕННЫХ (в отличие от RV530) конвейеров G73 дают себя знать. Четкое, бесспорное лидерство над конкурентом налицо. Превосходство колеблется в зависимости от теста, от просто заметного, до значительного. Если с семейством GeForce 6600 ATI еще может сразиться, то с G73 им придется непросто, и опять на повестку дня встает невыгодный для фирмы вопрос о дешевых вариантах на базе R520 или R580. Да, уже ясно, что G73 можно назвать в некотором роде локальной сенсацией — он работает стабильно, недорого и очень хорошо! Так хорошо, что просто нечего противопоставить в этом ценовом сегменте даже для сравнения. Судя по всему, реальные приложения только подтвердят этот вывод.

Наши новые шейдерные тесты

Новые тесты, на которые мы будем постепенно переходить в будущих обзорах, доступны для скачивания (см. выше) в составе архива бета-версии D3D RightMark. В будущем мы откажемся от синтетических тестов с более ранними версиями и полностью сосредоточимся на HLSL шейдерах для SM 2.0 и 3.0. Более ранние шейдеры можно будет проверить на примере существующих приложений, а синтетические тесты, нацеленные на текущий момент и даже далее, в будущее, требуют корректировки в соответствии с веяниями времени, что и было проделано.

Начнем с более простых шейдеров PS 2.0. Доступны два новых теста, реализующих актуальные для современных приложений эффекты:

  • Parallax Mapping;
  • Сложную процедурную текстуру замороженного стекла Frozen Glass с управляемыми извне параметрами.

Оба шейдера мы тестируем в двух исполнениях: максимально ориентированном на вычисления и на выборку текстур. Кроме того, мы проверяем результаты для FP16 и для FP32 точности вычислений.

Итак, сперва вычислительно интенсивные варианты решения задачи:



Как мы видим, на первом месте стабильно идет R580 (особенно ему удается параллакс-маппинг), затем G71. Опять таки, производительность G71 заметно зависит от точности. Никаких архитектурных отличий от G70 не выявлено. Теперь те же самые тесты в варианте с предпочтением выборки текстур:



Здесь, как мы видим, преимущество R580 сходит на нет. Интересная ситуация — слишком много зависит от контекста и предпочтения программистов, посмотрим, какие пути они выберут в своих приложениях.

Выводы: возросшая тактовая частота дает себя знать, но ситуация по-прежнему под вопросом, преимущество ATI в некоторых случаях значительно. Налицо существенный задел на будущее — для сложных кинематографических шейдеров и прекрасная фора для передовых игр настоящего. Но будет ли она раскрыта — ведь число текстурных блоков R580 по-прежнему 16. Далее, в игровых тестах мы увидим, как современные приложения соотносятся с соотношением 3:1, выбранным ATI, и насколько успешно повышенные частоты G71 позволяют сводить архитектурное преимущество противника на нет в реальных играх.

Тест HSR

Пиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:



Как мы видим, никаких изменений в раскладке не произошло. Иерархический HSR в исполнении ATI выглядит более успешным, чем одноуровневый в случае NVIDIA, особенно на сложных и средних сценах.

С текстурированием NVIDIA чуть реабилитирует себя — сказывается более эффективная (для простой закраски) интеграция текстурных модулей в пиксельный конвейер.

А теперь средний сегмент:




Здесь мы видим что, несмотря на потенциально более низкую архитектурную эффективность HSR, G73 может показать зубы, и показывает их. Налицо паритет с ATI, причем интересно отметить, что коэффициент эффективности HSR выше у средних решений NVIDIA (NV43 и G73) по сравнению с топовым G71. Впрочем, это логично — именно для среднего сегмента характерны сцены с более низким разрешением при прежней сложности геометрии и как никогда важна экономия ПСП (а HSR играет в ней не последнюю роль).

Тест Point Sprites








Данные приведены сразу для топовых и средних карт. Все как обычно — NVIDIA впереди на небольших спрайтах благодаря более эффективной работе с буфером кадра. В случае топовых карт, по мере роста их размера и сложности освещения она проигрывает, впрочем, не фатально. А в среднем сегменте G73 не дает ATI опомнится — вы посмотрите — это лидер, четкий лидер.

Выводы по синтетическим тестам

  1. Итак, новое топовое решение NVIDIA если не выиграет во всех реальных тестах, то, как минимум, восстановит паритет там, где он был заметно утерян с выходом X1900. И это при меньшей площади чипа, меньшем потреблении энергии и меньшем выделении тепла, чем у конкурента. Браво! Эффективность во всех смыслах этого слова налицо! Сомнения, которые могли возникнуть с выходом X1900, у приверженцев марки остаются, но становятся практически призрачными. И, чувствуется, что это еще не предел — есть задел для дальнейшего развития даже этой архитектуры, конечно, если это понадобится :-) а, судя по всему, через пол года мы увидим и G80.
  2. Новое решение среднего уровня — G73 показало абсолютное и безоговорочное лидерство. Судя по всему, практические тесты только подтвердят этот факт. ATI придется серьезно задуматься над тем, что можно противопоставить этому чипу и картам на его основе. Очевидна небольшая и приятная сенсация.
  3. Самая досадная проблема ATI — 16 текстурных блоков R580. В тех случаях, которые можно назвать неудобными, именно они не дают R580 показать себя лучше. Не надо быть провидцем, чтобы предсказать, что проблема напомнит о себе и в реальных игровых тестах, причем еще сильнее, чем это было в случае с G70. И тогда окончательные результаты, и выводы могут вполне заметно сдвинуться в сторону G71.
  4. Решения NVIDIA прекрасно масштабируются и, судя по всему, безболезненно перешли на новую технологию 90нм, уже сейчас получив заметные выгоды от этого производственного улучшения.

Впереди будет самая главная часть по тестам в играх. Оставайтесь с нами!

NVIDIA GeForce 7900 GTX/GT (G71), GeForce 7600 GT (G73) — Часть 3: Игровые тесты (производительность)



Блок питания для тестового стенда предоставлен компанией HIPER
Память для тестовых стендов предоставлена компанией





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.