Обзор NVIDIA GeForce 6600GT и 6600 (NV43): Часть 1 — Производительность.




СОДЕРЖАНИЕ

  1. Официальные спецификации
  2. Архитектура
  3. Особенности видеокарт
  4. Конфигурации стендов, список тестовых инструментов, качество в 2D
  5. Синтетические тесты в D3D RightMark
  6. Синтетические тесты в 3DMark03: FillRate Multitexturing
  7. Синтетические тесты в 3DMark03: Vertex Shaders
  8. Синтетические тесты в 3DMark03: Pixel Shaders
  9. Результаты тестов: Quake3 ARENA
  10. Результаты тестов: Serious Sam: The Second Encounter
  11. Результаты тестов: Return to Castle Wolfenstein
  12. Результаты тестов: Code Creatures DEMO
  13. Результаты тестов: Unreal Tournament 2003
  14. Результаты тестов: Unreal II: The Awakening
  15. Результаты тестов: RightMark 3D
  16. Результаты тестов: TRAOD
  17. Результаты тестов: FarCry
  18. Результаты тестов: Call Of Duty
  19. Результаты тестов: HALO: Combat Evolved
  20. Результаты тестов: Half-Life2(beta)
  21. Результаты тестов: Splinter Cell
  22. Результаты тестов: DOOM III
  23. Результаты тестов: 3DMark03 Game1
  24. Результаты тестов: 3DMark03 Game2
  25. Результаты тестов: 3DMark03 Game3
  26. Результаты тестов: 3DMark03 Game4
  27. Результаты тестов: 3DMark03 MARKS
  28. Выводы


Начало осени… Как и 5 лет назад, когда прозвучал анонс первого продукта с аппаратной поддержкой T&L — GeForce256, сегодня мы встречаем новинки от NVIDIA. Конечно, это не High-End, но менее интересным анонс от этого не становится. Собственно, анонс был еще в августе, однако тогда были представлены лишь характеристики видеокарт, а теперь мы, как и многие другие СМИ, имеем возможность показать, на что способны новейшие изделия для Middle-сектора трехмерных акселераторов.

До последнего времени в этом сегменте рынка лидерство держали продукты от ATI: RADEON 9600/PRO/XT, X600PRO/XT, обходя своих соперников в лице NVIDIA GeForce FX 5700/Ultra, PCX5750/5900 по скорости в современных играх с активным использованием шейдерных технологий. И только лишь спущенный «сверху» в этой сегмент FX 5900XT смог стать популярным и потеснить гегемонию канадских изделий. И вот теперь…

«Налу уже в пути за главным призом… Руби придется держать оборону… »

Да, не случайно в качестве героинь были взяты русалка и отважная девушка из соответствующих демо-программ NVIDIA и ATI, демонстрирующих новые технологии (SM3.0 от NVIDIA и 3Dc/SM2.0b от ATI). Новинки от калифорнийской компании, которые мы будет сегодня изучать, поддерживают шейдеры версии 3.0 в полном объеме, как и свои старшие собратья.

Отдаст ли Руби свой королевский алмаз нагоняющей ее Налу? Ведь вскоре предстоит анонс и новинок от ATI в этом же секторе видеокарт. Каков будет исход битвы? — Пока не знаем. Думаю, что материал по RV410 будет не менее интересным и захватывающим. Но пока мы абстрагируемся от этого и рассмотрим NV43 (GeForce 6600GT/6600) так, как если бы эти карты уже вышли в широкую продажу. Соответственно, конкурентами им станут те акселераторы, что имеют ныне популярность в сегменте цен от 150 до 200 долларов США. И, конечно, те видеокарты, на замену которым идут новинки.

Забегая вперед, отметим, что NV43 имеет встроенную поддержку интерфейса PCI-Express (далее PCX), поэтому AGP-продукты без комплекта с мостом HSI невозможны. А следовательно, они будут дороже в производстве и выйдут позже своих PCX-аналогов (если выйдут — ведь все будет зависеть от спроса). Это является существенным минусом новинок на сегодня, поскольку PCX-сектор только-только начинает свое развитие, и спрос на такие платформы пока минимален. Поэтому, каким бы замечательным ни был новый продукт, он обречен с самого начала на относительно малый спрос в Retail рынке виду того, что апгрейд с AGP-платформы на PCX пока имеет сомнительные выгоды. С другой стороны, OEM рынок и сборщики ПК, особенно зарубежные, не преминут наладить выпуск моделей с не такими дорогими, как топовые, но по прежнему полностью соответствующими современным потребностям DirectX PCX решениями.

Кроме того, кто знает, может как раз выход интересных и выгодных с точки зрения соотношения цена-скорость видеокарт может подстегнуть интерес к PCX в целом. В общем, время покажет. И не будем забывать, что у ATI ее RV410 выйдет также с родной поддержкой только PCX, а у канадской компании нет собственных двусторонних мостов AGP<->PCX, и поэтому ей будет практически невозможно реализовать новинки на AGP-шине. Впрочем, в этом секторе уже и так тесно, и есть много различных сходных по производительности решений из ранее выпущенного или выпускаемого ныне.

Нам было весьма интересно сравнить не только карты на одном интерфейсе, но и AGP- и PCX-варианты между собой. Это сделать, конечно же, очень сложно, поскольку платформы значительно отличаются. Однако мы помним, что находимся в секторе Middle-End, где современным процессорам вполне по плечу вызвать 100%-ную загрузку ускорителя, и производительность после определенного разрешения не так сильно зависит от платформы. Ниже вы узнаете, что вышло из наших кросплатформенных исследований.

А теперь вернемся к объектам сегодняшнего анализа: NVIDIA NV43 или GeForce 6600GT/6600 (линейка пока состоит из двух карт, отличающихся между собой лишь частями).

Официальные спецификации GeForce 6600GT/6600 (NV43)

  1. Кодовое имя чипа NV43
  2. Технология 110нм (TSMC) (!)
  3. 146 миллионов транзисторов
  4. FС корпус (перевернутый чип, без металлической крышки)
  5. 128 бит двуканальный интерфейс памяти (!)
  6. До 256 мегабайт DDR/GDDR2/GDDR3 памяти
  7. Встроенный в чип PCI Express16х шинный интерфейс
  8. Возможность трансляции интерфейса в APG 8х с помощью двустороннего PCI Express<->AGP моста HSI
  9. 8 Пиксельных процессоров, по одному текстурному блоку на каждом с произвольной фильтрацией целочисленных и плавающих текстур (анизотропия степени до 16х включительно).
  10. 3 Вершинных процессора, по одному текстурному блоку на каждом, без фильтрации выбираемых значений (дискретная выборка)
  11. Вычисление, блендинг и запись до 8 полных (цвет, глубина, буфер шаблонов) пикселей за такт (эксперимент показывает — до 4-х)
  12. Вычисление и запись до 16 значений глубины и буфера шаблонов за такт (если не производятся операции с цветом) (эксперимент показывает — до 8-х)
  13. Поддержка "двустороннего" буфера шаблонов
  14. Поддержка специальных оптимизаций прорисовки геометрии для ускорения алгоритмов теней на основе буфера шаблонов (т.н. технология Ultra Shadow II) в частности широко используемых в движке Doom III
  15. Все необходимое для поддержки пиксельных и вершинных шейдеров версии 3.0, включая динамические ветвления в пиксельных и вершинных процессорах, выбор значений текстур из вершинных процессоров и т.д.
  16. Фильтрация текстур в плавающем формате
  17. Поддерживается буфер кадра в плавающем формате (включая операции блендинга)
  18. MRT
  19. 2 RAMDAC 400 МГц
  20. 2 DVI интерфейса (требуются интерфейсные чипы)
  21. TV-Out и TV-In интерфейс (требуются интерфейсные чипы)
  22. Программируемый потоковый видеопроцессор (для задач компрессии, декомпрессии и постобработки видео)
  23. 2D ускоритель с поддержкой всех функций GDI+
  24. Встроенный мониторинг температуры и энергопотребления

Спецификации референсной карты GeForce 6600 GT

  1. Частота ядра 500 МГц
  2. Эффективная частота памяти 1 ГГц (2*500 МГц)
  3. Шина памяти 128 бит
  4. Тип памяти GDDR3
  5. Объем памяти 128 мегабайт
  6. Пропускная способность памяти 16 гигабайт в сек.
  7. Теоретическая скорость закраски 4 гигапикселя в сек.
  8. Теоретическая скорость выборки текстур 4 гигатекселя в сек.
  9. Один VGA (D-Sub) и один DVI-I разъем
  10. TV-Out
  11. Потребляет до 70 Ватт энергии (т.е. на PCI-Express карте разъем для дополнительного питания не нужен, рекомендован источник питания суммарной мощностью 300 или более Ватт)

Список карт, ныне выпущенных на базе NV43:

  • GeForce 6600GT: 500/500 (1000) MHz, 128MB GDDR3, PCI-Express x16, 8 пиксельных и 3 вершинных конвейеров ($199) — конкурент NVIDIA GeForce PCX5900, ATI RADEON X600 XT(?), а также будущих решений ATI (RV410);
  • GeForce 6600: 300/250-300 (500-600) MHz, 128/256MB DDR, PCI-Express x16, 8 пиксельных и 3 вершинных конвейеров ($149) — конкурент NVIDIA GeForce PCX5750, ATI RADEON X600 PRO (X600 XT?).

Общая схема чипа



Особые архитектурные отличия от NV40 не заметны, что, впрочем, не удивительно – NV43 является масштабированным (путем уменьшения числа вершинных и пиксельных процессоров и каналов контроллера памяти) решением, основанным на архитектуре NV40. Отличия количественные (на схеме выделены жирным), а не качественные – с точки зрения архитектуры чип практически не изменился.

Итак, в наличии 3 (было 6) вершинных процессоров, и два (было четыре) независимых пиксельных процессора, каждый из которых работает с одним квадом (фрагментом 2х2 пикселя). Интересно, что на сей раз, PCI Express стал нативным (т.е. реализованным на чипе) шинным интерфейсом, а AGP 8х платы будут содержать дополнительный двусторонний мост PIC-E <-> AGP (показан пунктиром) уже подробно описанный нами ранее.
Кроме того, отметим очень важный ограничивающий момент – двухканальный контроллер и 128 битную шину памяти – этот факт мы подробно обсудим и исследуем далее.

Архитектура вершинных и пиксельных процессоров, видеопроцессора осталась прежней – эти элементы были детально описаны нами в обзоре GeForce 6800 Ultra (ссылка). А теперь, поговорим о потенциальных количественных и качественных изменениях по отношению к NV40:

Теоретические соображения о том, что и как было урезано

В целом, на данный момент, мы получаем следующую линейку решений на базе архитектур NV4X и R4XX:

Карта

Чип

Pixel/
Vertex

Память

Полоса памяти

Fillrate
Mpix.

Частота ядра

NVIDIA

6800 U

NV40

16/6

256 (4 х 64)
GDDR3 1100

35.2

6400

400

6800 GT

NV40

16/ 6

256 (4 х 64)
GDDR3 1000

32.0

5600

350

6800

NV40

12/5

256 (4 х 64)
DDR 700

22.4

3900

325

6800 LE

NV40

8/4

256 (4х64)
DDR 700

22.4

2560

325

6600 GT

NV 43

8/3

128 (2х64)
GDDR 3 1000

16

4000

500

6600

NV 43

8/3

128 (2х64)
DDR 500-600-700

<11.2

2400

300

ATI

X800 XT

R42X

16/6

256 (4 х 64)
GDDR3 1000

32

8000

500

X800 PRO

R42X

12/6

256 (4 х 64)
GDDR3 1100

28.8

5700

475

X800 SE

R42X

8/6

256 (4 х 64)
DDR 700

22.4

3400

425

X700 XT*

RV41X

8/3

256 (4х64)
DDR (?)

?

?

~500 (?)

X 700 PRO / SE *

RV 41 ×

8/3

128 (2х64)
?

?

?

~400 (?)

X600 XXX

На базе предыдущего поколения архитектуры

*) данные основаны на непроверенных слухах (форум beyond3d и другие неофициальные сетевые источники), вскоре эти продукты будут анонсированы официально.

Если 6800 Ultra, GT и просто 6800 выглядят достаточно сбалансированными по соотношению полосы памяти и скорости закраски решениями, то 6800LE будет чаще упираться в недостаточную скорость закраски — полоса памяти там с избытком, а обе модели 6600 будут в первую очередь страдать из-за недостатка полосы пропускания. Пиковая скорость закраски 6600 GT составляет почти 2/3 от скорости 6800 Ultra, в то время как пропускная способность памяти более чем вдвое ниже, и это, без учета потенциально уменьшенных кэшей и двуканального контроллера памяти.

Таким образом, можно предсказать, что слабым местом семейства 6600 будут большие разрешения и режимы с полноэкранным сглаживанием, особенно на простых приложениях, а сильным — программы с длинными и сложными шейдерами и анизотропная фильтрация без одновременного MSAA. Далее, мы проверим это предположение игровыми и синтетическими тестами.

Сложно сейчас судить насколько оправданным был ход с 128 битной шиной памяти — с одной стороны это удешевляет корпус чипа и уменьшает число бракованных чипов, с другой стороны, разница в цене печатной платы для 256 бит и 128 бит не велика, и с избытком компенсируется разницей в цене обычной DDR и пока дорогой высокоскоростной GDDR3 памяти. Вероятно, с точки зрения производителей карт решение с 256 бит шиной было бы более удобным, как минимум, если бы у них была возможность выбора, а с точки зрения NVIDIA производящей чипы и зачастую продающей с ними в комплекте память, более выгодно 128 бит решение в комплекте с GDDR3. Другое дело, как это скажется на скорости — ведь на лицо потенциальное ограничение отличных возможностей чипа (8 конвейеров, 500 МГц частота ядра, и это еще не предел) из-за значительно урезанной пропускной полосы памяти:



DDR 700 × 256 бит = 22,4 Гигабайт против GDDR3 1000x128 бит = 16 Гигабайт.

Особенно беспокоит этот факт на фоне слухов о старшей модели X700, которая будет снабжена 256 битной памятью.

Впрочем, заметим, что и суффикс Ultra NVIDIA пока что приберегла — учитывая большой разгонный потенциал технологии 110 нм, можно ожидать появление карты с частотой ядра порядка 600 МГц или чуть менее, памятью 1100 или даже 1200 (в будущем) и названием 6600 Ultra. Вот только какова будет ее цена? В дальней перспективе, можно прогнозировать появление обновленного, 256 битного варианта Mainstream решения, мысленно назовем его NV46 оптимизированного по производительности, с 8 или даже 12 конвейерами и 256 битной шиной.

Вершинные и пиксельные процессоры в NV43, судя по всему, остались неизменными, а вот внутренние кэши могли быть уменьшены, пропорционально числу конвейеров. Впрочем, число транзисторов не дает особых поводов для беспокойства — учитывая не столь большие размеры кэшей было бы разумнее оставить их такими же как у NV40, скомпенсировав тем самым заметный недостаток пропускной полосы памяти. Вполне возможно, что достаточно крупный по транзисторам массив ALU, осуществляющих постобработку, проверку, генерацию Z и блендинг пикселов для записи результатов в буфер кадра также был уменьшен на каждом конвейере по сравнению с NV40 — все равно уменьшенная полоса памяти не позволит записать 4 полных гигапикселя в секунду, и потенциал закраски (8 конвейеров на 500 МГц) будет полноценно использоваться только на более-менее сложных шейдерах, с более чем двумя текстурами и сопутствующими шейдерными вычислениями.

Все эти предположения мы проверим в ходе последующих синтетических и игровых тестов.

Перед изучением самой карты приведем список статей, посвященных изучению предыдущих новинок: NV40/R420. Ведь очевидно уже, что архитектура NV43 является прямой наследницей технологий NV40 (после мощности чипа были поделены пополам).

Теоретико-аналитические материалы и обзоры видеокарт, в которых рассматриваются функциональные особенности GPU ATI RADEON X800 (R420) и NVIDIA GeForce 6800 (NV40)

Подчеркну еще раз, что сегодня только 1-я часть, посвященная производительности новинок. Качественные составляющие мы рассмотрим позже во второй части (3D-качество и воспроизведение видео).

Теперь поговорим о карте. Почему у нас в заголовке указаны две карты, а рассматриваем мы фактически одну? Дело в том, что 6600GT и 6600 отличаются друг от друга лишь частотами работы, поэтому мы можем с большой вероятностью сделать эмуляцию GF 6600 путем уменьшения частот у 6600GT. Что мы и сделали. Разумеется, учитывая то, что на серийных GeForce 6600 будет стоять не GDDR3 память, а простая DDR (кроме частот еще и тайминги разные), а также то, что NVIDIA жестко не декларирует частоты работы памяти у таких карт, и могут встречаться клокинги от 250 до 300 МГц по памяти; мы не можем говорить о 100%-ном совпадении наших результатов с теми, что покажут финальные GeForce 6600. Но прикинуть можно. И даже полезно. И поэтому в наших результатах будет показана и GeForce 6600 300/300 (600) МГц (взят предельный случай). Всем понятно, что реальные 6600 покажут производительность НЕ ВЫШЕ той, что у нас на диаграммах, и можно примерно прикинуть, в каких пределах она будет находиться.

Итак, reference card GeForce 6600GT.

Плата



NVIDIA GeForce 6600GT


Карта имеет интерфейс PCI-Express x16, 128 МБ памяти GDDR3 SDRAM размещенной в 4-х микросхемах на лицевой стороне PCB.
NVIDIA GeForce 6600GT
Микросхемы памяти Samsung (GDDR3). Время выборки у микросхем памяти 2,0 ns, что соответствует частоте работы 500 (1000) МГц, на которой память и работает. Частота работы GPU — 500 MHz. Шина обмена с памятью — 128 bit. Число пиксельных конвейеров Х число текстурников — 8х1. Число вершинных конвейеров — 3.


Сравнение с эталонным дизайном, вид спереди
NVIDIA GeForce 6600GT NVIDIA GeForce PCX5900
NVIDIA GeForce 6800


Сравнение с эталонным дизайном, вид сзади
NVIDIA GeForce 6600GT/6600 NVIDIA GeForce PCX5900
NVIDIA GeForce 6800


Очевидно, что дизайн GF 6600GT уникальный и не похож ни на один предшествующий. Прежде всего, это уменьшение размеров самой карты, что позволяет отсутствие 256-битной шины, влияющей все же на размеры PCB. А также сильное упрощение силового блока способствовало снижению площади PCB (ведь для PCX-карт, потребляющих менее 75Вт, уже не требуется наличия внешнего питания, а это упрощает дизайн). Наш объект при самой максимальной нагрузке потребляет менее 75Вт, поэтому никакие подключения напрямую к БП не требуются.

Несмотря на огромные частоты для 8-ми конвейерного чипа, кулер довольно примитивен.

NVIDIA GeForce 6600GT

Перед нами очень хорошо нам известное устройство охлаждения, представляющее собой закрытый радиатор, в который смещенный относительно центра чипа вентилятор вгоняет воздух, прогоняя внутри радиатора вдоль карты.



Можно предположить, что производители таких карт будут проводить эксперименты с использованием своих собственных кулеров, или воспользуются теми наработками, что были ранее сделаны для GeForce4 Ti (GeForce FX 5600/5700).

Сам GPU имеет относительно небольшие размеры своей площадки (понятно, ведь 128-битная шина), и вообще внешне очень похож на GeForce FX 5700. И размеры кристалла почти такие же. Но если у NV36 в эти размеры помещалось всего 4 пиксельных и 3 вершинных конвейера, то в данном случае пиксельных вдвое больше. Все же 0.11 мкм…



Видеокарта обладает важной особенностью, рассчитанной на будущее, а именно поддержкой SLI (то есть, как во времена Voodoo2, существует возможность увеличения суммарной мощности 3D-графики за счет добавления аналогичного акселератора). Для этого на плате в верхней части есть соответствующий разъем для подключения специального шлейфа (или соединителя) к двум видеокартам для синхронизации их работы:

Заканчивая изучение самой карты, отметим, что она обладает поддержкой VIVO, реализованной через Philips 7115 (с таким кодером мы ещё не встречались, поэтому наш бессменный исследователь мультимедийных дополнений или особенностей видеокарт Алексей Самсонов уже в нетерпеливом ожидании протестировать новинку).

Теперь скажем о разгоне. Благодаря оперативности автора RivaTuner Алексея Николайчука, эта утилита уже умеет работать с NV43.





У карты определяется число конвейеров (и пиксельных, и вершинных). На втором скриншоте видим, что у карты работают два quad-а (четверки пиксельных конвейеров).

Так вот, плата смогла работать устойчиво на частотах 590/590 (1180) MHz!. Небывалый потенциал! Я даже могу предположить, что после выхода ATI RV410 NVIDIA выпустит GeForce 6600 Ultra (не зря у старшей модели ныне только суффикс GT).

Карта на таких частотах работала, обдуваемая внешним вентилятором. И вот какие температуры мы увидели:



Да, подчас нагрев ядра достигал 88 градусов, но, как известно, для таких чипов это явно не предел (они могут нагреваться и до 100 градусов). Интересно заметить, что внешний вентилятор практически охлаждал только память, ибо его изъятие не привело к какому-либо росту температуры на ядре.

А вот что мы видим на штатных частотах:







[ Следующая часть (2) ]





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.