![]()
Как хорошо видно из фотографий, только дизайн карты на базе 7900 GTX, по сути, повторяет своего предшественника 7800 GTX 512MB. Остальные PCB уникальны. Плата для 7900 GT стала более компактной, сильно упростилась даже в сравнении с PСB от 7800 GT. Хотя основные моменты - взаимное расположение микросхем памяти и ядра - остались почти неизменными. Разводка учла новые форм-факторы памяти (136-пиновые микросхемы вместо прежних 144-пиновых). Что касается 7600 GT, то мы видим, что опять-таки, только новые микросхемы памяти повлияли на изменения в разводке платы. Все остальное почти то же самое. Надо отметить то, что карта 7900 GTX оснащена несколько чрезмерно быстрой памятью 1.1нс. При частоте в 1600 МГц достаточно и 1.2нс. Хотя с точки зрения надежности и т.п. наверно, это правильное решение. К тому же цены на такую память примерно схожи. У карт имеется гнездо TV-выхода, которое уникально по разъему, и для вывода изображения на ТВ как через S-Video, так и по RCA, требуется специальный адаптер-переходник, (обычно поставляемый вместе с картой). Он же обеспечивает и подключение Video-In для оцифровки аналогового видеопотока (если таковое имеется. К сожалению, кодек Philips 7115 был установлен только на одной карте 7600 GT). Более подробно о Video-In можно почитать здесь. А по ТВ-выходу - здесь. Продолжая изучать карты, мы видим, что все три снабжены парой гнезд DVI. Причем, Dual link DVI (у 7600 GT одно гнездо Single-, второе Dual-Link), что позволяет по цифровому каналу получать разрешения выше 1600х1200. Подключение к аналоговым мониторам с d-Sub (VGA) интерфейсам производится через специальные адаптеры-переходники DVI-to-d-Sub. Максимальные разрешения и частоты:
Отдельно надо сказать насчет частот ядер. У почти всех ранее нами исследуемых GT/GTX все три частоты ядра выставлялись с шагом 27 МГц, и частота геометрического блока была выше остальных на 40 МГц. Об этом подробно мы уже писали ранее. Однако в данном случае эта самая разница в 40 МГц у 7600 GT была убрана, а вместе с ней и шаг в 27 МГц. Теперь все три частоты могут меняться как угодно с шагом до 1-2 МГц, причем на 7600 GT они равны друг другу и меняются синхронно. А у 7900 GTX разница между частотой геометрического блока и остальными частотами блоков ядра даже выросла до 50 МГц. При этом шаг в 27 МГц также был убран. У 7900 GT разница - 20 МГц, и шага в 27 МГц также нет. Поэтому выше приведенные частоты ядер являются фактическими, а не приводятся к одному из значений из ряда 432-459-486-513 МГц.
Теперь посмотрим на сами процессоры.
Интрига дня! Вы посмотрите, как резко уменьшилась площадь кристалла G71 по сравнению с G70! Подсчеты показали, что это уменьшение составило 1.44 раза! К тому же мы уже знаем, что число транзисторов в ядре уменьшилось с 305 до 279 млн. Специалисты из NVIDIA прекрасно поработали над дизайном чипа, и в результаты мы получили столь же эффективный, работающий на более высокой частоте, но очень дешевый кристалл, который к тому же имеет более низкое энергопотребление.
Думаю, что нет смысла описывать этот GPU, так как это копия предыдущего. По сути, тот же чип, только работающий на более низких частотах. Всем понятно, что сюда пойдут отбраковки от 7900 GTX (по частотам).
Видим, что несмотря на то, что G73 обладает 12-ю пиксельными конвейерами и 5-ю вершинными против 8-ми пиксельных и 3-х вершинных у 6600 GT, площадь ядра, за счет уменьшения техпроцесса и грамотного дизайна, уменьшилась. Более того, GPU работает на гораздо более высоких частотах относительно 6600 GT. С помощью бета-версии нового RivaTuner-а мы смогли установить, что внутри G73 не три, а четыре квада (16 конвейеров)! Просто один квад выключен (заблокирован аппаратно без возможности программного включения). Это говорит о том, что в будущем по мере отлаживания производства, возможен выход и что-то типа 7600 GTX уже с 16-ю пиксельными конвейерами. Конечно, тут станет вопрос о том, хватит ли ПСП для обеспечения такого ядра (все же шина 128-битная). Но, во-первых, это всего лишь предположение, может, никогда не будет выпущено такого GPU; во-вторых, по мере падения цен на память можно на такие карты ставить и самую быструю память, что как-то компенсирует узость шины. В-третьих, выходят все более новые игры, которым нужно, прежде всего, быстродействие GPU, а не возможности ПСП. В-четвертых, все же есть риск того, что разработчики намудрили что-то с регистрами, и потому зафиксирован лишний квад, которого там может и не быть (это маловероятно, но будем допускать, что все могут ошибаться).
Установка и драйверыКонфигурация тестового стенда:
VSync отключен. Для оценки эффективности нового ядра мы провели также тесты на 7900 GTX на пониженных до 7800 GTX 512 частотах 550/1700 МГц. Как я уже отмечал выше, после некоторой доработки автором Алексеем Николайчуком последняя бета-версия RivaTuner стала поддерживать и эти три новинки.
NVIDIA GeForce 7900 GTX 512MB PCI-E![]() ![]() Обратите внимание на то, что с помощью RivaTuner-а и без того низкие обороты кулера были сведены к 25% от номинала! И даже при всего лишь 500 с лишним оборотах в минуту нагрев ядра не превысил под нагрузкой 70 градусов! Отменный результат! И по ощущениям карта стала заметно меньше греться относительно 7800 GTX (после работы ее можно спокойно вытащить, не обжигаясь об PCB - плата просто теплая).
NVIDIA GeForce 7900 GT 256MB PCI-E![]() ![]() К сожалению, частота вращения вентилятора не определяется микросхемой мониторинга, поэтому показать ее мы не сможем. Как мы видим, даже при таком не очень большом кулере (сравним с тем, что на 7800 GTX, а ведь, по сути, перед нами это самое и есть, только в новом исполнении), нагрев под нагрузкой не выше 65 градусов (замечу, что обороты вентилятора не велики, и шума нет).
NVIDIA GeForce 7600 GT 256MB PCI-E![]() ![]() Здесь аналогичная ситуация с мониторингом, но кулер при включении 3D-приложений резко поднимает обороты. Как я уже сказал, это не проблема. С помощью RivaTuner-а можно снизить их до 25% от номинала, и шум прекратится. И даже при этом температура ядра не выше 70 градусов (подчеркну, что показания сняты при заблокировании частоты вращения вентилятора до 25% от максимальной).
В начале этой части я написал, что мы получили два комплекта карт. Поэтому смогли исследовать и режим SLI у каждой.
Синтетические тесты
Использованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступны на
сайте http://3d.rightmark.org
Также мы использовали новые, усложненные и перекликающиеся с адекватными сейчас задачами тесты пиксельных шейдеров
версии 2.0 - D3D RightMark Pixel Shading 2 и нацеленные на будущее тесты D3D RightMark Pixel Shading 3. Сейчас эти тесты
находятся в стадии бета-тестирования и уже доступны для скачивания здесь: Тесты топовых карт проводились:
Тесты карт среднего сегмента проводились:
Тест Pixel Filling
Пиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:
![]()
Если повышенная частота ядра новой карты на базе G70 позволяла нам говорить о паритете, то G71 заявляет твердо - он новый лидер. В этом тесте. Никаких новшеств относительно взаимного поведения ATI и NVIDIA или намеков на архитектурные изменения G71 по сравнению с G70 нет (мы проверили эти чипы на одинаковой частоте и обнаружили полную идентичность во всем, кроме скорости геометрических тестов, но последний пункт объяснился банально - небольшой фактической разницей в тактовой частоте геометрического блока G71 относительно G70 при прочих равных частотах). Итак, архитектурных отличий нет, но разница в тактовой частоте обеспечивает новому чипу лидерство.
![]() Та же самая картина, но уже в координатах количества записанных в буфер кадра пикселей. В пиковых случаях – 0, 1 и 2 текстуры G71 заметно впереди.
Проверим ту же задачу, но в исполнении PS 2.0 шейдера:
![]() Итак, можно констатировать, что ничего не изменилось — как FFP, так и шейдеры работают совершенно одинаково (с точки зрения железа FFP эмулируется шейдером) и показывают одинаковые результаты. Более высокая тактовая частота G70 позволяет ему доминировать. Теперь посмотрим, как обстоят дела в среднем сегменте: ![]() ![]() В этом сегменте дела обстоят для NVIDIA еще лучше, новый герой среднего ценового диапазона - G73 вне конкуренции. Двукратное преимущество без исключений, это сильно! ATI придется очень туго - решения на базе R520 или R580 в этом ценовом диапазоне будут смотреться неуклюже и не принесут компании много прибыли, а конкурентоспособность RV530, как мы видим, под вопросом (который мы и исследуем подробно). Тест Geometry Processing Speed
Самый простой шейдер — предельная пропускная способность по треугольникам:
![]() Все согласно тактовым частотам и числу вершинных блоков. R580 по-прежнему чуть впереди по пиковой ПСП, но как мы знаем, она не решает чего-либо в современных играх. Смотрим далее: более сложный шейдер — один смешанный источник света: ![]()
Картина закономерностей прежняя, но теперь, повышенные тактовые частоты G71 позволяют говорить о паритете. Усложняем задачу далее:
![]() На смешанном источнике света проявляется наличие аппаратной оптимизации эмуляции FFP – в этом поколении она есть как у NVIDIA, так и у ATI. Между собой карты вновь распределились сугубо по частотам. Видно, что вершинная архитектура G71 не претерпела никаких изменений, но скорость вершинного блока возросла. Очевиден паритет. Еще более сложная задача, включая переходы: ![]() Здесь мы опять видим, что переходы – слабое место вершинного блока ATI, и в сумме с повышенной частотой ядра G71 мы наблюдаем некий проигрыш на грани паритета. В сложных вершинных тестах ATI уже не спасает высокая прямая ПСП по треугольникам. Как и в случае G70, для G71 динамические переходы предпочтительнее статических. Выводы по геометрическим тестам: картина не сильно изменилась качественно, но количественная разница между G71 и G70 свела на нет все преимущества R580, которые мы могли отмечать в прошлом сравнении. Никаких архитектурных новшеств или изменений не наблюдается. Все то же самое, но лучше - вспомним эпиграф первой части. А теперь среднее звено: ![]() ![]() ![]() ![]() В общем, и целом можно говорить о паритете G73 и X1600 (RV530). В области абсолютной ПСП по треугольникам G73 впереди, однако в остальных тестах на лицо достаточно четкое равновесие. Все соображения относительно архитектурных особенностей остаются прежними - блоки RV530 и G73 наследованы от старших товарищей. Отметим только, что в среднем сегменте геометрическая производительность сказывается на результатах реальных игровых приложений еще меньше - 128 битные шины локальной памяти дают себя знать и чаще служат узким звеном в процессе рендеринга. Похвальным фактом является двукратный прирост G73 по сравнению с NV43 - этот чип заметно проигрывал ATI, а теперь паритет восстановлен. Этот факт скажется на профессиональных картах (традиционно успешная для NVIDIA вотчина) на базе G73 - там геометрическая мощь важна. Тест Pixel Shaders
Первая группа шейдеров — достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:
![]() Картина не изменилась по отношению к предыдущему обзору X1900 - просто G71 стал еще немного быстрее согласно росту тактовой частоты.
Посмотрим далее, более длинные шейдеры:
![]() Здесь ситуация повторяет прежний обзор - NVIDIA получает преимущество от 16 битной точности представления (не забываем, что интенсивные промежуточные вычисления в такой точности могут привести к заметному ухудшению качества рендеринга, и сейчас стандартом де-факто и требованиями всех будущих API являются внутренние вычисления в формате FP32). На сложной модели вычислений R580 заметно обыгрывает NVIDIA, особенно если не учитывать FP16 вариант. Это похвально. В любом случае, расстановка сил в области пиксельных шейдеров не изменилась, и все будет зависеть от приложений. R580 действительно может считаться королем шейдерной мощи и по-прежнему превосходит G71 на многих, не упирающихся в выборку текстур, вычислениях.
А теперь средний сегмент:
![]() ![]() Несмотря на продвинутую архитектуру X1600, 12 ПОЛНОЦЕННЫХ (в отличие от RV530) конвейеров G73 дают себя знать. Четкое, бесспорное лидерство над конкурентом налицо. Превосходство колеблется в зависимости от теста, от просто заметного, до значительного. Если с семейством GeForce 6600 ATI еще может сразиться, то с G73 им придется непросто, и опять на повестку дня встает невыгодный для фирмы вопрос о дешевых вариантах на базе R520 или R580. Да, уже ясно, что G73 можно назвать в некотором роде локальной сенсацией - он работает стабильно, недорого и очень хорошо! Так хорошо, что просто нечего противопоставить в этом ценовом сегменте даже для сравнения. Судя по всему, реальные приложения только подтвердят этот вывод. Наши новые шейдерные тестыНовые тесты, на которые мы будем постепенно переходить в будущих обзорах, доступны для скачивания (см. выше) в составе архива бета-версии D3D RightMark. В будущем мы откажемся от синтетических тестов с более ранними версиями и полностью сосредоточимся на HLSL шейдерах для SM 2.0 и 3.0. Более ранние шейдеры можно будет проверить на примере существующих приложений, а синтетические тесты, нацеленные на текущий момент и даже далее, в будущее, требуют корректировки в соответствии с веяниями времени, что и было проделано. Начнем с более простых шейдеров PS 2.0. Доступны два новых теста, реализующих актуальные для современных приложений эффекты:
Оба шейдера мы тестируем в двух исполнениях: максимально ориентированном на вычисления и на выборку текстур. Кроме того, мы проверяем результаты для FP16 и для FP32 точности вычислений.
Итак, сперва вычислительно интенсивные варианты решения задачи:
![]()
Как мы видим, на первом месте стабильно идет R580 (особенно ему удается параллакс-маппинг), затем G71. Опять таки, производительность G71 заметно зависит от точности. Никаких архитектурных отличий от G70 не выявлено. Теперь те же самые тесты в варианте с предпочтением выборки текстур:
![]() Здесь, как мы видим, преимущество R580 сходит на нет. Интересная ситуация – слишком много зависит от контекста и предпочтения программистов, посмотрим, какие пути они выберут в своих приложениях.
Выводы: возросшая тактовая частота дает себя знать, но ситуация по-прежнему под вопросом, преимущество ATI в некоторых случаях значительно. Налицо существенный задел на будущее – для сложных кинематографических шейдеров и прекрасная фора для передовых игр настоящего. Но будет ли она раскрыта – ведь число текстурных блоков R580 по-прежнему 16. Далее, в игровых тестах мы увидим, как современные приложения соотносятся с соотношением 3:1, выбранным ATI, и насколько успешно повышенные частоты G71 позволяют сводить архитектурное преимущество противника на нет в реальных играх. Тест HSR
Пиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:
![]() ![]() Как мы видим, никаких изменений в раскладке не произошло. Иерархический HSR в исполнении ATI выглядит более успешным, чем одноуровневый в случае NVIDIA, особенно на сложных и средних сценах. С текстурированием NVIDIA чуть реабилитирует себя – сказывается более эффективная (для простой закраски) интеграция текстурных модулей в пиксельный конвейер.
А теперь средний сегмент:
![]() ![]() Здесь мы видим что, несмотря на потенциально более низкую архитектурную эффективность HSR, G73 может показать зубы, и показывает их. Налицо паритет с ATI, причем интересно отметить, что коэффициент эффективности HSR выше у средних решений NVIDIA (NV43 и G73) по сравнению с топовым G71. Впрочем, это логично - именно для среднего сегмента характерны сцены с более низким разрешением при прежней сложности геометрии и как никогда важна экономия ПСП (а HSR играет в ней не последнюю роль). Тест Point Sprites![]() ![]() ![]() ![]() Данные приведены сразу для топовых и средних карт. Все как обычно – NVIDIA впереди на небольших спрайтах благодаря более эффективной работе с буфером кадра. В случае топовых карт, по мере роста их размера и сложности освещения она проигрывает, впрочем, не фатально. А в среднем сегменте G73 не дает ATI опомнится - вы посмотрите - это лидер, четкий лидер. Выводы по синтетическим тестам
Впереди будет самая главная часть по тестам в играх. Оставайтесь с нами! NVIDIA GeForce 7900 GTX/GT (G71), GeForce 7600 GT (G73) - Часть 3: Игровые тесты (производительность)
Андрей Воробьев (anvakams@ixbt.com)
Александр Медведев (unclesam@ixbt.com) Опубликовано 09 марта 2006 г. |
| | Комментарии? Поправки? Дополнения? anvakams@ixbt.com
| ![]()
|
||||||||||||||||||