![]()
Оба продукта представляют собой reference cards, то есть предсерийные образцы. Мы еще будем рассматривать и серийные изделия, но это позже. Напомню, то обе карты имеют по 256 мегабайт памяти GDDR3 со временем выборки 1.6ns, при этом у NV40 частота по памяти - 550 (1100) МГц, а у R420 - 575 (1150) МГц. Частоты работы чипов: NV40 - 400 и 450 МГц, R420 - 525 МГц. Оба GPU содержат по 16 пиксельных и 6 вершинных конвейеров. NV40 поддерживает еще версию шейдеров 3.0, а R420 - собственную технология сжатия карт нормалей - 3Dc. Вот кратко и все.
Для визуальной и очень примерной оценки возможностей по разгону неплохо бы привести снова снимок, где представлены оба чипа: NV40 и R420:
Мы заметим, что размер кристалла у NV40 самый большой (что и не удивительно при его 222 млн. транзисторов), однако, как показал опыт, все же отдельные экземпляры могут разгоняться с 400 до 450 МГц. Например, наша карта при использовании термопасты с содержанием серебра, смогла заработать на таких частотах при наличии всего небольшого дополнительного вентилятора, обеспечивающего поток холодного воздуха на турбину родного кулера от видеокарты. Конечно, это ни о чем не говорит насчет процента GPU, способных гарантированно работать на 450 МГц, но все же показательно. Хотя, пока по Сети ходят слухи, что процент выхода мал, и на 450 МГц работать будут считанные отобранные чипы. Как будет на самом деле - покажет время.
Насчет разгонов X800 XT пока ничего не могу сказать, во время тестирования у карты был BIOS, запрещающий разгон по чипу. Этот вопрос мы будем
еще исследовать дальше. Хотя, надо сказать, что последняя бета-версия RivaTuner (автор Алексей Николайчук AKA Unwinder) уже поддерживает X800 в
полном объеме, показывая не только число пиксельных конвейеров, но и осуществляя мониторинг по температуре:
Сейчас автор совместно с нами работает над патчем к драйверам, позволяющим менять число конвейеров, включая ранее заблокированные (как было у RADEON 9500/9700; 9800SE/9800). Пока есть проблемы (сотрудник ATI не обманул меня, говоря о том, что так просто поменять число конвейеров программным путем уже не удастся), стоят защиты. Но работа ведется и время покажет! :-)
Установка и драйверыКонфигурации тестовых стендов:
Синтетические тесты D3D RightMarkИспользованная нами версия пакета синтетических тестов D3D RightMark Beta 4 (1050) и ее описание доступны на сайте http://3d.rightmark.org Еще раз отмечу, что все тесты в RightMark снимались на компьютере на базе Pentium4. Все тесты включают в себя результаты из обзоров NV40 на частоте 400МГц и обзора R420, поэтому мы прокомментируем только отличия и характер поведения NV40 с ядром 450МГц. Итак: Тест Pixel FillingПиковая производительность выборки текстур (texelrate), режим FFP, для разного числа текстур накладываемых на один пиксель:
В случае одной и двух текстур NV40-450 вполне предсказуемо упирается в пропускную способность памяти, а точнее скорость работы с буфером кадра. По мере роста числа текстур преимущество более высокой частоты ядра начинает проявляться, но никаких кардинальных изменений в расклад сил не вносит - R420 лидер. А сейчас - скорость закраски буфера кадра (fillrate, pixelrate), режим FFP, для разного числа текстур накладываемых на один пиксель: Та же самая ситуация. Посмотрим, как скорость закраски зависит от версии шейдеров:
Ничего нового. Итак, 450 МГц не внесли существенных изменений в расклад сил в этом тесте. Вполне логично - до 525 МГц им все еще далеко. А теперь посмотрим, как текстурные модули справляются с кэшированием и билинейной фильтрацией реальных текстур различных размеров:
Различия есть, но их сложно назвать существенными. Полоса пропускания памяти и алгоритм фильтрации определяют в этом тесте больше, чем 50 МГц прирост ядра. А теперь посмотрим на зависимость производительности текстурных модулей от формата текстур:
Больше размер:
Вновь ничего нового или удивительного. Итак, можно констатировать отсутствие существенных отличий. Тест Geometry Processing SpeedСамый простой шейдер – предельная пропускная способность по треугольникам:
Заметный прирост, причем теперь NV40-450 становится лидером. Интересно, что скачок на вершинных шейдерах превышает разницу частоты - сказались новые драйверы - на лицо лучшая оптимизация коротких вершинных шейдеров. Посмотрим, сохранится ли этот скачкообразный прирост на более сложных задачах. Более сложный шейдер – один простой точечный источник света:
Сюрпризы исчезли. Оптимизация коснулась только пиковой пропускной способности, на более-менее стандартной задаче она себя уже так не проявит. Как бы там ни было, результат вершинных шейдеров не зависит так сильно от пропускной полосы памяти, и потому увеличился пропорционально частоте ядра. Усложняем задачу далее:
Здесь NV40 FFP лидер, несмотря на частотное преимущество ATI. Но общая картина по-прежнему скалывается скорее в пользу ATI - выше частота ядра - больше скорость вершинных шейдеров. А теперь самая сложная задача, три источника света, причем, для сравнения в вариантах без переходов, со статическим и динамическим управлением исполнением:
FFP силен, а статические переходы заметно ударяют по чипам NVIDIA. Парадокс в том, что динамические переходы на чипах от NVIDIA выгоднее статических. Общая картина вновь в пользу R420, везде, где дело не касается FFP… Вывод - вновь никаких сюрпризов. Вершинные шейдеры масштабируются строго пропорционально частоте ядра - сказывается отсутствие сильной зависимости от пропускной полосы памяти.
Тест Pixel ShadersПервая группа шейдеров – достаточно простых для исполнения в реальном времени, 1.1, 1.4 и 2.0:
Мы видим, что NV40 на частоте 450 МГц работает быстрее. Но, недостаточно быстрее - лидер по пиксельным шейдерам игровой сложности прежний - R420. Посмотрим, сможет ли спасти положение NV40 использование 16 битной точности плавающих чисел:
Преимущество 16 битной точности для NV40 есть, в некоторых шейдерах больше, в некоторых меньше. Порою, оно позволяет догнать R420 (не забываем про возможные артефакты пониженной точности - см. игровую секцию обзора) но не отыграть у него пальму первенства. Частота и еще раз частота. А теперь посмотрим на действительно сложный, «кинематографичный» шейдер 2.a в силу небольшого числа зависимых выборок уложившийся в ограничения пиксельных конвейеров R420:
Пропорционально быстрее. Теперь NV40-450 выигрывает у R420, но только в случае использования 16 битной точности. Итого, по пиксельным шейдерам: 450 МГц позволяют, порой, выровнять производительность с R420. Но не демонстрируют того, что можно было бы назвать четким лидерством.
Тест HSRПиковая эффективность (без текстур и с текстурами) в зависимости от сложности геометрии:
Картина практически идентична, небольшие отличия в эффективности 450 МГц варианта NV40 вызваны иным соотношением частот ядра и памяти.
Тест Point Sprites.Интересно, что в новых драйверах NVIDIA кардинально исправлено досадное падение производительности, которое мы наблюдали на малых размерах спрайтов!
ВЫВОДЫ
То есть, даже 450 МГц не дает твердой победы NV40 в области синтетических тестов.
[ Следующая часть (2) ]Андрей Воробьев (anvakams@ixbt.com)
Александр Медведев (unclesam@ixbt.com) Опубликовано 18 мая 2004 года |
Обсудить в конференции (комментариев: 64) |
| Комментарии? Поправки? Дополнения? anvakams@ixbt.com
| ![]()
|