Обзор VPU 3Dlabs P10 и карты Wildcat VP870 на его основе

или "Наглядный процессор"


" Расширяется круг инженеров, которым приходится изучать, осваивать и творчески применять микропроцессорные средства в прикладных разработках"

(А.Л. Гуртовцев, В.С. Гудыменко — "Программы для микропроцессоров", с.3.)


СОДЕРЖАНИЕ

  1. Общие сведения о P10 и позиционирование
  2. Линейка продуктов
  3. Спецификации P10
  4. Архитектура P10
  5. Особенности видеокарты 3Dlabs Wildcat VP870 128MB
  6. Конфигурации тестовых стендов и особенности настроек драйверов
  7. Результаты тестов: коротко о 2D и предельные тесты из DirectX 8.1 SDK
  8. Результаты тестов: Синтетические тесты 3DMark2001 SE
  9. Результаты тестов: Игровые тесты 3DMark2001 SE
  10. Качество 3D в играх
  11. Результаты тестов: Профессиональные тесты: SPECviewperf 7.0
  12. Результаты тестов: Профессиональные тесты: Discreet 3DS MAX 4.26
  13. Выводы

3D-графика, 3DMark2001 SE — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски



Напомним, что теоретические пределы для данного теста составляют 880 миллионов пикселей в секунду для Parhelia, 1100 для RADEON 8500 и 1200 для Ti 4600 соответственно. Как мы видим, по фактической скорости закраски Parhelia наиболее близко подошла к пиковым значениям, видимо, благодаря 256-битной шине памяти. Точное значение частоты ядра P10 неизвестно, однако, зная, что чип может записывать 4 точки за такт, можно предположить, что оно очень близко к Parhelia 512. Интересно, что с ростом разрешения эффективность закраски Parhelia чуть падает, что говорит о недостаточном совершенстве контроллера памяти.

Также напомним, что пиковые значения для этого теста составляют 3520 (1760) миллионов текселей в секунду для Parhelia (в скобках указано значение при работе схемы 4 конвейера по 2 текстурника на каждом), 2200 - для RADEON 8500 и 2400 для Ti 4600. В случае мультитекстурирования большую роль играет сбалансированность чипа. На сей раз, около своей пиковой скорости оказался уже Ti 4600, чуть далее — RADEON 8500. P10 существенно проигрывает остальным картам — он не может похвастаться наличием нескольких текстурных блоков на конвейер закраски, и посему было вполне логично ожидать сравнимых с предыдущим тестом результатов. Интересно, наличие лишь одного текстурного блока столь же существенно скажется на R300?

Сцена с большим количеством полигонов

На этом тесте особое внимание следует уделить минимальному разрешению — именно там зависимость от закраски практически нивелируется:

При наличии одного источника света Ti 4600 показывает себя абсолютным лидером. Его результат не только значительно (более, чем в 2 раза) превосходит Parhelia, но и (что более важно) вплотную приблизился к значению практического предела пропускной способности по треугольникам, полученному ранее с помощью Optimized Mesh из DX8.1 SDK. Впрочем, не будем умалять достоинств RADEON 8500, также приблизившегося к предельной цифре, полученной в тесте из SDK. А вот с P10 и Parhelia ситуация далека от идеала. Особенно далека от него Matrox Parhelia.

В случае 8 источников света Parhelia несколько реабилитирует себя: с ростом числа источников его производительность падает более медленно, чем RADEON 8500. Лидер — по-прежнему Ti 4600, аутсайдером теперь становится P10.

Интересно, это проблема драйверов или недостаточной производительности самого пула вершинных процессоров?

Рельефное текстурирование

Посмотрим на результаты синтетической EMBM сцены:

Печальная картина подтверждает тесты из SDK. А теперь DP3 рельеф:

"Все те же лица".

Вершинные шейдеры



Проигрыш по всем статьям. И это при столь обещающих результатах теста на предельную пропускную способность по треугольникам. И это, при наличии 16 скалярных вершинных процессоров. Либо что-то не в порядке с драйверами, либо вершинное железо очень сильно заточено под OpenGL и не может конкурировать с DX ускорителями, либо оно просто-напросто недостаточно производительно. Последнее было бы крайне обидно, но маловероятно.

Пиксельный шейдер

Руководствуясь высказанными выше соображениями о том, что слишком малые разрешения "упираются" в геометрию, а слишком большие — в пропускную полосу памяти, обратим основное внимание на 1024х768 и 1280х1024:

На несложных пиксельных шейдерах P10 умудряется сохранять приемлемую производительность, несколько выигрывая у Parhelia. Это подтверждает полученные при тестировании пиксельных шейдеров в SDK результаты. Но посмотрим и на тест Advanced Pixel Shader.

Картина совершенно иная. Как уже отмечалось в секции SDK — чем длинее шейдер, тем хуже для P10. И вновь, интересно, как будут обстоять дела с этим вопросом у R300 и NV30.

Спрайты



В этой области у P10 все плохо — еще хуже чем у Parhelia. Очевидно, что спрайты эмулируются стандартными треугольниками. С другой стороны, не будем забывать, что подобные скоростные системы плоских частиц имеют пока сугубо игровые применения.

Итак, подведем второй промежуточный итог. По сумме синтетических тестов карта 3Dlabs P10 в основном проигрывает своим конкурентам. Впрочем, это и ожидалось — ускоритель не ориентирован на игровые приложения, а тест 3D Mark 2001 несомненно является игровым тестом, даже с точки зрения синтетических алгоритмов. Кроме того, судя по всему драйверы для DX8 не являлись первичной целью создателей P10 и до сих пор являются слишком слабо оптимизированными, чтобы соревноваться с продуктами ATI или NVIDIA.

3D-графика, 3DMark2001 — игровые тесты



3DMark2001, 3DMARKS

Как мы видим, в целом положение 3Dlabs Wildcat VP870 в игровых тестах DirectX 8.1 оказалось между ATI RADEON 7500 и RADEON 9000 Pro. Но это благодаря тому, что карта поддерживает пиксельные шейдеры, и поэтому Game4 функционирует. Ниже мы убедимся в том, что реальная скорость бывает даже ниже, чем у GeForce4 MX 440 (который по сумме баллов проиграл из-за отсутствия результатов по Game4).



3DMark2001, Game1 Low details

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 19773/33753/143422
  • Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
  • Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB

А тут карта на P10 — аутсайдер, даже GeForce4 MX 440 смог показать чуть более высокую производительность.



3DMark2001, Game2 Low details

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 46159/51440/147828
  • Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
  • Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB

Картина схожая, производительность где-то около той, что выдает GeForce4 MX 440.



3DMark2001, Game3 Low details

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 16681/21746/39890
  • Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
  • Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB

Чуть-чуть скорость у P10 выросла, а толку все равно мало.



3DMark2001, Game4

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 55601/81714/180938
  • Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
  • Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB

Заметим, что в этом тесте, достаточно сложном и современном с точки зрения насыщеной эффетками реалистичной сцены P10 наконец-то хоть кого-то опередила :-). На сей раз в аутсайдерах осталась карта Matrox Parhelia.

В целом по 3DMark2001 можно сказать, что наши предварительные результаты тестирования в синтетике и выводы по ним полностью подтвердились практикой: 3Dlabs Wildcat VP870 и ее драйверы пока никоим образом не приспособлены к DirectX игровым приложениям. Пока невозможно даже четко сказать, кто больше виноват: драйверы или баланс возможностей самого P10. Будем ждать известий от Creative Labs — нынешнего хозяина 3Dlabs, который обещал выпустить на рынок игровой акселератор на базе P10. Тогда мы сможем подробно исследовать: что в этом вопросе изменилось в лучшую сторону.

Пока же постараемся утешить профессионалов-дизайнеров — они уже сейчас смогут в часы (или минуты) своего досуга поиграть на этой карте в любимые игры (пусть и с несколько меньшим комфортом в плане скорости: придется снижать разрешение).

Качество 3D-графики в играх

Однако и тут есть нарекания. Слава Богу, что их не так много, но вот пресловутая игра Morrowind, в которой практически впервые водная поверхность реализована через пиксельные шейдеры, выдала следующие картинки на 3Dlabs Wildcat VP870 (для сравнения приведены скриншоты, полученные на RADEON 8500):

P10

RADEON 8500

При этом игра была обновлена при помощи последнего патча до версии 1.02.0722.

Были замечены некоторые искажения и в других играх (правда малозначительные). Более подробно можно будет узнать о качестве из следующего (августовского) выпуска 3DGiТогов (в галерею скриншотов будут помещены кадры из многих игр, полученные на P10).





Дополнительно

Обзор VPU 3Dlabs P10 и карты VP870 на его основе

Обзор VPU 3Dlabs P10 и карты Wildcat VP870 на его основе

или "Наглядный процессор"

" Расширяется круг инженеров, которым приходится изучать, осваивать и творчески применять микропроцессорные средства в прикладных разработках"

(А.Л. Гуртовцев, В.С. Гудыменко — "Программы для микропроцессоров", с.3.)


СОДЕРЖАНИЕ

  1. Общие сведения о P10 и позиционирование
  2. Линейка продуктов
  3. Спецификации P10
  4. Архитектура P10
  5. Особенности видеокарты 3Dlabs Wildcat VP870 128MB
  6. Конфигурации тестовых стендов и особенности настроек драйверов
  7. Результаты тестов: коротко о 2D и предельные тесты из DirectX 8.1 SDK
  8. Результаты тестов: Синтетические тесты 3DMark2001 SE
  9. Результаты тестов: Игровые тесты 3DMark2001 SE
  10. Качество 3D в играх
  11. Результаты тестов: Профессиональные тесты: SPECviewperf 7.0
  12. Результаты тестов: Профессиональные тесты: Discreet 3DS MAX 4.26
  13. Выводы

3D-графика, 3DMark2001 SE — синтетические тесты

Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.

Скорость закраски



Напомним, что теоретические пределы для данного теста составляют 880 миллионов пикселей в секунду для Parhelia, 1100 для RADEON 8500 и 1200 для Ti 4600 соответственно. Как мы видим, по фактической скорости закраски Parhelia наиболее близко подошла к пиковым значениям, видимо, благодаря 256-битной шине памяти. Точное значение частоты ядра P10 неизвестно, однако, зная, что чип может записывать 4 точки за такт, можно предположить, что оно очень близко к Parhelia 512. Интересно, что с ростом разрешения эффективность закраски Parhelia чуть падает, что говорит о недостаточном совершенстве контроллера памяти.

Также напомним, что пиковые значения для этого теста составляют 3520 (1760) миллионов текселей в секунду для Parhelia (в скобках указано значение при работе схемы 4 конвейера по 2 текстурника на каждом), 2200 - для RADEON 8500 и 2400 для Ti 4600. В случае мультитекстурирования большую роль играет сбалансированность чипа. На сей раз, около своей пиковой скорости оказался уже Ti 4600, чуть далее — RADEON 8500. P10 существенно проигрывает остальным картам — он не может похвастаться наличием нескольких текстурных блоков на конвейер закраски, и посему было вполне логично ожидать сравнимых с предыдущим тестом результатов. Интересно, наличие лишь одного текстурного блока столь же существенно скажется на R300?

Сцена с большим количеством полигонов

На этом тесте особое внимание следует уделить минимальному разрешению — именно там зависимость от закраски практически нивелируется:

При наличии одного источника света Ti 4600 показывает себя абсолютным лидером. Его результат не только значительно (более, чем в 2 раза) превосходит Parhelia, но и (что более важно) вплотную приблизился к значению практического предела пропускной способности по треугольникам, полученному ранее с помощью Optimized Mesh из DX8.1 SDK. Впрочем, не будем умалять достоинств RADEON 8500, также приблизившегося к предельной цифре, полученной в тесте из SDK. А вот с P10 и Parhelia ситуация далека от идеала. Особенно далека от него Matrox Parhelia.

В случае 8 источников света Parhelia несколько реабилитирует себя: с ростом числа источников его производительность падает более медленно, чем RADEON 8500. Лидер — по-прежнему Ti 4600, аутсайдером теперь становится P10.

Интересно, это проблема драйверов или недостаточной производительности самого пула вершинных процессоров?

Рельефное текстурирование

Посмотрим на результаты синтетической EMBM сцены:

Печальная картина подтверждает тесты из SDK. А теперь DP3 рельеф:

"Все те же лица".

Вершинные шейдеры



Проигрыш по всем статьям. И это при столь обещающих результатах теста на предельную пропускную способность по треугольникам. И это, при наличии 16 скалярных вершинных процессоров. Либо что-то не в порядке с драйверами, либо вершинное железо очень сильно заточено под OpenGL и не может конкурировать с DX ускорителями, либо оно просто-напросто недостаточно производительно. Последнее было бы крайне обидно, но маловероятно.

Пиксельный шейдер

Руководствуясь высказанными выше соображениями о том, что слишком малые разрешения "упираются" в геометрию, а слишком большие — в пропускную полосу памяти, обратим основное внимание на 1024х768 и 1280х1024:

На несложных пиксельных шейдерах P10 умудряется сохранять приемлемую производительность, несколько выигрывая у Parhelia. Это подтверждает полученные при тестировании пиксельных шейдеров в SDK результаты. Но посмотрим и на тест Advanced Pixel Shader.

Картина совершенно иная. Как уже отмечалось в секции SDK — чем длинее шейдер, тем хуже для P10. И вновь, интересно, как будут обстоять дела с этим вопросом у R300 и NV30.

Спрайты



В этой области у P10 все плохо — еще хуже чем у Parhelia. Очевидно, что спрайты эмулируются стандартными треугольниками. С другой стороны, не будем забывать, что подобные скоростные системы плоских частиц имеют пока сугубо игровые применения.

Итак, подведем второй промежуточный итог. По сумме синтетических тестов карта 3Dlabs P10 в основном проигрывает своим конкурентам. Впрочем, это и ожидалось — ускоритель не ориентирован на игровые приложения, а тест 3D Mark 2001 несомненно является игровым тестом, даже с точки зрения синтетических алгоритмов. Кроме того, судя по всему драйверы для DX8 не являлись первичной целью создателей P10 и до сих пор являются слишком слабо оптимизированными, чтобы соревноваться с продуктами ATI или NVIDIA.

3D-графика, 3DMark2001 — игровые тесты



3DMark2001, 3DMARKS

Как мы видим, в целом положение 3Dlabs Wildcat VP870 в игровых тестах DirectX 8.1 оказалось между ATI RADEON 7500 и RADEON 9000 Pro. Но это благодаря тому, что карта поддерживает пиксельные шейдеры, и поэтому Game4 функционирует. Ниже мы убедимся в том, что реальная скорость бывает даже ниже, чем у GeForce4 MX 440 (который по сумме баллов проиграл из-за отсутствия результатов по Game4).



3DMark2001, Game1 Low details

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 19773/33753/143422
  • Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
  • Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB

А тут карта на P10 — аутсайдер, даже GeForce4 MX 440 смог показать чуть более высокую производительность.



3DMark2001, Game2 Low details

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 46159/51440/147828
  • Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
  • Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB

Картина схожая, производительность где-то около той, что выдает GeForce4 MX 440.



3DMark2001, Game3 Low details

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 16681/21746/39890
  • Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
  • Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB

Чуть-чуть скорость у P10 выросла, а толку все равно мало.



3DMark2001, Game4

Характеристики теста:

  • Rendered triangles per frame (min/avg/max): 55601/81714/180938
  • Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
  • Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB

Заметим, что в этом тесте, достаточно сложном и современном с точки зрения насыщеной эффетками реалистичной сцены P10 наконец-то хоть кого-то опередила :-). На сей раз в аутсайдерах осталась карта Matrox Parhelia.

В целом по 3DMark2001 можно сказать, что наши предварительные результаты тестирования в синтетике и выводы по ним полностью подтвердились практикой: 3Dlabs Wildcat VP870 и ее драйверы пока никоим образом не приспособлены к DirectX игровым приложениям. Пока невозможно даже четко сказать, кто больше виноват: драйверы или баланс возможностей самого P10. Будем ждать известий от Creative Labs — нынешнего хозяина 3Dlabs, который обещал выпустить на рынок игровой акселератор на базе P10. Тогда мы сможем подробно исследовать: что в этом вопросе изменилось в лучшую сторону.

Пока же постараемся утешить профессионалов-дизайнеров — они уже сейчас смогут в часы (или минуты) своего досуга поиграть на этой карте в любимые игры (пусть и с несколько меньшим комфортом в плане скорости: придется снижать разрешение).

Качество 3D-графики в играх

Однако и тут есть нарекания. Слава Богу, что их не так много, но вот пресловутая игра Morrowind, в которой практически впервые водная поверхность реализована через пиксельные шейдеры, выдала следующие картинки на 3Dlabs Wildcat VP870 (для сравнения приведены скриншоты, полученные на RADEON 8500):

P10

RADEON 8500

При этом игра была обновлена при помощи последнего патча до версии 1.02.0722.

Были замечены некоторые искажения и в других играх (правда малозначительные). Более подробно можно будет узнать о качестве из следующего (августовского) выпуска 3DGiТогов (в галерею скриншотов будут помещены кадры из многих игр, полученные на P10).