Пока такие карты выпускает только сама компания 3Dlabs, поэтому в повторе традиционной фразы о том, что
оценка 2D-качества зависит от конкретного экземпляра, нет нужды. Но, хотя в данном
случае качество и не зависит от конкретного экземпляра, связка карта-монитор могут по-прежнему
играть огромную роль, прежде всего, качество монитора и кабеля.
3D-графика, MS DirectX 8.1 SDK - предельные тесты
Для тестирования различных предельных характеристик чипов мы использовали модифицированные (для
большего удобства и контроля) примеры из последней версии DirectX SDK (8.1, релиз). Без лишних
преамбул перейдем к уже хорошо знакомым нашим постоянным читателям тестам:
Optimized Mesh
Этот тест призван выяснить практический предел пропускной способности ускорителя по треугольникам. Для этого
используется несколько одновременно выводимых в небольшом окне моделей, каждая из которых состоит из 50
тысяч треугольников. Текстурирование отсутствует. Размеры моделей минимальны - каждый треугольник не
превышает одного пиксела. Хочется сразу отметить, что результат этого теста, разумеется, останется
недостижим для реальных приложений, где размеры треугольников значительны, присутствуют текстуры и
освещение. Приведем результаты этого теста для трех методов отрисовки - оптимизированной для оптимальной
скорости вывода (в том числе, с учетом размера внутреннего кэша вершин на чипе) модели - Optimized,
неоптимизированной исходной модели - Unoptimized и той-же неоптимизированной модели, выводимой в виде
одного Triangle Strip - Strip. Кроме того, приведены значения в режиме программной эмуляции вершинного
конвейера, дабы выяснить эффективность передачи геометрии от процессора к GPU:
В случае полностью оптимизированной модели, когда влияние подсистемы памяти минимально, мы измеряем
практически чистую производительность трансформации и установки треугольников. Налицо безоговорочное
лидерство Ti 4600. 65 миллионов треугольников в секунду - цифра нешуточная, практически вдвое
превосходит результаты RADEON 8500 и Parhelia. P10 занимает почетное второе место, вполне приемлемо
отставая от NV25, в первую очередь, вероятно, из-за меньшей тактовой частоты ядра. Однако
не будем забывать что не за горами NV30, геометрическая производительность которого вполне будет
более чем вдвое выше предшественника - NV25. Отметим существенное преимущество P10 в случае
принудительной активации программного расчета геометрии. Особенно заметно оно на неоптимизированной
модели. Ранее безусловным лидером в этом вопросе всегда были решения NVIDIA, теперь же результаты NV25
в этом вопросе побиты вдвое! Основным сдерживающим фактором при передаче геометрии является, как правило,
AGP шина и алгоритм взаимодействия ускорителя с процессором. P10 несомненно использует какие-то новые
оптимизации передачи, возможно меньшую точность представления координат и атрибутов вершин или какие-либо
иные техники сжатия геометрической информации. Интересно, что и в случае Strip модели двукратное преимущество
сохраняется - видимо, полоса передаваемых данных действительно снижена вдвое для каждой вершины.
Производительность блока вершинного шейдера
Этот тест позволяет определить предельную производительность блока вершинных шейдеров. Выполняется
достаточно сложный шейдер, вычисляющий как видовые преобразования, так и геометрические функции. Тест
проводится в минимальном разрешении, дабы минимизировать влияние закраски:
И вновь налицо существенное преимущество Ti 4600. P10 практически делит второе место с RADEON 8500.
Вершинный матричный блендинг
Эта возможность T&L используется для правдоподобной анимации и скиннинга моделей. Мы протестировали
блендинг с использованием двух матриц как в фиксированном "аппаратном" варианте, так и с
использованием вершинного шейдера, выполняющего ту же функцию. Кроме того, мы, как обычно, "подстраховались"
результатами, полученными в режиме программной эмуляции T&L:
Интересно, что P10 по какой-то причине не смог выполнить аппаратный блендинг на основе
вершинного шейдера, судя по всему, проблема в драйверах, т.к. все необходимые аппаратные возможности для
исполнения вершинных шейдеров присутствуют. В случае полностью аппаратного блендинга (так же выполняемого
лишенными фиксированного T&L GPU как некий шейдер) P10 вновь занимает почетное второе место.
EMBM рельеф
В этом тесте мы измеряем производительность, а точнее - ее падение, возникающее при использовании наложения
карт отражения (Environment) и рельефа на основе карт отражения (EMBM - Environment Bump). Для
тестирования использовалось разрешение 1280*1024 - т.к. именно в нем различия между картами и разными
режимами текстурирования выражены наиболее резко:
Что ж, результаты теста подтверждают наш постулат о вершинно ориентированном балансе производительности
P10. В вопросах закраски он все время проигрывает, во многом из-за отсутствия развитых технологий
экономии пропускной полосы памяти. Какой стыд, это происходит даже при наличии 256 бит шины! Сильнее
всего активация EMBM бьет по P10. Чип от Matrox красит обычные режимы лишь чуть-чуть быстрее P10, но в
EMBM заметно вырывается вперед.
Производительность пиксельных шейдеров
Мы вновь использовали модифицированный пример MFCPixelShader, измерив
производительность карт в высоком разрешении при выполнении 5 различных
по сложности шейдеров, для билинейно фильтрованных текстур:
На простом шейдере P10 впереди - 64 процессора и более широкая шина дают о себе знать. Но не забываем
про расплату за гибкость - все это лишь последовательно выполняющие команды процессоры, а не массив
выдающих по результату за такт стадий. В итоге, по мере роста сложности шейдера производительность остальных
чипов падает скачками, по мере объединения конвейеров и не зависит от сложности самого шейдера, а только
от числа задействованных в нем стадий. Скорость P10 падает с каждой новой командой - т.е. быстрее, чем
у всех конкурентов, снабженных стадиями на пиксельном конвейере. Зависит она и от сложности используемых
в шейдере команд. В итоге, будучи лидером на самом простом шейдере, на самом сложном P10 опережает
только R200, известный нам своей неторопливостью в шейдерных делах еще по предыдущим обзорам.
Итак, подведем первый промежуточный итог. По сумме тестов DX 8.1 SDK карта VP870 выглядит очень уверенно
(по сравнению с DX8 поколением игровых ускорителей) в вопросах обработки геометрии, но заметно сдает в
вопросах закраски. Налицо четкая ориентация на профессиональные приложения. Судя по всему, эта карта
не сможет составить конкуренцию поколению DX9 (R300 и NV30) даже в геометрических вопросах.
Мы еще вернемся к этим тестам несколько позже (осенью), когда будет возможность протестировать наличие
шейдеров версии 2.0 и прочих возможностей DirectX 9.0.
3D-графика, 3DMark2001 SE - синтетические тесты
Подчеркну, что все замеры по всем 3D-тестам проводились в 32-битной глубине цвета.
Скорость закраски
Напомним, что теоретические пределы для данного теста составляют 880 миллионов пикселей в секунду для
Parhelia, 1100 для RADEON 8500 и 1200 для Ti 4600 соответственно. Как мы видим, по фактической скорости
закраски Parhelia наиболее близко подошла к пиковым значениям, видимо, благодаря 256-битной шине памяти.
Точное значение частоты ядра P10 неизвестно, однако, зная, что чип может записывать 4 точки за такт, можно
предположить, что оно очень близко к Parhelia 512. Интересно, что с ростом разрешения эффективность
закраски Parhelia чуть падает, что говорит о недостаточном совершенстве контроллера памяти.
Также напомним, что пиковые значения для этого теста составляют 3520 (1760) миллионов текселей в секунду
для Parhelia (в скобках указано значение при работе схемы 4 конвейера по 2 текстурника на каждом), 2200 -
для RADEON 8500 и 2400 для Ti 4600. В случае мультитекстурирования большую роль играет сбалансированность
чипа. На сей раз, около своей пиковой скорости оказался уже Ti 4600, чуть далее - RADEON 8500. P10
существенно проигрывает остальным картам - он не может похвастаться наличием нескольких текстурных блоков
на конвейер закраски, и посему было вполне логично ожидать сравнимых с предыдущим тестом результатов. Интересно,
наличие лишь одного текстурного блока столь же существенно скажется на R300?
Сцена с большим количеством полигонов
На этом тесте особое внимание следует уделить минимальному разрешению - именно там зависимость от
закраски практически нивелируется:
При наличии одного источника света Ti 4600 показывает себя абсолютным лидером. Его результат не только
значительно (более, чем в 2 раза) превосходит Parhelia, но и (что более важно) вплотную приблизился к
значению практического предела пропускной способности по треугольникам, полученному ранее с помощью
Optimized Mesh из DX8.1 SDK. Впрочем, не будем умалять достоинств RADEON 8500, также приблизившегося к
предельной цифре, полученной в тесте из SDK. А вот с P10 и Parhelia ситуация далека от идеала. Особенно
далека от него Matrox Parhelia.
В случае 8 источников света Parhelia несколько реабилитирует себя: с ростом числа источников его
производительность падает более медленно, чем RADEON 8500. Лидер - по-прежнему Ti 4600, аутсайдером
теперь становится P10.
Интересно, это проблема драйверов или недостаточной производительности самого пула вершинных процессоров?
Рельефное текстурирование
Посмотрим на результаты синтетической EMBM сцены:
Печальная картина подтверждает тесты из SDK. А теперь DP3 рельеф:
"Все те же лица".
Вершинные шейдеры
Проигрыш по всем статьям. И это при столь обещающих результатах теста на предельную пропускную
способность по треугольникам. И это, при наличии 16 скалярных вершинных процессоров. Либо что-то не
в порядке с драйверами, либо вершинное железо очень сильно заточено под OpenGL и не может конкурировать
с DX ускорителями, либо оно просто-напросто недостаточно производительно. Последнее было бы крайне обидно,
но маловероятно.
Пиксельный шейдер
Руководствуясь высказанными выше соображениями о том, что слишком малые разрешения "упираются" в
геометрию, а слишком большие - в пропускную полосу памяти, обратим основное внимание на 1024х768
и 1280х1024:
На несложных пиксельных шейдерах P10 умудряется сохранять приемлемую производительность, несколько выигрывая у
Parhelia. Это подтверждает полученные при тестировании пиксельных шейдеров в SDK результаты. Но посмотрим
и на тест Advanced Pixel Shader.
Картина совершенно иная. Как уже отмечалось в секции SDK - чем длинее шейдер, тем хуже для P10. И вновь,
интересно, как будут обстоять дела с этим вопросом у R300 и NV30.
Спрайты
В этой области у P10 все плохо - еще хуже чем у Parhelia. Очевидно, что спрайты эмулируются стандартными
треугольниками. С другой стороны, не будем забывать, что подобные скоростные системы плоских частиц имеют
пока сугубо игровые применения.
Итак, подведем второй промежуточный итог. По сумме синтетических тестов карта 3Dlabs P10 в
основном проигрывает своим конкурентам. Впрочем, это и ожидалось - ускоритель не ориентирован на игровые
приложения, а тест 3D Mark 2001 несомненно является игровым тестом, даже с точки зрения синтетических
алгоритмов. Кроме того, судя по всему драйверы для DX8 не являлись первичной целью создателей P10 и
до сих пор являются слишком слабо оптимизированными, чтобы соревноваться с продуктами ATI или NVIDIA.
3D-графика, 3DMark2001 - игровые тесты
3DMark2001, 3DMARKS
Как мы видим, в целом положение 3Dlabs Wildcat VP870 в игровых тестах DirectX 8.1 оказалось между
ATI RADEON 7500 и RADEON 9000 Pro. Но это благодаря тому, что карта поддерживает пиксельные шейдеры, и
поэтому Game4 функционирует. Ниже мы убедимся в том, что реальная скорость бывает даже ниже, чем у
GeForce4 MX 440 (который по сумме баллов проиграл из-за отсутствия результатов по Game4).
3DMark2001, Game1 Low details
Характеристики теста:
- Rendered triangles per frame (min/avg/max): 19773/33753/143422
- Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
- Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB
А тут карта на P10 - аутсайдер, даже GeForce4 MX 440 смог показать чуть более высокую производительность.
3DMark2001, Game2 Low details
Характеристики теста:
- Rendered triangles per frame (min/avg/max): 46159/51440/147828
- Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
- Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB
Картина схожая, производительность где-то около той, что выдает GeForce4 MX 440.
3DMark2001, Game3 Low details
Характеристики теста:
- Rendered triangles per frame (min/avg/max): 16681/21746/39890
- Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
- Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB
Чуть-чуть скорость у P10 выросла, а толку все равно мало.
3DMark2001, Game4
Характеристики теста:
- Rendered triangles per frame (min/avg/max): 55601/81714/180938
- Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
- Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
- Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB
Заметим, что в этом тесте, достаточно сложном и современном с точки зрения насыщеной эффетками реалистичной
сцены P10 наконец-то хоть кого-то опередила :-). На сей раз в аутсайдерах осталась карта Matrox Parhelia.
В целом по 3DMark2001 можно сказать, что наши предварительные результаты тестирования в синтетике и выводы
по ним полностью подтвердились практикой: 3Dlabs Wildcat VP870 и ее драйверы пока никоим образом не
приспособлены к DirectX игровым приложениям. Пока невозможно даже четко сказать, кто больше виноват:
драйверы или баланс возможностей самого P10. Будем ждать известий от Creative Labs - нынешнего хозяина 3Dlabs,
который обещал выпустить на рынок игровой акселератор на базе P10. Тогда мы сможем подробно исследовать:
что в этом вопросе изменилось в лучшую сторону.
Пока же постараемся утешить профессионалов-дизайнеров - они уже сейчас смогут в часы (или минуты) своего досуга поиграть на
этой карте в любимые игры (пусть и с несколько меньшим комфортом в плане скорости: придется снижать разрешение).
Качество 3D-графики в играх
Однако и тут есть нарекания. Слава Богу, что их не так много, но вот пресловутая игра Morrowind, в которой
практически впервые водная поверхность реализована через пиксельные шейдеры, выдала следующие картинки
на 3Dlabs Wildcat VP870 (для сравнения приведены скриншоты, полученные на RADEON 8500):
При этом игра была обновлена при помощи последнего патча до версии 1.02.0722.
Были замечены некоторые искажения и в других играх (правда малозначительные). Более подробно можно будет узнать
о качестве из следующего (августовского) выпуска 3DGiТогов (в галерею скриншотов будут помещены кадры из
многих игр, полученные на P10).
Профессиональные тесты, SPECviewperf 7.0
Итак, мы подробно рассмотрели работу VP870 в играх и DIRECTX 8. Однако главные выводы в обзоре профессиональной карты,
несомненно, должны делаться на основе исследования ее в профессиональных тестах. В качестве инструментария мы выбрали два
теста: новый SPECviewperf 7.0 и 3DS MAX 4.26. Новая версия SPECviewperf представляет из себя отличную "профессиональную"
синтетику, а 3DS MAX - это отличный "живой" пример DCC приложения. Первый тест покажет нам баланс профессиональных
возможностей карты, второй - ее реальные преимущества в реальной работе.
Подробные описания тестов и методик
можно посмотреть у нас на сайте.
Как мы тестировали: устанавливалась операционная система, потом устанавливались драйвера видеокарт, после
чего запускались тесты и снимались показания. VP870 прошел все тесты из набора SPECviewperf без проблем -
не было ни зависаний, ни нареканий по качеству. Впрочем, именно это мы и ожидаем в первую очередь от
профессиональных, тщательно протестированных и сертифицированных драйверов. Давайте подробно посмотрим на
результаты этого тестирования:
Первый тест, основанный на движке 3D MAX показывает четкое лидерство VP870, особенно если в драйверах
установлен режим оптимизации для геометрии, что лишний раз подтверждает наш вывод о балансе P10 в эту
сторону. VP870 быстрее ближайшего конкурента (900XGL) почти на 7%. Напомним, что последний при этом
позиционируется в более высокую нишу, и сравнивать его результаты по-хорошему надо со следующей,
более быстрой картой 3Dlabs. Безусловно, это нельзя назвать уверенным преимуществом, учитывая
отличную масштабируемость карт на базе процессора Quadro4. Если выйдет более высокочастотная модель
на базе Quadro4, преимущество P10 может быть сведено на нет. Однако сейчас, особенно при учете
текущих цен, P10 выглядит привлекательно. Так ли это в реальном приложении, мы узнаем из
результатов тестирования карты непосредственно в 3D MAX.
В этом ориентированном на закраску тесте VP870 показал себя крайне слабо. Отставание от лидера почти на 35%,
причем практически неважно, какой режим оптимизации включен в драйверах. Учитывая что 3Dlabs позиционирует эту
карту, как соперника Quadro4 750XGL, результаты этого синтетического теста можно признать провальными - VP870
даже близко не подошел к Quadro4 750XGL.
Новый тест, и совершенно другая картина. VP870 обгоняет самую быструю Quadro4 на 6%. Учитывая позиционирование
карты от 3Dlabs, это весьма неплохой результат. Еще более отчетливо начинает проявляться разница между
текстурным и геометрическим режимами оптимизации - если в ориентированных на закраску тестах текстурная
оптимизация не особенно помогает (не забываем, что скорость закраски зависит не только от текстур), то
в геометрических включение геометрической оптимизации сказывается весьма положительно. Можно сделать
интересный вывод - в любых реальных приложениях, скорее всего, имеет смысл все время держать включенной
только геометрическую оптимизацию.
В этом сбалансированном тесте много как текстур, так и достаточно сложной геометрии, поэтому разницы между режимами
практически нет, в целом же, картина опять в пользу VP870. На этот раз разница между VP870 и Quadro4 составила 8%. Это
хороший знак для большинства реальных сбалансированных приложений.
Расстановка сил кардинально поменялась, и в этом тесте мы будем сравнивать уже не VP870 vs Quadro4, а
VP870 vs FireGL 8800, потому что FireGL 8800 быстрее, чем Quadro4 900XGL, в свою очередь, VP870
быстрее FireGL 8800. VP870 быстрее, чем FireGL 8800, на 7.6%, и быстрее Quadro4 900XGL на 14.4%.
Тест несет смешанную нагрузку, и разница между геометрическим и текстурным режимом оптимизации невелика -
составляет чуть более 2%.
И в этом тесте VP870 оказывается на вершине, опережая абсолютно все карты фирм-конкурентов. Если
выразить разницу в процентах, то получается, что VP870 в режиме оптимизации геометрии быстрее Quadro4 900XGL
на 37%, быстрее FireGL 8800 на 47% и быстрее Quadro4 750XGL на 56%. И так же выразим процентное
соотношение в режиме оптимизации текстур: VP870 vs Quadro4 900 XGL = 26%, VP870 vs FireGL 8800 = 35%,
VP870 vs Quadro4 750 XGL = 43%. Разница между разными режимами оптимизации составляет 8%, опять в пользу
оптимизации геометрии.
Теперь подведем общий итог по результатам тестирования в SPECviewperf 7.0. Как видно из приведенных диаграмм,
в большинстве случаев лидирует карта от 3Dlabs на новом чипе P10. Как правило, она выигрывает в режиме
оптимизации геометрии. Из этого факта можно сделать два вывода: во-первых, specviewperf в большинстве
тестов упор делает именно на обработку геометрии. Точнее, этот упор делают реальные профессиональные
приложения и задачи, а тест лишь отражает их популярные надобности. Во-вторых, имеет смысл раз и навсегда
включить в драйверах режим оптимизации геометрии, хуже от этого не будет никогда, а вот лучше - достаточно
часто.
В текущих условиях - при нынешних ценах и тактовых частотах в этом сегменте рынка лучшим выбором
(на основе SPECviewperf 7.0) несомненно является VP870. Теперь посмотрим на результаты реального приложения:
Профессиональные тесты, Discreet 3DS MAX 4.26
После исследования в specviewperf, который все-таки является синтетическим тестом (хотя и эмулирует
характерные для реальных приложений нагрузки на ускоритель), мы рассмотрим
работу VP870 в 3DS MAX. В тестировании 3DS MAX мы исключили лишь моделирование работы дизайнера, но
уверены, что "живая" работа будет более менее понятна, после количественных показателей
нашего исследования. Мы несколько сократили отчет об исследовании качества в силу того, что все
тестовые сцены рендерятся и отображаются правильно, и приводить множество скриншотов нет никакого смысла
(положительно сказывается сертификация драйверов). Мы приведем только скриншоты результатов работы антиалиасинга.
Начнем исследования с тестирования скорости работы на стандартных демосценах, что идут
в комплекте 3DS MAX. Поясним условные обозначения на диаграммах. Под термином
"Special driver" мы понимаем специальный драйвер от производителя видеокарты, который
предназначен только для работы в 3DS MAX. Драйвера от компании ATI называются MAXIMUM, драйвера от
компании NVIDIA называются MAXTREME, а драйвер для VP870 от 3Dlabs никак не называется, более
того, он не имеет каких-то своих функций управления, используя только стандартные настройки 3DS MAX.
Под термином "OpenGL" подразумевается работа через стандартный OpenGL драйвер. Мы помним,
о том, что в тесте SPECviewperf 3dmax-01, основанном на движке 3DS MAX, VP870 оказался первым и является
вероятным кандидатом на звание наиболее предпочтительной карты для работы с этой системой трехмерного
моделирования. Расставим же точки над i.
Тестовая сцена 4views, показывает нам, одновременное отображение в четырех областях проекции. И
в этом тесте VP870 держится примерно на уровне своих соперников от NVIDIA. В разных режимах чуть
лучше, чем Quadro4 750XGL, но чуть хуже Quadro4 900XGL, причем только при использовании специального
драйвера. В чистом OpenGL он проигрывает картам линейки Quadro4. Отчасти это объясняется тем, что
карты от NVIDIA обладают бОльшим числом поддерживаемых OpenGL расширений (см. таблицу расширений OpenGL).
Тест на геометрические возможности подтверждает лидерство VP870 в области обработки сложной геометрии.
Небольшое преимущество при работе в OpenGL и уверенное лидерство под управлением специального драйвера.
Сделаем вывод: 3Dlabs очень ответственно подошли к специальному драйверу, он не является просто враппером,
а существенно оптимизирует вывод изображения.
А вот усложнение геометрии до максимума показывает, что VP870 лидер лишь до определенного уровня
сложности геометрии в сцене, после чего начинают сказываться уже другие причины (Карта упирается
в пропускную способность AGP шины или сказываются какие-либо другие аспекты взаимодействия с процессором).
А вот тесты по работе с множеством источников света типа SPOT показывают нам, что этот вид освещения -
не конек VP870, и хотя результаты достаточно высокие для комфортной работы с ними, общая картина несколько
удручает тем, что по скорости этот чип проигрывает всем остальным ускорителям. Возможно, что картина
изменится с выходом новых драйверов, причем достаточно кардинально, так как с остальными источниками
света новое детище 3Dlabs справляется весьма успешно (судя по всему, все они реализуются в виде
специальных шейдеров).
Как видно, с большим количеством источников света типа DIRECT лучше всех в OpenGL справляется карта
от ATI (Вспомним DirectX синтетику - именно этот чип снабжен аппаратным блоком фиксированного T&L,
что дает ему некоторое преимущество с ростом числа источников света). VP870 лишь немного уступает
лидеру. Однако при использовании специального драйвера картина кардинально меняется -
использование специального драйвера позволяет карте от 3Dlabs взять пальму первенства.
Что примечательно, разные режимы оптимизации никак не влияют на результаты. Между ними
есть разница в 1-2 fps, что, как вы и сами понимаете, скорее можно списать на погрешность в измерениях,
чем именно на разницу оптимизации.
Последний тип источника света, применяемого в 3DS MAX, это источник света типа OMNI. Как видите,
все карты примерно на одном уровне в OpenGL режиме, впрочем, разница невелика и под управлением
специального драйвера.
Очень важный тест растеризации. Вот где начинает сказываться оптимизация драйверов под разные
режимы работы у карты VP870, вот где проявляется та самая, заявленная производителем, программируемость
чипа. Под управлением OpenGL результат в принципе прогнозируемый, а вот под управлением
специального драйвера результаты просто поражают воображение. Превосходство более чем на 40%! При
этом обратите внимание, что у других карт скоростные показатели даже несколько выше в OpenGL режиме.
Вывод - удачная реализация специального драйвера от 3Dlabs гармонично использует широкие
возможности по гибкому программированию работы самого чипа. Именно в этом тесте мы можем почувствовать реальную
пользу, приносимую действительно гибко программируемой архитектурой, несмотря на существенную зависимость
этого теста от скорости закраски - которая, как известно, не является коньком P10.
Далее идет набор тестов на текстуризацию. Посмотрите, как кардинально меняются результаты при включении
разных режимов оптимизации в драйверах VP870! Причем при использовании специального драйвера скорости
только возрастают, что позволяет карте от 3Dlabs находиться на вершине Олимпа. Разумеется, стандартные
драйвера OpenGL не столь блистательны - они используются 3DS без учета специфики чипа.
Этот тест просто-напросто "запутал" драйвера VP870. В нем используется и большое количество
текстур, и достаточно сложная геометрия. Золотой середины не получилось - в этом тесте карта не показала
ничего примечательно, несмотря на то, что со своей задачей она справляется на довольно высоком уровне.
И последний режим текстурирования. В этом тесте также присутствует и достаточно сложная геометрия, и
немалое количество текстур. Тем не менее, соблюдается некоторая пропорциональность - одно не довлеет
над другим. За счет этого карта VP870 является абсолютным лидером в режиме оптимизации текстур.
Чуть хуже дело обстоит с режимом оптимизации геометрии, особенно в OpenGL. В данном тесте мы
исследуем именно текстурирование, а с ним у карты всё получилось хорошо.
Важная часть тестирования - умение карты правильно и быстро прорисовывать большое количество прямых
линий, так называемый каркасный режим работы. И при работе в OpenGL, и при работе под специальным драйвером
результаты не зависят от типа оптимизации, причем результаты в OpenGL достаточно низкие. При использовании
специального драйвера, в котором, очевидно, используется несколько иной, более выгодный для P10 алгоритм
работы, скорость вырастает в разы. При этом прирост скорости позволяет карте забраться на вершину и
стать лидером этого теста.
Важный момент - проверим работу Line Antialiasing.
Как видно, падения в скорости не происходит. При этом ситуация практически ничем не отличается от
предыдущего теста. Антиалиасинг линий для нового творения 3Dlabs является приятным и абсолютно
бесплатным приложением.
И, поскольку речь зашла о антиалиасинге, а значит, и о качестве, мы приведем скриншоты, антиалиасинга в
различных режимах работы.
Итак, сначала покажем, как отображает тестовую сцену карта без антиалиасинга линий.
Режим оптимизации под геометрию, управление - OpenGL:
Режим оптимизации геометрии, управление - special driver:
Как видно, визуальных отличий абсолютно никаких нет. Теперь включаем антиалиасинг:
Режим оптимизации под геометрию, управление - OpenGL:
Режим оптимизации геометрии, управление - special driver:
Глядя на эти скриншоты можно сделать следующий вывод: антиалиасинг более аккуратный под
управлением OpenGL, нежели чем под управлением специального драйвера.Под управлением
специального драйвера антиалиасинг выглядит более грубым. Антиалиасинг выполняется чипом
весьма быстро, что говорит о том, что эта задача была успешно реализована инженерами
компании, и можно смело постоянно использовать его в повседневной работе без ущерба
производительности.
У карты есть огромный потенциал, который, возможно будет реализовываться с появлением новых драйверов.
Подведем итоги по 3DS MAX. Тестирование в SPECviewperf обнадежило и порадовало. Мы надеялись получить
нового безусловного лидера. Однако тест в реальных приложениях показал, что не всё так просто. Да,
карта получилась качественная и достаточно быстрая, чтобы претендовать на лидерство,
но вместе с тем лидерство этой карты не может быть однозначным. В разных тестах
результаты зависят от множества окружающих условий и подавляющего преимущества практически
не наблюдается. Как минимум, мы можем констатировать добротность специального драйвера, рекомендовать
его к применению и отметить существенное увеличение результатов при его использовании.
Выводы
- Прежде всего, эта карта является превосходным решением для профессионалов-дизайнеров,
работающих в сфере 3D-моделирования. 3Dlabs Wildcat VP870, обладая ценой (по данным www.pricewatch.com),
равной стоимости NVIDIA Quadro4 750XGL ($580 на начало августа), во многих тестах не отстает и даже
побеждает куда более дорогую карту на базе Quadro4 900XGL.
- Карта изначально разрабатывалась как профессиональное решение, и очень хороша в режимах и сценах
с акцентом на скорость расчета геометрии. Это же касается и режимов со сглаживанием, особенно линий.
- Что касается реализованных в P10 пиксельных и вершинных шейдеров, то пока их применение в профессиональной
графике достаточно ограниченно, но мы уже можем наблюдать плоды гибкой программируемости чипа на примере
высокооптимизированного драйвера специально для 3DS MAX. Как бы там ни было, потенциал данной карты
в этом вопросе еще далеко не раскрыт, будем ждать появления OpenGL 2.0, DirectX 9 и с ними различных
высокоуровневых языков для программирования графических ускорителей.
- Мы еще вернемся к исследованию 3Dlabs Wildcat VP870 в разных профессиональных приложениях,
следите за анонсами сводных тестирований профессиональных карт (осень этого года принесет читателям
ряд очень интересных статей в этом плане).
- С точки зрения игровых приложений 3Dlabs Wildcat VP870 выглядит крайне скромно. Впрочем, вполне
естественно ожидать этого от профессиональной карты. Оптимизированные под профессиональные пакеты
драйверы (достаточно посмотреть хотя бы на список расширений ICD OpenGL, чтобы убедиться в этом),
достаточно слабый (неоптимизированный) DirectX 8 драйвер и особенности самого P10, сбалансированного
с учетом неигровых применений, не позволяют рассчитывать на высокую скорость в играх.
- Мы считаем, что игровой потенциал этого чипа не раскрыт и на 50%, поэтому будем ожидать выхода игровой
платы на базе P10 или его специальной игровой модификации, сбалансированной с учетом большей производительности
закраски. Надеемся, что у этой карты будут уже полноценные с точки зрения игровых применений драйверы.
И еще раз отметим, что низкая относительно прочих участников тестирования DirectX производительность карты
может заметно возрасти после выхода DirectX 9.0, поэтому мы не закрываем эту тему, а лишь ее несколько
ее откладываем.
Комментарии? Поправки? Дополнения? anvakams@ixbt.com
|