MadOnion 3D Mark 2001 и NVIDIA GeForce3

любовь с первого взгляда


И ты взглянула на меня,
Моля о маленькой подсказке,
Твой взгляд был преисполнен ласки,
И вспыхнул я, как от огня…



Весна, а с нею столь долгожданный 3DMark2001. Он пришелся очень кстати — и энтузиастам трехмерного дела, и фирме NVIDIA с ее новым чипом GeForce3, и нам, скромным обозревателям железных друзей человека. Что ж, не медля ни секунды, бросимся в захватывающий вихрь весеннего танца. Участие в тестировании принимают:

Кавалеры:

  • Intel Pentium 4 — 1.5 ГГц (FSB 100*4 МГц)
  • Intel Pentium 4 — 1.8 ГГц (FSB 105*4 МГц)
  • Intel Pentium III — 1 ГГц (FSB 133 МГц)
  • AMD Athlon — 1.2 ГГц (FSB 133*2 МГц)

Дамы:

  • NVIDIA GeForce3
  • NVIDIA GeForce2 Ultra
  • ATI Radeon 64 DDR VIVO (183 МГц)

Балом заправляет:

  • 3DMark2001 Pro — версия 1.0

Свита кавалеров (тестовые стенды)

  1. Компьютер на базе Pentium III — 1000 MHz:
    • процессор Intel Pentium III — 1000EB (133 MHz FSB);
    • системная плата Chaintech 6OJV (i815);
    • оперативная память 256 MB PC133 (2xDIMM Transcend);
    • жесткий диск IBM DPTA 20GB UltraDMA/66;

  2. Компьютер на базе Athlon — 1.2 GHz:
    • процессор AMD Athlon Thunderbird — 1.2GHz (266MHz FSB);
    • системная плата Soltek 75KAV-X (VIA KT133A);
    • оперативная память 256 MB PC133 (2xDIMM Hyundai);
    • жесткий диск Fujitsu 10GB UltraDMA/66

  3. Компьютер на базе Pentium4 — 1.5 GHz и Pentium4 — 1.7 (o/c 1.8) GHz:
    • процессоры Intel Pentium 4 — 1.5 GHz, 1.7 GHz;
    • системная плата ASUS P4T (i850);
    • оперативная память 256 MB ECC PC800 RDRAM (2x RIMM Buffalo);
    • жесткий диск 45Gb IBM Deskstar GXP75

Мы проводили тесты в трех разрешениях: 800х600, 1024х768 и 1280х1024. Везде устанавливались 32 бит глубина цвета, 24 бит Z, 32 бит текстуры, было разрешено сжатие текстур и отключено полноэкранное сглаживание. Кроме того, хотя это и не столь актуально в наше время, мы все же приведем величину падения производительности (в %) в случае перехода с 16 на 32 бит глубину цвета. Дабы количественно определить вклад аппаратного T&L в суммарную производительность GeForce3, мы приведем результаты, полученные на самом быстром процессоре обзора (Pentium 4 1.8ГГц) при включенной программной эмуляции T&L. Обратите внимание, что тесты производительности вершинных шейдеров также выполнялись на GeForce2 Ultra и Radeon в режиме программной эмуляции.

Общие впечатления от 3DMark2001

Тест, как и его предшественник, выводит на экран плавно проявляющуюся заставочную картинку, причем, пользуется для этой цели Direct3D, вызывая у многих карт переключение режима и заставляя экран слегка моргнуть разочек, а монитор вновь поймать развертку. Я не претендую на роль программиста MadOnion, но есть очевидный метод реализации тот же самого эффекта без досадного моргания. На заставке выводится логотип, соответствующий типу процессора, при этом, мобильный вариант Pentium II 366, установленный в ноутбуке, почему-то опознается как Celeron. С остальными процессорами, имеющимися в нашем распоряжении, тест знаком. Впрочем, хватит ворчать, перейдем к делу. Интерфейс программы стал чуть компактнее — одно окно с уже знакомым нам расположением элементов:


Из основных нововведений (о самих тестах чуть позже) можно выделить наличие "играбельного" варианта одного из тестовых эпизодов (а конкретно, Game 1 — Car Chase). Впрочем, как в него играть, для меня осталось загадкой, и погибал я все время достаточно быстро, так и не доехав до какого-либо финишного пункта. Демонстрационный режим, несомненно, производит впечатление, но искушенный зритель сразу заметит некую "скомканность" демонстрации — она очень коротка по времени, некоторые эффекты откровенно слабы, другие слишком мимолетны. Это скорее сценарный, нежели технологический просчет. Кроме того, вероятно по соображениям совместимости, в нее не включены многие из присутствующих в тестах сцен. Также, на мой взгляд, следовало бы добавить несколько тестов, учитывающих возможности новых карт, например, тесселяцию гладких поверхностей.

Общий результат

Огромный недостаток 3DMark2001 заключается в закрытости этого теста — никто не знает, на основе каких соображений была выведена следующая формула:

3DMark score = (Game1LowDetail + Game2LowDetail + Game3LowDetail) * 10 + (Game1HighDetail + Game2HighDetail + Game3HighDetail + Game4) * 20

Это не только усложняет его трактовку, но и приводит к многочисленным обидам, спорам и заявлениям в "подсуживании" определенным картам. Как бы там ни было, мы не только приведем здесь результаты, но и попытаемся прокомментировать их в меру своих возможностей.


GeForce3 — бесспорный лидер данного теста. Даже существенная разница в производительности платформ не позволяет другим картам настигнуть GeForce3 в неравных условиях (Pentium III 1 ГГц + GeForce3 против Pentium4 и Athlon). Программная эмуляция T&L существенно ухудшает результаты карты, но по-прежнему позволяет ей оставаться в лидерах, за исключением самого низкого разрешения. Как бы там ни было, налицо любовь с первого взгляда, возникшая между 3DMark2001 и новым творением NVIDIA. Не стоит бездумно обвинять этот тест в "заточке" под новый чип. Так же как 3DMark2000 был рассчитан на DirectX 7.0 и все его возможности, так и новый тест создавался исключительно c учетом специфики DirectX 8, и использует много новых возможностей данного API. С "железной" же стороны лишь GeForce3 обладает полноценной поддержкой DirectX 8, и именно по этому высокие результаты ускорителя не должны вызывать изумление. Как только появятся прочие DX8 карты (Radeon2 и, возможно, новое творение Matrox), GeForce3 может получить серьезных конкурентов в этом тесте. Пока же лидер хорошо предсказуем. Мы не приводим результаты, снятые в режиме Pure Hardware T&L ибо, по неизвестной причине, для GeForce3 они во всех тестах совпадают с обычным Hardware T&L, а на остальных картах этот режим вообще не доступен. Даже если включить его твикером для Radeon, тест не показывает данный режим среди возможных вариантов.


Как мы видим, падение производительности, вызываемое переходом в 32 бит режимы, минимально и может волновать только хозяев GeForce2 Ultra в режиме 1024х768 и, разумеется, выше.

Результаты по конкретным играм

В тесте присутствуют четыре основных тестовых сцены (или игры, как будет угодно читателю). Первые три имеют два режима детализации - низкий и высокий, последняя только один (ему так и хочется дать название "сверхдетализованный"). Давайте по порядку обсудим все эти игровые сцены и полученные нами результаты.

Car Chase

Боевой авто-симулятор, навеянный нетленной антиутопией о войне с роботами (Terminator 1 и 2). Создатели теста утверждают, что эта игровая сцена честным образом тратит процессорное время на расчет физики и поведения объектов, как это сделала бы любая реальная игра. Что ж, это несомненно плюс — мы сможем не только говорить о скорости ускорителя, но и прикинуть, как он покажет себя в будущих играх на той или иной платформе.


При низком уровне детализации картина соответствует суммарному значению теста. Разве что Ultra немного реабилитировала себя в паре с Athlon. Radeon также неплох, особенно учитывая столь невысокую частоту чипа. Играбельной эту игру можно назвать для GeForce3 во всех разрешениях, для Ultra до 1024х768, для Radeon только в 800х600.


Еще раз продемонстрируем падение производительности при переходе на 32 бит цвет — в этом тесте оно должно волновать только владельцев GeForce2 Ultra.


И правда, в этом тесте не все зависит только от ускорителя. Вот и GeForce2 Ultra получила шанс блеснуть в паре с Athlon. А значит, иногда имеет смысл потратить деньги на покупку новой платформы (тем более, что переход с Pentium III на Athlon потребует минимальных вложений), а не на самый новый и могущественный ускоритель. Впрочем, ни на одной из карт-платформ эта игра не является удобоиграемой — слишком мала частота расчитываемых кадров, особенно если учесть аркадную направленность теста.

Dragothic

Некая сказочно-историческая фэнтези с драконом, красивой наездницей оного, городом, кораблем и несчадно опаляемыми огнем людьми. Жанр этой игры придумать сложно, будем считать что это аркадная сцена из какой то 3D Adventure или стратегии. Судя по всему, сцены имеют высокое значение overdraw и достаточно слабую оптимизацию геометрии при выводе. Итак:


Ага, с интелектом тут неважно — вся работа ложится на ускоритель. Частота процессора практически не влияет на скорость, влияет только частота FSB (видимо, геометрическая информация передается по AGP, а не хранится в локальном буфере карты). Наше визуальное наблюдение о высоком значении overdraw подтверждает и результат Radeon в максимальном разрешении — HyperZ и HSR помогли ему приблизиться к Ultra.


А вот тут, благодаря HSR и Z компрессии, Radeon обходит на GeForce2 Ultra "на повороте". Высокая детализация этой игры добавляет в изображение новые детали и персонажи, а ускорителю — работы. Но не столь существенно как в предыдущем тесте — визуально игра по прежнему динамична. Не забудем также, что для подобного жанра скорость не столь важна как в случае предыдущего теста.

Lobby

Сцена навеяна "Mатрицей". Надо отметить, что детальность самих моделей невысока — где то на уровне Quake2. Судя по всему присутствует скининг (матричный блендинг) и скелетная анимация. В активе детальные текстуры и огромное количество всяческих гильз, осколков и прочих мелочей, они значительно нагружают ускоритель. Назовем этот жанр киношутером.


Как и ожидалось — результаты высоки, а нагрузка на процессор, судя по всему, находится с нагрузкой на ускоритель в состоянии тонкого "паритета". Посмотрим что у нас с высокой детализацией:


В двух разрешениях в эту игру по прежнему можно играть, но только на старших процессорах и GeForce3. Вот она новая планка жанра, настоятельно требующая смены и платформы, и ускорителя. Это не Doom3, конечно, но задуматься стоит. Radeon ведет борьбу на равных только в разрешении 800х600.

Nature

Потрясающий тест заставляет вспоминать известный поэтический перл из популярного отечественного фильма Брат 2. Речка, небо голубое, и травинка и лесок, в поле каждый колосок, камни… Ну и все такое… Конечно, рисуются не каждый листочек или травинка по отдельности, а небольшие группы оных, нарисованные на текстуре с использованием прозрачности. Но рисуются и шевелятся они достаточно реалистично, да и общее количество таких групп весьма значительно. Красиво, ничего не скажешь:


Выполняется этот тест только на GeForce3 — используются вершинные и пиксельные шейдеры. Об использовании первых говорит скачок производительности в режиме программной эмуляции T&L, о вторых — невозможность выполнить этот тест на картах, отличных от GeForce3. Надо отметить, что пиксельные шейдеры принимают участие в формировании водной поверхности большого озера, поскольку в демо-режиме 3DMark2001 тест Nature имеется и даже работает на всех акселераторах, однако при этом камера избегает демонстрации озера. Жду не дождусь, когда можно будет поиграть в реальные игры с таким пейзажем. Интересует только один вопрос — а красивые девушки там будут?

Синтетические тесты

Новый набор тестов приближен к реальностям DX8. Но не будем забегать в перед, давайте по порядку:

Fill Rate



Скорость закраски сильно зависит от чипа и не сильно отличается от результатов, полученных нами ранее с помощью 3DMark2000. Напомню, что теоретический предел для карт в режиме одна текстура на пиксель соответственно 800, 1000 и 366 миллионов пикселей в секунду. Еще раз отметим практически не зависящий от глубины цвета результат Radeon, и существенную зависимость GeForce2 Ultra.


А вот тут мы наблюдаем существенные изменения. Теперь этот тест измеряет fillrate не для двух, а для максимального поддерживаемого данным ускорителем числа текстур, накладываемых на один пиксель. С моей точки зрения это верный подход, учитывающий в том числе и возможность последовательного мультитекстурирования (использование одного TMU для расчета нескольких текстур за несколько тактов). Мы можем наглядно убедится в преимуществе расчета 4 текстур за 2 такта (GeForce3) перед двумя проходами с двумя текстурами (GeForce2 Ultra). Даже повышенная частота не спасла этот чип. Ну а в 32 битном цвете Ultra проиграла даже Radeon. Несмотря на низкую тактовую частоту ему помогла высокая эффективность работы с 32 битным цветом и возможность рассчитывать 3 текстуры за такт.

High Polygon Count


         

Здесь мы можем воочию наблюдать преимущество аппаратного T&L перед программной эмуляцией даже на столь мощном процессоре, как Pentium4 1.8ГГц. Здесь же мы убеждаемся в том, что предельная валовая производительность T&L Radeon существенно ниже (не достигает 6 миллионов треугольников в секунду), а более высокая тактовая частота GeForce2 Ultra позволяет ей обходить GeForce3 даже на предельном числе источников света. Здесь, как и во многих других местах, результаты очень хорошо соотносятся с полученными нами ранее с использованием модифицированных примеров DX8 SDK. Порочная традиция резкого падения производительности при увеличении числа источников налицо. Причем, вопреки ожиданиям, никакого существенного улучшения ситуации у GeForce3 не наблюдается. Жалко, что тест с 4 источниками исключен из списка — нельзя выяснить даже приблизительный характер зависимости.

Рельеф

В наличие два теста отражающих веянья настоящего и ближайшего будущего — EMBM и DP3 рельефное текстурирование.

Environment Mapped Bump Mapping


         




Картина практически не требует комментариев "по сути вопроса". Постоянные читатели нашего сайта наверное уже давно в курсе, что чипы серии GeForce2 EMBM не поддерживают вообще, а результаты остальных участников тестирования вполне адекватны. В том числе, налицо небольшая зависимость от процессора, связанная с достаточной геометрической сложностью тестовой сцены (число полигонов достаточно заметно влияет на зависимость от процессора — в этой сцене геометрическая информация передается по AGP).

DOT3 Product Bump Mapping


         



Здесь, в более реалистичном, но и более сложном с точки зрения подготовки исходных данных методе DotProduct, выигрывает GeForce3, возможно, не только за счет преимущества перед GeForce2 Ultra в 32 бит режиме, но и за счет (предположение) использования шейдеров для генерации параметров, необходимых для правильного применения DP3 BM.

Теперь нас ждет несколько тестов, ориентированных на новые возможности DX8.

Vertex Shader


         

В этом тесте множество маленьких героев из Lobby бегают по плоской поверхности. Вершинные шейдеры используются, вероятно, для расчета скелетной анимации моделей и/или скининга.


Здесь нас ожидает совершенно странная ситуация. Мы в очередной раз сталкиваемся с фактом практически эквивалентной производительности аппаратного исполнения шейдеров и программной эмуляции. Напомню, что только GeForce3 (четыре столбика слева) выполняет шейдеры теста аппаратно. На сей раз, Pentium III явно не хватает, а вот Athlon и Pentium4 станции сумели обеспечить ускорители сравнимым объемом вершин. Результаты столь близки, что создается впечатление достижения некоего потолка. Тест уперся во что-либо еще, например в пропускную способность AGP. Как говорится, дело ясное, что дело темное — я думаю, что в скором времени мы подробно исследуем вопрос производительности вершинных шейдеров и их программной эмуляции в отдельной статье, а пока предоставим читателям возможность самостоятельно поломать голову над этой загадкой. Один из возможных вопросов — а все ли шейдеры исполняются на GeForce3 аппаратно, и не используется ли в этом тесте AGP для каких-либо целей, ограничивая его результаты.

Pixel Shader


         

Красивейший тест — пролет над ночным океаном, во всю мощь демонстрирует возможности пиксельных шейдеров. Слов нет, одни только эмоции:


Здесь нас ожидает настоящий сюрприз — по неизвестной нам причине Pentium4 проигрывает Athlon и Pentium III! Вероятно, некие особенности оптимизации драйверов под эту платформу сыграли плохую услугу именно этому тесту. Нам остается только догадываться, в чем дело (еще раз повторю, что к сожалению 3DMark2001 закрытый тест и его исходный код недоступен для анализа ни нам, ни, судя по всему, большинству авторов драйверов для популярных чипов).

Point Sprites

И напоследок — прекрасная воксельная (заданная огромным количеством точек с трехмерными координатами) статуя лошади. Для ее вывода используются Point Sprites, описанные нами ранее.


Radeon, к сожалению, все еще не поддерживает их корректно, а вот GeForce3 продемонстрировал четкое преимущество над GeForce2, где оные судя по всему выводятся с помощью двух обычных треугольников.

Галерея скриншотов и вопросы качества

В этом разделе мы представим скринщоты, полученные на игровых тестах в режиме High Quality на GeForce3.

Car Chase


         




Как мы уже отметили выше, это пример реальной игры будущего поколения c точным расчетом физических процессов. Обратите внимание на прорисовки машин и их частей. Сцены очень сложные, характеристики таковы:

Low detail:

  • Rendered triangles per frame (min/avg/max): 19773/33753/143422
  • Rendered textures per frame with 16 bit textures (min/avg/max): 7.5/8.8/16.5 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.1/17.7/30.3 MB
  • Rendered textures per frame with texture compression (min/avg/max): 10.7/12.2/21.0 MB

High detail:
  • Rendered triangles per frame (min/avg/max): 21007/67597/204128
  • Rendered textures per frame with 16 bit textures (min/avg/max): 6.5/12.8/20.1 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 12.5/22.9/36.0 MB
  • Rendered textures per frame with texture compression (min/avg/max): 10.0/16.4/25.0 MB
Режим High — детализации отличается от Low следующим:
  • Добавлены динамические тени от движущихся объектов
  • Подсветка прожекторами у роботов делает весьма эффектные блики на объектах
  • Добавлена масса дополнительных объектов
  • Все объекты более детализированы
  • Увеличено число летающих роботов

Dragothic


         

Игра имеет весьма высокий коэффициент Overdraw, связанный с отображением множества домов, частично закрывающих друг друга (вспомним сразу тест VillageMark).

         

Как любая игра подобного жанра, эта игровая ситуация не может не иметь множества эффектов, связанных как с освещением, так и с реалистичным движением героев, особенно мифического плана.

         

Обратите внимание на отличную прорисовку "физиономии" дракона.

Сцены также весьма сложные, а вот суммарный размер текстур сильно меньше, чем у предыдущей игры. Характеристики таковы:

Low detail:

  • Rendered triangles per frame (min/avg/max): 46159/51440/147828
  • Rendered textures per frame with 16 bit textures (min/avg/max): 8.0/8.8/10.1 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 15.6/17.2/19.8 MB
  • Rendered textures per frame with texture compression (min/avg/max): 9.3/10.9/13.5 MB

High detail:
  • Rendered triangles per frame (min/avg/max): 81604/99707/342347
  • Rendered textures per frame with 16 bit textures (min/avg/max): 11.8/13.2/14.5 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 22.7/25.8/28.5 MB
  • Rendered textures per frame with texture compression (min/avg/max): 11.8/15.0/17.4 MB
Режим High — детализации отличается от Low следующим:
  • Добавлены динамические тени от движущихся людей
  • Поселок (городок) большего размера
  • Используются дополнительные карты освещения.
  • Добавлены стрелки, метающие огненные стрелы
  • Дракон отображается полностью

Lobby


         

     

     

Обратите внимание на тщательность прорисовки лица главного героя. Казалось бы, отменное качество (кроме лишь того, что дужку от очков почему-то не дорисовали до уха, и очки висят в воздухе). Однако, видимо, кроме лица и частей одежды, ни на что другое у разработчиков не хватило терпения, и мы видим резко бросающиеся в глаза контрасты в уровне детализации:

       

       

Посмотрите на то, как сделаны руки и рукава у героя. Это просто ужасно, что пожалели полигонов на эти детали. А как выполнены колени у стреляющего? Наверное, он на протезах, а не на ногах... Все это несколько портит впечатление от увиденного.

Сцены не очень сложные (разумеется, относительно предыдущих!), суммарный размер текстур также меньше, чем у предыдущих игр. Характеристики таковы:

Low detail:

  • Rendered triangles per frame (min/avg/max): 16681/21746/39890
  • Rendered textures per frame with 16 bit textures (min/avg/max): 2.8/4.1/4.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 5.7/8.2/9.4 MB
  • Rendered textures per frame with texture compression (min/avg/max): 5.0/7.2/8.4 MB

High detail:
  • Rendered triangles per frame (min/avg/max): 23304/41729/93845
  • Rendered textures per frame with 16 bit textures (min/avg/max): 4.8/6.0/7.1 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 7.8/10.3/12.2 MB
  • Rendered textures per frame with texture compression (min/avg/max): 7.0/9.3/10.9 MB
Режим High — детализации отличается от Low следующим:
  • Добавлены динамические тени от движущихся людей
  • Добавлены различного рода отблески и ряд других эффектов освещения

Nature


         

         

Безусловно, это самый красивый из всех игровых тестов. Мы уже отметили этот факт выше :-) Главная его особенность, что он использует пиксельные шейдеры (плюс вершинные шейдеры и кубическое текстурирование) для формирования водных поверхностей (кроме быстро бегущей речки). Поэтому лицезреть эту игру во всей красе можно пока только на GeForce3 (в демо-режиме водные поверхности не отображаются).


Как уже говорилось выше, не каждый листочек выполнен в виде отдельного объекта, а используются в некотором роде массивы листьев и травинок, нарисованных на одной текстуре. Однако этих массивов очень много, и каждому приданы движения, точно эмулирующие физические процессы. А про эффекты освещения и говорить не приходится — все видно и так! При формировании этой красоты используются вершинные шейдеры. Как мы видим, этот тест наиболее полно использует возможности DirectX 8.0.

Сцены довольно сложные, суммарный размер текстур очень большой. Характеристики таковы:

High detail:

  • Rendered triangles per frame (min/avg/max): 55601/81714/180938
  • Rendered textures per frame with 16 bit textures (min/avg/max): 14.9/17.4/20.7 MB
  • Rendered textures per frame with 32 bit textures (min/avg/max): 28.4/33.5/40.0 MB
  • Rendered textures per frame with texture compression (min/avg/max): 28.4/33.5/40.0 MB

Заключение

Очевидно, что тест скорее удался. Но, все же, многие ждали большего. Это удел любого лидера — от него всегда ждут большего, невзирая на его текущие заслуги. Мы же ждем не дождемся нового, открытого теста для Direct3D и OpenGL который позволил бы нам не только детально исследовать все предельные и общие характеристики карт, но и предоставил возможность убедиться (глядя на его исходный код), что его тестовые сцены измеряют именно то, что от них ждут. И этот тест уже близок...




Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.