Дорогие читатели! Редакция сайта iXBT.com обращается к вам с просьбой отключить блокировку рекламы на нашем сайте.
Дорогие читатели,
Редакция сайта iXBT.com обращается к вам с просьбой отключить блокировку рекламы на нашем сайте.
Дело в том, что деньги, которые мы получаем от показа рекламных баннеров, позволяют нам писать статьи и новости, проводить тестирования, разрабатывать методики, закупать специализированное оборудование и поддерживать в рабочем состоянии серверы,
чтобы форум и другие проекты работали быстро и без сбоев.
Мы никогда не размещали навязчивую рекламу и не просили вас кликать по баннерам.
Вашей посильной помощью сайту может быть отсутствие блокировки рекламы.
Очевидно, что карта GTX 1070 Ti получена из карты GTX 1080, куда установлено ядро с немного урезанными блоками (а если вести отсчет от GTX 1070, то, наоборот, ядро усилено).
PCB этих карт абсолютно одинаковы.
Схема питания получила 5 фаз (dualFET), управляется цифровым контроллером NCP81022 производства On Semiconductor.
Система охлаждения
Референсная СО Nvidia имеет традиционную закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан
на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Нижняя пластина камеры прижимается
к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где
пары конденсируются. Мы уже рассказывали о такой схеме современного охлаждения топовых ускорителей.
Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, обеспечивающую пониженный уровень шума.
Микросхемы памяти и силовые транзисторы охлаждаются с помощью специальной пластины кулера. На оборотной стороне PCB установлена пластина, которая является, по сути, декорацией
и предохраняет заднюю часть от повреждений.
После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 83 градусов, что
является нормальным и обычным результатом для топовых ускорителей. На торце СО имеется подсвечиваемый логотип ускорителя.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)
Методика измерения шума
Помещение шумоизолировано и заглушено, снижены реверберации.
Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником
механического шума.
Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
Режимы измерения:
Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой
промежуточных кадров.
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
Оценка градаций уровня шума выполняется по методике, описанной здесь:
28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при
долговременной работе. Оценка: шум низкий.
от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать
будет затруднительно. Оценка: шум средний.
40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.
В режиме простоя в 2D вентилятор работал на частоте 1100 оборотов в минуту, при этом температура графического ядра не поднималась выше 31 градуса, а уровень шума был немного выше
фонового и составлял 23,0 дБА.
При просмотре фильма с аппаратным декодированием температура графического ядра чуть вырастала (до 33 градусов), вентилятор работал на той же частоте вращения (1100 об/мин),
уровень шума не изменялся (23,0 дБА).
В режиме максимальной нагрузки в 3D температура достигала уровня 83 °C, частота вращения вентилятора поднималась до 2168 оборотов в минуту, шум вырастал до 38,7 дБА.
В результате шум СО под нагрузкой достаточно высокий, но не переходящий эргономических пределов. Стоит напомнить, что референсные кулеры будут встречаться на практике только в картах Founders Edition,
которые в основном можно купить на сайте компании Nvidia (партнеры такие карты обычно почти не пускают в продажу, только в первых партиях).
Термоснимок
Максимальный нагрев карты (не ядра) 73 градуса — на печатной плате с края под пластиной с обратной стороны.
Комплектация
Видеокарта попала к нам в ОЕМ-виде, без комплекта.
Синтетические тесты
Используемые нами пакеты синтетических тестов можно скачать здесь:
D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
Для анализа производительности новой модели видеокарты GeForce GTX 1070 Ti были выбраны именно эти решения Nvidia по очень простой причине, которую мы уже упоминали на прошлой странице. GeForce GTX 1070 Ti вклинивается в линейку видеокарт компании строго между моделей GeForce GTX 1080 и GTX 1070, основанных на таком же графическом процессоре GP104, но с разным количеством активных исполнительных блоков. Хотя новая видеокарта по мощности ближе к GeForce GTX 1080, но и сравнение с младшей GTX 1070 также будет интересным.
Выбрать конкурентов из стана соперников также было довольно просто. Компания AMD выпустила две модели видеокарт на основе графического процессора Vega 10, аналогичного GP104 по мощности: Radeon RX Vega 64 и Vega 56, и они примерно соответствуют уровню GeForce GTX 1080 и GTX 1070 Ti, как по цене, так и по производительности. Справедливости ради, еще раз отметим, что реальным соперником на рынке для представленной GTX 1070 Ti является именно младшая модель видеокарты компании AMD — Radeon RX Vega 56.
В DirectX 10-версию RightMark3D вошли два ранее знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также два дополнительных теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы. Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
Производительность в этом тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт с пропускной способностью памяти. Результаты при детализации уровня «High» получаются чуть ниже, чем при детализации «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD лидируют со времени выпуска первых видеочипов на базе архитектуры GCN, и именно различные модели Radeon являлись лучшими в этих сравнениях, что говорит о большей эффективности выполнения ими подобных программ. Это подтверждается и сегодня — хотя рассматриваемая нами видеокарта GeForce GTX 1070 Ti и практически не уступила GTX 1080, но с Radeon RX Vega 56 конкурировать не может, не говоря уже о более мощной модели на основе графического процессора Vega 10.
В первом нашем Direct3D 10-тесте новая видеоплата компании Nvidia оказалась всего на 1% медленнее старшей модели GeForce GTX 1080, основанной на полном чипе GP104, а отрыв от младшего решения GTX 1070 получился более чем в 20%, что хоть и меньше теоретической разницы, но все же весьма ощутимо. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:
В усложненных условиях результаты теста мало изменились, но став лишь чуть интереснее. Новая видеокарта модели GeForce GTX 1070 Ti опережает модель GTX 1070 даже несколько меньше, а вот от GTX 1080 она отстала уже на 7-8%, что хоть и близко к теоретическому отрыву в 5%, но все же больше его. GeForce GTX 1070 Ti в этом тесте все так же отстает от конкурирующих с ним видеокарт в виде Radeon RX Vega 56 и Vega 64, хотя в самом сложном режиме разница между урезанными GP104 от Nvidia и Vega 10 от AMD оказалась уже не такой большой, как раньше — около 20%.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».
Диаграмма очень схожа с предыдущей, также без включения суперсэмплинга. В этот раз новая модель видеокарты GeForce GTX 1070 Ti оказалась лишь на 2% медленнее старшей сестры GTX 1080, опередив младшую модель GTX 1070 на привычные 20%. Если мы посмотрим на сравнение с видеокартами AMD, то в этом случае новинка все так же сильно отстает — младшая из плат Radeon, которая и является ее конкурентом, оказалась быстрее на 26-27%. Посмотрим, что изменит включение суперсэмплинга:
При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга и сказывается меньше, чем в предыдущем случае. Эти условия в наших сравнениях обычно существенно меняют соотношение сил, это же получилось и сегодня.
Хотя графические решения AMD Radeon в этом D3D10-тесте пиксельных шейдеров также работают несколько эффективнее конкурирующих плат GeForce, но новые видеокарты, основанные на чипах архитектуры Pascal, смогли показать достойные результаты. Так, новая модель GTX 1070 Ti уже практически не уступает Radeon RX Vega 56 в самых тяжелых условиях (разница составила 5%). По сравнению с другими решениями Nvidia, новая видеокарта показала скорость на 18-24% быстрее GeForce GTX 1070 и уступила старшей GTX 1080 около 4%, что соответствует теории.
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, а порой даже упор в ПСП.
В случае нашего теста Mineral, выпущенная сегодня в продажу GeForce GTX 1070 Ti показала неплохой результат на уровне GTX 1080, серьезно опередив младшую модель GTX 1070. Что касается плат от компании AMD, то главный соперник сегодняшней новинки в виде Radeon RX Vega 56 смог обойти видеокарту Nvidia более чем на 20% — в математических тестах графические процессоры AMD всегда сильны.
Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте из нашего RightMark мы видим почти такие же результаты, очень похожие на предыдущую диаграмму. Новая модель GeForce GTX 1070 Ti и в этот раз ничуть не отстала от GTX 1080 и оказалась на 24% быстрее своей младшей сестры GTX 1070, что близко к теоретической разнице между ними.
Если сравнивать урезанный GP104 архитектуры Pascal с решениями AMD, то обе видеокарты Radeon показывают лучшие результаты, так как графические процессоры этой компании весьма сильны именно в математических тестах, хотя с выпуском решений архитектуры Pascal компания Nvidia и улучшила свои позиции, в том числе и по математической производительности, но GeForce GTX 1070 Ti этого не хватило для того, чтобы достать Vega 56 — последняя хоть и не так сильно (на 13%), но быстрее.
Direct3D 10: тесты геометрических шейдеров
В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.
Разница между результатами видеокарт на чипах Nvidia и AMD тут не слишком большая, но она в пользу решений калифорнийской компании. Вероятно, это обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и хотя последние подтянулись с выпуском Vega, но даже не топовый GP104 до сих пор имеет большее количество блоков по обработке геометрии и выигрывает у своих конкурентов.
Новая модель GeForce GTX 1070 Ti обогнала свою младшую сестру GTX 1070 на основе еще более урезанной GP104 во всех условиях на 7-11%, а от старшей платы GTX 1080 заметно отстала лишь в самом сложном режиме. Видеокарты Radeon в этом тесте показывают результаты несколько хуже. Прямой конкурент в виде Radeon RX Vega 56 на основе самого мощного GPU компании AMD уступил до 24% в сложных условиях, да и Vega 64 также проиграла новинке (в легком режиме скорость чем-то ограничена). Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки цифры в этом тесте изменились незначительно, и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. GeForce GTX 1070 Ti и в этом подтесте показала сильный результат, обогнав конкурентов от AMD в тяжелых и средних условиях, и почти не отстав от GeForce GTX 1080, что соответствует теории.
К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:
На этой диаграмме мы видим несколько иные относительные результаты, по сравнению с тестом Galaxy, тут есть явные отличия. Новая видеоплата компании Nvidia, основанная на урезанном чипе GP104, хоть и оказалась быстрее младшей модели GeForce GTX 1070 примерно на 10%, но и от более мощной модификации на том же GPU она отстала на 6-8%, особенно в сложных условиях. Эта разница явно больше теоретической. Возможно, тут сказывается упор в пропускную способность памяти. Посмотрим, изменится ли что-то в тяжелом режиме:
В таких условиях результаты видеокарт GeForce явно поменялись, но сегодняшняя новинка относительно своих сестер положение не изменила. GeForce GTX 1070 Ti обогнала GTX 1070 на 11-15%, уступив старшей модели до 8%, что многовато, так как по текстурной и шейдерной производительности разница должна быть меньшей. Впрочем, вывод в любом случае такой — в тестах на основе геометрических шейдеров новинка показала себя очень хорошо, особенно по сравнению с конкурентами от AMD.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Наши предыдущие исследования показали, что на результаты этого теста может влиять филлрейт или пропускная способность памяти, ограничивающие производительность, что всегда хорошо заметно по результатам плат Nvidia в простых режимах. Новая видеокарта GeForce GTX 1070 Ti в этом тесте показывает скорость на уровне старшей модели на том же графическом процессоре, ведь все они имеют одинаковую скорость заполнения сцены. GeForce GTX 1070 отстала от новинки на 17-18%, что чуть ниже теоретической разницы.
Обе платы компании AMD на базе видеочипа Vega 10 в этот раз оказались весьма сильны, и они не просто достали до рассматриваемой сегодня модели GeForce, но и опередили ее с запасом — только в самых сложных условиях разница между GTX 1070 Ti и Vega 56 оказалась 11%, в других условиях она была до 30%. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:
Ситуация на диаграмме заметно изменилась, решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Хотя в самом легком режиме они продолжают отлично выступать, опережая в том числе новое решение на основе урезанного чипа GP104, но в сложных условиях модель GeForce GTX 1070 Ti показала уже более высокую скорость. Она на 15-19% быстрее GTX 1070 и все так же отстает до 8% от полноценного GP104. Если сравнивать новинку с парой Radeon, то она явно проигрывает платам AMD в легком и среднем режимах, а вот в тяжелом одерживает победу, обогнав конкурента на весомые 20%.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» похожи на то, что мы видели на предыдущих диаграммах, но скоростные показатели всех GeForce в этом тесте несколько ниже. Производительности новой модели GeForce GTX 1070 Ti хватает для того, чтобы показать результат лучше GTX 1070 на 10-16% и не отстать от GTX 1080 более чем на 6% (и то не всегда), а вот решения конкурента тут явно быстрее. Radeon RX Vega 56 впереди в легком режиме на 25%, и на 8% — в тяжелом. Рассмотрим второй вариант этой же задачи:
С усложнением условий во втором тесте текстурных выборок скорость всех решений стала ниже, но пострадали все видеокарты, поэтому выводы меняются мало. Новая модель GeForce GTX 1070 Ti на 7-14% быстрее своей младшей сестры GTX 1070, но совсем не отстает от более мощного варианта на том же GPU. Если сравнивать новинку с неплохо выступившими в этих тестах Radeon, то прямой конкурент от AMD всегда быстрее GTX 1070 Ti, пусть разница между ними и сокращается с 20% в легких условиях сразу до 6% в тяжелых.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage могут открыть нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты GeForce GTX 1070 Ti в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.
Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока, и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GeForce GTX 1070 Ti и GTX 1080 точно соответствует теории — 5% в пользу более мощного решения. Младший же вариант видеокарты на основе еще больше урезанного GP104 отстал от новинки почти на треть, и эта разница также соответствует теоретической по скорости текстурирования.
Что касается сравнения скорости текстурирования новой видеоплаты Nvidia с конкурирующими с ней решениями конкурента, то и тут новинка отстала от обеих видеокарт AMD. Решения этой компании AMD с текстурированием справляются весьма неплохо. Прямой соперник новинки Radeon RX Vega 56, имеющий немало блоков TMU, обошел GTX 1070 Ti на 12%, а старший GPU оказался еще быстрее.
Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Цифры из второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест обычно измеряет именно производительность ROP. Рассматриваемая нами сегодня плата GeForce GTX 1070 Ti снова опередила младшую модель GTX 1070 более чем на четверть, отстав от старшей GTX 1080 на 7% — немного непонятно, почему получилась такая разница между ними в тесте, который должен показывать разницу в филлрейте (скорости блоков ROP).
Если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 1070 Ti с взятыми нами в тест решениями компании AMD, то рассматриваемая сегодня плата в этой задаче показала скорость на уровне старшей Radeon RX Vega 64, а ее прямой конкурент в виде Vega 56 отстает от новинки на 12%. На результатах явно сказывается и разное количество блоков ROP у этих плат и разная эффективность оптимизаций при сжатии ими данных во фреймбуфере.
Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Этот тест из пакета 3DMark Vantage отличается от проанализированных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров.
В этой «синтетике» из 3DMark Vantage, когда важны и математическая и текстурная производительность, новая плата GeForce GTX 1070 Ti снова показала очень неплохой результат, оказавшись на 27% быстрее младшей модели на том же графическом процессоре GP104, что полностью соответствует теории. Старшая же модель GTX 1080 была быстрее на те же 7%. Что еще более приятно, новая плата от Nvidia показала в этом тесте результат на 3% лучше, чем RX Vega 56, хотя Radeon в этом тесте обычно были весьма сильны.
Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но мы всегда отмечали странные результаты GeForce в этом тесте, в котором очередная новая видеокарта компании показала все ту же низкую скорость на уровне своих ближайших родственниц, младшей и старшей.
Неудивительно, что в таких условиях сравнение с платами Radeon в этом тесте для GeForce GTX 1070 Ti получилось не очень радостным. Несмотря на теоретическое отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма эффективно, заметно обгоняя все видеокарты GeForce, представленные в нашем сравнении. Что-то на видеокартах Nvidia не работает так, как должно, и двукратного проигрыша просто быть не может даже в теории.
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором «геометрическом» тесте из 3DMark Vantage ситуация сильно отличается от предыдущей диаграммы. В этот раз новая GeForce GTX 1070 Ti показывает результат, лишь на 4-7% меньше сразу трех видеокарт сравнения, имеющих близкие результаты. Новая плата Nvidia в этот раз на 9% опередила младшую модель GeForce GTX 1070, стоящей на ступень ниже, но отстала от остальных. Сравнение новинки от компании Nvidia с конкурирующими видеокартами AMD в этот раз показало ее отставание на 4% от прямого соперника — Radeon RX Vega 64.
Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В этом математическом тесте производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, несколько отличающееся от того, что мы получили в схожих тестах нашего пакета RightMark.
Хорошо видно, что видеочипы компании AMD с архитектурой GCN справляются с подобными задачами явно лучше решений конкурента в случаях, когда выполняется интенсивная «математика», но новая модель от компании Nvidia, основанная на урезанном графическом процессоре GP104, почти достала своего соперника Radeon RX Vega 56, уступив тому 12% — это немало, но даже такой проигрыш можно считать неплохим результатом для новинки, с учетом специфики этого конкретного теста.
Если сравнивать новинку с соседними моделями компании в линейке, то GTX 1070 Ti в этом тесте получилась быстрее GTX 1070 на традиционные уже 28%, и все те же привычные для нашего материала 7% уступила старшей GTX 1080, что довольно близко и к теоретической разнице между всеми этими решениями на основе GP104.
***
Исходя из результатов синтетических тестов новой видеокарты Nvidia GeForce GTX 1070 Ti, основанной на урезанном графическом процессоре GP104, а также показателям производительности других моделей видеокарт от обоих производителей дискретных видеочипов, мы делаем вывод о том, что рассматриваемая нами сегодня видеокарта станет сильным конкурентом на рынке, а также одним из наиболее выгодных решений на рынке мощных игровых видеокарт в целом. Самое важное достижение новинки в том, что она совсем незначительно отстала от GeForce GTX 1080 (примерно на 5-7%, что соответствует теории) и была заметно быстрее GeForce GTX 1070.
А это значит, что конкурент для Radeon RX Vega 56 в играх должен получиться сильный, хотя сравнение решений AMD и Nvidia в синтетических тестах никогда простым не было. Видеокарта компании Nvidia показала хорошие результаты почти во всех синтетических тестах, уступив в некоторых из них своему конкуренту по объективным причинам. И хотя мы не раз наблюдали и проигрыши новинки в синтетике, по сравнению с недавно вышедшими на рынок платами Radeon, но тут нужно учитывать практику предыдущих тестов, которые показали, что не всю синтетику можно напрямую перенести на игры. В которых мы увидим соотношение результатов, не соответствующее каким-то одним типам синтетических тестов: чисто геометрических или сугубо математических.
Ведь у Radeon и GeForce разные сильные стороны, и хотя решения компании AMD традиционно отличаются эффективным исполнением интенсивных вычислительных задач, графические процессоры Nvidia весьма эффективно используют свои возможности в реальных играх и имеют достаточную скорость текстурирования и высокую скорость заполнения. Поэтому в игровых приложениях все будет несколько иначе, по сравнению с синтетическими тестами. GeForce GTX 1070 Ti должна показать в играх скорость чуть ниже уровня GeForce GTX 1080, что поставит ее на очень хорошую позицию, по сравнению с конкурирующей видеокартой Radeon RX Vega 56, против которой она и создавалась, собственно.
В следующей части нашего материала мы как раз и оценим производительность новой видеокарты Nvidia, созданной на основе слегка урезанного графического процессора GP104, по сравнению с ее конкурентом в игровых приложениях, протестировав GeForce GTX 1070 Ti в нашем наборе современных игр и сравнив показатели новинки с Radeon RX Vega 56.
Очевидно, что карта GTX 1070 Ti получена из карты GTX 1080, куда установлено ядро с немного урезанными блоками (а если вести отсчет от GTX 1070, то, наоборот, ядро усилено).
PCB этих карт абсолютно одинаковы.
Схема питания получила 5 фаз (dualFET), управляется цифровым контроллером NCP81022 производства On Semiconductor.
Система охлаждения
Референсная СО Nvidia имеет традиционную закрытую форму с цилиндрическим вентилятором на конце. Радиатор, прижимающийся к ядру, основан
на испарительной камере, внутри которой находится особая легкоиспаряемая жидкость. Нижняя пластина камеры прижимается
к ядру, тепло передается жидкости, которая испаряется и уносит тепло к верхней пластине (имеющей ребра охлаждения), где
пары конденсируются. Мы уже рассказывали о такой схеме современного охлаждения топовых ускорителей.
Вентилятор гонит воздух через вышеупомянутый радиатор и имеет особую форму крыльчатки, обеспечивающую пониженный уровень шума.
Микросхемы памяти и силовые транзисторы охлаждаются с помощью специальной пластины кулера. На оборотной стороне PCB установлена пластина, которая является, по сути, декорацией
и предохраняет заднюю часть от повреждений.
После 6-часового прогона под нагрузкой максимальная температура GPU не превысила 83 градусов, что
является нормальным и обычным результатом для топовых ускорителей. На торце СО имеется подсвечиваемый логотип ускорителя.
Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder)
Методика измерения шума
Помещение шумоизолировано и заглушено, снижены реверберации.
Системный блок, в котором исследовался шум видеокарт, не имеет вентиляторов, не является источником
механического шума.
Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера.
Измерения проводились на расстоянии 50 см от видеокарты на уровне системы охлаждения.
Режимы измерения:
Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов.
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой
промежуточных кадров.
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark.
Оценка градаций уровня шума выполняется по методике, описанной здесь:
28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при
долговременной работе. Оценка: шум низкий.
от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать
будет затруднительно. Оценка: шум средний.
40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.
В режиме простоя в 2D вентилятор работал на частоте 1100 оборотов в минуту, при этом температура графического ядра не поднималась выше 31 градуса, а уровень шума был немного выше
фонового и составлял 23,0 дБА.
При просмотре фильма с аппаратным декодированием температура графического ядра чуть вырастала (до 33 градусов), вентилятор работал на той же частоте вращения (1100 об/мин),
уровень шума не изменялся (23,0 дБА).
В режиме максимальной нагрузки в 3D температура достигала уровня 83 °C, частота вращения вентилятора поднималась до 2168 оборотов в минуту, шум вырастал до 38,7 дБА.
В результате шум СО под нагрузкой достаточно высокий, но не переходящий эргономических пределов. Стоит напомнить, что референсные кулеры будут встречаться на практике только в картах Founders Edition,
которые в основном можно купить на сайте компании Nvidia (партнеры такие карты обычно почти не пускают в продажу, только в первых партиях).
Термоснимок
Максимальный нагрев карты (не ядра) 73 градуса — на печатной плате с края под пластиной с обратной стороны.
Комплектация
Видеокарта попала к нам в ОЕМ-виде, без комплекта.
Синтетические тесты
Используемые нами пакеты синтетических тестов можно скачать здесь:
D3D RightMark Beta 4 (1050) с описанием на сайте 3d.rightmark.org.
D3D RightMark Pixel Shading 2 и D3D RightMark Pixel Shading 3 — тесты пиксельных шейдеров версий 2.0 и 3.0, ссылка.
Для анализа производительности новой модели видеокарты GeForce GTX 1070 Ti были выбраны именно эти решения Nvidia по очень простой причине, которую мы уже упоминали на прошлой странице. GeForce GTX 1070 Ti вклинивается в линейку видеокарт компании строго между моделей GeForce GTX 1080 и GTX 1070, основанных на таком же графическом процессоре GP104, но с разным количеством активных исполнительных блоков. Хотя новая видеокарта по мощности ближе к GeForce GTX 1080, но и сравнение с младшей GTX 1070 также будет интересным.
Выбрать конкурентов из стана соперников также было довольно просто. Компания AMD выпустила две модели видеокарт на основе графического процессора Vega 10, аналогичного GP104 по мощности: Radeon RX Vega 64 и Vega 56, и они примерно соответствуют уровню GeForce GTX 1080 и GTX 1070 Ti, как по цене, так и по производительности. Справедливости ради, еще раз отметим, что реальным соперником на рынке для представленной GTX 1070 Ti является именно младшая модель видеокарты компании AMD — Radeon RX Vega 56.
В DirectX 10-версию RightMark3D вошли два ранее знакомых нам теста PS 3.0 под Direct3D 9, которые были переписаны под DirectX 10, а также два дополнительных теста. В первую пару добавились возможности включения самозатенения и шейдерного суперсэмплинга, что дополнительно увеличивает нагрузку на видеочипы. Эти тесты измеряют производительность выполнения пиксельных шейдеров с циклами при большом количестве текстурных выборок (в самом тяжелом режиме до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере.
Первым тестом пиксельных шейдеров будет Fur. При самых низких настройках в нем используется от 15 до 30 текстурных выборок из карты высот и две выборки из основной текстуры. Режим Effect detail — «High» увеличивает количество выборок до 40—80, включение «шейдерного» суперсэмплинга — до 60—120 выборок, а режим «High» совместно с SSAA отличается максимальной «тяжестью» — от 160 до 320 выборок из карты высот.
Проверим сначала режимы без включенного суперсэмплинга, они относительно просты, и соотношение результатов в режимах «Low» и «High» должно быть примерно одинаковым.
Производительность в этом тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ. А в варианте без суперсэмплинга дополнительное влияние на производительность оказывает еще и эффективный филлрейт с пропускной способностью памяти. Результаты при детализации уровня «High» получаются чуть ниже, чем при детализации «Low».
В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD лидируют со времени выпуска первых видеочипов на базе архитектуры GCN, и именно различные модели Radeon являлись лучшими в этих сравнениях, что говорит о большей эффективности выполнения ими подобных программ. Это подтверждается и сегодня — хотя рассматриваемая нами видеокарта GeForce GTX 1070 Ti и практически не уступила GTX 1080, но с Radeon RX Vega 56 конкурировать не может, не говоря уже о более мощной модели на основе графического процессора Vega 10.
В первом нашем Direct3D 10-тесте новая видеоплата компании Nvidia оказалась всего на 1% медленнее старшей модели GeForce GTX 1080, основанной на полном чипе GP104, а отрыв от младшего решения GTX 1070 получился более чем в 20%, что хоть и меньше теоретической разницы, но все же весьма ощутимо. Посмотрим на результат этого же теста, но с включенным «шейдерным» суперсэмплингом, увеличивающим работу в четыре раза: в такой ситуации что-то должно измениться, и ПСП с филлрейтом будут влиять меньше:
В усложненных условиях результаты теста мало изменились, но став лишь чуть интереснее. Новая видеокарта модели GeForce GTX 1070 Ti опережает модель GTX 1070 даже несколько меньше, а вот от GTX 1080 она отстала уже на 7-8%, что хоть и близко к теоретическому отрыву в 5%, но все же больше его. GeForce GTX 1070 Ti в этом тесте все так же отстает от конкурирующих с ним видеокарт в виде Radeon RX Vega 56 и Vega 64, хотя в самом сложном режиме разница между урезанными GP104 от Nvidia и Vega 10 от AMD оказалась уже не такой большой, как раньше — около 20%.
Следующий DX10-тест измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок и называется Steep Parallax Mapping. При низких настройках он использует от 10 до 50 текстурных выборок из карты высот и три выборки из основных текстур. При включении тяжелого режима с самозатенением число выборок возрастает в два раза, а суперсэмплинг увеличивает это число в четыре раза. Наиболее сложный тестовый режим с суперсэмплингом и самозатенением выбирает от 80 до 400 текстурных значений, то есть в восемь раз больше по сравнению с простым режимом. Проверяем сначала простые варианты без суперсэмплинга:
Второй пиксель-шейдерный тест Direct3D 10 интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, а тяжелые варианты, вроде steep parallax mapping, давно используются во многих проектах, например в играх серий Crysis, Lost Planet и многих других. Кроме того, в нашем тесте, помимо суперсэмплинга, можно включить самозатенение, увеличивающее нагрузку на видеочип еще примерно в два раза — такой режим называется «High».
Диаграмма очень схожа с предыдущей, также без включения суперсэмплинга. В этот раз новая модель видеокарты GeForce GTX 1070 Ti оказалась лишь на 2% медленнее старшей сестры GTX 1080, опередив младшую модель GTX 1070 на привычные 20%. Если мы посмотрим на сравнение с видеокартами AMD, то в этом случае новинка все так же сильно отстает — младшая из плат Radeon, которая и является ее конкурентом, оказалась быстрее на 26-27%. Посмотрим, что изменит включение суперсэмплинга:
При включении суперсэмплинга и самозатенения задача становится тяжелее, совместное включение сразу двух опций увеличивает нагрузку на карты почти в восемь раз, вызывая серьезное падение производительности. Разница между скоростными показателями протестированных видеокарт немного изменилась, хотя включение суперсэмплинга и сказывается меньше, чем в предыдущем случае. Эти условия в наших сравнениях обычно существенно меняют соотношение сил, это же получилось и сегодня.
Хотя графические решения AMD Radeon в этом D3D10-тесте пиксельных шейдеров также работают несколько эффективнее конкурирующих плат GeForce, но новые видеокарты, основанные на чипах архитектуры Pascal, смогли показать достойные результаты. Так, новая модель GTX 1070 Ti уже практически не уступает Radeon RX Vega 56 в самых тяжелых условиях (разница составила 5%). По сравнению с другими решениями Nvidia, новая видеокарта показала скорость на 18-24% быстрее GeForce GTX 1070 и уступила старшей GTX 1080 около 4%, что соответствует теории.
Следующая пара тестов пиксельных шейдеров содержит минимальное количество текстурных выборок для снижения влияния производительности блоков TMU. В них используется большое количество арифметических операций, и измеряют они именно математическую производительность видеочипов, скорость выполнения арифметических инструкций в пиксельном шейдере.
Первый математический тест — Mineral. Это тест сложного процедурного текстурирования, в котором используются лишь две выборки из текстурных данных и 65 инструкций типа sin и cos.
Результаты предельных математических тестов чаще всего лишь примерно соответствуют разнице по частотам и количеству вычислительных блоков, на результаты влияет и разная эффективность их использования в конкретных задачах, и оптимизация драйверов, и новейшие системы управления частотами и питанием, а порой даже упор в ПСП.
В случае нашего теста Mineral, выпущенная сегодня в продажу GeForce GTX 1070 Ti показала неплохой результат на уровне GTX 1080, серьезно опередив младшую модель GTX 1070. Что касается плат от компании AMD, то главный соперник сегодняшней новинки в виде Radeon RX Vega 56 смог обойти видеокарту Nvidia более чем на 20% — в математических тестах графические процессоры AMD всегда сильны.
Рассмотрим второй тест шейдерных вычислений, который носит название Fire. Он тяжелее для ALU, и текстурная выборка в нем только одна, а количество инструкций типа sin и cos увеличено вдвое, до 130. Посмотрим, что изменилось при увеличении нагрузки:
Во втором математическом тесте из нашего RightMark мы видим почти такие же результаты, очень похожие на предыдущую диаграмму. Новая модель GeForce GTX 1070 Ti и в этот раз ничуть не отстала от GTX 1080 и оказалась на 24% быстрее своей младшей сестры GTX 1070, что близко к теоретической разнице между ними.
Если сравнивать урезанный GP104 архитектуры Pascal с решениями AMD, то обе видеокарты Radeon показывают лучшие результаты, так как графические процессоры этой компании весьма сильны именно в математических тестах, хотя с выпуском решений архитектуры Pascal компания Nvidia и улучшила свои позиции, в том числе и по математической производительности, но GeForce GTX 1070 Ti этого не хватило для того, чтобы достать Vega 56 — последняя хоть и не так сильно (на 13%), но быстрее.
Direct3D 10: тесты геометрических шейдеров
В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, первый вариант носит название «Galaxy», техника аналогична «point sprites» из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Аналогичные алгоритмы должны получить широкое использование в будущих играх под DirectX 10.
Изменение балансировки в тестах геометрических шейдеров не влияет на конечный результат рендеринга, итоговая картинка всегда абсолютно одинакова, изменяются лишь способы обработки сцены. Параметр «GS load» определяет, в каком из шейдеров производятся вычисления — в вершинном или геометрическом. Количество вычислений всегда одинаково.
Рассмотрим первый вариант теста «Galaxy», с вычислениями в вершинном шейдере, для трех уровней геометрической сложности:
Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек, с каждым шагом падение FPS близкое к двукратному. Задача эта для мощных современных видеокарт довольно простая, и производительность в ней ограничена скоростью обработки геометрии, а иногда и пропускной способностью памяти и/или филлрейтом.
Разница между результатами видеокарт на чипах Nvidia и AMD тут не слишком большая, но она в пользу решений калифорнийской компании. Вероятно, это обусловлено отличиями в геометрических конвейерах чипов этих компаний. В тестах геометрии платы GeForce всегда были конкурентоспособнее Radeon, и хотя последние подтянулись с выпуском Vega, но даже не топовый GP104 до сих пор имеет большее количество блоков по обработке геометрии и выигрывает у своих конкурентов.
Новая модель GeForce GTX 1070 Ti обогнала свою младшую сестру GTX 1070 на основе еще более урезанной GP104 во всех условиях на 7-11%, а от старшей платы GTX 1080 заметно отстала лишь в самом сложном режиме. Видеокарты Radeon в этом тесте показывают результаты несколько хуже. Прямой конкурент в виде Radeon RX Vega 56 на основе самого мощного GPU компании AMD уступил до 24% в сложных условиях, да и Vega 64 также проиграла новинке (в легком режиме скорость чем-то ограничена). Посмотрим, как изменится ситуация при переносе части вычислений в геометрический шейдер:
При изменении нагрузки цифры в этом тесте изменились незначительно, и для плат AMD и для решений Nvidia. Видеокарты в этом тесте геометрических шейдеров слабо реагируют на изменение параметра GS load, отвечающего за перенос части вычислений в геометрический шейдер, поэтому и наши выводы остаются неизменными. GeForce GTX 1070 Ti и в этом подтесте показала сильный результат, обогнав конкурентов от AMD в тяжелых и средних условиях, и почти не отстав от GeForce GTX 1080, что соответствует теории.
К сожалению, «Hyperlight» — второй тест геометрических шейдеров, демонстрирующий использование сразу нескольких техник: instancing, stream output, buffer load, в котором используется динамическое создание геометрии при помощи отрисовки в два буфера, а также новая возможность Direct3D 10 — stream output, на всех современных видеокартах компании AMD не работает. Этот тест давно перестал запускаться на платах этой компании, и ошибка не исправлена вот уже несколько лет. Так что рассматриваем в этом тесте только результаты видеокарт Nvidia:
На этой диаграмме мы видим несколько иные относительные результаты, по сравнению с тестом Galaxy, тут есть явные отличия. Новая видеоплата компании Nvidia, основанная на урезанном чипе GP104, хоть и оказалась быстрее младшей модели GeForce GTX 1070 примерно на 10%, но и от более мощной модификации на том же GPU она отстала на 6-8%, особенно в сложных условиях. Эта разница явно больше теоретической. Возможно, тут сказывается упор в пропускную способность памяти. Посмотрим, изменится ли что-то в тяжелом режиме:
В таких условиях результаты видеокарт GeForce явно поменялись, но сегодняшняя новинка относительно своих сестер положение не изменила. GeForce GTX 1070 Ti обогнала GTX 1070 на 11-15%, уступив старшей модели до 8%, что многовато, так как по текстурной и шейдерной производительности разница должна быть меньшей. Впрочем, вывод в любом случае такой — в тестах на основе геометрических шейдеров новинка показала себя очень хорошо, особенно по сравнению с конкурентами от AMD.
Direct3D 10: скорость выборки текстур из вершинных шейдеров
В тестах «Vertex Texture Fetch» измеряется скорость большого количества текстурных выборок из вершинного шейдера. Тесты схожи, по сути, так что соотношение между результатами карт в тестах «Earth» и «Waves» должно быть примерно одинаковым. В обоих тестах используется displacement mapping на основании данных текстурных выборок, единственное существенное отличие состоит в том, что в тесте «Waves» используются условные переходы, а в «Earth» — нет.
Рассмотрим первый тест «Earth», сначала в режиме «Effect detail Low»:
Наши предыдущие исследования показали, что на результаты этого теста может влиять филлрейт или пропускная способность памяти, ограничивающие производительность, что всегда хорошо заметно по результатам плат Nvidia в простых режимах. Новая видеокарта GeForce GTX 1070 Ti в этом тесте показывает скорость на уровне старшей модели на том же графическом процессоре, ведь все они имеют одинаковую скорость заполнения сцены. GeForce GTX 1070 отстала от новинки на 17-18%, что чуть ниже теоретической разницы.
Обе платы компании AMD на базе видеочипа Vega 10 в этот раз оказались весьма сильны, и они не просто достали до рассматриваемой сегодня модели GeForce, но и опередили ее с запасом — только в самых сложных условиях разница между GTX 1070 Ti и Vega 56 оказалась 11%, в других условиях она была до 30%. Посмотрим на производительность представленных в сравнении видеокарт в этом же тесте, но с увеличенным количеством текстурных выборок:
Ситуация на диаграмме заметно изменилась, решения компании AMD в тяжелых режимах потеряли значительно больше плат GeForce. Хотя в самом легком режиме они продолжают отлично выступать, опережая в том числе новое решение на основе урезанного чипа GP104, но в сложных условиях модель GeForce GTX 1070 Ti показала уже более высокую скорость. Она на 15-19% быстрее GTX 1070 и все так же отстает до 8% от полноценного GP104. Если сравнивать новинку с парой Radeon, то она явно проигрывает платам AMD в легком и среднем режимах, а вот в тяжелом одерживает победу, обогнав конкурента на весомые 20%.
Рассмотрим результаты второго теста текстурных выборок из вершинных шейдеров. Тест «Waves» отличается меньшим количеством выборок, зато в нем используются условные переходы. Количество билинейных текстурных выборок в данном случае до 14 («Effect detail Low») или до 24 («Effect detail High») на каждую вершину. Сложность геометрии изменяется аналогично предыдущему тесту.
Результаты во втором тесте вершинного текстурирования «Waves» похожи на то, что мы видели на предыдущих диаграммах, но скоростные показатели всех GeForce в этом тесте несколько ниже. Производительности новой модели GeForce GTX 1070 Ti хватает для того, чтобы показать результат лучше GTX 1070 на 10-16% и не отстать от GTX 1080 более чем на 6% (и то не всегда), а вот решения конкурента тут явно быстрее. Radeon RX Vega 56 впереди в легком режиме на 25%, и на 8% — в тяжелом. Рассмотрим второй вариант этой же задачи:
С усложнением условий во втором тесте текстурных выборок скорость всех решений стала ниже, но пострадали все видеокарты, поэтому выводы меняются мало. Новая модель GeForce GTX 1070 Ti на 7-14% быстрее своей младшей сестры GTX 1070, но совсем не отстает от более мощного варианта на том же GPU. Если сравнивать новинку с неплохо выступившими в этих тестах Radeon, то прямой конкурент от AMD всегда быстрее GTX 1070 Ti, пусть разница между ними и сокращается с 20% в легких условиях сразу до 6% в тяжелых.
3DMark Vantage: тесты Feature
Синтетические тесты из пакета 3DMark Vantage могут открыть нам то, что мы ранее упустили. Feature тесты из этого тестового пакета обладают поддержкой DirectX 10, до сих пор актуальны и интересны тем, что отличаются от наших. При анализе результатов новейшей видеокарты GeForce GTX 1070 Ti в этом пакете мы сделаем какие-то новые и полезные выводы, ускользнувшие от нас в тестах из пакетов семейства RightMark.
Feature Test 1: Texture Fill
Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.
Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark достаточно высока, и итоговые цифры разных моделей близки к соответствующим теоретическим параметрам. Разница в скорости между GeForce GTX 1070 Ti и GTX 1080 точно соответствует теории — 5% в пользу более мощного решения. Младший же вариант видеокарты на основе еще больше урезанного GP104 отстал от новинки почти на треть, и эта разница также соответствует теоретической по скорости текстурирования.
Что касается сравнения скорости текстурирования новой видеоплаты Nvidia с конкурирующими с ней решениями конкурента, то и тут новинка отстала от обеих видеокарт AMD. Решения этой компании AMD с текстурированием справляются весьма неплохо. Прямой соперник новинки Radeon RX Vega 56, имеющий немало блоков TMU, обошел GTX 1070 Ti на 12%, а старший GPU оказался еще быстрее.
Feature Test 2: Color Fill
Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне своевременным.
Цифры из второго подтеста 3DMark Vantage показывают производительность блоков ROP, без учета величины пропускной способности видеопамяти (т. н. «эффективный филлрейт»), и тест обычно измеряет именно производительность ROP. Рассматриваемая нами сегодня плата GeForce GTX 1070 Ti снова опередила младшую модель GTX 1070 более чем на четверть, отстав от старшей GTX 1080 на 7% — немного непонятно, почему получилась такая разница между ними в тесте, который должен показывать разницу в филлрейте (скорости блоков ROP).
Если сравнивать скорость заполнения сцены новой видеокартой GeForce GTX 1070 Ti с взятыми нами в тест решениями компании AMD, то рассматриваемая сегодня плата в этой задаче показала скорость на уровне старшей Radeon RX Vega 64, а ее прямой конкурент в виде Vega 56 отстает от новинки на 12%. На результатах явно сказывается и разное количество блоков ROP у этих плат и разная эффективность оптимизаций при сжатии ими данных во фреймбуфере.
Feature Test 3: Parallax Occlusion Mapping
Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.
Этот тест из пакета 3DMark Vantage отличается от проанализированных нами ранее тем, что результаты в нем зависят не исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров.
В этой «синтетике» из 3DMark Vantage, когда важны и математическая и текстурная производительность, новая плата GeForce GTX 1070 Ti снова показала очень неплохой результат, оказавшись на 27% быстрее младшей модели на том же графическом процессоре GP104, что полностью соответствует теории. Старшая же модель GTX 1080 была быстрее на те же 7%. Что еще более приятно, новая плата от Nvidia показала в этом тесте результат на 3% лучше, чем RX Vega 56, хотя Radeon в этом тесте обычно были весьма сильны.
Feature Test 4: GPU Cloth
Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.
Скорость рендеринга в этом тесте также зависит сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. То есть, сильные стороны чипов Nvidia должны проявляться, но мы всегда отмечали странные результаты GeForce в этом тесте, в котором очередная новая видеокарта компании показала все ту же низкую скорость на уровне своих ближайших родственниц, младшей и старшей.
Неудивительно, что в таких условиях сравнение с платами Radeon в этом тесте для GeForce GTX 1070 Ti получилось не очень радостным. Несмотря на теоретическое отставание по геометрической производительности у чипов AMD, по сравнению с конкурирующими решениями, платы Radeon в этом тесте работают весьма эффективно, заметно обгоняя все видеокарты GeForce, представленные в нашем сравнении. Что-то на видеокартах Nvidia не работает так, как должно, и двукратного проигрыша просто быть не может даже в теории.
Feature Test 5: GPU Particles
Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи видеочипа. Также используется вершинная симуляция, каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот.
Аналогично одному из тестов нашего RightMark3D 2.0, частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Но тест больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.
Во втором «геометрическом» тесте из 3DMark Vantage ситуация сильно отличается от предыдущей диаграммы. В этот раз новая GeForce GTX 1070 Ti показывает результат, лишь на 4-7% меньше сразу трех видеокарт сравнения, имеющих близкие результаты. Новая плата Nvidia в этот раз на 9% опередила младшую модель GeForce GTX 1070, стоящей на ступень ниже, но отстала от остальных. Сравнение новинки от компании Nvidia с конкурирующими видеокартами AMD в этот раз показало ее отставание на 4% от прямого соперника — Radeon RX Vega 64.
Feature Test 6: Perlin Noise
Последний feature-тест пакета Vantage является математически-интенсивным тестом для GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.
В этом математическом тесте производительность решений хоть и не полностью соответствует теории, но близка к тому, что должно быть, исходя из пиковых показателей. В математическом тесте из пакета компании Futuremark, показывающем пиковую производительность видеочипов в предельных задачах, мы видим распределение результатов, несколько отличающееся от того, что мы получили в схожих тестах нашего пакета RightMark.
Хорошо видно, что видеочипы компании AMD с архитектурой GCN справляются с подобными задачами явно лучше решений конкурента в случаях, когда выполняется интенсивная «математика», но новая модель от компании Nvidia, основанная на урезанном графическом процессоре GP104, почти достала своего соперника Radeon RX Vega 56, уступив тому 12% — это немало, но даже такой проигрыш можно считать неплохим результатом для новинки, с учетом специфики этого конкретного теста.
Если сравнивать новинку с соседними моделями компании в линейке, то GTX 1070 Ti в этом тесте получилась быстрее GTX 1070 на традиционные уже 28%, и все те же привычные для нашего материала 7% уступила старшей GTX 1080, что довольно близко и к теоретической разнице между всеми этими решениями на основе GP104.
***
Исходя из результатов синтетических тестов новой видеокарты Nvidia GeForce GTX 1070 Ti, основанной на урезанном графическом процессоре GP104, а также показателям производительности других моделей видеокарт от обоих производителей дискретных видеочипов, мы делаем вывод о том, что рассматриваемая нами сегодня видеокарта станет сильным конкурентом на рынке, а также одним из наиболее выгодных решений на рынке мощных игровых видеокарт в целом. Самое важное достижение новинки в том, что она совсем незначительно отстала от GeForce GTX 1080 (примерно на 5-7%, что соответствует теории) и была заметно быстрее GeForce GTX 1070.
А это значит, что конкурент для Radeon RX Vega 56 в играх должен получиться сильный, хотя сравнение решений AMD и Nvidia в синтетических тестах никогда простым не было. Видеокарта компании Nvidia показала хорошие результаты почти во всех синтетических тестах, уступив в некоторых из них своему конкуренту по объективным причинам. И хотя мы не раз наблюдали и проигрыши новинки в синтетике, по сравнению с недавно вышедшими на рынок платами Radeon, но тут нужно учитывать практику предыдущих тестов, которые показали, что не всю синтетику можно напрямую перенести на игры. В которых мы увидим соотношение результатов, не соответствующее каким-то одним типам синтетических тестов: чисто геометрических или сугубо математических.
Ведь у Radeon и GeForce разные сильные стороны, и хотя решения компании AMD традиционно отличаются эффективным исполнением интенсивных вычислительных задач, графические процессоры Nvidia весьма эффективно используют свои возможности в реальных играх и имеют достаточную скорость текстурирования и высокую скорость заполнения. Поэтому в игровых приложениях все будет несколько иначе, по сравнению с синтетическими тестами. GeForce GTX 1070 Ti должна показать в играх скорость чуть ниже уровня GeForce GTX 1080, что поставит ее на очень хорошую позицию, по сравнению с конкурирующей видеокартой Radeon RX Vega 56, против которой она и создавалась, собственно.
В следующей части нашего материала мы как раз и оценим производительность новой видеокарты Nvidia, созданной на основе слегка урезанного графического процессора GP104, по сравнению с ее конкурентом в игровых приложениях, протестировав GeForce GTX 1070 Ti в нашем наборе современных игр и сравнив показатели новинки с Radeon RX Vega 56.