Обзор видеоускорителя Nvidia GeForce GTX 1660Ti: новая «промежуточная» линейка на Turing, но без технологий GeForce RTX

Справочные материалы:

Теоретическая часть: особенности архитектуры

Выход видеокарт Nvidia, основанных на графической архитектуре Turing, стал важной вехой для 3D-графики реального времени. Первые решения линейки GeForce RTX были представлены компанией еще осенью, и постепенно Nvidia выпустила несколько моделей, предназначенных для разных ценовых диапазонов: GeForce RTX 2080 Ti, GeForce RTX 2080, GeForce RTX 2070 и GeForce RTX 2060.

Самое важное нововведение в GPU этого семейства — специализированные блоки для аппаратного ускорения трассировки лучей, позволяющие использовать физически корректный расчет распространения лучей света, в отличие от растеризации, лишь имитирующей их поведение. В GeForce RTX мы увидели первую массовую реализацию технологии, которая уже используется в двух играх: Battlefield V — для рендеринга реалистичных отражений, и Metro Exodus, где трассировка лучей применяется для расчета глобального освещения и затенения. Второй важной функциональностью Turing стало добавление еще одного типа вычислительных блоков — тензорных ядер, которые быстро справляются с алгоритмами глубокого обучения, что также уже применяется в играх в виде DLSS.

Специалисты Nvidia решили внедрить специализированные блоки для этих задач в Turing, что может серьезно сказаться на всем дальнейшем развитии графики в целом, но включение этих весьма сложных блоков дополнительно к уже имеющимся, при отсутствии серьезного прогресса в микроэлектронном производстве (используемый новинками техпроцесс 12 нм по своим характеристикам лишь чуть лучше 16-нанометрового), привело к увеличению размера кристаллов новых GPU, которые получились весьма крупными и дорогостоящими в производстве, что сказалось и на розничных ценах.

В феврале пришло время и для менее дорогих GPU новой архитектуры. Графический процессор TU116 стал первым среди бюджетного подсемейства Turing, который предназначен для решений с ценами ниже $300, и первой видеокартой на основе этого чипа стала модель GeForce GTX 1660 Ti, предлагаемая по цене $279. При подготовке среднебюджетных решений семейства Turing возможность оставить в них RT-ядра и тензорные ядра была лишь теоретической — уж слишком сильно они усложняют чипы. Задолго до выхода GPU этого уровня распространялись слухи о том, что они лишатся специализированных блоков для аппаратного ускорения трассировки лучей и глубокого обучения, так и получилось в итоге: модель GeForce GTX 1660 Ti вышла с приставкой GTX, а не RTX, и этот GPU не включает в себя RT-ядра и тензорные ядра, с которыми мы познакомились в предыдущих решениях семейства.

Оно и неудивительно, ведь в сильно ограниченном транзисторном бюджете этой ценовой категории было бы невозможно предложить достаточный уровень производительности таких блоков, так как даже GeForce RTX 2060 с трудом справляется с этими задачами, и не в самых высоких разрешениях. А добавление тех же RT-ядер к GPU не имеет смысла без соответствующего уровня производительности обычных CUDA-ядер. С тензорными ядрами вопрос сложнее, и мы его подробно рассмотрим далее. В любом случае, факт в том, что GeForce GTX 1660 Ti не имеет поддержки аппаратного ускорения трассировки лучей и глубокого обучения и фокусируется на достижении максимально возможной производительности в существующих играх в рамках транзисторного бюджета.

В архитектуре Turing инженеры компании Nvidia внедрили и множество других улучшений по сравнению с архитектурой Pascal: одновременное исполнение операций с плавающей запятой FP32 и целочисленных INT32, значительно измененную и улучшенную систему кэширования данных и несколько новых технологий рендеринга: программируемый конвейер обработки геометрии, переменную частоту затенения, затенение в текстурном пространстве, поддержку последних версий технологий DirectX 12, относящихся к уровню возможностей Feature Level 12_1.

Благодаря всем улучшениям мультипроцессоров Turing, по производительности и энергоэффективности видеокарта на базе TU116 превосходит аналогичные GPU из предыдущих семейств. Новый GPU особенно хорош в современных играх, использующих сложные шейдеры. Модель GeForce GTX 1660 Ti в среднем в 2-3 раза быстрее GeForce GTX 960 и до полутора раз быстрее GeForce GTX 1060 6GB в самых требовательных играх последнего времени.

Да и в сверхпопулярных многопользовательских проектах, таких как PUBG, Apex Legends, Fortnite и Call of Duty Black Ops 4, новый GPU позволяет получить 120 FPS и более при высоких настройках качества в Full HD-разрешении. Это довольно важно для динамичных сетевых шутеров, тогда как на видеокартах уровня GeForce GTX 960 игроки получают в тех же условиях лишь 50-60 FPS. А для таких игр высокая частота кадров довольно важна, ведь привычная мерка в 60 FPS в них не является пределом мечтаний — при подключении мониторов с частотой обновления 120-144 Гц удвоенный прирост плавности может принести и повышенную эффективность в сражениях.

В общем, GeForce GTX 1660 Ti за его цену даже чисто на бумаге выглядит весьма интересным решением для обновления видеоподсистемы у тех игроков, кто еще не сделал апгрейда на Pascal. На сегодняшний день почти две трети (64%) игроков имеют видеокарты уровня GeForce GTX 960 или ниже, а новинка предлагает уровень производительности вдвое-втрое выше этого устаревшего GPU практически во всех играх и поэтому довольно привлекательна для апгрейда.

Так как рассматриваемая модель видеокарты компании Nvidia основана на графическом процессоре архитектуры Turing, также имеющей много общего и с предыдущими архитектурами Pascal и Volta, то перед прочтением материала мы советуем ознакомиться с нашими предыдущими статьями:

[26.11.18] Nvidia GeForce RTX 2070 — третий по скорости ускоритель нового поколения
[08.10.18] Обзор новинки 3D-графики 2018 года — Nvidia GeForce RTX 2080
[19.09.18] Nvidia GeForce RTX 2080 Ti — обзор флагмана 3D-графики 2018 года
[14.09.18] Игровые видеокарты Nvidia GeForce RTX — первые мысли и впечатления
[06.06.17] Nvidia Volta — новая вычислительная архитектура
[09.03.17] GeForce GTX 1080 Ti — новый король игровой 3D-графики

Графический ускоритель GeForce GTX 1660 Ti
Кодовое имя чипа	TU116
Технология производства	12 нм FinFET
Количество транзисторов	6,6 млрд (у GP106 — 4,4 млрд)
Площадь ядра	284 мм² (у GP106 — 200 мм²)
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти	192-битная: 6 независимых 32-битных контроллеров памяти с поддержкой памяти типов GDDR5 и GDDR6
Частота графического процессора	1500 (1770) МГц
Вычислительные блоки	24 потоковых мультипроцессора, включающих 1536 CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32
Блоки текстурирования	96 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	6 широких блоков ROP (48 пикселей) с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка подключения по интерфейсам HDMI 2.0b и DisplayPort 1.4a

Спецификации референсной видеокарты GeForce GTX 1660 Ti
Частота ядра	1500 (1770) МГц
Количество универсальных процессоров	1536
Количество текстурных блоков	96
Количество блоков блендинга	48
Эффективная частота памяти	12 ГГц
Тип памяти	GDDR6
Шина памяти	192-бит
Объем памяти	6 ГБ
Пропускная способность памяти	288 ГБ/с
Вычислительная производительность (FP16/FP32)	11,0/5,5 терафлопс
Теоретическая максимальная скорость закраски	85 гигапикселей/с
Теоретическая скорость выборки текстур	170 гигатекселей/с
Шина	PCI Express 3.0
Разъемы	в зависимости от видеокарты
Энергопотребление	до 120 Вт
Дополнительное питание	один 8-контактный разъем
Число слотов, занимаемых в системном корпусе	2
Рекомендуемая цена	$279 (22 990 рублей)

Рассматриваемая сегодня модель открывает новое семейство видеокарт — серию GeForce GTX 16, которая отличается от серии GeForce RTX 20 и суффиксом, и численными значениями серии. Если с заменой RTX на GTX все понятно (карты GTX не имеют поддержки технологий, которые есть у RTX), то меньшее значение для серии выглядит немного странно — видимо, в Nvidia решили не давать этим картам серию 20, чтобы сильнее разделить серии из маркетинговых соображений. А вот почему было выбрано именно число 16 — не очень понятно (кроме очевидного факта, что оно между 10 и 20). Почему не 15, например?

Интересно, что видеокарта GTX 1660 Ti не имеет публичного референсного варианта, равно как и Founders Edition. Партнеры компании делают собственные дизайны карт на основе внутреннего эталонного дизайна карты Nvidia, и в этом случае мы сразу же увидели в продаже множество вариантов карт с различными характеристиками и системами охлаждения. Кстати, с большой долей вероятности можно предположить, что на основе урезанной версии чипа TU116 у Nvidia в скором времени выйдут и другие решения семейства GTX 16, как бывало ранее.

GeForce GTX 1660 Ti поступила в продажу по цене от $279, то есть на $30 дороже GTX 1060 6GB, которую она и заменяет в линейке компании. Конечно же, это дешевле, чем $349 за RTX 2060, но такое решение снова выглядит как повышение цен на GPU определенного ценового диапазона. Если в случае с RTX оно было оправдано новыми технологиями, то в случае с GTX 1660 Ti это просто повышение цены для среднебюджетного GPU. Что еще более странно с учетом того, что новинка является прямой заменой для GTX 1060 6GB. Те, правда, уже почти все распроданы и не будут мешать продажам новой видеокарты.

Вероятно, выставленная цена имеет некоторое отношение к цене прямого конкурента новинки — не так давно вышедшей видеокарты AMD семейства Polaris, Radeon RX 590, поступившей в продажу изначально за те же деньги. Конкурент из этой Radeon для новой GeForce получается так себе, и ему помогает разве что снижение цены, ведь по производительности GTX 1660 Ti должна быть ближе к более дорогой Radeon RX Vega 56. Кстати, некоторое время партнеры AMD даже продавали эту видеокарту за примерно такие же деньги, но это была разовая акция и далеко не во всех странах, так что мы продолжаем считать прямым конкурентом новинки именно RX 590.

В новом GPU инженеры решили использовать проверенную временем 192-битную шину памяти, которая ограничивает возможные варианты объема видеопамяти значениями 6 ГБ или 12 ГБ. Второй вариант крутоват для модели этого ценового сегмента, особенно учитывая дорогую GDDR6-память, поэтому пришлось ограничиться 6 ГБ. Как и в случае RTX 2060, это кажется компромиссным решением, хотелось бы иметь 8 ГБ. Впрочем, в реальном применении в течение актуального жизненного цикла GPU, с учетом того, что он рассчитан на разрешение Full HD, случаи с жесткой нехваткой видеопамяти вряд ли будут возникать слишком часто.

Еще одной важной характеристикой любого GPU является потребление энергии, и тут Nvidia смогла вместить GTX 1660 Ti в тот же теплопакет 120 Вт, что и GTX 1060 6GB. Видимо, за это во многом стоит поблагодарить отказ от технологий RTX, так как старшие чипы Turing потребляют больше энергии, чем их предшественники из семейства Pascal.

GeForce GTX 1660 Ti вышла в продажу еще 22 февраля и партнеры компании Nvidia сразу предложили широкий набор различных модификаций этой видеокарты на основе их собственного дизайна, включая фабрично разогнанные варианты с самыми разными системами охлаждения, имеющими от одного до трех вентиляторов:

Типичная видеокарта модели GeForce GTX 1660 Ti довольствуется одним 8-контактным разъемом дополнительного питания PCI Express, а вот количество и тип разъемов вывода информации на дисплеи зависит исключительно от конкретной карты. Сам по себе GPU поддерживает все те же разъемы и стандарты DVI, HDMI, DisplayPort и VirtualLink, что и более мощные решения семейства Turing.

Архитектурные особенности

Главное, что отличает TU116 от чипов TU10x с архитектурной точки зрения — отсутствие самой интересной части функциональности, появившейся именно в чипах семейства Turing. Из нового среднебюджетного GPU были убраны аппаратные блоки для ускорения трассировки лучей и тензорные ядра — все для того, чтобы недорогой графический процессор был не слишком сложным и лучше делал свое основное дело — традиционный рендеринг привычным методом растеризации.

С площадью кристалла в 284 мм² чип TU116 получился значительно меньше самого слабого из представленных ранее чипов семейства Turing — TU106. Естественно, и количество транзисторов уменьшилось с 10,8 млрд до 6,6 млрд, что очень серьезно снижает себестоимость производства, очень важную для среднебюджетных графических процессоров. Но если сравнивать TU116 с GP106, то новый GPU примерно настолько же больше него по размеру (200 мм² у GP106), так что изменения в мультипроцессорах Turing тоже не обошлись даром.

По доступным публике данным не слишком просто понять, насколько велик вклад именно RT-ядер и тензорных ядер в сложность старших чипов Turing, так как TU116 имеет меньшее количество мультипроцессоров и других блоков по сравнению с TU106 и напрямую их сравнить не получится. Но давайте все же рассмотрим характеристики нескольких моделей видеокарт Nvidia из двух последних поколений, близких друг к другу по цене:

	GTX 1660 Ti	RTX 2060	GTX 1060
Кодовое имя GPU	TU116	TU106	GP106
Кол-во транзисторов, млрд	6,6	10,8	4,4
Площадь кристалла, мм²	284	445	200
Базовая частота, МГц	1500	1365	1506
Турбо-частота, МГц	1770	1680	1708
CUDA-ядра, шт	1536	1920	1280
Производительность FP32, TFLOPS	5,5	6,5	4,4
Тензорные ядра, шт.	0	240	0
RT-ядра, шт.	0	30	0
Блоки ROP, шт.	48	48	48
Блоки TMU, шт.	96	120	80
Объем видеопамяти, ГБ	6	6	6
Шина памяти, бит	192	192	192
Тип памяти	GDDR6	GDDR6	GDDR5
Частота памяти, ГГц	12	14	8
ПСП памяти, ГБ/с	288	336	192
Энергопотребление TDP, Вт	120	160	120
Рекомендованная цена, $	279	349	249(299)

TU116 имеет ту же архитектуру мультипроцессоров, что и видеокарты семейства GeForce RTX, за исключением RT-ядер и тензорных ядер (некоторые подробности будут ниже), так что сравнивать с RTX 2060 новинку можно. В модели GTX 1660 Ti применяется полный чип TU116, и количество мультипроцессоров в нем было сокращено до 24 по сравнению с TU106. Кроме этого, немного снизили частоту GDDR6-памяти с 14 ГГц до 12 ГГц, оставив 192-битную шину. В остальном же эти чипы вполне сравнимы — и в теории, и на практике. Как бы компенсируя меньшее количество исполнительных блоков, GTX 1660 Ti получила чуть большую тактовую частоту, хотя эта разница особой роли не играет.

Если сравнивать по пиковым показателям, то GTX 1660 Ti получился даже чуть быстрее RTX 2060 по филлрейту — из-за одинакового количества блоков ROP и чуть повышенной частоты, а вот по более важным показателям математической и текстурной производительности новинка обеспечивает где-то около 85% производительности старшей RTX 2060. Впрочем, по сравнению с GTX 1060 6GB новая видеокарта минимум на четверть быстрее ее по этим же показателям, по ПСП вообще наполовину, а вот преимущество по филлрейту почти отсутствует. То есть, GTX 1660 Ti должна быть по скорости где-то между этими двумя моделями и близко к уровню еще одной — GTX 1070.

Полная версия чипа TU116 в модификации для GTX 1660 Ti содержит три кластера Graphics Processing Cluster (GPC), и в каждом из них — по четыре кластера Texture Processing Cluster (TPC), состоящих из движков PolyMorph Engine и пары мультипроцессоров SM. В свою очередь, каждый SM состоит из: 64 CUDA-ядер и четырех блоков текстурирования TMU. То есть, всего TU116 содержит 1536 CUDA-ядер в 24 мультипроцессорах. Подсистема памяти состоит из шести 32-битных контроллеров памяти, что дает нам в целом 192-битную шину.

Что касается тактовых частот графического процессора, то базовая частота чипа GeForce GTX 1660 Ti равна 1500 МГц, а турбо-частота достигает 1770 МГц. Как обычно для решений Nvidia, это не максимальная частота, а средняя для нескольких игр и приложений. Реальная частота в каждом случае будет отличаться, так как она зависит как от игры, так и от условий конкретной системы (питания, температура и т. п.). Видеопамять стандарта GDDR6 работает на частоте 12 ГГц, что дает нам очень высокую для среднебюджетного сегмента пропускную способность в 288 ГБ/с.

Кроме отрезания функциональности RTX, TU116 ничем не хуже своих старших братьев — в остальном по своим возможностям он полностью соответствует чипам TU10x, архитектура мультипроцессоров в целом одинакова. И с программной точки зрения, GTX 1660 Ti ничем не отличается от решений GeForce RTX, кроме поддержки аппаратной трассировки лучей и ускорения задач глубокого обучения при помощи тензорных ядер — эти задачи тоже будут выполняться, просто со значительно меньшей скоростью.

Мультипроцессор в TU116 почти идентичен блокам SM, которые мы видели в старших чипах Turing. Он состоит из четырех разделов и имеет свои текстурные блоки и кэш-память первого уровня. Даже размеры кэшей и регистрового файла в мультипроцессорах не изменились. А вот что изменилось в TU116 по сравнению со старшими чипами семейства, так это объем кэш-памяти второго уровня вне мультипроцессоров. Если старшие чипы Turing имеют по 512 КБ L2-кэша на раздел ROP (и у TU106 всего получается 4 МБ), то TU116 ограничен лишь 256 КБ L2-кэша (1,5 МБ на чип).

Структура нового дизайна мультипроцессоров SM отличается от того, что было в Pascal. Мультипроцессор Turing разделен на четыре раздела — каждый с собственным блоком планирования и распределения (warp scheduler and dispatch unit), и способен выполнять по 32 потока за такт. В разделах есть несколько типов исполнительных блоков: 16 ядер FP32, 16 ядер INT32 и 32 ядра для исполнения операций с FP16 точностью. Самое важное отличие заключается в том, что обработкой целочисленных операций и операций с плавающей запятой теперь занимаются разные блоки, а операции со сниженной точностью FP16 выполняются вдвое быстрее, чем FP32.

И это повышает эффективность загрузки блоков GPU. Приведем пример шейдеров из игры Shadow of the Tomb Raider, в которых на каждые 100 инструкций приходится в среднем 38 инструкций INT32 и 62 FP32. Все предыдущие архитектуры Nvidia, включая Pascal, выполняют их последовательно одна за другой, а Turing умеет параллельно выполнять INT и FP, так как в SM появились дополнительные блоки для исполнения целочисленных операций.

Одновременное исполнение FP- и INT-операций обеспечивает более эффективное исполнение шейдеров, и в сложных случаях прирост получается в полтора раза и более. В частности, общая производительность рендеринга GeForce GTX 1660 Ti в игре Shadow of the Tomb Raider примерно в полтора раза выше, чем у GTX 1060 6GB, хотя это связано не только с указанной модификацией, конечно же.

Также в Turing была значительно улучшена система кэширования — внедрена унифицированная архитектура для разделяемой памяти и кэшей: первого уровня и текстурного. Новая система кэширования имеет вдвое больше блоков загрузки-выгрузки данных (Load-Store Unit — LSU), шире линии передачи данных в кэш-память и обратно (32-бита против 16-бит) и большее их количество, а также втрое больший объем L1-кэша по сравнению с аналогичным GPU из семейства Pascal (GeForce GTX 1060).

Новый дизайн системы кэширования значительно увеличил эффективность кэширования данных и позволяет переконфигурировать размер кэша тогда, когда программистом не используется полный объем разделяемой памяти. L1-кэш может быть объемом 64 КБ, в дополнение к 32 КБ разделяемой памяти на каждый мультипроцессор, или наоборот, можно снизить объем L1-кэша до 32 КБ, оставив 64 КБ на разделяемую память.

Одной из игр, получающих преимущество от улучшений кэширования в Turing, стала Call of Duty Black Ops 4. По результатам внутренних тестов Nvidia, GeForce GTX 1660 Ti примерно на 50% быстрее своей предшественницы GTX 1060 6GB в этой игре — во многом из-за более эффективной работы кэш-памяти. Также наверняка сработала и быстрая GDDR6-память, поддержка которой появилась именно в Turing. GeForce GTX 1660 Ti имеет те же 6 ГБ памяти, подключенной к GPU по 192-битному интерфейсу, как и старшая модель GTX 1060, но из-за установки на нее скоростной GDDR6-памяти, работающей на эффективной частоте в 12 ГГц, новая модель имеет на 50% большую пропускную способность памяти.

Также архитектурой Turing поддерживаются новые технологии для увеличения производительности в играх: Variable Rate Shading (VRS) — переменная частота затенения, Texture-Space Shading — затенение в текстурном пространстве, Multi-View Rendering — отрисовка с нескольких позиций, Mesh Shading — полностью программируемый конвейер обработки геометрии, CR и ROVs — технологии DirectX 12 уровня возможностей Feature Level 12_1.

Переменная частота затенения позволяет реализовать два важных алгоритма адаптивной частоты затенения в зависимости от содержания и движения в сцене — Content Adaptive Shading и Motion Adaptive Shading. Оба алгоритма позволяют изменять частоту затенения для некоторых участков изображения, которые не требуют рендеринга с полным качеством, когда вполне достаточно и меньшего количества выборок для увеличения производительности.

К примеру, Motion Adaptive Shading позволяет регулировать частоту затенения в зависимости от наличия/скорости изменений в сцене. Самый простой и понятный пример — гоночная игра, где центральная часть с автомобилем игрока отрисовывается в полном качестве, а дорога и окружение на периферии кадра рендерятся с худшим качеством, так как они все равно слишком быстро движутся и человеческие глаза и мозг просто не могут увидеть разницу в качестве.

Или взять Content Adaptive Shading, при работе которого частота затенения определяется разницей в цвете соседних пикселей на протяжении нескольких кадров. Если цвета от кадра в кадр меняются слабо, как на поверхности неба, то вполне можно этот участок отрисовать с меньшей частотой затенения, и человек снова не увидит визуальной разницы. Переменная частота затенения уже используется в игре Wolfenstein II: The New Colossus, и меньшая работа по закраске пикселей приносит приличный прирост производительности, помогая GeForce GTX 1660 Ti быть в полтора раза быстрее, чем GTX 1060 6GB.

Часть улучшений в Turing пришла из Volta, а часть — новые архитектурные новинки, которые есть только в новейшем поколении. Некоторым могло показаться, что TU116 правильнее причислять к архитектуре Volta, так как у него нет RT-ядер и тензорных ядер, а многие улучшения в мультипроцессорах уже были сделаны в GV100. Это не соответствует действительности, так как в Turing есть изменения, которые отсутствуют в Volta: поддержка некоторых возможностей DirectX 12 (resource heap tier 2) и технологии, о которых мы выше рассказывали: Mesh Shading, Variable Rate Shading, Texture Space Shading и другие.

Также в архитектуре Turing были улучшены последние слабые места архитектуры Pascal относительно конкурирующей GCN у AMD, которые могли приводить к снижению производительности в ПК-играх на Pascal, так как код был оптимизирован для GCN. У Turing никаких слабостей уже не осталось, она всегда достаточно эффективна, в том числе с применением асинхронного исполнения шейдерных программ, популярного в современных играх.

Отметим еще один важный момент по поводу тензорных ядер. В TU116 их нет, как говорит Nvidia, но удвоенный темп выполнения операций с точностью FP16 остался, но в семействе GeForce RTX они выполняются на том же «железе», что и тензорные операции (при работе используется часть тензорных ядер). Для поддержки этой функциональности в TU116 пришлось оставить урезанную часть тензорных ядер — выделенные FP16-блоки, которые также могут работать одновременно с FP32-блоками (вместо INT, но не все три типа блоков вместе). И с программной точки зрения для приложений не будет никакой разницы, все GPU нового семейства способны выполнять FP16 с удвоенной производительностью.

Впрочем, конкретно в играх эта возможность до сих пор остается не особенно востребованной, так как из популярных проектов используется разве что в Wolfenstein II и Far Cry 5 (для симуляции водной поверхности), да и то — еще неизвестно, остались ли они в последних патчах. То же самое касается и того, что на всех решениях Turing могут выполняться параллельно FP32 FMA и INT32 операции, или FP16 (с удвоенной производительностью) и INT32 операции, или FP32 и ускоренные FP16. Теоретически, на этих FP16 блоках могут параллельно выполняться и тензорные операции, но лишь в теории, поддержки того же DLSS в TU116 нет и вряд ли она будет — тут даже удвоенной скорости FP16 не хватит.

Если говорить о вещах, не связанных с 3D, то в TU116 есть обновленный блок вывода информации, поддерживающий дисплеи с высоким разрешением, HDR и высокой частотой обновления. Все платы на графических процессорах архитектуры Turing имеют порты DisplayPort 1.4a, позволяющие вывести информацию на 8K-монитор с частотой обновления 60 Гц с поддержкой технологии VESA Display Stream Compression (DSC) 1.2, обеспечивающей высокую степень сжатия.

Все решения семейства Turing также поддерживают два 8K-дисплея при 60 Гц (требуется по одному кабелю на каждый), такое же разрешение также можно получить при подключении через установленный USB-C. Кроме этого, все TU1xx поддерживают полноценный HDR в конвейере вывода информации, включая tone mapping для различных мониторов — со стандартным динамическим диапазоном и расширенным.

Все новые GPU семейства Turing содержат улучшенный кодировщик видеоданных NVEnc, добавляющий поддержку сжатия данных в формате H.265 (HEVC) при разрешении 8K и 30 FPS. Из других улучшений — снижение битрейта при схожем качестве на 25% для HEVC и до 15% для H.264. Также был обновлен и декодер видеоданных NVDec, получивший поддержку декодирования данных в формате HEVC YUV444 10-бит/12-бит HDR при 30 FPS, в формате H.264 при 8K-разрешении и в формате VP9 с 10-бит/12-бит данными.

Чипы семейства Turing улучшили качество кодирования видеоданных, которое приблизилось к качеству чисто программных кодеров, а порой и опережает их. Так, NVEnc в Turing обеспечивает уровень качества программного кодирования программным кодером x264 с профилем Fast при гораздо меньшей нагрузке на CPU. Настолько меньшей, что GPU вполне «тянет» стриминг в разрешении 4К, слишком тяжелый для типичных процессоров при программном кодировании видео. Кодер Nvidia уже поддерживается в популярном пакете OBS для стриминга, и стримеры с его помощью могут транслировать игру при использовании одного ПК, что невозможно при программном кодировании.

Более подробно с возможностями семейства Turing вы можете ознакомиться в большом обзоре GeForce RTX 2080 Ti.

Предварительная оценка производительности и промежуточные выводы

Что касается производительности Turing по сравнению с Pascal, то все улучшения эффективности мультипроцессоров в новой архитектуре значительно улучшили как производительность (в полтора раза по оценке Nvidia), так и энергоэффективность (на 40%). Прирост производительности Turing по количеству исполняемых операций за такт в реальных играх составляет около полутора раз, а при том же уровне энергопотребления среднее преимущество GTX 1660 Ti над GTX 1060 6GB по итоговой частоте кадров можно оценить примерно в 35%-40%.

И чем новее игры используются, тем больше преимущество от увеличенной эффективности Turing. Так, если в устаревших проектах вроде Fallout 4 и Deus Ex: Mankind Divided преимущество новинки над GTX 1060 оказывается лишь 20%-30%, то в Shadow of the Tomb Raider и Call of Duty Black Ops 4 оно доходит до 40%-45% и даже более. В целом же можно сказать, что видеокарта модели GeForce GTX 1660 Ti явно разработана для игры в Full HD-разрешении, и она обеспечивает в этих условиях отличную производительность при максимальном качестве картинки.

Похоже, что с выходом решений линейки GeForce GTX 16 (за GTX 1660 Ti вскоре последуют и другие модели), компании Nvidia будет несколько проще продвигать возможности старшего подсемейства GeForce RTX, ведь они будут жестко разделены по возможностям и в более дешевых вариантах поддержки самых современных технологий в ближайшем будущем не ожидается.

Для тех, кому не нужны эти новые технологии (весьма впечатляющие, но пока что больше в теории, чем на практике — вышло всего две игры с поддержкой трассировки лучей и хотя трассировка приносит более качественный рендеринг, но многим игрокам не хватает вау-фактора) будут предложены решения GeForce GTX 16, а если игрок готов потратить больше денег за уникальные графические возможности — старшие видеокарты семейства Turing к их услугам.

Особенности видеокарты

Объект исследования: ускоритель трехмерной графики (видеокарта) MSI GeForce GTX 1660 Ti Gaming X 6 ГБ 192-битной GDDR6

Сведения о производителе: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США.Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) — около 5000 человек.

Характеристики карты

MSI GeForce GTX 1660 Ti Gaming X 6 ГБ 192-битной GDDR6
GPU	GeForce GTX 1660 Ti (TU116)
Интерфейс	PCI Express x16
Частота работы GPU (ROPs), МГц	Референс: 1500—1770(Boost)—1965(Max) MSI: 1500—1875(Boost)—2010(Max)
Частота работы памяти (физическая (эффективная)), МГц	Референс: 3000 (12 000) MSI: 3060 (12 240)
Ширина шины обмена с памятью, бит	192
Число вычислительных блоков в GPU	24
Число операций (ALU) в блоке	64
Суммарное количество блоков ALU (CUDA)	1536
Число блоков текстурирования (BLF/TLF/ANIS)	96
Число блоков растеризации (ROP)	48
Число блоков RayTracing	нет
Число тензорных блоков	нет
Размеры, мм	250×115×42
Количество слотов в системном блоке, занимаемые видеокартой	3
Цвет текстолита	черный
Энергопотребление пиковое в 3D, Вт	123
Энергопотребление в режиме 2D, Вт	20
Энергопотребление в режиме «сна», Вт	10
Уровень шума в 3D (максимальная нагрузка), дБА	25,9
Уровень шума в 2D (просмотр видео), дБА	18,0
Уровень шума в 2D (в простое), дБА	18,0
Видеовыходы	1×HDMI 2.0b 3×DisplayPort 1.4
Поддержка многопроцессорной работы	нет
Максимальное количество приемников/мониторов для одновременного вывода изображения	4
Питание: 8-контактные разъемы	1
Питание: 6-контактные разъемы	0
Максимальное разрешение/частота, Display Port	3840×2160@160 Гц (7680×4320@30 Гц)
Максимальное разрешение/частота, HDMI	3840×2160@60 Гц
Максимальное разрешение/частота, Dual-Link DVI	2560×1600@60 Гц (1920×1200@120 Гц)
Максимальное разрешение/частота, Single-Link DVI	1920×1200@60 Гц (1280×1024@85 Гц)
Средняя цена	24 700 руб. (на момент написания материала)

Особенности карты и сравнение с GTX 1060

MSI GeForce GTX 1660 Ti Gaming X	Nvidia GeForce GTX 1060
вид спереди

вид сзади

Мы сравниваем с GTX 1060 прежде всего потому, что GTX 1660 Ti будет замещать именно этот ускоритель, хотя по уровню производительности он примерно соответствует GTX 1070. Да и по ширине шины они с GTX 1060 схожи.

Для всех карт с шиной памяти 192 бит характерна разводка 256-битной шины на печатной плате, при этом просто не задействованы два посадочных места под микросхемы памяти (каждая микросхема имеет ширину подключения 32 бита, поэтому 256 − 2 × 32 = 192).

В схеме питания задействованы два ШИМ-контроллера: OnSemi NCP81610 управляет 4 фазами питания GPU, а uP1666Q производства uPI управляет двумя фазами питания микросхем памяти. Подвод питания осуществляется через один 8-контактный разъем.

Как обычно, с помощью утилиты MSI Afterburner можно не только напрямую повысить частоты работы карты, но и запустить Nvidia Scanner, который поможет определить безопасный максимум разгона ядра и памяти. И если Afterburner уже стала международно признанной и очень популярной программой, не привязанной к производителю видеокарт, то теперь MSI предлагает и утилиту Dragon Center, поддерживающую управление не только частотами, но и подсветкой.

Режимов работы красочной подсветки очень много.

В результате имеем очень красивую видеокарту в работе. В начале раздела описания карты имеется видеоролик, где это можно увидеть в динамике.

Карта имеет стандартный набор видеовыходов: 3 DP и 1 HDMI.

Также следует заметить, что частоты работы у карты MSI чуть повышены относительно референсных значений, но именно чуть-чуть — на 2,3%.

Память

Карта имеет 6 ГБ памяти GDDR6 SDRAM, размещенной в 6 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6) рассчитаны на номинальную частоту работы в 3000 (12000) МГц

Охлаждение и нагрев

Главной частью системы охлаждения под названием TwinFrozr 7 является довольно большой никелированный радиатор, пронизанный тепловыми трубками. Поверх установлен кожух с двумя вентиляторами Torx 3.0 (имеющими особую форму крыльчаток, помогающую ускорить воздушный поток без увеличения шума, и работающими на одинаковой частоте вращения). Вентиляторы останавливаются в случае простоя карты (при температуре GPU ниже 50-52 градусов). Микросхемы памяти и силовые транзисторы охлаждаются отдельной пластиной, но там охлаждение чисто символическое. С оборотной стороны карта прикрывается специальной пластиной, которая обеспечивает жесткость печатной платы и, теоретически, немного помогает рассеивать тепло с микросхем памяти и силовых транзисторов (прижатая к ним рамка крепится сквозь текстолит именно к этой пластине), а на деле является декоративным элементом.

Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder):

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 65 градусов, что является очень хорошим результатом для видеокарты такого уровня.

Максимальный нагрев — центральная часть карты.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума выполняется по методике, описанной здесь:

28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя в 2D температура составляла 44 °C, вентиляторы не работали. Шум был равен фоновому 18,0 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось: температура ядра оставалась прежней, вентиляторы также не работали, шум сохранялся на уровне 18,0 дБА.

В режиме максимальной нагрузки в 3D температура достигала 65 °C. Вентиляторы при этом раскручивались до 1450 оборотов в минуту, шум вырастал до 25,9 дБА, так что шум от данной СО минимальный.

Комплект поставки и упаковка

Базовый комплект поставки серийной карты должен включать в себя руководство пользователя, диск с драйверами и утилитами. Мы видим, по сути, базовый комплект.

Синтетические тесты

Недавно мы обновили пакет синтетических тестов, он все еще экспериментальный и будет меняться. Мы бы хотели добавить еще больше примеров с вычислениями (compute shaders), но с этим есть определенные сложности. В будущем мы постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — пишите их в комментариях к статье или отправьте почтой.

Из ранее активно использовавшихся нами тестов RightMark3D мы оставили лишь несколько самых тяжелых вариантов. Остальные уже изрядно устарели и на столь мощных GPU упираются в различные ограничители, не загружают работой блоки графического процессора и не показывают истинную его производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы пока что решили оставить в полном составе, так как заменить их попросту нечем, хотя и они уже устарели.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько тестов для измерения производительности трассировки лучей и один тест для сравнения производительности сглаживания методами DLSS и TAA для современных решений Nvidia. В качестве полусинтетического теста у нас также используется и популярный 3DMark Time Spy, помогающий определить прирост от асинхронных вычислений.

Синтетические тесты проводились на следующих видеокартах:

GeForce GTX 1660 Ti со стандартными параметрами (GTX 1660 Ti)
GeForce RTX 2060 со стандартными параметрами (RTX 2060)
GeForce GTX 1070 со стандартными параметрами (GTX 1070)
GeForce GTX 1060 со стандартными параметрами (GTX 1060)
Radeon RX 590 со стандартными параметрами (RX 590)

Для анализа производительности новой видеокарты GeForce GTX 1660 Ti мы взяли эти решения по следующим причинам. Естественно, что мы сравнили новинку с RTX 2060, как самой младшей моделью из GeForce RTX. Также мы взяли для теста его прямого предшественника в виде GeForce GTX 1060 (с 6 ГБ памяти, конечно) — чтобы понять, насколько среднебюджетный Turing быстрее аналогичного по уровню GPU семейства Pascal. Ну и на всякий случай в части тестов была и модель GTX 1070, примерно на уровне которой должна выступить новинка.

В качестве основного и единственного в этот раз соперника для GeForce GTX 1660 Ti у нас выступает видеокарта Radeon RX 590, имеющая близкую рекомендованную цену. Будет интересно узнать, насколько они соответствуют друг другу и по производительности. Вторую подходящую видеокарту AMD для нашего сегодняшнего сравнения мы брать не стали — нет особого смысла сравнивать новинку с Vega 56 или Vega 64, так как они стоят дороже, а возможностей для снижения цен у AMD вряд ли много.

Тесты Direct3D 10

Мы сильно сократили состав DirectX 10-тестов из RightMark3D, оставив только несколько примеров с наибольшей нагрузкой на GPU. Первая пара тестов измеряет производительность выполнения относительно простых пиксельных шейдеров с циклами при большом количестве текстурных выборок (до нескольких сотен выборок на пиксель) и сравнительно небольшой загрузке ALU. Иными словами, в них измеряется скорость текстурных выборок и эффективность ветвлений в пиксельном шейдере. Оба примера включают самозатенение и шейдерный суперсэмплинг, увеличивающий нагрузку на видеочипы.

Первый тест пиксельных шейдеров — Fur. При максимальных настройках в нем используется от 160 до 320 текстурных выборок из карты высот и несколько выборок из основной текстуры. Производительность в данном тесте зависит от количества и эффективности блоков TMU, на результат влияет также и эффективность выполнения сложных программ.

В задачах процедурной визуализации меха с большим количеством текстурных выборок, решения компании AMD в лидерах еще со времен выхода первых графических процессоров архитектуры GCN. И совершенно неудивительно, что единственная видеокарта Radeon до сих пор очень неплохо выступила в очередном сравнении, что говорит о большей эффективности выполнения ей подобных программ.

Рассматриваемая нами сегодня видеокарта модели GeForce GTX 1660 Ti выступила неплохо, явно опередив GTX 1060, пусть и не так сильно, как нам хотелось бы. Ведь от RTX 2060 она отстала прилично (даже чуть больше, чем должно быть по теории), показав результат заметно хуже своего прямого конкурента в виде Radeon RX 590. Похоже, что в таких простых тестах семейство Turing в принципе не слишком сильно и новым GPU нужны более сложные шейдеры и условия в целом.

Следующий DX10-тест Steep Parallax Mapping также измеряет производительность исполнения сложных пиксельных шейдеров с циклами при большом количестве текстурных выборок. При максимальных настройках он использует от 80 до 400 текстурных выборок из карты высот и несколько выборок из базовых текстур. Этот шейдерный тест Direct3D 10 несколько интереснее с практической точки зрения, так как разновидности parallax mapping широко применяются в играх, в том числе и такие варианты как steep parallax mapping. Кроме того, в нашем тесте мы включили самозатенение, увеличивающее нагрузку на видеочип в два раза, и суперсэмплинг, также повышающий требования к мощности GPU.

Диаграмма похожа на предыдущую, но в этот раз видеокарты GeForce выступили лучше. Новинка уже почти догнала прямого конкурента из стана компании AMD, да и к GTX 1070 из предыдущего поколения стала явно ближе. Преимущество TU116 над GP106 стало более явным, хотя упора в ПСП или ROP тут нет. Разница между GTX 1660 Ti и RTX 2060 все так же оказалась более чем 15%, которые должны быть по теории. Будем надеяться, что в более сложных DirectX 11 и 12 тестах новинка Nvidia лучше раскроет свои возможности.

Из пары тестов пиксельных шейдеров с минимальным количеством текстурных выборок и относительно большим количеством арифметических операций, мы выбрали более сложный, так как они уже порядком устарели и уже не измеряют чисто математическую производительность GPU. Да и за последние годы скорость выполнения именно арифметических инструкций в пиксельном шейдере не так важна, большинство вычислений перешли в compute shaders. Итак, тест шейдерных вычислений Fire — текстурная выборка в нем лишь одна, а количество инструкций типа sin и cos равно 130 штукам. Впрочем, для современных GPU это семечки.

В математическом тесте из нашего RigthMark мы часто получаем результаты, довольно далекие от теории и сравнений в других аналогичных бенчмарках. Вероятно, столь мощные платы ограничивает что-то, не относящееся к скорости вычислительных блоков, так как GPU при тестировании не загружен работой на 100%. Рассматриваемая сегодня GeForce GTX 1660 Ti в этом тесте опережает GTX 1060, но заметно отстает от GTX 1070 и RTX 2060 (в этом тесте разница между TU106 и TU116 близка к теоретической). Да и единственный GPU конкурирующей компании оказался примерно на том же уровне с новой видеокартой GeForce.

Переходим к тесту геометрических шейдеров. В составе пакета RightMark3D 2.0 есть два теста скорости геометрических шейдеров, но один из них (Hyperlight, демонстрирующий использование техник: instancing, stream output, buffer load, использующий динамическое создание геометрии и stream output), на всех видеокартах компании AMD не работает, поэтому мы решили оставить лишь второй — Galaxy. Техника в этом тесте аналогична point sprites из предыдущих версий Direct3D. В нем анимируется система частиц на GPU, геометрический шейдер из каждой точки создает четыре вершины, образующие частицу. Вычисления производятся в геометрическом шейдере.

Соотношение скоростей при разной геометрической сложности сцен примерно одинаково для всех решений, производительность соответствует количеству точек. Задача для мощных современных GPU довольно простая, но разница между разными моделями видеокарт есть. Удивительно, что новая GeForce GTX 1660 Ti в этом тесте показала низкий результат на уровне GTX 1060, чуть обогнав ее в самом сложном подтесте из трех. Да и разница между GTX 1660 Ti и RTX 2060 уж слишком велика, так просто не должно быть.

Единственное утешение в том, что новинка значительно обошла прямого конкурента во всех условиях. Отставание выбранной нами в качестве соперника Radeon при высокой геометрической сложности получилось очень приличным — более 40%. В этом тесте разница между видеокартами на чипах Nvidia и AMD уже явно в пользу решений калифорнийской компании, что обусловлено отличиями в геометрических конвейерах GPU. В тестах геометрии платы GeForce всегда конкурентоспособнее Radeon, и мощные видеочипы Nvidia, имеющие сравнительно большое количество блоков по обработке геометрии, почти всегда выигрывают в них.

Последним тестом из Direct3D 10 станет скорость большого количества текстурных выборок из вершинного шейдера. Из пары имеющихся у нас тестов с использованием displacement mapping на основании данных из текстур, мы выбрали тест Waves, имеющий условные переходы в шейдере и поэтому более сложный и современный. Количество билинейных текстурных выборок в данном случае составляет 24 штуки на каждую вершину.

Результаты в тесте вершинного текстурирования Waves в очередной раз оказались довольно странными. Новая GeForce GTX 1660 Ti снова показывает скорость лишь на уровне GTX 1060, упираясь во что-то необъяснимое, особенно в самых простых условиях. Производительность новой модели GPU оказалась значительно ниже, чем у RTX 2070, ведь по теории разница между ними не должна превышать 15%-20%.

Тесты из 3DMark Vantage

Мы традиционно рассматриваем также и синтетические тесты из пакета 3DMark Vantage, ведь они иногда показывают нам то, что мы упустили в тестах собственного производства. Feature тесты из этого тестового пакета также обладают поддержкой DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новой видеокарты GeForce мы сделаем какие-то полезные выводы, ускользнувшие от нас в тестах пакета RightMark 2.0.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark довольно высока, тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя у семейства Turing они получились заниженными, что мы отмечали и ранее. Хотя сегодняшний герой отстает от RTX 2060 ровно настолько, сколько и должен проигрывать по теории. Но в целом, разница в скорости между Turing и Pascal тут явно не в пользу новинок.

Сравнение скорости текстурирования рассматриваемой сегодня видеоплаты компании Nvidia с конкурирующей видеокартой AMD с такой же ценой показывает, что представленная недавно GeForce GTX 1660 Ti уступила видеокарте Radeon RX 590 очень прилично, так как все Radeon имеют большое количество блоков TMU и с задачей текстурирования справляются явно лучше. Не сказать, что разница глобальная, но неприятная.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP. Вероятно, примерно так оно и есть, сразу три платы GeForce показали близкие результаты. Новая GTX 1660 Ti среди них, и она даже немного опередила RTX 2060 и GTX 1070, что объясняется именно высокой теоретической скоростью заполнения (филлрейтом). Если сравнивать видеокарты GeForce RTX 2060 и Radeon RX 590 по скорости заполнения сцены, то рассматриваемая нами сегодня плата в этом тесте показала значительно большую скорость по сравнению с конкурирующей.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров.

Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель GeForce GTX 1660 Ti показала неплохой результат, даже чуть-чуть опередив Radeon, а ведь графические процессоры AMD в этом тесте всегда были сильны. Новинка оказалась почти на 40% быстрее, чем GTX 1060 и достала до уровня GTX 1070. А вот RTX 2060 впереди ровно на столько, сколько получается в теории.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что рассчитывает физические взаимодействия (имитация ткани) при помощи видеочипа. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы в который раз получаем явно некорректные результаты в этом тесте. Очередная новая видеокарта GeForce показала очень низкую скорость на уровне решений предшествующего поколения. C этим тестом точно что-то не так, логического объяснения таким результатам у нас нет.

В таких условиях и сравнение с единственным Radeon для GeForce GTX 1660 Ti не имеет смысла. Несмотря на теоретически меньшее количество геометрических исполнительных блоков и отставание по геометрической производительности у чипов AMD, плата Radeon в этом тесте по какой-то (скорее всего, программной) причине работает заметно лучше, почти в два раза обгоняя абсолютно все видеокарты GeForce, представленные в сегодняшнем сравнении.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты. Но они хотя бы выше, чем в прошлом подтесте. Новинка оказалась быстрее аналогичного представителя архитектуры Pascal в виде GTX 1060 и чуть-чуть отстала от RTX 2060. Сравнение новой модели GeForce с единственной представленной в материале видеокартой компании AMD показало примерное равенство.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но ближе к пиковой производительности видеочипов в предельных задачах. Но в этом тесте используются операции с плавающей запятой, и новая архитектура Turing не может использовать свои уникальные возможности и показать результат заметно выше представителей из семейства Pascal. GeForce GTX 1660 Ti в этом тесте оказалась между GTX 1070 и GTX 1060, отстав также и от RTX 2060 — строго в соответствии с теорией.

Видеочипы компании AMD с архитектурой GCN справляются с подобными задачами еще лучше — в тех случаях, когда выполняется интенсивная «математика» в предельных режимах. Radeon RX 590 в этом тесте стала победителем, хотя ее преимущество над RTX 2060 и невелико, но GTX 1660 Ti она обошла с запасом. Впрочем, мы далее рассмотрим более современные тесты, использующие повышенную нагрузку на GPU, и показатели Turing в них будут лучше.

Тесты Direct3D 11

Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.

Первый Direct3D11-тест тоже не раскрывает новых возможностей архитектуры Turing, все видеокарты GeForce проиграли единственному конкуренту в виде Radeon RX 590, который оказался быстрее всех. Сегодняшняя новинка ничем не отличается от аналогичного решения из семейства Pascal, да и RTX 2060 не сильно быстрее в этот раз, что явно не соответствует теории. Судя по высокой частоте кадров, вычисления в этом примере из SDK не слишком сложны, и мощные GPU просто не могут показать свои способности.

Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.

Производительность рендеринга в этом тесте зависит от оптимизации драйвера и командного процессора GPU. И с этим у всех решений Nvidia все в порядке, видеокарты GeForce опередили лучшую из Radeon. Интересно, что если сравнить сегодняшнюю новинку с аналогом из прошлого поколения, то GeForce GTX 1660 Ti выиграла у GTX 1060 очень прилично. А вот RTX 2060 оказалась быстрее новинки на 16%, что близко к теории. В общем, все графические процессоры архитектуры Turing в таких сложных условиях выступают просто отлично!

Ну и третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно интересный. При тестировании мы использовали настройки по умолчанию.

Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. По этим параметрам более мощные видеокарты Nvidia выигрывают у Radeon RX 590, но их преимущество не настолько уж велико, если не брать GeForce RTX 2060, которая не является конкурентом для остальных решений, по сути.

Новая видеокарта калифорнийской компании с запасом опередила представительницу из семейства Pascal, став второй в этом тесте. А вот RTX 2060 в этот раз слишком далеко впереди — теорией это объяснить непросто. Впрочем, частота кадров тут слишком высокая в любом случае и задача слишком легкая даже для GPU средней мощности.

Тесты Direct3D 12

Переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.

Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Turing. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.

Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU. Решения Nvidia в тесте явно лучше справляются с этими операциями, а одновременное исполнение INT32- и FP32-инструкций на графических процессорах TU116 и TU106 позволило им стать лучшими. Рассматриваемая нами новинка сильно опередила свой аналог GTX 1060, а также оказалась явно быстрее, чем ее прямой конкурент в виде Radeon RX 590. Отставание от RTX 2060 на удивление великовато. Возможно, сказывается сниженный объем кэш-памяти второго уровня.

Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1 048 576 штук.

Производительность в этом тесте зависит от драйвера, командного процессора и мультипроцессоров GPU. Все видеокарты компании Nvidia справились с задачей отлично (с учетом большого количества обрабатываемой геометрии) и примерно одинаково, что говорит скорее об упоре в возможности именно программной части (драйвера), поэтому и сравнивать GeForce друг с другом бессмысленно. А вот Radeon RX 590 очень сильно отстала от них, как и все остальные Radeon в наших предыдущих тестах. Вероятно, дело в недостатке программной оптимизации — драйверы компании AMD нуждаются в улучшении.

Ну и последний пример с поддержкой D3D12 — уже известный нам nBody Gravity тест, но в другом варианте. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10 000 до 64 000.

По количеству кадров в секунду видно, что эта вычислительная задача довольно сложна. Новинка из серии GeForce GTX, но с архитектурой Turing, основанная на графическом процессоре TU116, смогла приблизиться к своей старшей сестре — RTX 2060, разница между ними соответствует теоретической. Решение из предшествующего семейства видеокарт GeForce осталось позади, как и единственная видеокарта конкурирующей компании.

В качестве дополнительного синтетического теста с поддержкой Direct3D12 мы взяли известный бенчмарка Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Так мы поймем, изменилось ли что-то в поддержке async compute в Turing. Для верности мы протестировали видеокарты Nvidia в двух разрешениях экрана и двух графических тестах.

По представленным диаграммам видно, что прирост от включения асинхронных вычислений в Time Spy не слишком сильно изменился между двумя поколениями GPU компании Nvidia. Для Pascal это 3%-7%, а для Turing уже 5%-10% (в зависимости от режима). В новых графических процессорах одновременное исполнение разных типов вычислений было улучшено, на одном и том же шейдерном мультипроцессоре архитектуры Turing теперь могут запускаться и графические и вычислительные шейдеры. Но бенчмарк Time Spy использует такие возможности слабо, поэтому и разница невелика.

Если рассматривать производительность GeForce GTX 1660 Ti в этой задаче по сравнению с аналогичной моделью Nvidia из старшего семейства RTX, то получается, что новинка отстает от RTX 2060 где-то на 15%-17%, что соответствует разнице в теоретических показателях. Новинка на чипе TU116 оказалась заметно быстрее соперничающей с ней видеокарты Radeon RX 590, и это преимущество настраивает на оптимистичный лад перед игровыми тестами.

Вычислительные тесты

Мы все еще находимся в поиске бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается уже довольно старый и не слишком хорошо оптимизированный тест трассировки лучей, но не аппаратной — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.

Новая модель GeForce GTX 1660 Ti оказалась медленнее, чем RTX 2060 на 20%-25%, что можно объяснить разницей в размере кэш-памяти второго уровня, важной для подобных вычислений. Если же взять GTX 1060 из предыдущего семейства Pascal, то сегодняшняя новинка заметно быстрее ее. Неплохой результат всех чипов семейства Turing обусловлен изменениями в системе кэширования, и во многом благодаря этому GTX 1660 Ti наконец-то опередила своего прямого конкурента Radeon RX 590 в подобных задачах, пусть и только в одном из подтестов.

Еще одним тестом вычислительной производительности графических процессоров станет V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества Turing. Учтите, что в данном тесте выдается результат в виде времени, затраченного на рендеринг, и чем он ниже — тем лучше.

Увы, но архитектура Turing не получила преимущества от своих оптимизаций в V-Ray (как минимум, пока что). Правда, результаты всех GeForce все равно заметно выше, чем у единственной видеокарты AMD Radeon — похоже, что данный рендерер лучше оптимизирован под видеокарты Nvidia. Новинка опережает модель Radeon RX 590 чуть ли не вдвое. Что касается сравнения с другими GeForce, то новинка расположилась между RTX 2060 и GTX 1060, отстав от более старшей модели Turing на 20%, что чуть выше теоретической разницы.

Выводы по теоретической части и синтетическим тестам

Судя по теоретическим данным и синтетическим тестам, видеокарта модели GeForce GTX 1660 Ti, основанная на графическом процессоре TU116 архитектуры Turing, занимает на рынке игровых видеокарт место GeForce GTX 1060, выступая на уровне более старшей модели — GTX 1070, хотя были в наших тестах и спорные результаты. Со старыми синтетическими бенчмарками у всех новых GPU дела обстоят не очень хорошо, но в более новых тестах влияние архитектурных улучшений в Turing хорошо заметно. Предполагаем, что в играх новинка должна быть примерно на уровне GTX 1070 из предыдущего семейства Pascal.

Надо отметить, что у Nvidia с семейством Turing получилась довольно необычная продуктовая линейка. Это наверняка объясняется сложностями внедрения таких глобальных и непростых вещей, как трассировка лучей и ускорение задач искусственного интеллекта, которые были сделаны в старших решениях GeForce RTX, но пока на рынке были только они, все было ровно и понятно, а вот с выходом GeForce GTX 1660 Ti линейка стала более разнородной.

Хотя графический процессор TU116 — это все тот же Turing (за минусом технологий RTX и пары мелких количественных изменений типа объема L2-кэша), получилось так, что видеокарты нового поколения раскололись на два подсемейства: с трассировкой лучей и тензорными ядрами и без них. RTX — подороже и покруче, GTX — подешевле и без «лишних» технологий. Наверное, на данном этапе это единственное грамотное решение, когда внедрение новых технологий обходится пока что слишком дорого в прямом и переносном смыслах.

В том числе поэтому подсемейство RTX обеспечило не такой уж большой прирост по соотношению цены и производительности по сравнению с Pascal (за счет повышенной сложности и себестоимости новинок), а вот урезанный по возможностям GTX 1660 Ti стал максимально эффективным решением для текущих игр без трассировки — по сравнению с любой другой видеокартой. Новинка на чипе TU116 оказалась выгоднее других решений из своего ценового сегмента и поэтому принята рынком лучше, чем ее более дорогие собратья из семейства Turing с поддержкой RTX.

Это и неудивительно, ведь GeForce GTX 1660 Ti обеспечивает в среднем на 40% бо́льшую производительность по сравнению с GTX 1060 6GB, и пусть это не такой уж большой прирост в абсолютных цифрах, но с учетом цены это сейчас самый удачный вариант. Особенно для тех, на кого и целится Nvidia — владельцев видеокарт уровня GTX 960, которые не обновились на Pascal. В этом случае GTX 1660 Ti легко обеспечит им двукратный и более прирост, оказавшись на уровне GTX 1070 из прошлого поколения.

С точки зрения энергоэффективности, GTX 1660 Ti удивляет еще больше: Nvidia смогла повысить производительность при том же энергопотреблении, что и у GTX 1060 6GB! Так что TU116 на 35%-40% эффективнее справляется с работой по сравнению с одним из лучших чипов архитектуры Pascal, что является очень наглядным показателем роста эффективности Turing. Нет даже особого смысла сравнивать новинку с прямым ценовым конкурентом из стана AMD, который потребляет гораздо больше энергии. Вообще, что касается прямого сравнения GTX 1660 Ti и RX 590, то видеокарте AMD тут мало что светит при практически той же цене — GTX 1660 Ti получился быстрее и значительно эффективнее. И на RX 590 пришлось снижать цену, ведь с энергопотреблением ничего не поделаешь как минимум до выхода Navi.

Но и у GTX 1660 Ti есть опасный конкурент — RTX 2060. Да, эта модель дороже, но не так уж намного, а если в ближайшие месяцы появится еще несколько хороших игр с поддержкой трассировки лучей и других отсутствующих в младшем Turing технологий, то в не такой уж и большой переплате за RTX появится определенный смысл. Может быть, в Nvidia изначально и планировали таким образом переманивать игроков на RTX? В любом случае, пока что, при всего лишь двух играх с трассировкой лучей, у GTX 1660 Ti есть все шансы стать одной из самых популярных видеокарт на рынке.

Немного смущает лишь повышенная цена по сравнению с GTX 1060 6GB, но рынок есть рынок — даже при цене в $279 на данный момент этот GPU получился весьма выгодным. А из потенциальных минусов GeForce GTX 1660 Ti отметим разве что объем локальной видеопамяти 6 ГБ, которого может не хватить в некоторых играх и условиях через пару лет. Но пока что этого объема VRAM вполне хватает, что мы и должны увидеть в наших игровых тестах, к которым переходим.

Игровые тесты

Конфигурация тестового стенда

Компьютер на базе процессора AMD Ryzen 7 2700X (Socket AM4):
- процессор AMD Ryzen 7 2700X (разгон до 4,0 ГГц);
- СО Antec Kuhler H2O 920;
- системная плата Asus ROG Crosshair VI Hero на чипсете AMD X370;
- оперативная память 16 ГБ (2×8 ГБ) DDR4 AMD Radeon R9 UDIMM 3200 МГц (16-18-18-39);
- жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
- блок питания Seasonic Prime 1000 W Titanium (1000 Вт);
- блок питания Thermaltake RGB 750W;
- корпус Thermaltake Versa J24;
операционная система Windows 10 Pro 64-битная; DirectX 12;
телевизор LG 43UK6750 (43″ 4K HDR);
драйверы AMD версии 19.2.1;
драйверы Nvidia версии 418.91 (для GeForce GTX 1660 Ti версии 419.35);
VSync отключен.

Список инструментов тестирования

Во всех играх использовалось максимальное качество графики в настройках.

Wolfenstein II: The New Colossus (Bethesda Softworks/MachineGames)
Tom Clancy’s Ghost Recon Wildlands (Ubisoft/Ubisoft)
Assassin’s Creed: Origins (Ubisoft/Ubisoft)
Battlefield V (EA Digital Illusions CE/Electronic Arts)
Far Cry 5 (Ubisoft/Ubisoft)
Shadow of the Tomb Raider (Eidos Montreal/Square Enix) — HDR включен
Total War: Warhammer II (Creative Assembly/Sega)
Strange Brigade (Rebellion Developments/Rebellion Developments)

Результаты тестирования.

Wolfenstein II: The New Colossus

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
GeForce GTX 1660 Ti	GeForce GTX 1060 6GB	+76,0	+86,3	+128,6
GeForce GTX 1660 Ti	GeForce GTX 1070	+4,8	+14,5	+20,0
GeForce GTX 1660 Ti	Radeon RX Vega 56	−7,0	−4,0	−2,0

Tom Clancy’s Ghost Recon Wildlands

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
GeForce GTX 1660 Ti	GeForce GTX 1060 6GB	+52,4	+56,3	+57,1
GeForce GTX 1660 Ti	GeForce GTX 1070	+4,3	+5,6	+12,8
GeForce GTX 1660 Ti	Radeon RX Vega 56	−4,0	0,0	+2,3

Assassin’ Creed: Origins

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
GeForce GTX 1660 Ti	GeForce GTX 1060 6GB	+19,7	+29,5	+47,8
GeForce GTX 1660 Ti	GeForce GTX 1070	0,0	+5,6	+9,7
GeForce GTX 1660 Ti	Radeon RX Vega 56	+1,4	−1,7	−10,5

Battlefield V

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
GeForce GTX 1660 Ti	GeForce GTX 1060 6GB	+53,1	+71,4	+69,6
GeForce GTX 1660 Ti	GeForce GTX 1070	+16,7	+10,8	+5,4
GeForce GTX 1660 Ti	Radeon RX Vega 56	−9,3	−11,1	−13,3

Far Cry 5

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
GeForce GTX 1660 Ti	GeForce GTX 1060 6GB	+40,0	+43,8	+123,5
GeForce GTX 1660 Ti	GeForce GTX 1070	+3,2	+4,5	+8,6
GeForce GTX 1660 Ti	Radeon RX Vega 56	−7,5	−17,9	−7,3

Shadow of the Tomb Raider

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
GeForce GTX 1660 Ti	GeForce GTX 1060 6GB	+25,0	+40,0	+47,4
GeForce GTX 1660 Ti	GeForce GTX 1070	+3,8	+10,5	+7,7
GeForce GTX 1660 Ti	Radeon RX Vega 56	+3,8	+5,0	−12,5

Total War: Warhammer II

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
GeForce GTX 1660 Ti	GeForce GTX 1060 6GB	+36,4	+40,0	+43,8
GeForce GTX 1660 Ti	GeForce GTX 1070	−1,6	0,0	0,0
GeForce GTX 1660 Ti	Radeon RX Vega 56	+5,3	+20,0	+35,3

Strange Brigade

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
GeForce GTX 1660 Ti	GeForce GTX 1060 6GB	+48,6	+51,0	+60,7
GeForce GTX 1660 Ti	GeForce GTX 1070	+2,9	+6,9	+12,5
GeForce GTX 1660 Ti	Radeon RX Vega 56	−6,1	−8,3	−10,0

Рейтинг iXBT.com

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и нормирован по самому слабому ускорителю — Radeon RX 550 (то есть сочетание скорости и функций Radeon RX 550 приняты за 100%). Рейтинги ведутся по 22 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. Из общего списка выбирается группа карт для анализа, куда входят GeForce GTX 1660 Ti и его конкуренты.

Для расчета рейтинга полезности использованы розничные цены на начало марта 2019 года.

№	Модель ускорителя	Рейтинг iXBT.com	Рейтинг полезности	Цена, руб.
10	RX Vega 56 8 ГБ, 1156—1590/1600	610	203	30 000
11	MSI GTX 1660 Ti 6 ГБ, 1500—2010/12240	610	247	24 700
12	GTX 1660 Ti 6 ГБ, 1500—1965/12000	600	261	23 000
13	GTX 1070 8 ГБ, 1507—1797/8000	550	204	27 000
14	RX 590 8 ГБ, 1469—1545/8000	480	240	20 000
16	GTX 1060 6 ГБ, 1507—1860/8000	380	205	18 500

Учитывая, что у компании AMD нет четких конкурентов для ценового сегмента 22—25 тысяч рублей, нам пришлось взять и более дорогой Radeon RX Vega 56 (он оказался лишь чуть-чуть быстрее, чем GTX 1660 Ti), и более дешевый Radeon RX 590 (он оказался сильно медленнее). Также GTX 1660 Ti не только с колоссальным отрывом обошел GTX 1060, но и оказался быстрее, чем GTX 1070.

При изучении GeForce RTX 2060 мы уверенно говорили, что RTX 2060 нацелен на разрешение Full HD без каких-либо компромиссов по качеству графики (все настройки на максимум!), а во многих играх он обеспечит хорошую играбельность и в 2.5К. В случае GeForce GTX 1660 Ti мы говорим о полной нацеленности на разрешение Full HD (самое популярное в мире игр на сегодня) при условии максимальных настроек качества, и лишь некоторые не самые требовательные к графике игры продемонстрируют хорошую играбельность на этом ускорителе и в разрешении 2.5К.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатели предыдущего рейтинга разделить на цены соответствующих ускорителей.

№	Модель ускорителя	Рейтинг полезности	Рейтинг iXBT.com	Цена, руб.
02	GTX 1660 Ti 6 ГБ, 1500—1965/12000	261	600	23 000
05	MSI GTX 1660 Ti 6 ГБ, 1500—2010/12240	247	610	24 700
06	RX 590 8 ГБ, 1469—1545/8000	240	480	20 000
10	GTX 1060 6 ГБ, 1507—1860/8000	205	380	18 500
11	GTX 1070 8 ГБ, 1507—1797/8000	204	550	27 000
12	RX Vega 56 8 ГБ, 1156—1590/1600	203	610	30 000

Как и в случае с GeForce RTX 2060, новый продукт GTX 1660 Ti с ходу уверенно заявил о притязаниях на лидерство в своей группе. Даже более дешевый Radeon RX 590 сошел с пьедестала и перестал быть лучшим выбором по соотношению возможностей и цены.

Выводы

Nvidia GeForce GTX 1660 Ti — удачное проникновение Turing в самый массовый сегмент игрового рынка. Будучи немного медленнее, чем GeForce RTX 2060, но составляя прямую конкуренцию Radeon RX Vega 56 и уходящему с рынка GeForce GTX 1070 (заметим, что про GeForce GTX 1060 речи вообще не идет, новинка гораздо быстрее!), GeForce GTX 1660 Ti обеспечит великолепную производительность в разрешении Full HD с максимальным настройками графики в играх. А иногда можно будет неплохо поиграть и в разрешении 2560×1440. GeForce GTX 1660 Ti демонстрирует великолепный прирост производительности относительно своего формального предка GeForce GTX 1060 (на десятки процентов, иногда и в 2 раза), прилично обходит GeForce GTX 1070 и выходит примерно на уровень конкурента из стана AMD, Radeon RX Vega 56, который, имея более высокую цену, менее выгоден.

У конкретного протестированного нами видеоускорителя MSI GeForce GTX 1660 Ti Gaming X (6 ГБ) можно выделить относительно компактные размеры при очень тихой СО с красивой подсветкой и великолепную поддержку фирменным программным обеспечением.

Итог: GeForce GTX 1660 Ti получился очень успешным представителем нового семейства по соотношению возможностей и стоимости не только в своем ценовом сегменте — он вообще вышел в лидеры среди всех игровых видеокарт в плане выгодности приобретения. Правда, этот ускоритель не поддерживает такие новые технологии семейства GeForce RTX, как трассировка лучей и «умный» DLSS на основе тензорных ядер. Однако у архитектуры Turing есть и другие улучшения по сравнению с Pascal. Инженеры Nvidia серьезно переработали мультипроцессоры для повышения количества операций, выполняемых за каждый такт, заодно повысив и общую эффективность новых GPU. Важнейшим изменением стало появление выделенных блоков для исполнения целочисленных инструкций, которыми раньше занимались те же FP32-блоки. INT32-операции теперь выполняются параллельно с FP32, что повысило эффективность исполнения сложных программ, все чаще использующих целочисленные операции, хотя вычисления с плавающей запятой и остаются главными для GPU.

В Turing появилась и новая возможность выполнения операций с плавающей запятой пониженной точности с удвоенным темпом. FP16 использовалась графическими процессорами Nvidia много лет назад, но с тех пор практически все «игровые» GPU перестали выполнять такие операции с более высокой скоростью (хотя в некоторых решениях для вычислений они применялись). Быть может, с распространением этой возможности ее поддержка найдет более широкое применение в играх. Пусть далеко не все шейдеры позволяют без появления артефактов снизить точность до FP16, однако преимущества в виде удвоенного темпа, экономии регистрового файла и пониженных требований к пропускной способности могут принести дополнительный прирост скорости.

В номинации «Оригинальный дизайн» карта MSI GeForce GTX 1660 Ti Gaming X 6 ГБ получила награду:

Благодарим компанию Nvidia Russia
и лично Ирину Шеховцову
за предоставленную на тестирование видеокарту

Для тестового стенда:
блок питания Seasonic Prime 1000 W Titanium предоставлен компанией Seasonic