Обзор видеоускорителя Nvidia GeForce GTX 1660Ti: новая «промежуточная» линейка на Turing, но без технологий GeForce RTX

Справочные материалы:

Теоретическая часть: особенности архитектуры

Выход видеокарт Nvidia, основанных на графической архитектуре Turing, стал важной вехой для 3D-графики реального времени. Первые решения линейки GeForce RTX были представлены компанией еще осенью, и постепенно Nvidia выпустила несколько моделей, предназначенных для разных ценовых диапазонов: GeForce RTX 2080 Ti, GeForce RTX 2080, GeForce RTX 2070 и GeForce RTX 2060.

Самое важное нововведение в GPU этого семейства — специализированные блоки для аппаратного ускорения трассировки лучей, позволяющие использовать физически корректный расчет распространения лучей света, в отличие от растеризации, лишь имитирующей их поведение. В GeForce RTX мы увидели первую массовую реализацию технологии, которая уже используется в двух играх: Battlefield V — для рендеринга реалистичных отражений, и Metro Exodus, где трассировка лучей применяется для расчета глобального освещения и затенения. Второй важной функциональностью Turing стало добавление еще одного типа вычислительных блоков — тензорных ядер, которые быстро справляются с алгоритмами глубокого обучения, что также уже применяется в играх в виде DLSS.

Специалисты Nvidia решили внедрить специализированные блоки для этих задач в Turing, что может серьезно сказаться на всем дальнейшем развитии графики в целом, но включение этих весьма сложных блоков дополнительно к уже имеющимся, при отсутствии серьезного прогресса в микроэлектронном производстве (используемый новинками техпроцесс 12 нм по своим характеристикам лишь чуть лучше 16-нанометрового), привело к увеличению размера кристаллов новых GPU, которые получились весьма крупными и дорогостоящими в производстве, что сказалось и на розничных ценах.

В феврале пришло время и для менее дорогих GPU новой архитектуры. Графический процессор TU116 стал первым среди бюджетного подсемейства Turing, который предназначен для решений с ценами ниже $300, и первой видеокартой на основе этого чипа стала модель GeForce GTX 1660 Ti, предлагаемая по цене $279. При подготовке среднебюджетных решений семейства Turing возможность оставить в них RT-ядра и тензорные ядра была лишь теоретической — уж слишком сильно они усложняют чипы. Задолго до выхода GPU этого уровня распространялись слухи о том, что они лишатся специализированных блоков для аппаратного ускорения трассировки лучей и глубокого обучения, так и получилось в итоге: модель GeForce GTX 1660 Ti вышла с приставкой GTX, а не RTX, и этот GPU не включает в себя RT-ядра и тензорные ядра, с которыми мы познакомились в предыдущих решениях семейства.

Оно и неудивительно, ведь в сильно ограниченном транзисторном бюджете этой ценовой категории было бы невозможно предложить достаточный уровень производительности таких блоков, так как даже GeForce RTX 2060 с трудом справляется с этими задачами, и не в самых высоких разрешениях. А добавление тех же RT-ядер к GPU не имеет смысла без соответствующего уровня производительности обычных CUDA-ядер. С тензорными ядрами вопрос сложнее, и мы его подробно рассмотрим далее. В любом случае, факт в том, что GeForce GTX 1660 Ti не имеет поддержки аппаратного ускорения трассировки лучей и глубокого обучения и фокусируется на достижении максимально возможной производительности в существующих играх в рамках транзисторного бюджета.

В архитектуре Turing инженеры компании Nvidia внедрили и множество других улучшений по сравнению с архитектурой Pascal: одновременное исполнение операций с плавающей запятой FP32 и целочисленных INT32, значительно измененную и улучшенную систему кэширования данных и несколько новых технологий рендеринга: программируемый конвейер обработки геометрии, переменную частоту затенения, затенение в текстурном пространстве, поддержку последних версий технологий DirectX 12, относящихся к уровню возможностей Feature Level 12_1.

Благодаря всем улучшениям мультипроцессоров Turing, по производительности и энергоэффективности видеокарта на базе TU116 превосходит аналогичные GPU из предыдущих семейств. Новый GPU особенно хорош в современных играх, использующих сложные шейдеры. Модель GeForce GTX 1660 Ti в среднем в 2-3 раза быстрее GeForce GTX 960 и до полутора раз быстрее GeForce GTX 1060 6GB в самых требовательных играх последнего времени.

Да и в сверхпопулярных многопользовательских проектах, таких как PUBG, Apex Legends, Fortnite и Call of Duty Black Ops 4, новый GPU позволяет получить 120 FPS и более при высоких настройках качества в Full HD-разрешении. Это довольно важно для динамичных сетевых шутеров, тогда как на видеокартах уровня GeForce GTX 960 игроки получают в тех же условиях лишь 50-60 FPS. А для таких игр высокая частота кадров довольно важна, ведь привычная мерка в 60 FPS в них не является пределом мечтаний — при подключении мониторов с частотой обновления 120-144 Гц удвоенный прирост плавности может принести и повышенную эффективность в сражениях.

В общем, GeForce GTX 1660 Ti за его цену даже чисто на бумаге выглядит весьма интересным решением для обновления видеоподсистемы у тех игроков, кто еще не сделал апгрейда на Pascal. На сегодняшний день почти две трети (64%) игроков имеют видеокарты уровня GeForce GTX 960 или ниже, а новинка предлагает уровень производительности вдвое-втрое выше этого устаревшего GPU практически во всех играх и поэтому довольно привлекательна для апгрейда.

Так как рассматриваемая модель видеокарты компании Nvidia основана на графическом процессоре архитектуры Turing, также имеющей много общего и с предыдущими архитектурами Pascal и Volta, то перед прочтением материала мы советуем ознакомиться с нашими предыдущими статьями:

Графический ускоритель GeForce GTX 1660 Ti
Кодовое имя чипа TU116
Технология производства 12 нм FinFET
Количество транзисторов 6,6 млрд (у GP106 — 4,4 млрд)
Площадь ядра 284 мм² (у GP106 — 200 мм²)
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12, с поддержкой уровня возможностей Feature Level 12_1
Шина памяти 192-битная: 6 независимых 32-битных контроллеров памяти с поддержкой памяти типов GDDR5 и GDDR6
Частота графического процессора 1500 (1770) МГц
Вычислительные блоки 24 потоковых мультипроцессора, включающих 1536 CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32
Блоки текстурирования 96 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 6 широких блоков ROP (48 пикселей) с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов поддержка подключения по интерфейсам HDMI 2.0b и DisplayPort 1.4a
Спецификации референсной видеокарты GeForce GTX 1660 Ti
Частота ядра 1500 (1770) МГц
Количество универсальных процессоров 1536
Количество текстурных блоков 96
Количество блоков блендинга 48
Эффективная частота памяти 12 ГГц
Тип памяти GDDR6
Шина памяти 192-бит
Объем памяти 6 ГБ
Пропускная способность памяти 288 ГБ/с
Вычислительная производительность (FP16/FP32) 11,0/5,5 терафлопс
Теоретическая максимальная скорость закраски 85 гигапикселей/с
Теоретическая скорость выборки текстур 170 гигатекселей/с
Шина PCI Express 3.0
Разъемы в зависимости от видеокарты
Энергопотребление до 120 Вт
Дополнительное питание один 8-контактный разъем
Число слотов, занимаемых в системном корпусе 2
Рекомендуемая цена $279 (22 990 рублей)

Рассматриваемая сегодня модель открывает новое семейство видеокарт — серию GeForce GTX 16, которая отличается от серии GeForce RTX 20 и суффиксом, и численными значениями серии. Если с заменой RTX на GTX все понятно (карты GTX не имеют поддержки технологий, которые есть у RTX), то меньшее значение для серии выглядит немного странно — видимо, в Nvidia решили не давать этим картам серию 20, чтобы сильнее разделить серии из маркетинговых соображений. А вот почему было выбрано именно число 16 — не очень понятно (кроме очевидного факта, что оно между 10 и 20). Почему не 15, например?

Интересно, что видеокарта GTX 1660 Ti не имеет публичного референсного варианта, равно как и Founders Edition. Партнеры компании делают собственные дизайны карт на основе внутреннего эталонного дизайна карты Nvidia, и в этом случае мы сразу же увидели в продаже множество вариантов карт с различными характеристиками и системами охлаждения. Кстати, с большой долей вероятности можно предположить, что на основе урезанной версии чипа TU116 у Nvidia в скором времени выйдут и другие решения семейства GTX 16, как бывало ранее.

GeForce GTX 1660 Ti поступила в продажу по цене от $279, то есть на $30 дороже GTX 1060 6GB, которую она и заменяет в линейке компании. Конечно же, это дешевле, чем $349 за RTX 2060, но такое решение снова выглядит как повышение цен на GPU определенного ценового диапазона. Если в случае с RTX оно было оправдано новыми технологиями, то в случае с GTX 1660 Ti это просто повышение цены для среднебюджетного GPU. Что еще более странно с учетом того, что новинка является прямой заменой для GTX 1060 6GB. Те, правда, уже почти все распроданы и не будут мешать продажам новой видеокарты.

Вероятно, выставленная цена имеет некоторое отношение к цене прямого конкурента новинки — не так давно вышедшей видеокарты AMD семейства Polaris, Radeon RX 590, поступившей в продажу изначально за те же деньги. Конкурент из этой Radeon для новой GeForce получается так себе, и ему помогает разве что снижение цены, ведь по производительности GTX 1660 Ti должна быть ближе к более дорогой Radeon RX Vega 56. Кстати, некоторое время партнеры AMD даже продавали эту видеокарту за примерно такие же деньги, но это была разовая акция и далеко не во всех странах, так что мы продолжаем считать прямым конкурентом новинки именно RX 590.

В новом GPU инженеры решили использовать проверенную временем 192-битную шину памяти, которая ограничивает возможные варианты объема видеопамяти значениями 6 ГБ или 12 ГБ. Второй вариант крутоват для модели этого ценового сегмента, особенно учитывая дорогую GDDR6-память, поэтому пришлось ограничиться 6 ГБ. Как и в случае RTX 2060, это кажется компромиссным решением, хотелось бы иметь 8 ГБ. Впрочем, в реальном применении в течение актуального жизненного цикла GPU, с учетом того, что он рассчитан на разрешение Full HD, случаи с жесткой нехваткой видеопамяти вряд ли будут возникать слишком часто.

Еще одной важной характеристикой любого GPU является потребление энергии, и тут Nvidia смогла вместить GTX 1660 Ti в тот же теплопакет 120 Вт, что и GTX 1060 6GB. Видимо, за это во многом стоит поблагодарить отказ от технологий RTX, так как старшие чипы Turing потребляют больше энергии, чем их предшественники из семейства Pascal.

GeForce GTX 1660 Ti вышла в продажу еще 22 февраля и партнеры компании Nvidia сразу предложили широкий набор различных модификаций этой видеокарты на основе их собственного дизайна, включая фабрично разогнанные варианты с самыми разными системами охлаждения, имеющими от одного до трех вентиляторов:

Типичная видеокарта модели GeForce GTX 1660 Ti довольствуется одним 8-контактным разъемом дополнительного питания PCI Express, а вот количество и тип разъемов вывода информации на дисплеи зависит исключительно от конкретной карты. Сам по себе GPU поддерживает все те же разъемы и стандарты DVI, HDMI, DisplayPort и VirtualLink, что и более мощные решения семейства Turing.

Архитектурные особенности

Главное, что отличает TU116 от чипов TU10x с архитектурной точки зрения — отсутствие самой интересной части функциональности, появившейся именно в чипах семейства Turing. Из нового среднебюджетного GPU были убраны аппаратные блоки для ускорения трассировки лучей и тензорные ядра — все для того, чтобы недорогой графический процессор был не слишком сложным и лучше делал свое основное дело — традиционный рендеринг привычным методом растеризации.

С площадью кристалла в 284 мм² чип TU116 получился значительно меньше самого слабого из представленных ранее чипов семейства Turing — TU106. Естественно, и количество транзисторов уменьшилось с 10,8 млрд до 6,6 млрд, что очень серьезно снижает себестоимость производства, очень важную для среднебюджетных графических процессоров. Но если сравнивать TU116 с GP106, то новый GPU примерно настолько же больше него по размеру (200 мм² у GP106), так что изменения в мультипроцессорах Turing тоже не обошлись даром.

По доступным публике данным не слишком просто понять, насколько велик вклад именно RT-ядер и тензорных ядер в сложность старших чипов Turing, так как TU116 имеет меньшее количество мультипроцессоров и других блоков по сравнению с TU106 и напрямую их сравнить не получится. Но давайте все же рассмотрим характеристики нескольких моделей видеокарт Nvidia из двух последних поколений, близких друг к другу по цене:

  GTX 1660 Ti RTX 2060 GTX 1060
Кодовое имя GPU TU116 TU106 GP106
Кол-во транзисторов, млрд 6,6 10,8 4,4
Площадь кристалла, мм² 284 445 200
Базовая частота, МГц 1500 1365 1506
Турбо-частота, МГц 1770 1680 1708
CUDA-ядра, шт 1536 1920 1280
Производительность FP32, TFLOPS 5,5 6,5 4,4
Тензорные ядра, шт. 0 240 0
RT-ядра, шт. 0 30 0
Блоки ROP, шт. 48 48 48
Блоки TMU, шт. 96 120 80
Объем видеопамяти, ГБ 6 6 6
Шина памяти, бит 192 192 192
Тип памяти GDDR6 GDDR6 GDDR5
Частота памяти, ГГц 12 14 8
ПСП памяти, ГБ/с 288 336 192
Энергопотребление TDP, Вт 120 160 120
Рекомендованная цена, $ 279 349 249(299)

TU116 имеет ту же архитектуру мультипроцессоров, что и видеокарты семейства GeForce RTX, за исключением RT-ядер и тензорных ядер (некоторые подробности будут ниже), так что сравнивать с RTX 2060 новинку можно. В модели GTX 1660 Ti применяется полный чип TU116, и количество мультипроцессоров в нем было сокращено до 24 по сравнению с TU106. Кроме этого, немного снизили частоту GDDR6-памяти с 14 ГГц до 12 ГГц, оставив 192-битную шину. В остальном же эти чипы вполне сравнимы — и в теории, и на практике. Как бы компенсируя меньшее количество исполнительных блоков, GTX 1660 Ti получила чуть большую тактовую частоту, хотя эта разница особой роли не играет.

Если сравнивать по пиковым показателям, то GTX 1660 Ti получился даже чуть быстрее RTX 2060 по филлрейту — из-за одинакового количества блоков ROP и чуть повышенной частоты, а вот по более важным показателям математической и текстурной производительности новинка обеспечивает где-то около 85% производительности старшей RTX 2060. Впрочем, по сравнению с GTX 1060 6GB новая видеокарта минимум на четверть быстрее ее по этим же показателям, по ПСП вообще наполовину, а вот преимущество по филлрейту почти отсутствует. То есть, GTX 1660 Ti должна быть по скорости где-то между этими двумя моделями и близко к уровню еще одной — GTX 1070.

Полная версия чипа TU116 в модификации для GTX 1660 Ti содержит три кластера Graphics Processing Cluster (GPC), и в каждом из них — по четыре кластера Texture Processing Cluster (TPC), состоящих из движков PolyMorph Engine и пары мультипроцессоров SM. В свою очередь, каждый SM состоит из: 64 CUDA-ядер и четырех блоков текстурирования TMU. То есть, всего TU116 содержит 1536 CUDA-ядер в 24 мультипроцессорах. Подсистема памяти состоит из шести 32-битных контроллеров памяти, что дает нам в целом 192-битную шину.

Что касается тактовых частот графического процессора, то базовая частота чипа GeForce GTX 1660 Ti равна 1500 МГц, а турбо-частота достигает 1770 МГц. Как обычно для решений Nvidia, это не максимальная частота, а средняя для нескольких игр и приложений. Реальная частота в каждом случае будет отличаться, так как она зависит как от игры, так и от условий конкретной системы (питания, температура и т. п.). Видеопамять стандарта GDDR6 работает на частоте 12 ГГц, что дает нам очень высокую для среднебюджетного сегмента пропускную способность в 288 ГБ/с.

Кроме отрезания функциональности RTX, TU116 ничем не хуже своих старших братьев — в остальном по своим возможностям он полностью соответствует чипам TU10x, архитектура мультипроцессоров в целом одинакова. И с программной точки зрения, GTX 1660 Ti ничем не отличается от решений GeForce RTX, кроме поддержки аппаратной трассировки лучей и ускорения задач глубокого обучения при помощи тензорных ядер — эти задачи тоже будут выполняться, просто со значительно меньшей скоростью.

Мультипроцессор в TU116 почти идентичен блокам SM, которые мы видели в старших чипах Turing. Он состоит из четырех разделов и имеет свои текстурные блоки и кэш-память первого уровня. Даже размеры кэшей и регистрового файла в мультипроцессорах не изменились. А вот что изменилось в TU116 по сравнению со старшими чипами семейства, так это объем кэш-памяти второго уровня вне мультипроцессоров. Если старшие чипы Turing имеют по 512 КБ L2-кэша на раздел ROP (и у TU106 всего получается 4 МБ), то TU116 ограничен лишь 256 КБ L2-кэша (1,5 МБ на чип).

Структура нового дизайна мультипроцессоров SM отличается от того, что было в Pascal. Мультипроцессор Turing разделен на четыре раздела — каждый с собственным блоком планирования и распределения (warp scheduler and dispatch unit), и способен выполнять по 32 потока за такт. В разделах есть несколько типов исполнительных блоков: 16 ядер FP32, 16 ядер INT32 и 32 ядра для исполнения операций с FP16 точностью. Самое важное отличие заключается в том, что обработкой целочисленных операций и операций с плавающей запятой теперь занимаются разные блоки, а операции со сниженной точностью FP16 выполняются вдвое быстрее, чем FP32.

И это повышает эффективность загрузки блоков GPU. Приведем пример шейдеров из игры Shadow of the Tomb Raider, в которых на каждые 100 инструкций приходится в среднем 38 инструкций INT32 и 62 FP32. Все предыдущие архитектуры Nvidia, включая Pascal, выполняют их последовательно одна за другой, а Turing умеет параллельно выполнять INT и FP, так как в SM появились дополнительные блоки для исполнения целочисленных операций.

Одновременное исполнение FP- и INT-операций обеспечивает более эффективное исполнение шейдеров, и в сложных случаях прирост получается в полтора раза и более. В частности, общая производительность рендеринга GeForce GTX 1660 Ti в игре Shadow of the Tomb Raider примерно в полтора раза выше, чем у GTX 1060 6GB, хотя это связано не только с указанной модификацией, конечно же.

Также в Turing была значительно улучшена система кэширования — внедрена унифицированная архитектура для разделяемой памяти и кэшей: первого уровня и текстурного. Новая система кэширования имеет вдвое больше блоков загрузки-выгрузки данных (Load-Store Unit — LSU), шире линии передачи данных в кэш-память и обратно (32-бита против 16-бит) и большее их количество, а также втрое больший объем L1-кэша по сравнению с аналогичным GPU из семейства Pascal (GeForce GTX 1060).

Новый дизайн системы кэширования значительно увеличил эффективность кэширования данных и позволяет переконфигурировать размер кэша тогда, когда программистом не используется полный объем разделяемой памяти. L1-кэш может быть объемом 64 КБ, в дополнение к 32 КБ разделяемой памяти на каждый мультипроцессор, или наоборот, можно снизить объем L1-кэша до 32 КБ, оставив 64 КБ на разделяемую память.

Одной из игр, получающих преимущество от улучшений кэширования в Turing, стала Call of Duty Black Ops 4. По результатам внутренних тестов Nvidia, GeForce GTX 1660 Ti примерно на 50% быстрее своей предшественницы GTX 1060 6GB в этой игре — во многом из-за более эффективной работы кэш-памяти. Также наверняка сработала и быстрая GDDR6-память, поддержка которой появилась именно в Turing. GeForce GTX 1660 Ti имеет те же 6 ГБ памяти, подключенной к GPU по 192-битному интерфейсу, как и старшая модель GTX 1060, но из-за установки на нее скоростной GDDR6-памяти, работающей на эффективной частоте в 12 ГГц, новая модель имеет на 50% большую пропускную способность памяти.

Также архитектурой Turing поддерживаются новые технологии для увеличения производительности в играх: Variable Rate Shading (VRS) — переменная частота затенения, Texture-Space Shading — затенение в текстурном пространстве, Multi-View Rendering — отрисовка с нескольких позиций, Mesh Shading — полностью программируемый конвейер обработки геометрии, CR и ROVs — технологии DirectX 12 уровня возможностей Feature Level 12_1.

Переменная частота затенения позволяет реализовать два важных алгоритма адаптивной частоты затенения в зависимости от содержания и движения в сцене — Content Adaptive Shading и Motion Adaptive Shading. Оба алгоритма позволяют изменять частоту затенения для некоторых участков изображения, которые не требуют рендеринга с полным качеством, когда вполне достаточно и меньшего количества выборок для увеличения производительности.

К примеру, Motion Adaptive Shading позволяет регулировать частоту затенения в зависимости от наличия/скорости изменений в сцене. Самый простой и понятный пример — гоночная игра, где центральная часть с автомобилем игрока отрисовывается в полном качестве, а дорога и окружение на периферии кадра рендерятся с худшим качеством, так как они все равно слишком быстро движутся и человеческие глаза и мозг просто не могут увидеть разницу в качестве.

Или взять Content Adaptive Shading, при работе которого частота затенения определяется разницей в цвете соседних пикселей на протяжении нескольких кадров. Если цвета от кадра в кадр меняются слабо, как на поверхности неба, то вполне можно этот участок отрисовать с меньшей частотой затенения, и человек снова не увидит визуальной разницы. Переменная частота затенения уже используется в игре Wolfenstein II: The New Colossus, и меньшая работа по закраске пикселей приносит приличный прирост производительности, помогая GeForce GTX 1660 Ti быть в полтора раза быстрее, чем GTX 1060 6GB.

Часть улучшений в Turing пришла из Volta, а часть — новые архитектурные новинки, которые есть только в новейшем поколении. Некоторым могло показаться, что TU116 правильнее причислять к архитектуре Volta, так как у него нет RT-ядер и тензорных ядер, а многие улучшения в мультипроцессорах уже были сделаны в GV100. Это не соответствует действительности, так как в Turing есть изменения, которые отсутствуют в Volta: поддержка некоторых возможностей DirectX 12 (resource heap tier 2) и технологии, о которых мы выше рассказывали: Mesh Shading, Variable Rate Shading, Texture Space Shading и другие.

Также в архитектуре Turing были улучшены последние слабые места архитектуры Pascal относительно конкурирующей GCN у AMD, которые могли приводить к снижению производительности в ПК-играх на Pascal, так как код был оптимизирован для GCN. У Turing никаких слабостей уже не осталось, она всегда достаточно эффективна, в том числе с применением асинхронного исполнения шейдерных программ, популярного в современных играх.

Отметим еще один важный момент по поводу тензорных ядер. В TU116 их нет, как говорит Nvidia, но удвоенный темп выполнения операций с точностью FP16 остался, но в семействе GeForce RTX они выполняются на том же «железе», что и тензорные операции (при работе используется часть тензорных ядер). Для поддержки этой функциональности в TU116 пришлось оставить урезанную часть тензорных ядер — выделенные FP16-блоки, которые также могут работать одновременно с FP32-блоками (вместо INT, но не все три типа блоков вместе). И с программной точки зрения для приложений не будет никакой разницы, все GPU нового семейства способны выполнять FP16 с удвоенной производительностью.

Впрочем, конкретно в играх эта возможность до сих пор остается не особенно востребованной, так как из популярных проектов используется разве что в Wolfenstein II и Far Cry 5 (для симуляции водной поверхности), да и то — еще неизвестно, остались ли они в последних патчах. То же самое касается и того, что на всех решениях Turing могут выполняться параллельно FP32 FMA и INT32 операции, или FP16 (с удвоенной производительностью) и INT32 операции, или FP32 и ускоренные FP16. Теоретически, на этих FP16 блоках могут параллельно выполняться и тензорные операции, но лишь в теории, поддержки того же DLSS в TU116 нет и вряд ли она будет — тут даже удвоенной скорости FP16 не хватит.

Если говорить о вещах, не связанных с 3D, то в TU116 есть обновленный блок вывода информации, поддерживающий дисплеи с высоким разрешением, HDR и высокой частотой обновления. Все платы на графических процессорах архитектуры Turing имеют порты DisplayPort 1.4a, позволяющие вывести информацию на 8K-монитор с частотой обновления 60 Гц с поддержкой технологии VESA Display Stream Compression (DSC) 1.2, обеспечивающей высокую степень сжатия.

Все решения семейства Turing также поддерживают два 8K-дисплея при 60 Гц (требуется по одному кабелю на каждый), такое же разрешение также можно получить при подключении через установленный USB-C. Кроме этого, все TU1xx поддерживают полноценный HDR в конвейере вывода информации, включая tone mapping для различных мониторов — со стандартным динамическим диапазоном и расширенным.

Все новые GPU семейства Turing содержат улучшенный кодировщик видеоданных NVEnc, добавляющий поддержку сжатия данных в формате H.265 (HEVC) при разрешении 8K и 30 FPS. Из других улучшений — снижение битрейта при схожем качестве на 25% для HEVC и до 15% для H.264. Также был обновлен и декодер видеоданных NVDec, получивший поддержку декодирования данных в формате HEVC YUV444 10-бит/12-бит HDR при 30 FPS, в формате H.264 при 8K-разрешении и в формате VP9 с 10-бит/12-бит данными.

Чипы семейства Turing улучшили качество кодирования видеоданных, которое приблизилось к качеству чисто программных кодеров, а порой и опережает их. Так, NVEnc в Turing обеспечивает уровень качества программного кодирования программным кодером x264 с профилем Fast при гораздо меньшей нагрузке на CPU. Настолько меньшей, что GPU вполне «тянет» стриминг в разрешении 4К, слишком тяжелый для типичных процессоров при программном кодировании видео. Кодер Nvidia уже поддерживается в популярном пакете OBS для стриминга, и стримеры с его помощью могут транслировать игру при использовании одного ПК, что невозможно при программном кодировании.

Более подробно с возможностями семейства Turing вы можете ознакомиться в большом обзоре GeForce RTX 2080 Ti.

Предварительная оценка производительности и промежуточные выводы

Что касается производительности Turing по сравнению с Pascal, то все улучшения эффективности мультипроцессоров в новой архитектуре значительно улучшили как производительность (в полтора раза по оценке Nvidia), так и энергоэффективность (на 40%). Прирост производительности Turing по количеству исполняемых операций за такт в реальных играх составляет около полутора раз, а при том же уровне энергопотребления среднее преимущество GTX 1660 Ti над GTX 1060 6GB по итоговой частоте кадров можно оценить примерно в 35%-40%.

И чем новее игры используются, тем больше преимущество от увеличенной эффективности Turing. Так, если в устаревших проектах вроде Fallout 4 и Deus Ex: Mankind Divided преимущество новинки над GTX 1060 оказывается лишь 20%-30%, то в Shadow of the Tomb Raider и Call of Duty Black Ops 4 оно доходит до 40%-45% и даже более. В целом же можно сказать, что видеокарта модели GeForce GTX 1660 Ti явно разработана для игры в Full HD-разрешении, и она обеспечивает в этих условиях отличную производительность при максимальном качестве картинки.

Похоже, что с выходом решений линейки GeForce GTX 16 (за GTX 1660 Ti вскоре последуют и другие модели), компании Nvidia будет несколько проще продвигать возможности старшего подсемейства GeForce RTX, ведь они будут жестко разделены по возможностям и в более дешевых вариантах поддержки самых современных технологий в ближайшем будущем не ожидается.

Для тех, кому не нужны эти новые технологии (весьма впечатляющие, но пока что больше в теории, чем на практике — вышло всего две игры с поддержкой трассировки лучей и хотя трассировка приносит более качественный рендеринг, но многим игрокам не хватает вау-фактора) будут предложены решения GeForce GTX 16, а если игрок готов потратить больше денег за уникальные графические возможности — старшие видеокарты семейства Turing к их услугам.

Особенности видеокарты

Объект исследования: ускоритель трехмерной графики (видеокарта) MSI GeForce GTX 1660 Ti Gaming X 6 ГБ 192-битной GDDR6

Сведения о производителе: Компания Nvidia Corporation (торговая марка Nvidia) основана в 1993 году в США.Штаб-квартира в Санта-Кларе (Калифорния). Разрабатывает графические процессоры, технологии. До 1999 года основной маркой была Riva (Riva 128/TNT/TNT2), с 1999 года и по настоящее время — GeForce. В 2000 году были приобретены активы 3dfx Interactive, после чего торговые марки 3dfx/Voodoo перешли к Nvidia. Своего производства нет. Общая численность сотрудников (включая региональные офисы) — около 5000 человек.

Характеристики карты

MSI GeForce GTX 1660 Ti Gaming X 6 ГБ 192-битной GDDR6
GPU GeForce GTX 1660 Ti (TU116)
Интерфейс PCI Express x16
Частота работы GPU (ROPs), МГц Референс: 1500—1770(Boost)—1965(Max)
MSI: 1500—1875(Boost)—2010(Max)
Частота работы памяти (физическая (эффективная)), МГц Референс: 3000 (12 000)
MSI: 3060 (12 240)
Ширина шины обмена с памятью, бит 192
Число вычислительных блоков в GPU 24
Число операций (ALU) в блоке 64
Суммарное количество блоков ALU (CUDA) 1536
Число блоков текстурирования (BLF/TLF/ANIS) 96
Число блоков растеризации (ROP) 48
Число блоков RayTracing нет
Число тензорных блоков нет
Размеры, мм 250×115×42
Количество слотов в системном блоке, занимаемые видеокартой 3
Цвет текстолита черный
Энергопотребление пиковое в 3D, Вт 123
Энергопотребление в режиме 2D, Вт 20
Энергопотребление в режиме «сна», Вт 10
Уровень шума в 3D (максимальная нагрузка), дБА 25,9
Уровень шума в 2D (просмотр видео), дБА 18,0
Уровень шума в 2D (в простое), дБА 18,0
Видеовыходы 1×HDMI 2.0b
3×DisplayPort 1.4
Поддержка многопроцессорной работы нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 4
Питание: 8-контактные разъемы 1
Питание: 6-контактные разъемы 0
Максимальное разрешение/частота, Display Port 3840×2160@160 Гц (7680×4320@30 Гц)
Максимальное разрешение/частота, HDMI 3840×2160@60 Гц
Максимальное разрешение/частота, Dual-Link DVI 2560×1600@60 Гц (1920×1200@120 Гц)
Максимальное разрешение/частота, Single-Link DVI 1920×1200@60 Гц (1280×1024@85 Гц)
Средняя цена 24 700 руб. (на момент написания материала)

Особенности карты и сравнение с GTX 1060

MSI GeForce GTX 1660 Ti Gaming X Nvidia GeForce GTX 1060
вид спереди
вид сзади

Мы сравниваем с GTX 1060 прежде всего потому, что GTX 1660 Ti будет замещать именно этот ускоритель, хотя по уровню производительности он примерно соответствует GTX 1070. Да и по ширине шины они с GTX 1060 схожи.

Для всех карт с шиной памяти 192 бит характерна разводка 256-битной шины на печатной плате, при этом просто не задействованы два посадочных места под микросхемы памяти (каждая микросхема имеет ширину подключения 32 бита, поэтому 256 − 2 × 32 = 192).

В схеме питания задействованы два ШИМ-контроллера: OnSemi NCP81610 управляет 4 фазами питания GPU, а uP1666Q производства uPI управляет двумя фазами питания микросхем памяти. Подвод питания осуществляется через один 8-контактный разъем.

Как обычно, с помощью утилиты MSI Afterburner можно не только напрямую повысить частоты работы карты, но и запустить Nvidia Scanner, который поможет определить безопасный максимум разгона ядра и памяти. И если Afterburner уже стала международно признанной и очень популярной программой, не привязанной к производителю видеокарт, то теперь MSI предлагает и утилиту Dragon Center, поддерживающую управление не только частотами, но и подсветкой.

Режимов работы красочной подсветки очень много.

В результате имеем очень красивую видеокарту в работе. В начале раздела описания карты имеется видеоролик, где это можно увидеть в динамике.

Карта имеет стандартный набор видеовыходов: 3 DP и 1 HDMI.

Также следует заметить, что частоты работы у карты MSI чуть повышены относительно референсных значений, но именно чуть-чуть — на 2,3%.

Память

Карта имеет 6 ГБ памяти GDDR6 SDRAM, размещенной в 6 микросхемах по 8 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6) рассчитаны на номинальную частоту работы в 3000 (12000) МГц

Охлаждение и нагрев

Главной частью системы охлаждения под названием TwinFrozr 7 является довольно большой никелированный радиатор, пронизанный тепловыми трубками. Поверх установлен кожух с двумя вентиляторами Torx 3.0 (имеющими особую форму крыльчаток, помогающую ускорить воздушный поток без увеличения шума, и работающими на одинаковой частоте вращения). Вентиляторы останавливаются в случае простоя карты (при температуре GPU ниже 50-52 градусов). Микросхемы памяти и силовые транзисторы охлаждаются отдельной пластиной, но там охлаждение чисто символическое. С оборотной стороны карта прикрывается специальной пластиной, которая обеспечивает жесткость печатной платы и, теоретически, немного помогает рассеивать тепло с микросхем памяти и силовых транзисторов (прижатая к ним рамка крепится сквозь текстолит именно к этой пластине), а на деле является декоративным элементом.

Мониторинг температурного режима с помощью MSI Afterburner (автор А. Николайчук AKA Unwinder):

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 65 градусов, что является очень хорошим результатом для видеокарты такого уровня.

Максимальный нагрев — центральная часть карты.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума выполняется по методике, описанной здесь:

  • 28 дБА и менее: шум плохо различим уже на расстоянии одного метра от источника, даже при очень низком уровне фонового шума. Оценка: шум минимальный.
  • от 29 до 34 дБА: шум различим уже с двух метров от источника, но не особо обращает на себя внимания. С таким уровнем шума вполне можно мириться даже при долговременной работе. Оценка: шум низкий.
  • от 35 до 39 дБА: шум уверенно различается и заметно обращает на себя внимание, особенно в помещении с низким уровнем шума. Работать с таким уровнем шума можно, но спать будет затруднительно. Оценка: шум средний.
  • 40 дБА и более: такой постоянный уровень шума уже начинает раздражать, от него быстро устаешь, появляется желание выйти из комнаты или выключить прибор. Оценка: шум высокий.

В режиме простоя в 2D температура составляла 44 °C, вентиляторы не работали. Шум был равен фоновому 18,0 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось: температура ядра оставалась прежней, вентиляторы также не работали, шум сохранялся на уровне 18,0 дБА.

В режиме максимальной нагрузки в 3D температура достигала 65 °C. Вентиляторы при этом раскручивались до 1450 оборотов в минуту, шум вырастал до 25,9 дБА, так что шум от данной СО минимальный.

Комплект поставки и упаковка

Базовый комплект поставки серийной карты должен включать в себя руководство пользователя, диск с драйверами и утилитами. Мы видим, по сути, базовый комплект.

Синтетические тесты

Недавно мы обновили пакет синтетических тестов, он все еще экспериментальный и будет меняться. Мы бы хотели добавить еще больше примеров с вычислениями (compute shaders), но с этим есть определенные сложности. В будущем мы постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — пишите их в комментариях к статье или отправьте почтой.

Из ранее активно использовавшихся нами тестов RightMark3D мы оставили лишь несколько самых тяжелых вариантов. Остальные уже изрядно устарели и на столь мощных GPU упираются в различные ограничители, не загружают работой блоки графического процессора и не показывают истинную его производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы пока что решили оставить в полном составе, так как заменить их попросту нечем, хотя и они уже устарели.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько тестов для измерения производительности трассировки лучей и один тест для сравнения производительности сглаживания методами DLSS и TAA для современных решений Nvidia. В качестве полусинтетического теста у нас также используется и популярный 3DMark Time Spy, помогающий определить прирост от асинхронных вычислений.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce GTX 1660 Ti со стандартными параметрами (GTX 1660 Ti)
  • GeForce RTX 2060 со стандартными параметрами (RTX 2060)
  • GeForce GTX 1070 со стандартными параметрами (GTX 1070)
  • GeForce GTX 1060 со стандартными параметрами (GTX 1060)
  • Radeon RX 590 со стандартными параметрами (RX 590)

Для анализа производительности новой видеокарты GeForce GTX 1660 Ti мы взяли эти решения по следующим причинам. Естественно, что мы сравнили новинку с RTX 2060, как самой младшей моделью из GeForce RTX. Также мы взяли для теста его прямого предшественника в виде GeForce GTX 1060 (с 6 ГБ памяти, конечно) — чтобы понять, насколько среднебюджетный Turing быстрее аналогичного по уровню GPU семейства Pascal. Ну и на всякий случай в части тестов была и модель GTX 1070, примерно на уровне которой должна выступить новинка.

В качестве основного и единственного в этот раз соперника для GeForce GTX 1660 Ti у нас выступает видеокарта Radeon RX 590, имеющая близкую рекомендованную цену. Будет интересно узнать, насколько они соответствуют друг другу и по производительности. Вторую подходящую видеокарту AMD для нашего сегодняшнего сравнения мы брать не стали — нет особого смысла сравнивать новинку с Vega 56 или Vega 64, так как они стоят дороже, а возможностей для снижения цен у AMD вряд ли много.

 
Тесты Direct3D 10
 
Тесты из 3DMark Vantage
 
Тесты Direct3D 11
 
Тесты Direct3D 12
 
Вычислительные тесты

Выводы по теоретической части и синтетическим тестам

Судя по теоретическим данным и синтетическим тестам, видеокарта модели GeForce GTX 1660 Ti, основанная на графическом процессоре TU116 архитектуры Turing, занимает на рынке игровых видеокарт место GeForce GTX 1060, выступая на уровне более старшей модели — GTX 1070, хотя были в наших тестах и спорные результаты. Со старыми синтетическими бенчмарками у всех новых GPU дела обстоят не очень хорошо, но в более новых тестах влияние архитектурных улучшений в Turing хорошо заметно. Предполагаем, что в играх новинка должна быть примерно на уровне GTX 1070 из предыдущего семейства Pascal.

Надо отметить, что у Nvidia с семейством Turing получилась довольно необычная продуктовая линейка. Это наверняка объясняется сложностями внедрения таких глобальных и непростых вещей, как трассировка лучей и ускорение задач искусственного интеллекта, которые были сделаны в старших решениях GeForce RTX, но пока на рынке были только они, все было ровно и понятно, а вот с выходом GeForce GTX 1660 Ti линейка стала более разнородной.

Хотя графический процессор TU116 — это все тот же Turing (за минусом технологий RTX и пары мелких количественных изменений типа объема L2-кэша), получилось так, что видеокарты нового поколения раскололись на два подсемейства: с трассировкой лучей и тензорными ядрами и без них. RTX — подороже и покруче, GTX — подешевле и без «лишних» технологий. Наверное, на данном этапе это единственное грамотное решение, когда внедрение новых технологий обходится пока что слишком дорого в прямом и переносном смыслах.

В том числе поэтому подсемейство RTX обеспечило не такой уж большой прирост по соотношению цены и производительности по сравнению с Pascal (за счет повышенной сложности и себестоимости новинок), а вот урезанный по возможностям GTX 1660 Ti стал максимально эффективным решением для текущих игр без трассировки — по сравнению с любой другой видеокартой. Новинка на чипе TU116 оказалась выгоднее других решений из своего ценового сегмента и поэтому принята рынком лучше, чем ее более дорогие собратья из семейства Turing с поддержкой RTX.

Это и неудивительно, ведь GeForce GTX 1660 Ti обеспечивает в среднем на 40% бо́льшую производительность по сравнению с GTX 1060 6GB, и пусть это не такой уж большой прирост в абсолютных цифрах, но с учетом цены это сейчас самый удачный вариант. Особенно для тех, на кого и целится Nvidia — владельцев видеокарт уровня GTX 960, которые не обновились на Pascal. В этом случае GTX 1660 Ti легко обеспечит им двукратный и более прирост, оказавшись на уровне GTX 1070 из прошлого поколения.

С точки зрения энергоэффективности, GTX 1660 Ti удивляет еще больше: Nvidia смогла повысить производительность при том же энергопотреблении, что и у GTX 1060 6GB! Так что TU116 на 35%-40% эффективнее справляется с работой по сравнению с одним из лучших чипов архитектуры Pascal, что является очень наглядным показателем роста эффективности Turing. Нет даже особого смысла сравнивать новинку с прямым ценовым конкурентом из стана AMD, который потребляет гораздо больше энергии. Вообще, что касается прямого сравнения GTX 1660 Ti и RX 590, то видеокарте AMD тут мало что светит при практически той же цене — GTX 1660 Ti получился быстрее и значительно эффективнее. И на RX 590 пришлось снижать цену, ведь с энергопотреблением ничего не поделаешь как минимум до выхода Navi.

Но и у GTX 1660 Ti есть опасный конкурент — RTX 2060. Да, эта модель дороже, но не так уж намного, а если в ближайшие месяцы появится еще несколько хороших игр с поддержкой трассировки лучей и других отсутствующих в младшем Turing технологий, то в не такой уж и большой переплате за RTX появится определенный смысл. Может быть, в Nvidia изначально и планировали таким образом переманивать игроков на RTX? В любом случае, пока что, при всего лишь двух играх с трассировкой лучей, у GTX 1660 Ti есть все шансы стать одной из самых популярных видеокарт на рынке.

Немного смущает лишь повышенная цена по сравнению с GTX 1060 6GB, но рынок есть рынок — даже при цене в $279 на данный момент этот GPU получился весьма выгодным. А из потенциальных минусов GeForce GTX 1660 Ti отметим разве что объем локальной видеопамяти 6 ГБ, которого может не хватить в некоторых играх и условиях через пару лет. Но пока что этого объема VRAM вполне хватает, что мы и должны увидеть в наших игровых тестах, к которым переходим.

Игровые тесты

Конфигурация тестового стенда

  • Компьютер на базе процессора AMD Ryzen 7 2700X (Socket AM4):
    • процессор AMD Ryzen 7 2700X (разгон до 4,0 ГГц);
    • СО Antec Kuhler H2O 920;
    • системная плата Asus ROG Crosshair VI Hero на чипсете AMD X370;
    • оперативная память 16 ГБ (2×8 ГБ) DDR4 AMD Radeon R9 UDIMM 3200 МГц (16-18-18-39);
    • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA2;
    • блок питания Seasonic Prime 1000 W Titanium (1000 Вт);
    • блок питания Thermaltake RGB 750W;
    • корпус Thermaltake Versa J24;
  • операционная система Windows 10 Pro 64-битная; DirectX 12;
  • телевизор LG 43UK6750 (43″ 4K HDR);
  • драйверы AMD версии 19.2.1;
  • драйверы Nvidia версии 418.91 (для GeForce GTX 1660 Ti версии 419.35);
  • VSync отключен.

Список инструментов тестирования

Во всех играх использовалось максимальное качество графики в настройках.

  • Wolfenstein II: The New Colossus (Bethesda Softworks/MachineGames)
  • Tom Clancy’s Ghost Recon Wildlands (Ubisoft/Ubisoft)
  • Assassin’s Creed: Origins (Ubisoft/Ubisoft)
  • Battlefield V (EA Digital Illusions CE/Electronic Arts)
  • Far Cry 5 (Ubisoft/Ubisoft)
  • Shadow of the Tomb Raider (Eidos Montreal/Square Enix) — HDR включен
  • Total War: Warhammer II (Creative Assembly/Sega)
  • Strange Brigade (Rebellion Developments/Rebellion Developments)

Результаты тестирования.

 
Wolfenstein II: The New Colossus
 
Tom Clancy’s Ghost Recon Wildlands
 
Assassin’ Creed: Origins
 
Battlefield V
 
Far Cry 5
 
Shadow of the Tomb Raider
 
Total War: Warhammer II
 
Strange Brigade

Рейтинг iXBT.com

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и нормирован по самому слабому ускорителю — Radeon RX 550 (то есть сочетание скорости и функций Radeon RX 550 приняты за 100%). Рейтинги ведутся по 22 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. Из общего списка выбирается группа карт для анализа, куда входят GeForce GTX 1660 Ti и его конкуренты.

Для расчета рейтинга полезности использованы розничные цены на начало марта 2019 года.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
10 RX Vega 56 8 ГБ, 1156—1590/1600 610 203 30 000
11 MSI GTX 1660 Ti 6 ГБ, 1500—2010/12240 610 247 24 700
12 GTX 1660 Ti 6 ГБ, 1500—1965/12000 600 261 23 000
13 GTX 1070 8 ГБ, 1507—1797/8000 550 204 27 000
14 RX 590 8 ГБ, 1469—1545/8000 480 240 20 000
16 GTX 1060 6 ГБ, 1507—1860/8000 380 205 18 500

Учитывая, что у компании AMD нет четких конкурентов для ценового сегмента 22—25 тысяч рублей, нам пришлось взять и более дорогой Radeon RX Vega 56 (он оказался лишь чуть-чуть быстрее, чем GTX 1660 Ti), и более дешевый Radeon RX 590 (он оказался сильно медленнее). Также GTX 1660 Ti не только с колоссальным отрывом обошел GTX 1060, но и оказался быстрее, чем GTX 1070.

При изучении GeForce RTX 2060 мы уверенно говорили, что RTX 2060 нацелен на разрешение Full HD без каких-либо компромиссов по качеству графики (все настройки на максимум!), а во многих играх он обеспечит хорошую играбельность и в 2.5К. В случае GeForce GTX 1660 Ti мы говорим о полной нацеленности на разрешение Full HD (самое популярное в мире игр на сегодня) при условии максимальных настроек качества, и лишь некоторые не самые требовательные к графике игры продемонстрируют хорошую играбельность на этом ускорителе и в разрешении 2.5К.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатели предыдущего рейтинга разделить на цены соответствующих ускорителей.

Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
02 GTX 1660 Ti 6 ГБ, 1500—1965/12000 261 600 23 000
05 MSI GTX 1660 Ti 6 ГБ, 1500—2010/12240 247 610 24 700
06 RX 590 8 ГБ, 1469—1545/8000 240 480 20 000
10 GTX 1060 6 ГБ, 1507—1860/8000 205 380 18 500
11 GTX 1070 8 ГБ, 1507—1797/8000 204 550 27 000
12 RX Vega 56 8 ГБ, 1156—1590/1600 203 610 30 000

Как и в случае с GeForce RTX 2060, новый продукт GTX 1660 Ti с ходу уверенно заявил о притязаниях на лидерство в своей группе. Даже более дешевый Radeon RX 590 сошел с пьедестала и перестал быть лучшим выбором по соотношению возможностей и цены.

Выводы

Nvidia GeForce GTX 1660 Ti — удачное проникновение Turing в самый массовый сегмент игрового рынка. Будучи немного медленнее, чем GeForce RTX 2060, но составляя прямую конкуренцию Radeon RX Vega 56 и уходящему с рынка GeForce GTX 1070 (заметим, что про GeForce GTX 1060 речи вообще не идет, новинка гораздо быстрее!), GeForce GTX 1660 Ti обеспечит великолепную производительность в разрешении Full HD с максимальным настройками графики в играх. А иногда можно будет неплохо поиграть и в разрешении 2560×1440. GeForce GTX 1660 Ti демонстрирует великолепный прирост производительности относительно своего формального предка GeForce GTX 1060 (на десятки процентов, иногда и в 2 раза), прилично обходит GeForce GTX 1070 и выходит примерно на уровень конкурента из стана AMD, Radeon RX Vega 56, который, имея более высокую цену, менее выгоден.

У конкретного протестированного нами видеоускорителя MSI GeForce GTX 1660 Ti Gaming X (6 ГБ) можно выделить относительно компактные размеры при очень тихой СО с красивой подсветкой и великолепную поддержку фирменным программным обеспечением.

Итог: GeForce GTX 1660 Ti получился очень успешным представителем нового семейства по соотношению возможностей и стоимости не только в своем ценовом сегменте — он вообще вышел в лидеры среди всех игровых видеокарт в плане выгодности приобретения. Правда, этот ускоритель не поддерживает такие новые технологии семейства GeForce RTX, как трассировка лучей и «умный» DLSS на основе тензорных ядер. Однако у архитектуры Turing есть и другие улучшения по сравнению с Pascal. Инженеры Nvidia серьезно переработали мультипроцессоры для повышения количества операций, выполняемых за каждый такт, заодно повысив и общую эффективность новых GPU. Важнейшим изменением стало появление выделенных блоков для исполнения целочисленных инструкций, которыми раньше занимались те же FP32-блоки. INT32-операции теперь выполняются параллельно с FP32, что повысило эффективность исполнения сложных программ, все чаще использующих целочисленные операции, хотя вычисления с плавающей запятой и остаются главными для GPU.

В Turing появилась и новая возможность выполнения операций с плавающей запятой пониженной точности с удвоенным темпом. FP16 использовалась графическими процессорами Nvidia много лет назад, но с тех пор практически все «игровые» GPU перестали выполнять такие операции с более высокой скоростью (хотя в некоторых решениях для вычислений они применялись). Быть может, с распространением этой возможности ее поддержка найдет более широкое применение в играх. Пусть далеко не все шейдеры позволяют без появления артефактов снизить точность до FP16, однако преимущества в виде удвоенного темпа, экономии регистрового файла и пониженных требований к пропускной способности могут принести дополнительный прирост скорости.

В номинации «Оригинальный дизайн» карта MSI GeForce GTX 1660 Ti Gaming X 6 ГБ получила награду:

Благодарим компанию Nvidia Russia
и лично Ирину Шеховцову
за предоставленную на тестирование видеокарту

Для тестового стенда:
блок питания Seasonic Prime 1000 W Titanium предоставлен компанией Seasonic

12 марта 2019 Г.