Обзор видеоускорителя Nvidia GeForce RTX 4060 Ti (8 ГБ) на основе карты Palit GeForce RTX 4060 Ti Dual

Общая информация о GeForce RTX 4060 Ti

При анонсе графической архитектуры Ada Lovelace в прошлом году компания Nvidia рассказала о трех видеокартах на ее основе: флагманской модели GeForce RTX 4090 и паре вариантов RTX 4080, один из которых затем переименовали в RTX 4070 Ti. Видеокарты выпускались на рынок постепенно, и мы успели рассмотреть их все, а совсем недавно была анонсирована еще пара видеокарт среднего ценового диапазона: GeForce RTX 4060 Ti и модель с таким же цифровым индексом без приставки. Первая в варианте с 8 ГБ видеопамяти по цене $399 уже вышла и даже продается, а модель с 16 ГБ (она будет сразу на сотню долларов дороже) и простая RTX 4060 с необъявленной пока ценой появятся в продаже в июле.

Сегодня мы рассмотрим только первую из них — GeForce RTX 4060 Ti с 8 ГБ памяти. Новая модель использует все самые современные технологии компании Nvidia, включая последние версии RT-ядер и тензорных ядер, которые мощнее предыдущих и поддерживают новые возможности, вроде технологии DLSS 3 и Shader Execution Reordering, и при этом ее GPU потребляет меньше энергии по сравнению с прямой предшественницей — RTX 3060 Ti. Ее основное преимущество перед соперниками как AMD, так и GeForce предыдущих поколений за те же деньги — в поддержке технологии генерации кадров DLSS 3, которая раньше была доступна только в GPU более высокой ценовой категории.

Главное нововведение DLSS 3 заключается в создании дополнительных интерполированных кадров на основе пары существующих, для чего используется специализированный аппаратный движок Optical Flow Accelerator, интерполирующий соседние кадры и создающий на их основе новые. Но даже без учета этого мощности RTX 4060 Ti вполне достаточно для того, чтобы обеспечить высокую частоту кадров при Full HD-разрешении и максимальных или очень высоких графических настройках в таких ресурсоемких играх, как Cyberpunk 2077, Microsoft Flight Simulator и многих других.

Nvidia систематически внедряла графическую архитектуру Ada Lovelace в своей линейке и шла сверху от флагманских решений вниз к среднебюджетным. Начинали они с RTX 4090 и RTX 4080, затем переходя к производительному сегменту с RTX 4070 Ti и RTX 4070, а теперь вот и к среднему ценовому диапазону с видеокартами RTX 4060 Ti и RTX 4060.

Nvidia позиционирует свою текущую линейку определенным образом. Если модели GeForce RTX 4090 и RTX 4080 предназначены для разрешения 4K при всех максимальных графических настройках, вместе с трассировкой лучей, а также для полупрофессионального использования в ПО для создания цифрового контента и средств, использующих возможности нейросетей, то GeForce RTX 4070 Ti и RTX 4070 уже обеспечат максимум графики лишь в разрешении 2560×1440, хотя без трассировки лучей их вполне хватит и для 4K. Ну а анонсированные недавно GeForce RTX 4060 Ti и RTX 4060 годятся уже только для Full HD-разрешения, если говорить о самых современных играх.

И в этом нет ничего странного, ведь это самые популярные категории среди игроков. Во-первых, судя по статистике аппаратного обеспечения в сервисе Steam, около 80% пользователей имеют видеокарты этого уровня и слабее (но более старые, разумеется): GTX 1060, GTX 1660, RTX 2060 и так далее. И почти столько же — 77% пользователей сервиса — имеют Full HD-мониторы и играют в разрешении 1920×1080 или даже ниже. Именно для них Nvidia и выпустила две видеокарты новой подсерии RTX 4060 — с приставкой Ti и без нее. Специалисты компании полагают, что эти модели могут стать неплохим вариантом для модернизации видеосистемы для владельцев старого железа. Сегодня мы попробуем разобраться, так ли это.

Графическая архитектура Ada Lovelace во многом схожа с архитектурой Ampere, на которой основаны различные модификации чипов GA10x, обе эти архитектуры имеют достаточно много общего и с предыдущими архитектурами Turing и Volta, и перед прочтением материала будет полезно ознакомиться с нашими предыдущими статьями по теме:

Графический ускоритель GeForce RTX 4060 Ti
Кодовое имя чипа	AD106
Технология производства	5 нм (TSMC 4N)
Количество транзисторов	22,9 млрд (35,8 млрд у AD104)
Площадь ядра	190 мм² (294,5 мм² у AD104)
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти	128-битная: 4 независимых 32-битных контроллера памяти с поддержкой памяти типа GDDR6
Частота графического процессора	до 2535 МГц
Вычислительные блоки	34 (из 36) потоковых мультипроцессора, включающих 4352 (из 4608) CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки	136 (из 144) тензорных ядер для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей	34 (из 36) RT-ядра для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования	136 (из 144) блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	6 широких блоков ROP на 48 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)

Спецификации видеокарты GeForce RTX 4060 Ti
Частота ядра	2310/2535 МГц
Количество универсальных процессоров	4352
Количество текстурных блоков	136
Количество блоков блендинга	48
Эффективная частота памяти	18 ГГц
Тип памяти	GDDR6
Шина памяти	128 бит
Объем памяти	8 ГБ
Пропускная способность памяти	288 ГБ/с
Вычислительная производительность (FP32)	до 22,1 терафлопс
Теоретическая максимальная скорость закраски	122 гигапикселя/с
Теоретическая скорость выборки текстур	345 гигатекселей/с
Шина	PCI Express 4.0 x8
Разъемы	по выбору производителя
Энергопотребление	до 160 Вт
Дополнительное питание	по выбору производителя
Число слотов, занимаемых в системном корпусе	по выбору производителя
Рекомендуемая цена	$399

Название новой модели соответствует принятому принципу наименования решений компании. Новинка на основе слегка урезанного чипа AD106 заняла свое положение в линейке на ступень ниже RTX 4070, как и должно быть исходя из применяемых графических процессоров, а ниже ее будет такая же модель без приставки Ti, которая появится в июле.

Nvidia оценила модель GeForce RTX 4060 Ti с 8 ГБ видеопамяти в $399 на рынке США, и это соответствует рекомендованной цене предшественника — RTX 3060 Ti. За эту цену на рынке настольных видеокарт свежих конкурентов у AMD пока что нет, так как младшая из пары топовых видеокарт AMD Radeon RX 7900 XT является конкурентом RTX 4070 Ti и стоит заметно дороже, а RX 7600 и дешевле и менее мощная. Так что сравнивать RTX 4060 Ti сегодня придется скорее с теми видеокартами прошлого, которые продаются по схожей цене: RX 6750 XT и RX 6800. Пока что ничего нового из текущего поколения AMD в этом ценовом диапазоне даже не анонсировала.

Рекомендуемую цену у RTX 4060 Ti не назвать низкой, но по нашим временам надеяться на меньшее было бы странно — дорожает абсолютно всё. А тут цена осталась как у RTX 3060 Ti, но зато увеличение производительности оставляет желать лучшего. С точки зрения покупателя всё понятно — шаг с RTX 3060 Ti и RTX 3070 недостаточно велик, чтобы выбирать именно RTX 4060 Ti. А вот с точки зрения Nvidia всё объяснимо. Рынок видеокарт сильно просел — и из-за общего состояния рынка и из-за конца майнингового бума. Продавать видеокарты в тех же количествах сейчас просто некому, поэтому пришлось искать другие методы, чтобы оставить прибыль на приемлемом уровне. Вот они и решили продавать меньше видеокарт, зато дороже. Учитывая сложившиеся рыночные условия, Nvidia выставила такую цену, которая позволит им продать не слишком много GPU, но недешево. Конечно, цена в $350 казалась бы для многих более приемлемой, но принесло ли бы такое снижение соответствующий рост объема продаж для компенсации пониженной прибыли с каждой видеокарты?

К сожалению, сложившаяся на рынке ситуация может привести к тому, что многие выберут для игр вовсе не ПК, а игровые консоли, которые продаются за аналогичную цену и точно дадут стабильную игру даже в 4K (условно, конечно, потому что зачастую там используется масштабирование) без каких-то проблем, с которыми они встречаются на ПК. А может соперничающие с Nvidia компании не дадут игрокам убежать на консоли? Конкуренцию для RTX 4060 Ti составляют такие решения AMD, как Radeon RX 6750 XT и RX 6800 — первая видеокарта продается дешевле и имеет несколько меньшую производительность, если не брать трассировку лучей (а в этом ценовом сегменте ее можно и не учитывать), а также 12 ГБ, а вторая пусть и дороже, но чуть производительнее и имеет еще больше видеопамяти. Правда, и она уступает в трассировке лучей и не имеет ничего похожего на DLSS 3. Возможно, потенциальным покупателям стоит присмотреться к RTX 3070 за примерно те же деньги — скорости будет побольше в среднем, хотя поддержки DLSS 3 в этом случае также не будет.

Про объем видеопамяти у новинки мы еще подробно поговорим далее, но из-за ширины шины в 128-бит у них был выбор между 8 ГБ и 16 ГБ, и Nvidia решила выпустить оба варианта — модель с большей емкостью видеопамяти выйдет на рынок позднее. Но на самом деле, для этого уровня производительности и 8 ГБ могут быть вполне достаточными на данный момент, если не стараться задирать на максимум абсолютно все настройки качества — это же не флагманский продукт. В редких играх может наблюдаться нехватка 8 ГБ видеопамяти, но чаще всего она вызвана плохой оптимизацией при портировании с консолей и плохим менеджментом ресурсов.

Ограничение потребления энергии у RTX 4060 Ti установлено на уровне 160 Вт, и для питания видеокарт новой модели не обязательно использовать новый 16-контактный разъем питания PCIe 5.0, ставший стандартом для ATX 3.0. С учетом передаваемых по разъему PCIe 75 Вт, может быть достаточно лишь одного привычного 8-контактного разъема для дополнительного питания видеокарты, но конкретные производители видеокарт могут считать иначе и установить два таких разъема — для большей стабильности.

К слову, если продолжать рассказывать о преимуществах новинки, то Nvidia заметно улучшила энергоэффективность видеокарт серии GeForce RTX 40, и модель RTX 4060 Ti тут не исключение. При максимальном уровне потребления в 160 Вт, требования к блоку питания по современным меркам минимальны — с этим практически любой БП справится. А энергоэффективность (производительность на ватт) у новинки и вовсе одна из лучших на рынке.

GeForce RTX 4060 Ti существует также и в виде Founders Edition. Вариант исполнения самой Nvidia сохранил двухвентиляторную сквозную конструкцию системы охлаждения Founders Edition последних поколений. Эффективность охлаждения хорошая, кулер очень похож на систему охлаждения RTX 4070 FE, за исключением некоторых внешних деталей. Холодный воздух поступает от одного вентилятора, проходит через радиаторы и выбрасывается вторым вентилятором. На видеокарте Founders Edition используется новый 16-контактный разъем питания ATX 12VHPWR, который упрощает подключение питания, но имеет свои недостатки. Впрочем, в случае не слишком мощной видеокарты они проявиться не должны. Для подключения старых БП в поставке есть переходник, преобразующий питание с двух привычных 8-контактных разъемов PCIe.

Кстати, как и некоторые другие модели видеокарт из этого ценового диапазона, RTX 4060 Ti получила лишь восемь линий PCI Express 4.0, хотя у предшественницы RTX 3060 Ti их было вдвое больше. Конечно, при использовании современных игровых систем с поддержкой PCIe 4.0, значимого влияния на скорость рендеринга это не окажет, но при работе в режиме PCIe 3.0 на некоторых старых системах отрицательное влияние на производительность вполне может оказаться ощутимым. А ведь многие вполне актуальные системы не имеют поддержки PCIe 4.0, к примеру, это процессоры Intel Comet Lake-S и десктопные APU серий AMD Ryzen 4000 и 5000. Конечно, как у AMD Radeon RX 6500 XT с поддержкой лишь четырех линий PCIe у RTX 4060 Ti не будет, но некоторое падение производительности вполне возможно.

Особенности архитектуры

В линейке видеокарт GeForce RTX 40 применяются графические процессоры AD10x, основанные на графической архитектуре Ada Lovelace. Инженеры компании Nvidia спроектировали графическую архитектуру, которая не только повысила производительность операций трассировки лучей и машинного вычисления на тензорных ядрах, но и предоставила некоторые новые возможности, позволяющие улучшить эффективность, также заметно повлиял переход на современный технологический процесс тайваньской компании TSMC, позволивший разместить в чипах большое количество исполнительных блоков. Новые GPU получились заметно более сложными, но при этом они работают на высокой тактовой частоте по сравнению с решениями предыдущих серий.

Модель GeForce RTX 4060 Ti основана на графическом процессоре AD106, который производится на фабриках TSMC с использованием специализированного техпроцесса 4N — 5-нанометрового, несмотря на название. Чип уже известен нам по мобильной графике RTX 4070 Laptop, где графический процессор применяется в своей максимальной конфигурации. Чип AD106 включает в себя все возможности и особенности флагманского решения AD102, включая RT-ядра третьего поколения и тензорные ядра четвертого — то есть поддерживает все улучшения трассировки лучей, а также технологию увеличения производительности DLSS 3 и новый ускоритель оптического потока OFA.

Графический процессор AD106 имеет приличное количество транзисторов — 22,9 млрд., что почти вдвое больше, чем GA106 из предыдущего поколения, и даже почти на треть больше, чем есть у GA104. А по производительности AD106 вполне можно сравнить с TU102 (RTX 2080 Ti), состоящем из 18,6 млрд. транзисторов — «лишние» транзисторы AD106 ушли на дополнительную кэш-память второго уровня в Ada, а также все улучшения CUDA-ядер, RT-ядер и тензорных ядер за пару поколений графических архитектур Nvidia.

Как и все графические процессоры компании Nvidia, чип AD106 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Как и в предыдущих архитектурах, кластер GPC самостоятельно производит все основные вычисления внутри кластера, и включает свой движок растеризации Raster Engine, шесть кластеров TPC, состоящих из 12 мультипроцессоров SM.

Графический процессор AD106 имеет три кластера обработки графики GPC, они содержат по шесть кластеров обработки текстур TPC, каждый из которых имеет по два потоковых мультипроцессора SM. Каждый мультипроцессор, в свою очередь, содержит по 128 CUDA-ядер в четырех разделах. Половина из них умеют вычислять данные в формате FP32, а другие поддерживают FP32 или INT32 — есть возможность параллельной обработки FP32 и INT32. Каждый мультипроцессор SM также содержит RT-ядро третьего поколения, четыре тензорных ядра четвертого поколения, кэш-память и четыре текстурных блока TMU.

В полной версии чипа AD106 есть три GPC, содержащих 4608 CUDA-ядер, 144 блоков TMU, 144 тензорных ядер и 36 RT-ядер. В каждом GPC есть по 16 ROP, и всего в чипе содержится 48 ROP. Но модель видеокарты GeForce RTX 4060 Ti основана на урезанной версии AD106, в которой отключен один кластер TPC в одном из GPC. Так что в данном варианте GPU содержится 4352 активных CUDA-ядра, 136 тензорных ядер, 34 RT-ядра и 136 текстурных модуля TMU. А вот количество ROP осталось полным — 48 штуки. Самым интересным и спорным моментом RTX 4060 Ti и AD106 является объем и шина памяти — это те же 8 ГБ, что и RTX 3060 Ti из предыдущего поколения, да еще при вдвое более узкой шиной памяти — всего лишь 128-бит.

Аналогичная видеокарта из предыдущего поколения GeForce RTX 3060 Ti имеет 256-битный интерфейс GDDR6-памяти с теми же 8 ГБ памяти при общей пропускной способности в 448 ГБ/с — что заметно выше, чем 288 ГБ/с у рассматриваемой GeForce RTX 4060 Ti, использующей вдвое более узкий 128-битный интерфейс памяти. Но у Nvidia есть объяснение своему решению — в новой архитектуре Ada Lovelace они попытались перебалансировать подсистему памяти, чтобы можно было применять более узкую шину памяти, заметно увеличив объем кэш-памяти на кристалле — их конкурент сделал примерно то же самое чуть раньше. Из преимуществ решения (для Nvidia) — снижение себестоимости, из недостатков (для пользователей) — потенциальная нехватка пропускной способности, что может вызвать снижение производительности в некоторых случаях. Но так как L2-кэш на порядок быстрее видеопамяти по задержкам, то больший его объем для часто используемых данных может дать и преимущество в некоторых случаях.

Изменения подсистемы памяти архитектуры Ada Lovelace

Для того, чтобы улучшить эффективную пропускную способность памяти, в архитектуре Ada Lovelace используется измененная подсистема кэширования с большим объемом кэш-памяти второго уровня. Так, в RTX 4060 Ti есть 32 МБ L2-кэша, в отличие от лишь 4 МБ у RTX 3060 Ti из предыдущего семейства. Дополнительный кэш должен снизить задержки доступа к памяти и улучшить эффективную пропускную способность, ведь GPU будет реже обращаться к локальной видеопамяти за данными. Также это дополнительно улучшает общую энергоэффективность.

Подсистема памяти в архитектуре Ada несколько отличается от того, что мы видели в предыдущих архитектурах компании. Все GPU новой архитектуры имеют заметно больший объем кэш-памяти второго уровня по сравнению с предыдущими семействами. Так, AD106 имеет L2-кэш объемом 32 МБ, что снижает передаваемый по шине памяти объем данных и обеспечивает лучшее сочетание производительности и потребления энергии. В графических процессорах семейства Ampere и всех предыдущих, объем L2-кэша был не слишком большим, и они должны были иметь высокую пропускную способность памяти, чтобы получать необходимый объем данных.

Напомним, что система кэширования данных GPU состоит из двух уровней: кэша данных первого уровня (L1) и второго (L2). Каждый мультипроцессор SM включает кэш данных первого уровня — он отличается очень низкой задержкой доступа, так как расположен рядом с вычислительными ядрами, и GPU ищет необходимые данные именно там. Но L1-кэш не может быть слишком большим, так как он располагается максимально близко к ядрам. И если необходимые данные не найдены в L1-кэше, то GPU запрашивает второй уровень кэша данных — L2. Эта подсистема также находится на самом кристалле GPU и подключается через высокоскоростные каналы данных к кластерам обработки графики GPC, каждый из которых содержит по несколько мультипроцессоров SM (см. диаграмму графического процессора). Если нужная информация есть в уже куда более объемном L2-кэше (попадание кэша), то эти данные довольно быстро и эффективно передаются вычислительным ядрам. А вот если данных нет и в L2-кэше (промах кэша), то GPU должен получить их по шине памяти во внешней видеопамяти, которая куда медленнее. Каждый промах кэш-памяти приводит к снижению производительности и эффективности.

И тут мы переходим к одному из важных нововведений подсистемы памяти графических процессоров архитектуры Ada — увеличенный L2-кэш. По сравнению Ampere, в Ada в несколько раз больший объем L2-кэша. Если сравнивать RTX 4060 Ti и RTX 3060 Ti, то в 8 раз, а если сравнивать GPU с 128-битной шиной памяти, то и 16 раз. Кроме этого, пропускная способность L2-кэша в графических процессорах Ada была еще и значительно увеличена, что также позволяет быстрее передавать большие объемы данных между кэшем и вычислительными ядрами. В итоге изменения привели к большему количеству попаданий в кэш второго уровня, что снизило передачу данных из локальной видеопамяти.

Для сравнения эффективности увеличенного L2-кэша Nvidia привела данные RTX 4060 Ti с 32 МБ L2-кэша и специальной версией такой же видеокарты со всего лишь 2 МБ кэша — как в 128-битных графических процессорах предыдущего поколения с 512 КБ L2-кэша на каждый 32-битный контроллер памяти. Как видно на иллюстрации, наличие 32 МБ кэша снизило передачу данных из памяти на 40%—60% по сравнению с вариантом с 2 МБ. А среднее сокращение трафика на 50% позволяет GPU использовать пропускную способность памяти вдвое эффективнее, и в результате всех улучшений графический процессор в RTX 4060 Ti с пропускной способностью памяти в 288 ГБ/с демонстрирует вдвое бо́льшую эффективную производительность — 554 ГБ/с (теоретический показатель). В общем, увеличенный объем кэша в Ada повышает производительность и улучшает общую энергоэффективность — при необходимости использовать более узкую шину памяти.

Что касается объема видеопамяти «всего лишь» в 8 ГБ — да, это столько же, что и у RTX 3060 Ti в прошлом поколении, хотя прошло уже два года. Многие утверждают, что 8 ГБ уже слишком мало и невозможно играть с этим количеством видеопамяти, а нужно минимум 12 ГБ. Конечно же, это не так. Для начала, нужно правильно оценивать потребности игр в объеме видеопамяти. Применять показатели «использования видеопамяти» в инструментах измерения производительности некорректно — это число означает скорее занятый объем видеопамяти, а не используемый. А игры и игровые движки работают по-разному, некоторые выделяют куда больший объем памяти себе, чем используют. Часто движки просто забивают имеющийся объем памяти даже если им это не нужно, запрашивая больше памяти по возможности. И точно узнать, сколько конкретно видеопамяти нужно, на деле просто невозможно, да и это значение постоянно меняется от кадра к кадру. Проще всего оценивать такие параметры частоты кадров как минимальная частота кадров или минимальная частота кадров для 0,1% (или 1%) худших кадров.

Конечно, лучше бы RTX 4060 Ti имела больше видеопамяти, с этим никто не спорит. Но на нее физически невозможно поставить что-то среднее между 8 ГБ и 16 ГБ, а второй вариант будет скоро доступен. Но для подавляющего большинства игр в разрешении Full HD, даже 8 ГБ будет вполне достаточно, а большее количество видеопамяти ничего не даст. Да, некоторые новые игры, такие как Hogwarts Legacy, Resident Evil 4, The Last of Us Part I и Star Wars Jedi: Survivor могут выделять очень много видеопамяти, но это еще не означает, что эти данные постоянно используются каждый кадр. Случаи нехватки 8 ГБ найти можно, но для GPU такого ценового уровня вполне нормально ставить качество текстур на высокое, а не ультра, и тогда всё будет в полном порядке. Ну а если вам всё же хочется больше памяти, то ждите RTX 4060 Ti 16 ГБ вариант в июле — посмотрим, сколько покупателей захочет заплатить лишние $100 за мнимые улучшения производительности и потенциал на будущее.

А почему на первый вариант RTX 4060 Ti вообще установили именно 8 ГБ видеопамяти, а не больше? Выпускаемые чипы GDDR6X- и GDDR6-памяти поставляются в виде 8 Гбит (1 ГБ) и 16 Гбит (2 ГБ) микросхем. Каждый чип может использовать два отдельных 16-битных канала памяти для подключения к 32-битному контроллеру памяти, или два 8-битных канала, чтобы две микросхемы подключились к одному 32-битному контроллеру. Так что к GPU с 128-битной шиной памяти (четыре 32-битных контроллера) можно присоединить или четыре или восемь чипов памяти. Смешивать чипы разной плотности в принципе возможно, но имеет свои недостатки. Так что для простоты будем считать, что по 128-битной шине можно получить 4 ГБ, 8 ГБ или 16 ГБ, но не 10 ГБ или 12 ГБ, к примеру. В модели GeForce RTX 4060 Ti с 8 ГБ используются четыре микросхемы GDDR6-памяти по 16 Гбит, а в 16 ГБ модели — восемь таких же чипов.

Остальные архитектурные улучшения семейства Ada Lovelace были разобраны нами в теоретическом обзоре, там же подробно описаны все изменения в RT-ядрах новой архитектуры, включая аппаратные блоки Opacity Micromap Engine и Displaced Micro-Mesh Engine, а также дополнительный планировщик для изменения порядка выполнения шейдеров Shader Execution Reordering, позволяющие повысить эффективность аппаратной трассировки лучей.

Осталось вкратце упомянуть возможности GeForce RTX 4060 Ti по работе с видеоданными. Они не отличаются от таковых у других моделей серии — в специализированном аппаратном кодировщике NVEnc восьмого поколения появилась поддержка кодирования видео в формате AV1, кодировщик AV1 в Ada на 40%-50% эффективнее кодировщика H.264, используемого в графических процессорах предыдущей серии, и новый формат AV1 позволит увеличить разрешение видеопотока при стриминге с 1080p до 1440p при том же битрейте. Все представленные графические процессоры Ada имеют по два аппаратных кодировщика NVEnc на борту, что позволяет кодировать видеоданные с разрешением 8K при 60 FPS или сразу четыре видеопотока разрешения 4K при 60 FPS — и при этом быстрее, чем на RTX 3090 Ti.

Кроме NVEnc, в графические процессоры архитектуры Ada включен аппаратный декодер пятого поколения NVDec, который появился в Ampere. Он поддерживает декодирование видеоданных с аппаратным ускорением в форматах: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и AV1. Также полностью поддерживается и декодирование видеоданных в разрешении 8K при 60 FPS.

Предварительная оценка производительности

Одним из явных преимуществ GeForce RTX 4060 Ti перед аналогичными по мощности GPU предыдущего поколения и конкурирующими решениями AMD является поддержка генерации (интерполяции) кадров в составе технологии DLSS 3, которой лишены все видеокарты RTX 30. За счет этого RTX 4060 Ti может обеспечить большую частоту кадров даже по сравнению с более мощными видеокартами серии RTX 30. В режиме рендеринга с трассировкой пути, появившемся наконец-то в игре Cyberpunk 2077, эта видеокарта сможет обеспечить комфортную игру именно вместе с DLSS 3, пусть и в невысоком разрешении.

Технология генерации промежуточных кадров DLSS 3 появилась в нынешнем поколении GeForce RTX 40 и уже поддерживается в нескольких десятках игр и приложений (вместе с еще не вышедшими, но уже анонсированными их около 50 штук), большая часть из которых также поддерживают и трассировку лучей. Практически все они обеспечивают приемлемый комфорт при игре в Full HD-разрешении и на GeForce RTX 4060 Ti, и количество игр с поддержкой технологии постоянно растет.

Те разработчики игр, которые использовали специализированный пакет Nvidia Streamline SDK для внедрения DLSS 2, с легкостью смогли интегрировать в свои проекты и DLSS 3, включая все компоненты технологии: масштабирование разрешения (что мы знаем как DLSS 2), генерацию промежуточных кадров (известна как DLSS 3) и технология снижения задержек, работающая совместно с предыдущими — Reflex. Более того, поддержка DLSS 3 скоро появится в самом популярном движке Unreal Engine 5.2. Еще в феврале 2021 года разработчики компании Nvidia выпустили бесплатный плагин для внедрения DLSS 2 в Unreal Engine, и он сделал добавление технологии в проекты, использующие этот движок, весьма простым. Теперь компания обещает релиз DLSS 3 в Unreal Engine Marketplace для версии движка Unreal Engine 5.2, что позволит получить доступ к технологии всем разработчикам, использующим Unreal Engine.

Что касается производительности, то вот данные Nvidia о среднем приросте частоты кадров от включения DLSS 3 в 18 игровых проектах на ПК с Intel Core i9-12900K в разрешении Full HD, при включенной трассировке лучей там, где она поддерживается. Если без учета генерации кадров увеличение частоты кадров составляет не слишком впечатляющие 15% при сравнении с RTX 3060 Ti, то с DLSS 3 будет уже 1,7 раза. Сравнение довольно спорное, не всем нравится DLSS, поэтому перейдем к сравнению теоретических показателей видеокарт, что позволит оценить потенциальную разницу между решениями разных поколений.

С точки зрения теоретических показателей всё вроде бы неплохо — и шейдерная производительность у новинки значительно выше, и производительность трассировки лучей и тензорных ядер. Но это — лишь пиковые показатели в определенных условиях. В большинстве игр же все эти решения будут друг к другу куда ближе. Тем более, что по пропускной способности памяти новинка даже отстает, хотя эффективная ПСП у нее вроде как выше (это мы проверим далее). А вот по какому параметру точно есть преимущество, так это по сниженному потреблению энергии, а вместе с ним и повышенной энергоэффективности. Тут вопросов нет, новинка значительно лучше решений предыдущих поколений.

Что касается производительности в играх, то GeForce RTX 4060 Ti предлагает скорость рендеринга где-то между RTX 3060 Ti и RTX 3070 с возможностью дополнительного увеличения частоты кадров в играх с поддержкой технологии DLSS 3. На системе с процессором Intel Core i9-12900K в Full HD-разрешении при максимальных настройках и с включенными трассировкой лучей и DLSS в играх с их поддержкой, новая модель показывает следующую производительность относительно своих предшественниц: RTX 3060 Ti и RTX 2060 Super (по данным Nvidia):

По производительности RTX 4060 Ti располагается примерно между RTX 3070 и RTX 3060 Ti. В играх, где применяется трассировка лучей, новинка ближе к RTX 3070, а в менее продвинутых графически — к младшей модели предыдущего поколения. Многие ожидали большего прироста производительности по отношению к линейке RTX 30 — по ожиданиям, хотя бы RTX 3070 должна была оставаться позади всегда, чтобы переход с младших видеокарт прошлого поколения имел смысл. Но Nvidia в целом и не позиционирует RTX 4060 Ti как продукт для таких покупателей, эта видеокарта ориентирована на владельцев устаревших игровых ПК на основе среднебюджетных моделей GTX 10, GTX 16 и младших видеокарт серии RTX 20.

В среднем при Full HD-разрешении в современных играх с использованием трассировки лучей, GeForce RTX 4060 Ti почти равна с RTX 3070 предыдущего поколения и аналогична еще более старой RTX 2080 Ti. Но прирост производительности от поколения к поколению очень невелик — около 15%, это заметно меньше того, что дали старшие модели линейки GeForce RTX 40 по сравнению с аналогами из RTX 30. Если сравнивать с AMD Radeon, то новая RTX 4060 Ti превосходит по скорости Radeon RX 6750 XT, а в некоторых играх с трассировкой она быстрее RX 6800 и даже RX 6800 XT. В Full HD-разрешении и при максимальных настройках, GeForce RTX 4060 Ti обычно достигает 60 кадров в секунду и более практически во всех играх, кроме самых требовательных. Новинка также вполне способна запускать многие игры и в разрешении 2560x1440, но иногда может потребоваться некоторое снижение настроек.

Наиболее важным преимуществом GeForce RTX 4060 Ti является поддержка генерации промежуточных кадров DLSS 3 — алгоритм создает дополнительный кадр на основе двух соседних по перемещению объектов в них. Если просматривать видеозапись замедленно и искать попиксельно, то некоторые проблемы и артефакты заметить можно, но при обычной игре вы вряд ли заметите какую-либо разницу, особенно при высоком FPS и разрешении, но только когда задержка не слишком велика. Возможность увеличить частоту кадров почти бесплатно — отличная возможность, с ее помощью можно включить ту же ресурсоемкую трассировку лучей или просто максимальные настройки качества. Единственный недостаток — количество игр с поддержкой DLSS 3, их пока что менее 50 штук. Зато ничего похожего у соперников до сих пор нет, хотя AMD и заявляли о разработке FSR 3, но мы не видели даже соответствующих демонстраций.

RTX 3060 Ti вышла два года назад, имела такую же цену в $399 и получила отличное соотношение цены и производительности для своего времени. И через два года Nvidia выпустила лишь чуть более производительную RTX 4060 Ti по той же рекомендованной цене и даже с тем же объемом видеопамяти. Так что вполне можно понять тех, кто был разочарован столь небольшим приростом производительности, если не учитывать улучшенную энергоэффективность и технологию генерации кадров DLSS3, конечно же. Но если сравнивать RTX 4060 Ti с существующими на рынке продуктами, то эта видеокарта не так уж плоха — она точно лучше аналогов в своем классе, и по производительности и по энергоэффективности.

Другое дело, что ожиданиям потенциальных покупателей этот уровень не совсем соответствует, и тут нужно вспомнить, что рынок есть рынок и он отреагирует соответствующим образом — если спрос будет ниже ожидаемого уровня, то Nvidia придется снижать цены, и это может сделать RTX 4060 Ti более интересным вариантом для покупки. Хотя модель RTX 3070 нужно было опережать во всех условиях, конечно же. На этом с теоретической частью мы закончили и переходим к рассмотрению практических особенностей видеокарты GeForce RTX 4060 Ti в исполнении компании Palit.

Особенности карты Palit GeForce RTX 4060 Ti Dual 8 ГБ

Сведения о производителе: Компания Palit Microsystems (торговая марка Palit) основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира — в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики — в Китае. На рынке в России — с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты начали идти только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после, по сути, банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, направленный на продажи в Китае. На сегодня внутри Palit Group сосредоточено еще несколько торговых марок и брендов.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Palit GeForce RTX 4060 Ti Dual 8 ГБ 128-битной GDDR6

Palit GeForce RTX 4060 Ti Dual 8 ГБ 128-битной GDDR6
Параметр	Значение	Номинальное значение (референс)
GPU	GeForce RTX 4060 Ti (AD106)
Интерфейс	PCI Express x8 4.0
Частота работы GPU (ROPs), МГц	2535(Boost)—2790(Max)	2535(Boost)—2790(Max)
Частота работы памяти (физическая (эффективная)), МГц	2250 (18000)	2250 (18000)
Ширина шины обмена с памятью, бит	128
Число вычислительных блоков в GPU	34
Число операций (ALU/CUDA) в блоке	128
Суммарное количество блоков ALU/CUDA	4352
Число блоков текстурирования (BLF/TLF/ANIS)	136
Число блоков растеризации (ROP)	48
Число блоков Ray Tracing	34
Число тензорных блоков	136
Размеры, мм	250×123×40	250×110×40
Количество слотов в системном блоке, занимаемые видеокартой	2	2
Цвет текстолита	черный	черный
Энергопотребление пиковое в 3D, Вт	166	160
Энергопотребление в режиме 2D, Вт	30	30
Энергопотребление в режиме «сна», Вт	11	11
Уровень шума в 3D (максимальная нагрузка), дБА	31,1	35,0
Уровень шума в 2D (просмотр видео), дБА	18,0	18,0
Уровень шума в 2D (в простое), дБА	18,0	18,0
Видеовыходы	1×HDMI 2.1, 3×DisplayPort 1.4a	1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы	нет
Максимальное количество приемников/мониторов для одновременного вывода изображения	4	4
Питание: 8-контактные разъемы	1	0
Питание: 6-контактные разъемы	0	0
Питание: 16-контактные разъемы	0	1
Вес карты с комплектом поставки (брутто), кг	0,94	1,3
Вес карты чистый (нетто), кг	0,62	0,9
Максимальное разрешение/частота, DisplayPort	3840×2160@144 Гц, 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI	3840×2160@144 Гц, 7680×4320@60 Гц
Средняя цена карты Palit	44 тысячи рублей на момент публикации обзора

Память

Карта имеет 8 ГБ памяти GDDR6 SDRAM, размещенной в 4 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Samsung (K4ZAF325BC-SC20) рассчитаны на номинальную частоту работы в 2500 (20000) МГц.

Особенности карты и сравнение с Palit GeForce RTX 4070 Dual (12 ГБ)

Palit GeForce RTX 4060 Ti Dual (8 ГБ)	Palit GeForce RTX 4070 Dual (12 ГБ)
вид спереди

вид сзади

Мы сравниваем нынешнюю карту из серии Dual с GeForce RTX 4070 Ti из той же серии Palit, чтобы показать, как кардинально могут отличаться соседние продукты в линейке. Наше мнение заключается в том, что в современных реалиях высоких требований к объему локальной видеопамяти (и ПСП) даже в среднебюджетных решениях опускаться ниже 12 ГБ при 192-битной шине обмена с памятью — недопустимо. Даже с учетом всех оптимизаций и кэшей у серии GeForce RTX 40. Однако у Nvidia свое ви́дение, и мы имеем PCB уже со 128-битной шиной (которую не имели счастья лицезреть очень давно, аж со времен серии GeForce GTX 1600) и 8 ГБ видеопамяти на борту. Далее в материале мы еще будет разбирать последствия таких решений.

Ядро имеет маркировку AD106-350, дата выпуска — 2-я неделя 2023 года.

Прекрасно видно, что установлено обрезанное на 2 блока ядро (34 из 36), потому и маркировка «-350» (у полновесных ядер обычно «-400»).

Суммарное количество фаз питания у карты Palit GeForce RTX 4060 Ti Dual — 7 (6+1).

Зеленым цветом отмечена схема питания ядра, красным — памяти. Все ШИМ-контроллеры расположены на оборотной стороне PCB.

6 фазами питания ядра управляет ШИМ-контроллер uP9512R (uPI Semiconductor). Он рассчитан максимум на 12 фаз.

Питанием микросхем памяти управляет ШИМ-контроллер под заказной маркировкой 7212 (On Semiconductor).

В преобразователе питания ядра, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае NCP302150 (On Semi), каждая из которых рассчитана максимально на 50 А.

В схеме питания микросхем памяти применены уже не сборки DrMOS, а полевые МОП-транзисторы Sinopower SM4377/4503 (50 A).

На лицевой стороне платы имеется контроллер uS5650Q (uPI Semi), который отвечает за мониторинг карты (отслеживание напряжений и температуры).

Подсветка у карты очень простая, контроль за ней возложен на сам GPU, так что посадочное место под контроллер подсветки пустует.

Штатные частоты ядра и памяти равны референсным значениям.

Энергопотребление карты Palit в тестах доходило до 166 Вт.

Предел лимита энергопотребления у данной карты поднять нельзя, так что пробовать ручной разгон я не стал.

Питание на карту Palit подается через обычный 8-контактный разъем питания стандарта PCIe 2.0.

Габариты данной карты невелики, особенно по толщине: 4 см. В результате видеокарта занимает 2 слота в системном блоке.

Управление работой карты обеспечивается с помощью фирменной утилиты Thunder Master.

*Панель разгона позволяет настроить частоты работы карты, а также задать параметры авторазгона*

Нагрев и охлаждение

Мы видим кулер, уже традиционно выполненный по концепции сквозного продува хвостовой части радиатора. Основой СО является многосекционный пластинчатый никелированный весьма плоский радиатор с тепловыми трубками, распределяющими тепло по ребрам радиатора.

Трубки припаяны к большой медной никелированной пластине, которая охлаждает как ядро, так и микросхемы памяти (через термопрокладки). А для охлаждения преобразователей питания VRM имеется своя подошва на радиаторе.

Задняя пластина служит только элементом защиты PCB и является составной частью общей концепции дизайна.

Поверх радиатора установлен кожух с двумя вентиляторами ∅100 мм, работающими на единой частоте вращения (по умолчанию; через программу ThunderMaster можно настроить их работу раздельно).

Остановка вентиляторов при малой нагрузке видеокарты происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти — ниже 80 градусов. Разумеется, СО при этом становится бесшумной. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются.

Мониторинг температурного режима:

После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 68 градусов (самой горячей точки — 82 °C), что является отличным результатом для видеокарт такого уровня. Энергопотребление карты доходило до 166 Вт.

Мы засняли и ускорили в 50 раз 8-минутный прогрев

Максимальный нагрев наблюдался в центральной части PCB, а также около разъема питания.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

менее 20 дБА: условно бесшумно
от 20 до 25 дБА: очень тихо
от 25 до 30 дБА: тихо
от 30 до 35 дБА: отчетливо слышно
от 35 до 40 дБА: громко, но терпимо
выше 40 дБА: очень громко

В режиме простоя в 2D температура была не выше 42 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось.

В режиме максимальной нагрузки в 3D температура достигала 68/82 °C (ядро/hot spot). Вентиляторы при этом раскручивались до 1584 оборотов в минуту, шум вырастал до 31,1 дБА: это уже отчетливо слышно, но еще не громко. Аудиозапись шума — здесь.

Спектрограмма шума:

Подсветка

Карта имеет очень скромную подсветку в виде ломаной линии на верхнем торце карты. В качестве некоторого «утешения» для любителей моддинговых штучек компания Palit предлагает возможность модификации кожуха СО с помощью концепции «Автор» (Maker).

Владельцы видеокарт GeForce RTX 40 серии GamingPro и Dual могут скачать с сайта Palit варианты образцов дизайна кожуха. Более того, можно добавить что-то свое, изменить шаблон, проявить творчество, сохранить в виде проектов, затем отнести их в 3D-печать или распечатать на своем принтере, затем раскрасить. Ну а потом снять штатный кожух (он крепится на защелках) и установить свой вариант кожуха.

Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой ThunderMaster. Режимов крайне мало, они просты.

Комплект поставки и упаковка

В комплекте поставки кроме карты ничего больше нет.

Тестирование: синтетические тесты

Мы провели тестирование новой модели видеокарты Nvidia со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Мы постоянно стараемся расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Из более-менее новых бенчмарков мы начали использовать несколько дополнительных тестов для измерения производительности трассировки лучей и, а также технологий масштабирования разрешения и увеличения производительности: DLSS, FSR и XeSS. В качестве полусинтетических тестов у нас также используется набор подтестов из довольно популярного пакета 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др. А вот примеры приложений DirectX 11 и 12, входящие в различные SDK, пришлось убрать — последнее время они всё чаще давали некорректные результаты.

Синтетические тесты проводились на следующих видеокартах:

GeForce RTX 4060 Ti со стандартными параметрами (RTX 4060 Ti)
GeForce RTX 4070 со стандартными параметрами (RTX 4070)
GeForce RTX 3070 со стандартными параметрами (RTX 3070)
GeForce RTX 3060 Ti со стандартными параметрами (RTX 3060 Ti)
Radeon RX 6800 со стандартными параметрами (RX 6800)
Radeon RX 6750 XT со стандартными параметрами (RX 6750 XT)

Для анализа производительности видеокарты GeForce RTX 4060 Ti мы взяли модель, которая стоит на ступень выше и основана на старшей модели GPU — RTX 4070. По этому сравнению будет понятно, насколько графический процессор AD106 медленнее урезанного AD104. Также в тесты вошла пара видеокарт компании Nvidia из предыдущего поколения — по сравнению с ними мы поймем, насколько новая видеокарта улучшила показатели производительности GPU данного ценового сегмента.

Прямого конкурента для новинки компания AMD в своем текущем поколении еще не выпустила, поэтому нам пришлось взять два варианта из прошлого, близкие по цене. Мы сравним новинку с условными конкурентами на основе предыдущей архитектуры в виде Radeon RX 6800 и RX 6750 XT — первая модель продается чуть дороже RTX 4060 Ti, а вторая чуть дешевле. На деле же рассматриваемой сегодня видеокарте в будущем придется конкурировать с решениями на основе RDNA3, но их пока не видно на горизонте.

Тесты из 3DMark Vantage

Много лет мы рассматриваем устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя иногда они всё же получаются несколько заниженными для некоторых GPU. Слегка урезанная версия графического процессора AD106 имеет не слишком большое количество текстурных модулей, но они работают на достаточно высокой частоте по сравнению с чипами предыдущих поколений, поэтому RTX 4060 Ti легко опередила представителя семейства Ampere такого же класса — RTX 3060 Ti.

А вот если сравнить новинку даже с младшим из пары условных конкурентов компании AMD, то результат скорее в пользу Radeon, так как RX 6750 XT и дешевле и заметно более старый. Скорость текстурирования у всех Radeon достаточно высока из-за большого количества текстурных блоков, хотя новое поколение видеокарт AMD не стало заметно быстрее предыдущего в таких условиях, и RTX 4060 Ti может побороться с той моделью, которая в будущем выйдет примерно по этой же цене.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Результаты второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест измеряет именно производительность подсистемы ROP, вот и в этом случае ПСП не оказала определяющего влияния, так как у RTX 4060 Ti и RTX 3060 Ti они отличаются вдвое. Разница между парой новых моделей GeForce получилась ожидаемой из-за разницы в количестве блоков ROP и частотах, всё соответствует теории. Что касается предшественника, то в этот раз опередить RTX 3060 Ti уже не получилось, новинка менее эффективна в этом тесте.

Единственный представленный в сегодняшнем сравнении Radeon, который является лишь условным конкурентом для рассматриваемой новинки, показал высокую производительность в этом тесте, опередив GeForce уровня 3060 Ti/4060 Ti. Видеокарты компании Nvidia по пиковой скорости заполнения сцены всегда уступали конкуренту, но RTX 4060 Ti выглядит даже слабее обычного, а уж сравнение даже со старым и слабым Radeon явно не в пользу новой видеокарты.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нем часто неплохо коррелируют с тем, что получается в игровых тестах.

Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель GeForce RTX 4060 Ti показала ожидаемый и довольно неплохой результат — она оказалась явно быстрее RTX 3060 Ti, что вполне соответствует разнице в теоретической скорости вычислений. Своего условного соперника в виде Radeon RX 6750 XT новинка из современного семейства GeForce RTX 40 опередила совсем чуть-чуть, и RX 6800 точно будет впереди. Но реальным конкурентом новинки будет другая модель видеокарты AMD, которая еще не вышла.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы давно уже получаем явно некорректные результаты в этом тесте, так что их можно назвать сомнительными. Модель RTX 4060 Ti уступила старшей версии на графическом процессоре AD104, но выиграла у RTX 3060 Ti.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты, как и в прошлом подтесте этого же бенчмарка. Все представленные в сравнении видеокарты Nvidia и в этот раз странно медленны, если сравнивать их с Radeon. Рассматриваемая сегодня RTX 4060 Ti не смогла опередить даже видеокарту RTX 3060 Ti, а от старшей модели RTX 4070 отстала примерно так, как и можно было предположить по теоретической разнице между ними. Ну а Radeon RX 6750 XT еще быстрее в этом тесте.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она обычно близка к пиковой производительности видеочипов в предельных задачах. В тесте используются операции с плавающей запятой, и новые архитектуры Nvidia могли бы раскрывать часть своих уникальных возможностей, но тест уже порядком устарел и не показывает все способности современных GPU.

Тем не менее, младшая модель видеокарты архитектуры Ada Lovelace показала результат явно лучше чем RTX 3060 Ti и уступила RTX 4070 на урезанной версии чипа AD104 примерно столько, сколько и должна по теории. Единственное представленное в тесте решение компании AMD на основе предыдущей архитектуры RDNA 2 выступило скорее на уровне RTX 3060 Ti, поэтому неудивительно, что рассматриваемая сегодня новинка обгоняет своего условного конкурента. Далее мы рассмотрим более современные тесты, использующие повышенную нагрузку на GPU.

Тесты Direct3D 12

Примеры из DirectX SDK компании Microsoft и из SDK компании AMD, использующие графический API Direct3D12, мы решили убрать из наших тестов, так как они давно показывают некорректные результаты в большинстве случаев. И в качестве единственного вычислительного теста с поддержкой Direct3D12 в этом разделе остался известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Для верности мы протестировали видеокарты сразу в двух графических тестах.

Рассмотрим производительность новой модели GeForce RTX 4060 Ti в этой задаче по сравнению со старшей моделью видеокарты на основе чипа AD104 — новинка отстала от RTX 4070 примерно так, как и должна. Если сравнивать ее с решениями из предыдущего поколения, то новая видеокарта оказалась ближе к уровню RTX 3070, чем к RTX 3060 Ti, так что этот тест настраивает на позитив. Впрочем, видеокарты Radeon, которые мы взяли в условные конкуренты новинки, в этом тесте явно сильнее, так как даже младшая RX 6750 XT показывает скорость на уровне сегодняшней новинки.

Тесты трассировки лучей

Одним из первых тестов производительности трассировки лучей является бенчмарк Port Royal создателей серии тестов 3DMark. Этот бенчмарк работает на всех графических процессорах с поддержкой DirectX Raytracing API. Мы проверили несколько видеокарт в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей в двух режимах, а также традиционным для растеризации методом.

Бенчмарк показывает сразу несколько новых возможностей применения трассировки лучей через DXR API, в нем используются алгоритмы отрисовки отражений и теней с применением трассировки, но тест в целом не слишком хорошо оптимизирован и достаточно сильно загружает в том числе и мощные GPU. Но для сравнения производительности разных GPU в этой конкретной задаче тест вполне подходит.

Видеокарты на основе архитектур AMD тут явно медленнее — трассировка лучей в исполнении этих решений менее эффективна. Что касается сравнения Ada и Ampere, то в этом тесте новая модель RTX 4060 Ti оказалась очень близка к RTX 3070 — причем, как раз включение трассировки просадило производительность новинки чуть больше. Возможно, как раз в этом тесте и сказалась большая пропускная способность памяти у решения прошлого поколения, а большая кэш-память не спасает Ada в этом случае. Но радует то, что RTX 4060 Ti смогла чуть-чуть опередить Radeon RX 6800 более высокого уровня, который до сих пор продается дороже.

Позднее вышел еще один подтест 3DMark, направленный на тестирование производительности трассировки лучей — DirectX Raytracing. В отличие от предыдущего, он не гибридный, и не использует растеризацию вовсе, а только трассировку лучей, поэтому гораздо лучше отражает скорость GPU именно по возможностям аппаратного ускорения трассировки. Сцена в бенчмарке используется уже известная нам по другим подтестам 3DMark, и она довольно небольшая — BVH-структура в теории может поместиться в Infinity Cache, что может помочь новым видеокартам Radeon.

А вот тут всё интереснее. В этом тесте рассматриваемая сегодня модель GeForce RTX 4060 Ti заметно опережает RTX 3070 более высокого ценового позиционирования — так что RT-блоки явно были улучшены в архитектуре Ada Lovelace, и видеокарты серии RTX 4000 имеют тут преимущество. От RTX 4070 сегодняшняя новинка отстала прилично, но мы этого и ожидали — RT-блоков у новой видеокарты заметно меньше, чем у ее старшей сестры.

Что касается Radeon, даже более RX 6800 из прошлого поколения далека от новинки, а уж про RX 6750 XT и говорить нечего — она отстала более чем в два раза. Видеокарты конкурента не могут соперничать с решениями Nvidia, так как выделенные RT-ядра, использующие модель MIMD, выполняют заметно большую часть работы и более универсальны, они не теряют в производительности при включении трассировки так сильно, как ядра Ray Accelerator + обычные SIMD-ядра у решений AMD. К слову, даже видеокарты на основе архитектуры RDNA3 мало что изменили, так что даже потенциальный будущий ценовой конкурент RTX 4060 Ti из следующего поколения вряд ли сможет бросить ей вызов в этом тесте.

К выходу новых поколений графических процессоров Nvidia и AMD в прошлом году в пакете 3DMark был выпущен еще один тест с серьезной нагрузкой именно на трассировку лучей — Speed Way. По своей нагрузке на различные блоки GPU он кажется похожим на будущие игровые проекты, которые станут использовать трассировку лучей еще активнее существующих, и поэтому для нас весьма интересен.

Видеокарты этого уровня показывают минимально играбельную частоту кадров только в более низком разрешении, и разница между GeForce и Radeon меньше, чем в предыдущем тесте. И вот тут мы видим тревожный звоночек — RTX 3070 оказалась быстрее, чем RTX 4060 Ti, и это печально для теста с трассировкой лучей. Единственная Radeon прошлого поколения тут явно отстает от сегодняшней новинки, хотя они не конкуренты ни по цене ни по поколению, так что сравнение условное. Остается ждать выхода менее дорогих видеокарт AMD текущего поколения, чтобы сделать какие-то выводы.

Переходим к полусинтетическим бенчмаркам, которые сделаны на игровых движках. Первым таким тестом стал Boundary — один из китайских игровых проектов с поддержкой DXR и DLSS. Это бенчмарк с очень серьезной нагрузкой на GPU, трассировка лучей в нем используется весьма активно — и для сложных отражений с несколькими отскоками луча, и для мягких теней, и для глобального освещения. Также в тесте используется технология DLSS, качество которой можно настраивать, и мы протестировали два варианта — без DLSS, чтобы сравнить с AMD Radeon, и с максимально возможным качеством для DLSS.

Без включения DLSS приемлемая производительность получается только в Full HD-разрешении. Единственная модель Radeon показала производительность слабее всех, а сегодняшняя новинка примерно вдвое быстрее ее. 4K-разрешение без включения масштабирования неиграбельно, так что рассматривать его нет особого смысла. А в Full HD новая модель RTX 4060 Ti всё же обгоняет RTX 3070, что можно считать хорошим результатом. Рассмотрим этот же тест с DLSS:

Даже с включением масштабирования разрешения методом DLSS 2 представленные видеокарты в 4K-разрешении не смогли обеспечить приемлемую частоту кадров, хотя в Full HD все превысили 60 FPS с запасом. Результат новой GeForce RTX 4060 Ti ожидаемо ниже, чем у RTX 4070, и новинка лишь немного лучше, чем RTX 3070 — обе не взяли планку 30 FPS в 4K. Так что позиционирование Nvidia на Full HD вполне оправдано, играть в 4K-разрешении при максимальных настройках в ресурсоемких играх не получится, придется снижать настройки.

Рассмотрим еще один полуигровой бенчмарк, также основанный на китайской игре — Bright Memory. Интересно, что оба теста довольно похожи по результатам и по качеству изображения, хотя по тематике они совсем разные. И всё же этот бенчмарк даже еще чуть более требователен, особенно конкретно к производительности трассировки лучей. Жаль, что на видеокартах AMD он не работает, требуя именно карты GeForce RTX.

Новая модель на базе слегка урезанного графического процессора AD106 показала почти такой же результат, как и в прошлом тесте. На фоне RTX 4070 она явно медленнее, что объяснимо, а сравнение с RTX 3070 интереснее. В низком разрешении новинка явно сильнее, причем значительно, но в 4K вперед выходит уже RTX 3070 — похоже, что сказывается нехватка пропускной способности видеопамяти у RTX 4060 Ti, и никакая кэш-память в этом случае уже не помогает. Объем видеопамяти у этих решений одинаковый, отличается ширина шины памяти. Но в целом результат для новинки такой — по тестам трассировки лучей она чуть быстрее RTX 3070, что не так уж плохо.

Вычислительные тесты

Мы продолжаем поиск бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается довольно старый и не слишком хорошо оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.

Новая модель GeForce RTX 4060 Ti, созданная на основе урезанной модификации самого младшего GPU архитектуры Ada Lovelace, имеет небольшое количество вычислительных блоков, но высокую тактовую частоту, но это не помогло ей обойти RTX 3060 Ti из предыдущего поколения! Они примерно равны, а RTX 3070 явно побыстрее обеих видеокарт. Отставание от старшей модели RTX 4070 оказалось равным примерно полтора раза, что вполне ожидаемо. Что касается Radeon, то результат новинки лишь в одном (но самом сложном) подтесте выше, чем у видеокарты соперника из прошлого поколения — Radeon RX 6800. Но эта видеокарта чуть дороже и из предыдущего поколения, ждем новые решения AMD.

Рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества новых видеокарт. В прошлых тестах мы использовали разные версии бенчмарка: которая выдает результат в виде времени, затраченного на рендеринг и в виде количества миллионов просчитанных путей за секунду, сейчас остался только первый вариант.

Тест также показывает программную трассировку лучей, но на решениях AMD запустить тест не получается. Новая модель GeForce RTX 4060 Ti заметно уступила старшей RTX 4070 — чуть больше ожиданий, зато оказалась быстрее не только RTX 3060 Ti, но и RTX 3070. Этот бенчмарк раскрывает особенности новой архитектуры лучше предыдущих — программная трассировка лучей в этом варианте предпочитает большой объем быстрой кэш-памяти, чем и отличаются решения Ada, а вот ПСП видеопамяти процесс рендеринга не слишком ограничивает. Если сравнить результаты RTX 4060 Ti и RTX 3060 Ti, то получается, что новая видеокарта в этом тесте на треть быстрее.

Рассмотрим еще одно приложение рендеринга — OctaneRender. Это довольно популярный рендерер, который можно использовать в большинстве приложений для создания 3D-контента, а главное, что он использует возможности CUDA и RTX, а версия OctaneRender 2020.1.5 получила поддержку Ampere. Бенчмарк на основе этого рендерера позволяет отключать RTX-ускорение и тестирует производительность сразу в нескольких тестовых сценах, отличающихся по нагрузке. Увы, но OpenCL тестом и рендерером не поддерживается. Приведем общее количество очков:

Новая видеокарта GeForce RTX 4060 Ti показала производительность на уровне RTX 3070 из прошлого семейства, что при включенном аппаратном ускорении RTX, которое заметно повышает результаты графических процессоров архитектур Ampere и Ada Lovelace, что без него. Предшественница новинки из предыдущего поколения — RTX 3060 Ti — тут оказалась чуть слабее. А вот старшая RTX 4070 очень далеко впереди — всё же для рендеринга лучше покупать решения более высокого уровня. Впрочем, во всех сложных вычислительных тестах младшая представительница архитектуры Ada Lovelace показала неплохие результаты, в среднем на уровне RTX 3070, а то и быстрее.

Тесты технологий DLSS/XeSS/FSR

В этом разделе будут дополнительные тесты, связанные с различными технологиями повышения производительности. Ранее это были только технологии масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS), а теперь к ним добавилась и технология генерации промежуточных кадров — DLSS 3. По сути, вставка кадров — это отдельная технология, и в остальном DLSS 2 ничем не отличается от DLSS 3.

Первым будет отдельный тест второй и третьей версий технологии DLSS, хотя ранее мы уже провели тесты с применением DLSS в приложениях с трассировкой лучей, но и отдельное тестирование в разрешении 4K интересно. Рассмотрим результаты четырех GPU компании Nvidia в популярном разрешении с включением технологии DLSS различных уровней качества и сразу двух версий (только для RTX 4000, конечно же):

Без включения DLSS 2.0, рендеринг производится в полном разрешении, что сильно сказывается на производительности, и такого уровня частоты кадров будет явно недостаточно даже в случае RTX 4070, не говоря о RTX 4060 Ti, которая почти вдвое медленнее в этом режиме — из-за меньшего объема видеопамяти, во многом. Новинка вместе с RTX 3070 показывает 16-17 FPS, чего явно недостаточно для комфортной игры, но DLSS как раз позволяет улучшить производительность, а заодно и качество сглаживания. Включение технологии DLSS 2 приводит к росту FPS в два и более раза, и новая модель RTX 4060 Ti уже обеспечивает 31 FPS или 46 FPS в среднем, в зависимости от режима качества, и RTX 3070 тут снова чуть быстрее.

Но в видеокартах графической архитектуры Ada Lovelace появилась поддержка DLSS 3.0 — технологии добавления промежуточных кадров, подробнее о которой можно прочитать в теоретической статье по RTX 4090 и RTX 4080. На практике включение генерации промежуточных кадров дает прирост FPS еще раза в полтора. И с включением технологии DLSS 3, RTX 4060 Ti уже почти достает до уровня производительности RTX 3090 в режиме DLSS Quality! Понятно, что RTX 3070 тут очень далеко позади, даже с Performance она дает максимум 49 FPS, тогда как с DLSS 3 новинка обеспечивает более чем 61 FPS. Генерация кадров позволяет повысить плавность видеоряда при незначительном увеличении задержек управления — пользователь может самостоятельно решить, что ему выбрать. Так что этот режим вполне можно считать явным преимуществом рассматриваемой сегодня модели.

Переходим ко второму методу повышения производительности посредством рендеринга в меньшем разрешении и масштабировании картинки до более высокого — аналог DLSS 2.0, предложенный компанией Intel, который называется XeSS и также использует возможности искусственного интеллекта при восстановлении информации в кадре. А отличается он от DLSS тем, что работает не только на редких видеокартах компании-разработчика, но и на всех современных GPU, пусть и не столь эффективно, как на решениях самой Intel. Для тестирования мы также взяли специализированный бенчмарк из пакета 3DMark, но в меньшем разрешении.

Включение XeSS также позволяет повысить частоту кадров — вдвое и более. Radeon RX 6700 XT работает в этом случае примерно с той же эффективностью, что и видеокарты Nvidia, ну а видеокарты Intel чуть лучше справляются с делом, так как умеют использовать для этого специализированные блоки, как и GeForce с DLSS. RTX 4060 Ti отстает от RTX 4070 по понятным причинам в виде худших теоретических показателей, при этом новинка снова очень близка к RTX 3070. В общем, хотя для всех решений Nvidia в играх лучше включать DLSS (при такой возможности), но и XeSS вполне имеет право на жизнь с учетом универсальности технологии Intel.

Ну и последний представитель семейства технологий масштабирования рендеринга — FSR 2.0 компании AMD. Почему-то именно эта технология последней появилась в списке специализированных подтестов 3DMark. К сожалению, сцены разных технологий масштабирования во всех случаях отличаются и напрямую их сравнить не получится, можно только по росту производительности, но нужно еще учитывать реальное разрешение рендеринга и разницу в качестве, а это — тема отдельного разговора.

В общем, ничего особенного в тестах FSR 2.0 мы не нашли, все GPU расположились примерно так, как мы и ожидали. Новая модель RTX 4060 Ti явно медленнее старшей RTX 4070, как и должно быть, и она немного не достает до уровня RX 6800 в этом тесте. Ждем недорогих видеокарт AMD нового поколения, чтобы сравнить их с новой GeForce. Настало время перейти к тестированию новой видеокарты Nvidia в игровых тестах.

Тестирование: игровые тесты

Конфигурация тестового стенда

Список инструментов тестирования

Во всех игровых тестах использовалось максимальное качество графики в настройках.

Marvel’s Spider-Man Miles Morales (Insomniac Games/Sony Interactive)
Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 1.61 (DLSS 3.0)
God of War (Sony IE/Sony IE)
Call of Duty: Modern Warfare II (Infinity Ward/Activision)
Marvel’s Guardians of the Galaxy (Eldos/Square Enix)
The Medium (Bloober/Bloober)
A Plague Tale: Requiem (Asobo Studio/Focus Entertainment)
Hogwarts Legacy (Avalance Software/Warner Bros)
Far Cry 6 (Ubisoft/Ubisoft)
Atomic Heart (Mundfish/VK)

Кратко о производительности в 3D-играх

Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Всё это нами субъективно оценивается по шкале из пяти градаций.

Игры без использования трассировки лучей (классическая растеризация):

Производительность GeForce RTX 4060 Ti находится примерно между GeForce RTX 3060 Ti и GeForce RTX 3070. Эта карта будет обеспечивать отменный комфорт во всех играх на максимальных настройках качества при отключенных трассировке лучей и технологиях масштабирования в разрешении до 2.5K включительно (правда, для сохранения высочайшего комфорта в некоторых играх придется понижать либо настройки графики, либо разрешение). Ближайшие конкуренты — AMD Radeon RX 6700 XT и Intel Arc A770.

Игры с использованием трассировки лучей и DLSS/FSR/XeSS:

C учетом некоторого падения производительности при активации в играх трассировки лучей (при этом появляется всё больше и больше игр с поддержкой Nvidia DLSS, а эта технология масштабирования позволяет резко поднять производительность, в том числе компенсируя падение от включения RT), а также того факта, что у видеокарт Radeon RX 6000 падение FPS куда более драматичное, новинка GeForce RTX 4060 Ti смотрится довольно убедительно. К тому же, приобретая GeForce RTX 4060 Ti, игрок получает и поддержку DLSS 3, так что в соответствующих играх можно будет вообще никогда не отключать трассировку лучей. Однако это относится уже только к разрешению 1080p (Full HD). В разрешении 2.5K отменный комфорт можно получить лишь без трассировки лучей и с DLSS 3.0 (а эта технология пока применена всего в нескольких десятках игр) или по крайней мере с DLSS 2.0.

Результаты тестирования в 3D-играх

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1080, 2560×1440 и 3840×2160

Marvel’s Spider-Man Miles Morales

Cyberpunk 2077

God of War

Call of Duty: Modern Warfare II

Marvel’s Guardians of the Galaxy

The Medium

A Plague Tale: Requiem

Hogwarts Legacy

Far Cry 6

Atomic Heart

Результаты тестов со включенной аппаратной трассировкой лучей и/или DLSS/FSR/XeSS в разрешениях 1920×1080, 2560×1440 и 3840×2160

Cyberpunk 2077, RT

Cyberpunk 2077, RT + DLSS/FSR

God of War, DLSS/FSR

Call of Duty: Modern Warfare II, DLSS/XeSS

Marvel’s Guardians of the Galaxy, RT

Marvel’s Guardians of the Galaxy, RT + DLSS/FSR

The Medium, RT

The Medium, RT + DLSS/FSR

Hogwarts Legacy, RT

Hogwarts Legacy, RT + DLSS/FSR/XeSS

Far Cry 6, RT

Far Cry 6, RT + FSR

Atomic Heart, DLSS/XeSS

Рейтинг iXBT.com

Методика расчета рейтингов

Методика расчета базируется на усреднении (берется среднее геометрическое) величин производительности в каждом тесте.

Рейтинги iXBT и полезности рассчитываются по следующей формуле:

Рейтинг iXBT для игр без использования трассировки лучей

К_iXBT = (K^1⁄30) × (P_OSS) ⁄ K_RX6500 × 100

К_ПОЛ = K_iXBT ⁄ Price × 10000

где:

К — составляющая, учитывающая скорость работы карт:

К =	(G01_19xx × G01_25xx × G01_38xx) ×
	(G02_19xx × G02_25xx × G02_38xx) ×
	(G03_19xx × G03_25xx × G03_38xx) ×
	(G04_19xx × G04_25xx × G04_38xx) ×
	(G05_19xx × G05_25xx × G05_38xx) ×
	(G06_19xx × G06_25xx × G06_38xx) ×
	(G07_19xx × G07_25xx × G07_38xx) ×
	(G08_19xx × G08_25xx × G08_38xx) ×
	(G09_19xx × G09_25xx × G09_38xx) ×
	(G10_19xx × G10_25xx × G10_38xx) ×

Для того чтобы читателю было понятно, как взаимно соотносятся возможности карт, мы берем К_RX6500 (составляющую, учитывающую скорость работы Radeon RX 6500 XT) за эталон и нормируем на нее показатели всех остальных ускорителей, получая рейтинги видеокарт относительно Radeon RX 6500 XT. Для демонстрации разницы в процентах умножаем всё на 100.

Условные обозначения:

К_ПОЛ — рейтинг полезности (чем он выше, тем лучшe оценка карты)
К_iXBT — рейтинг iXBT.com (чем он выше, тем лучшe оценка карты)
G01 — G10 — производительность (FPS) тестовых играх 1 — 10 в соответствующих разрешениях:
- G01_19xx — 1920×1200
- G01_25xx — 2560×1440
- G01_38xx — 3840×2160
Price — цена видеокарты на конец отчетного месяца по данным прайс-листов некоторых популярных маркетплейсов (берется средняя цена)
P_OSS — оценка новых функциональных возможностей видеокарты (см. пояснения ниже)

Рейтинг iXBT для игр c использованием трассировки лучей, DLSS/FSR/XeSS

К_iXBT-RT = (K^1⁄24) × (P_OSS) ⁄ K_rx6500 × 100

К_ПОЛ-RT = K_iXBT-RT ⁄ Price × 10000

где:

К — составляющая, учитывающая скорость работы карт:

К =
	(G02_19xx × G02_25xx × G02_38xx) ×
	(G03_19xx × G03_25xx × G03_38xx) ×
	(G04_19xx × G04_25xx × G04_38xx) ×
	(G05_19xx × G05_25xx × G05_38xx) ×
	(G06_19xx × G06_25xx × G06_38xx) ×
	(G08_19xx × G08_25xx × G08_38xx) ×
	(G09_19xx × G09_25xx × G09_38xx) ×
	(G10_19xx × G10_25xx × G10_38xx) ×

Условные обозначения:

К_ПОЛ — рейтинг полезности (чем он выше, тем лучшe оценка карты)
К_iXBT-RT — рейтинг iXBT.com (чем он выше, тем лучшe оценка карты)
G02 — G10 — производительность (FPS) тестовых играх 2 — 10 в соответствующих разрешениях с включенными технологиями RT/DLSS/FSR/XeSS:
- G02_19xx — 1920×1200
- G02_25xx — 2560×1440
- G02_38xx — 3840×2160
Price — цена видеокарты на конец отчетного месяца по данным прайс-листов некоторых популярных маркетплейсов (берется средняя цена)
P_OSS — оценка новых функциональных возможностей видеокарты (см. пояснения ниже)

Оценка P_OSS на данный момент равна 1 (зарезервирована на будущее).

Хотим выразить благодарность
Maxxx (maxm@online.sinor.ru),
Михаилу Сугакевичу (Mishail@newmail.ru)
Вячеславу Гордееву AKA Slaydev (sarz@dale.elektra.ru) и
Ruslan73 (http://forum.ixbt.com/users.cgi?id=info:Ruslan73)
dmitro13 (dmytro13@hotmail.com)
UnVial (lvg@pop.ioffe.rssi.ru)
Сергею Гайдукову (gsaf@sura.ru)
Михаилу Кузьмину (kuzmin@laser.ru)

за усовершенствование методики расчета рейтингов

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:

Вариант рейтинга iXBT.com без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по наиболее слабому ускорителю из группы карт — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%). Рейтинги ведутся по 29 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят GeForce RTX 4060 Ti и его конкуренты.

Рейтинг приведен суммарно для всех трех разрешений.

№	Модель ускорителя	Рейтинг iXBT.com	Рейтинг полезности	Цена, руб.
14	RX 6800 16 ГБ, 2105—2271/16000	413	83	50 000
15	RTX 3070 Ti 8 ГБ, 1770—1935/19000	396	94	42 000
16	RTX 3070 8 ГБ, 1725—1950/14000	356	96	37 000
17	RX 6750 XT 12 ГБ, 2600—2724/18000	353	93	38 000
18	RTX 4060 Ti 8 ГБ, 2535—2790/18000	329	75	44 000
19	RX 6700 XT 12 ГБ, 2581—2643/16000	327	96	34 000
20	Arc A770 16 ГБ, 2100—2400/17500	314	112	28 000
21	RTX 3060 Ti 8 ГБ, 1665—2010/14000	313	98	32 000

Мы хорошо видим, что новинка в лице GeForce RTX 4060 Ti в целом лишь на 5%—8% быстрее формального предшественника в лице GeForce RTX 3060 Ti, и это совсем не впечатляет и даже разочаровывает. При этом GeForce RTX 4060 Ti отстает от GeForce RTX 3070, находится на уровне Radeon RX 6700 XT и отстает от Radeon RX 6750 XT, хотя оба ускорителя AMD значительно дешевле.

Вариант рейтинга iXBT.com с включением RT/DLSS/FSR/XeSS

Рейтинг составлен по 9 тестам, в которых используется технология трассировки лучей и одновременно технология Nvidia DLSS, AMD FSR или Intel XeSS. Этот рейтинг нормирован по самому слабому ускорителю в данной группе — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%).

Рейтинг приведен суммарно для всех трех разрешений.

№	Модель ускорителя	Рейтинг iXBT.com	Рейтинг полезности	Цена, руб.
14	RTX 3070 Ti 8 ГБ, 1770—1935/19000	577	137	42 000
15	RTX 4060 Ti 8 ГБ, 2535—2790/18000	541	123	44 000
16	RX 6800 16 ГБ, 2105—2271/16000	524	105	50 000
17	RTX 3070 8 ГБ, 1725—1950/14000	518	140	37 000
18	RTX 3060 Ti 8 ГБ, 1665—2010/14000	450	141	32 000
19	Arc A770 16 ГБ, 2100—2400/17500	447	159	28 000
20	RX 6750 XT 12 ГБ, 2600—2724/18000	442	116	38 000
21	RX 6700 XT 12 ГБ, 2581—2643/16000	412	121	34 000

Безусловно, включение RT сильно бьет по семейству Radeon, и даже использование масштабирования FSR не сильно помогает картам AMD. Плюс GeForce RTX 4060 Ti поддерживает DLSS 3.0, что может оказаться козырем не только против ускорителей AMD, но и против решений семейства GeForce RTX 30. Однако на сегодня игр с поддержкой DLSS 3.0 крайне мало, не более нескольких десятков названий.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Для расчета рейтинга полезности использованы розничные цены на конец мая 2023 года.

Вариант рейтинга полезности без включения RT

№	Модель ускорителя	Рейтинг полезности	Рейтинг iXBT.com	Цена, руб.
03	Arc A770 16 ГБ, 2100—2400/17500	112	314	28 000
06	RTX 3060 Ti 8 ГБ, 1665—2010/14000	98	313	32 000
07	RTX 3070 8 ГБ, 1725—1950/14000	96	356	37 000
08	RX 6700 XT 12 ГБ, 2581—2643/16000	96	327	34 000
11	RTX 3070 Ti 8 ГБ, 1770—1935/19000	94	396	42 000
12	RX 6750 XT 12 ГБ, 2600—2724/18000	93	353	38 000
15	RX 6800 16 ГБ, 2105—2271/16000	83	413	50 000
18	RTX 4060 Ti 8 ГБ, 2535—2790/18000	75	329	44 000

Тут к описанному ранее не впечатляющему уровню производительности у GeForce RTX 4060 Ti добавляется капитальный удар по новинке в виде крайне завышенной стоимости. Можете сами всё увидеть — это явный провал.

Вариант рейтинга полезности с включением RT/DLSS/FSR/XeSS

№	Модель ускорителя	Рейтинг полезности	Рейтинг iXBT.com	Цена, руб.
02	Arc A770 16 ГБ, 2100—2400/17500	159	447	28 000
04	RTX 3060 Ti 8 ГБ, 1665—2010/14000	141	450	32 000
05	RTX 3070 8 ГБ, 1725—1950/14000	140	518	37 000
07	RTX 3070 Ti 8 ГБ, 1770—1935/19000	137	577	42 000
12	RTX 4060 Ti 8 ГБ, 2535—2790/18000	123	541	44 000
13	RX 6700 XT 12 ГБ, 2581—2643/16000	121	412	34 000
17	RX 6750 XT 12 ГБ, 2600—2724/18000	116	442	38 000
20	RX 6800 16 ГБ, 2105—2271/16000	105	524	50 000

Да, включение RT и сопутствующих «костылей» в виде технологий масштабирования помогает новинке оказаться чуть-чуть более привлекательной против Radeon RX 6700 XT/6750 XT, но именно чуть-чуть. Еще присутствующие на рынке в достаточном количестве GeForce RTX 3070/3060 Ti и даже GeForce RTX 3070 Ti не оставляют GeForce RTX 4060 Ti никакой надежды на успех при тех ценах, которые эта карта имеет на сегодня. Intel Arc A770 можно не учитывать из-за крайне слабого присутствия на рынке, но капитальный проигрыш предыдущему поколению GeForce RTX — это очень грустно.

Выводы

Nvidia GeForce RTX 4060 Ti (8 ГБ) — пятый по счету и по старшинству представитель нового поколения GeForce RTX 40 (Ada Lovelace), и, наверное, самый спорный и невразумительный.

В целом наблюдается явная тенденция к сокращению разрыва между соответствующими уровнями ускорителей двух поколений: GeForce RTX 4070 Ti — это, по сути, GeForce RTX 3090 Ti (опережение на 3 уровня); GeForce RTX 4070 — это, по сути, GeForce RTX 3080 (10 ГБ), то есть опережение уже всего на 1 уровень; а в случае с GeForce RTX 4060 Ti даже и такого нет: до GeForce RTX 3070 эта карта просто не дотягивает.

Получается, это попытка просто заполнить линейку GeForce RTX 40 любой ценой, переведя производство кристаллов с Samsung на TSMC. Что дальше? GeForce RTX 4060 будет медленнее, чем GeForce RTX 3060, имея даже меньший объем памяти (8 против 12 ГБ)? Про GeForce RTX 4050 даже думать боязно. За кого ведущий производитель принимает своих покупателей? Подпоркой в виде DLSS 3.0 сейчас можно заманить только совсем уж неграмотных. Не секрет, что до сих пор колоссальный процент игр на рынке вообще не имеет поддержки ни трассировки лучей, ни технологий масштабирования. Реально складывается ощущение, что в погоне за более прибыльным рынком устройств для реализации ИИ компания уже стала отмахиваться от геймеров, причем именно от массовых геймеров, которые явно не приобретают дорогущие GeForce RTX 4090/4080/4070 Ti: им предлагаются по довольно высоким ценам сомнительные решения, не демонстрирующие однозначного превосходства над картами предыдущего поколения.

Наши исследования показали, что GeForce RTX 4060 Ti имеет относительно привлекательное соотношение цены и производительности в своей группе исключительно в играх с применением технологии трассировки лучей и масштабирования DLSS 3.0 — тогда он еще худо-бедно дотягивается до GeForce RTX 3070/Ti. В остальных случаях это уровень чуть выше GeForce RTX 3060 Ti, максимум — посредине между последним и GeForce RTX 3070.

На момент подготовки нашего обзора продажи GeForce RTX 4060 Ti уже начались, поэтому мы делаем свои выводы не на основе условных оценок примерной стоимости, а на основании реальных ценников. И даже с учетом нынешнего курса рубля эти цены, как нам кажется, чрезмерно высокие, если учесть, что сейчас на маркетплейсах типа Озон или Авито можно купить новые карты GeForce RTX 3070 за 35-37 тысяч рублей (и не ждать, пока DLSS 3.0 завоюет хотя бы четверть рынка игр).

Разумеется, широкое внедрение DLSS 3.0 поможет GeForce RTX 4060 Ti стать намного более популярным ускорителем, но только в случае реально массового внедрения этой технологии масштабирования. Ну и ждем адекватного снижения цен, ибо факты говорят о том, что такие карты сейчас мало кто покупает.

Очевидны и два узких места у нового продукта, главное их которых — объем памяти в 8 ГБ (в интернете полно исследований на тему минимально требуемого на сегодня объема памяти для ускорителей, претендующих на комфорт в разрешениях выше Full HD, и это явно не 8 ГБ, а минимум 10-11, так что 12 ГБ были бы весьма полезны в случае с 4060 Ti). Второе узкое место вытекает из первого: шина обмена с памятью. Да, в ускорителе применен один из самых быстрых на сегодня типов памяти GDDR6, но всё равно ПСП оказывается удавкой. Опять же, если бы карту укомплектовали 12 гигабайтами памяти, то и шина была бы 192-битная.

Безусловно, у всего семейства GeForce RTX 40 заметно повышена эффективность блоков трассировки лучей, обновлены тензорные ядра, так что чем больше та или иная игра использует возможности RT, тем заметнее будет превосходство нового поколения, ведь в новой архитектуре Ada Lovelace возможности указанных блоков были серьезно улучшены, особенно это касается аппаратной трассировки лучей. Само определение пересечений луча и треугольника в третьем поколении RT-ядер было ускорено вдвое, но еще интереснее дополнительные аппаратные блоки в RT-ядрах: Opacity Micromap Engine, ускоряющий обработку полупрозрачных объектов, вроде языков пламени и листьев, и Displaced Micro-Mesh Engine, способный снизить время построения структур BVH и сократить требования к объему геометрических данных для очень сложных объектов. Еще одна важная новая возможность — переупорядочивание выполнения шейдеров при трассировке лучей — Shader Execution Reordering. Специальный планировщик способен на лету оптимизировать загрузку вычислительных блоков мультипроцессора SM, что потенциально может обеспечить двух-трехкратное ускорение для многих алгоритмов трассировки лучей.

И еще раз надо сказать про новую версию DLSS 3.0, использующую ускоритель оптического потока Optical Flow Accelerator, улучшенный в архитектуре Ada Lovelace. DLSS 3 использует как масштабирование разрешения из DLSS 2, так и удвоение частоты кадров при помощи вставки промежуточных, используя поле оптического потока. Данные из него комбинируются с векторами движения, и искусственный интеллект при помощи тензорных ядер генерирует промежуточные кадры, чтобы видеоряд был плавнее. А для того чтобы задержки при этом не слишком увеличивались, используется известная технология компании Reflex. В результате игрок может получить вдвое больше кадров в секунду при визуальном качестве, сравнимом с DLSS 2.

И всё это было бы прекрасно, если бы у маркетологов Nvidia не было проблем с реальной оценкой рынка ПК и спроса на компоненты в настоящее время.

Конкретная протестированная карта Palit GeForce RTX 4060 Ti Dual (8 ГБ) имеет плюс в виде сравнительно компактных габаритов: у нее двухслотовое размещение в системном блоке, и при этом СО не слишком шумная. Заметим, что для карты Palit можно самостоятельно модифицировать кожух СО с помощью фирменной концепции «Maker» — с последующей печатью на 3D-принтере.

Карта может потреблять до 170 Вт и имеет стандартный 8-контактный разъем питания.

Производитель декларирует наличие 3-летней гарантии на эту карту.

Отметим еще раз, что GeForce RTX 4060 Ti отлично подходит для игры в разрешении 1080p с максимальным качеством графики с трассировкой лучей с поддержкой DLSS/FSR/XeSS, а также неплохо смотрится в разрешении 2.5K без RT.

Также отметим поддержку стандарта HDMI 2.1, позволяющего выводить 4K-изображение со 120 FPS или 8K-разрешение при помощи одного кабеля, поддержку аппаратного декодирования видеоданных в формате AV1, технологию RTX IO, способную обеспечить быструю передачу и распаковку данных с накопителей прямо в GPU, а также технологию снижения задержек Reflex, полезную для киберспортсменов.

Справочные материалы: