Обзор видеоускорителя Nvidia GeForce RTX 4060 Ti (8 ГБ) на основе карты Palit GeForce RTX 4060 Ti Dual

Общая информация о GeForce RTX 4060 Ti

При анонсе графической архитектуры Ada Lovelace в прошлом году компания Nvidia рассказала о трех видеокартах на ее основе: флагманской модели GeForce RTX 4090 и паре вариантов RTX 4080, один из которых затем переименовали в RTX 4070 Ti. Видеокарты выпускались на рынок постепенно, и мы успели рассмотреть их все, а совсем недавно была анонсирована еще пара видеокарт среднего ценового диапазона: GeForce RTX 4060 Ti и модель с таким же цифровым индексом без приставки. Первая в варианте с 8 ГБ видеопамяти по цене $399 уже вышла и даже продается, а модель с 16 ГБ (она будет сразу на сотню долларов дороже) и простая RTX 4060 с необъявленной пока ценой появятся в продаже в июле.

Сегодня мы рассмотрим только первую из них — GeForce RTX 4060 Ti с 8 ГБ памяти. Новая модель использует все самые современные технологии компании Nvidia, включая последние версии RT-ядер и тензорных ядер, которые мощнее предыдущих и поддерживают новые возможности, вроде технологии DLSS 3 и Shader Execution Reordering, и при этом ее GPU потребляет меньше энергии по сравнению с прямой предшественницей — RTX 3060 Ti. Ее основное преимущество перед соперниками как AMD, так и GeForce предыдущих поколений за те же деньги — в поддержке технологии генерации кадров DLSS 3, которая раньше была доступна только в GPU более высокой ценовой категории.

Главное нововведение DLSS 3 заключается в создании дополнительных интерполированных кадров на основе пары существующих, для чего используется специализированный аппаратный движок Optical Flow Accelerator, интерполирующий соседние кадры и создающий на их основе новые. Но даже без учета этого мощности RTX 4060 Ti вполне достаточно для того, чтобы обеспечить высокую частоту кадров при Full HD-разрешении и максимальных или очень высоких графических настройках в таких ресурсоемких играх, как Cyberpunk 2077, Microsoft Flight Simulator и многих других.

Nvidia систематически внедряла графическую архитектуру Ada Lovelace в своей линейке и шла сверху от флагманских решений вниз к среднебюджетным. Начинали они с RTX 4090 и RTX 4080, затем переходя к производительному сегменту с RTX 4070 Ti и RTX 4070, а теперь вот и к среднему ценовому диапазону с видеокартами RTX 4060 Ti и RTX 4060.

Nvidia позиционирует свою текущую линейку определенным образом. Если модели GeForce RTX 4090 и RTX 4080 предназначены для разрешения 4K при всех максимальных графических настройках, вместе с трассировкой лучей, а также для полупрофессионального использования в ПО для создания цифрового контента и средств, использующих возможности нейросетей, то GeForce RTX 4070 Ti и RTX 4070 уже обеспечат максимум графики лишь в разрешении 2560×1440, хотя без трассировки лучей их вполне хватит и для 4K. Ну а анонсированные недавно GeForce RTX 4060 Ti и RTX 4060 годятся уже только для Full HD-разрешения, если говорить о самых современных играх.

И в этом нет ничего странного, ведь это самые популярные категории среди игроков. Во-первых, судя по статистике аппаратного обеспечения в сервисе Steam, около 80% пользователей имеют видеокарты этого уровня и слабее (но более старые, разумеется): GTX 1060, GTX 1660, RTX 2060 и так далее. И почти столько же — 77% пользователей сервиса — имеют Full HD-мониторы и играют в разрешении 1920×1080 или даже ниже. Именно для них Nvidia и выпустила две видеокарты новой подсерии RTX 4060 — с приставкой Ti и без нее. Специалисты компании полагают, что эти модели могут стать неплохим вариантом для модернизации видеосистемы для владельцев старого железа. Сегодня мы попробуем разобраться, так ли это.

Графическая архитектура Ada Lovelace во многом схожа с архитектурой Ampere, на которой основаны различные модификации чипов GA10x, обе эти архитектуры имеют достаточно много общего и с предыдущими архитектурами Turing и Volta, и перед прочтением материала будет полезно ознакомиться с нашими предыдущими статьями по теме:

Графический ускоритель GeForce RTX 4060 Ti
Кодовое имя чипа AD106
Технология производства 5 нм (TSMC 4N)
Количество транзисторов 22,9 млрд (35,8 млрд у AD104)
Площадь ядра 190 мм² (294,5 мм² у AD104)
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти 128-битная: 4 независимых 32-битных контроллера памяти с поддержкой памяти типа GDDR6
Частота графического процессора до 2535 МГц
Вычислительные блоки 34 (из 36) потоковых мультипроцессора, включающих 4352 (из 4608) CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки 136 (из 144) тензорных ядер для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей 34 (из 36) RT-ядра для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования 136 (из 144) блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 6 широких блоков ROP на 48 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)
Спецификации видеокарты GeForce RTX 4060 Ti
Частота ядра 2310/2535 МГц
Количество универсальных процессоров 4352
Количество текстурных блоков 136
Количество блоков блендинга 48
Эффективная частота памяти 18 ГГц
Тип памяти GDDR6
Шина памяти 128 бит
Объем памяти 8 ГБ
Пропускная способность памяти 288 ГБ/с
Вычислительная производительность (FP32) до 22,1 терафлопс
Теоретическая максимальная скорость закраски 122 гигапикселя/с
Теоретическая скорость выборки текстур 345 гигатекселей/с
Шина PCI Express 4.0 x8
Разъемы по выбору производителя
Энергопотребление до 160 Вт
Дополнительное питание по выбору производителя
Число слотов, занимаемых в системном корпусе по выбору производителя
Рекомендуемая цена $399

Название новой модели соответствует принятому принципу наименования решений компании. Новинка на основе слегка урезанного чипа AD106 заняла свое положение в линейке на ступень ниже RTX 4070, как и должно быть исходя из применяемых графических процессоров, а ниже ее будет такая же модель без приставки Ti, которая появится в июле.

Nvidia оценила модель GeForce RTX 4060 Ti с 8 ГБ видеопамяти в $399 на рынке США, и это соответствует рекомендованной цене предшественника — RTX 3060 Ti. За эту цену на рынке настольных видеокарт свежих конкурентов у AMD пока что нет, так как младшая из пары топовых видеокарт AMD Radeon RX 7900 XT является конкурентом RTX 4070 Ti и стоит заметно дороже, а RX 7600 и дешевле и менее мощная. Так что сравнивать RTX 4060 Ti сегодня придется скорее с теми видеокартами прошлого, которые продаются по схожей цене: RX 6750 XT и RX 6800. Пока что ничего нового из текущего поколения AMD в этом ценовом диапазоне даже не анонсировала.

Рекомендуемую цену у RTX 4060 Ti не назвать низкой, но по нашим временам надеяться на меньшее было бы странно — дорожает абсолютно всё. А тут цена осталась как у RTX 3060 Ti, но зато увеличение производительности оставляет желать лучшего. С точки зрения покупателя всё понятно — шаг с RTX 3060 Ti и RTX 3070 недостаточно велик, чтобы выбирать именно RTX 4060 Ti. А вот с точки зрения Nvidia всё объяснимо. Рынок видеокарт сильно просел — и из-за общего состояния рынка и из-за конца майнингового бума. Продавать видеокарты в тех же количествах сейчас просто некому, поэтому пришлось искать другие методы, чтобы оставить прибыль на приемлемом уровне. Вот они и решили продавать меньше видеокарт, зато дороже. Учитывая сложившиеся рыночные условия, Nvidia выставила такую цену, которая позволит им продать не слишком много GPU, но недешево. Конечно, цена в $350 казалась бы для многих более приемлемой, но принесло ли бы такое снижение соответствующий рост объема продаж для компенсации пониженной прибыли с каждой видеокарты?

К сожалению, сложившаяся на рынке ситуация может привести к тому, что многие выберут для игр вовсе не ПК, а игровые консоли, которые продаются за аналогичную цену и точно дадут стабильную игру даже в 4K (условно, конечно, потому что зачастую там используется масштабирование) без каких-то проблем, с которыми они встречаются на ПК. А может соперничающие с Nvidia компании не дадут игрокам убежать на консоли? Конкуренцию для RTX 4060 Ti составляют такие решения AMD, как Radeon RX 6750 XT и RX 6800 — первая видеокарта продается дешевле и имеет несколько меньшую производительность, если не брать трассировку лучей (а в этом ценовом сегменте ее можно и не учитывать), а также 12 ГБ, а вторая пусть и дороже, но чуть производительнее и имеет еще больше видеопамяти. Правда, и она уступает в трассировке лучей и не имеет ничего похожего на DLSS 3. Возможно, потенциальным покупателям стоит присмотреться к RTX 3070 за примерно те же деньги — скорости будет побольше в среднем, хотя поддержки DLSS 3 в этом случае также не будет.

Про объем видеопамяти у новинки мы еще подробно поговорим далее, но из-за ширины шины в 128-бит у них был выбор между 8 ГБ и 16 ГБ, и Nvidia решила выпустить оба варианта — модель с большей емкостью видеопамяти выйдет на рынок позднее. Но на самом деле, для этого уровня производительности и 8 ГБ могут быть вполне достаточными на данный момент, если не стараться задирать на максимум абсолютно все настройки качества — это же не флагманский продукт. В редких играх может наблюдаться нехватка 8 ГБ видеопамяти, но чаще всего она вызвана плохой оптимизацией при портировании с консолей и плохим менеджментом ресурсов.

Ограничение потребления энергии у RTX 4060 Ti установлено на уровне 160 Вт, и для питания видеокарт новой модели не обязательно использовать новый 16-контактный разъем питания PCIe 5.0, ставший стандартом для ATX 3.0. С учетом передаваемых по разъему PCIe 75 Вт, может быть достаточно лишь одного привычного 8-контактного разъема для дополнительного питания видеокарты, но конкретные производители видеокарт могут считать иначе и установить два таких разъема — для большей стабильности.

К слову, если продолжать рассказывать о преимуществах новинки, то Nvidia заметно улучшила энергоэффективность видеокарт серии GeForce RTX 40, и модель RTX 4060 Ti тут не исключение. При максимальном уровне потребления в 160 Вт, требования к блоку питания по современным меркам минимальны — с этим практически любой БП справится. А энергоэффективность (производительность на ватт) у новинки и вовсе одна из лучших на рынке.

GeForce RTX 4060 Ti существует также и в виде Founders Edition. Вариант исполнения самой Nvidia сохранил двухвентиляторную сквозную конструкцию системы охлаждения Founders Edition последних поколений. Эффективность охлаждения хорошая, кулер очень похож на систему охлаждения RTX 4070 FE, за исключением некоторых внешних деталей. Холодный воздух поступает от одного вентилятора, проходит через радиаторы и выбрасывается вторым вентилятором. На видеокарте Founders Edition используется новый 16-контактный разъем питания ATX 12VHPWR, который упрощает подключение питания, но имеет свои недостатки. Впрочем, в случае не слишком мощной видеокарты они проявиться не должны. Для подключения старых БП в поставке есть переходник, преобразующий питание с двух привычных 8-контактных разъемов PCIe.

Кстати, как и некоторые другие модели видеокарт из этого ценового диапазона, RTX 4060 Ti получила лишь восемь линий PCI Express 4.0, хотя у предшественницы RTX 3060 Ti их было вдвое больше. Конечно, при использовании современных игровых систем с поддержкой PCIe 4.0, значимого влияния на скорость рендеринга это не окажет, но при работе в режиме PCIe 3.0 на некоторых старых системах отрицательное влияние на производительность вполне может оказаться ощутимым. А ведь многие вполне актуальные системы не имеют поддержки PCIe 4.0, к примеру, это процессоры Intel Comet Lake-S и десктопные APU серий AMD Ryzen 4000 и 5000. Конечно, как у AMD Radeon RX 6500 XT с поддержкой лишь четырех линий PCIe у RTX 4060 Ti не будет, но некоторое падение производительности вполне возможно.

Особенности архитектуры

В линейке видеокарт GeForce RTX 40 применяются графические процессоры AD10x, основанные на графической архитектуре Ada Lovelace. Инженеры компании Nvidia спроектировали графическую архитектуру, которая не только повысила производительность операций трассировки лучей и машинного вычисления на тензорных ядрах, но и предоставила некоторые новые возможности, позволяющие улучшить эффективность, также заметно повлиял переход на современный технологический процесс тайваньской компании TSMC, позволивший разместить в чипах большое количество исполнительных блоков. Новые GPU получились заметно более сложными, но при этом они работают на высокой тактовой частоте по сравнению с решениями предыдущих серий.

Модель GeForce RTX 4060 Ti основана на графическом процессоре AD106, который производится на фабриках TSMC с использованием специализированного техпроцесса 4N — 5-нанометрового, несмотря на название. Чип уже известен нам по мобильной графике RTX 4070 Laptop, где графический процессор применяется в своей максимальной конфигурации. Чип AD106 включает в себя все возможности и особенности флагманского решения AD102, включая RT-ядра третьего поколения и тензорные ядра четвертого — то есть поддерживает все улучшения трассировки лучей, а также технологию увеличения производительности DLSS 3 и новый ускоритель оптического потока OFA.

Графический процессор AD106 имеет приличное количество транзисторов — 22,9 млрд., что почти вдвое больше, чем GA106 из предыдущего поколения, и даже почти на треть больше, чем есть у GA104. А по производительности AD106 вполне можно сравнить с TU102 (RTX 2080 Ti), состоящем из 18,6 млрд. транзисторов — «лишние» транзисторы AD106 ушли на дополнительную кэш-память второго уровня в Ada, а также все улучшения CUDA-ядер, RT-ядер и тензорных ядер за пару поколений графических архитектур Nvidia.

Как и все графические процессоры компании Nvidia, чип AD106 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Как и в предыдущих архитектурах, кластер GPC самостоятельно производит все основные вычисления внутри кластера, и включает свой движок растеризации Raster Engine, шесть кластеров TPC, состоящих из 12 мультипроцессоров SM.

Графический процессор AD106 имеет три кластера обработки графики GPC, они содержат по шесть кластеров обработки текстур TPC, каждый из которых имеет по два потоковых мультипроцессора SM. Каждый мультипроцессор, в свою очередь, содержит по 128 CUDA-ядер в четырех разделах. Половина из них умеют вычислять данные в формате FP32, а другие поддерживают FP32 или INT32 — есть возможность параллельной обработки FP32 и INT32. Каждый мультипроцессор SM также содержит RT-ядро третьего поколения, четыре тензорных ядра четвертого поколения, кэш-память и четыре текстурных блока TMU.

В полной версии чипа AD106 есть три GPC, содержащих 4608 CUDA-ядер, 144 блоков TMU, 144 тензорных ядер и 36 RT-ядер. В каждом GPC есть по 16 ROP, и всего в чипе содержится 48 ROP. Но модель видеокарты GeForce RTX 4060 Ti основана на урезанной версии AD106, в которой отключен один кластер TPC в одном из GPC. Так что в данном варианте GPU содержится 4352 активных CUDA-ядра, 136 тензорных ядер, 34 RT-ядра и 136 текстурных модуля TMU. А вот количество ROP осталось полным — 48 штуки. Самым интересным и спорным моментом RTX 4060 Ti и AD106 является объем и шина памяти — это те же 8 ГБ, что и RTX 3060 Ti из предыдущего поколения, да еще при вдвое более узкой шиной памяти — всего лишь 128-бит.

Аналогичная видеокарта из предыдущего поколения GeForce RTX 3060 Ti имеет 256-битный интерфейс GDDR6-памяти с теми же 8 ГБ памяти при общей пропускной способности в 448 ГБ/с — что заметно выше, чем 288 ГБ/с у рассматриваемой GeForce RTX 4060 Ti, использующей вдвое более узкий 128-битный интерфейс памяти. Но у Nvidia есть объяснение своему решению — в новой архитектуре Ada Lovelace они попытались перебалансировать подсистему памяти, чтобы можно было применять более узкую шину памяти, заметно увеличив объем кэш-памяти на кристалле — их конкурент сделал примерно то же самое чуть раньше. Из преимуществ решения (для Nvidia) — снижение себестоимости, из недостатков (для пользователей) — потенциальная нехватка пропускной способности, что может вызвать снижение производительности в некоторых случаях. Но так как L2-кэш на порядок быстрее видеопамяти по задержкам, то больший его объем для часто используемых данных может дать и преимущество в некоторых случаях.

Изменения подсистемы памяти архитектуры Ada Lovelace

Для того, чтобы улучшить эффективную пропускную способность памяти, в архитектуре Ada Lovelace используется измененная подсистема кэширования с большим объемом кэш-памяти второго уровня. Так, в RTX 4060 Ti есть 32 МБ L2-кэша, в отличие от лишь 4 МБ у RTX 3060 Ti из предыдущего семейства. Дополнительный кэш должен снизить задержки доступа к памяти и улучшить эффективную пропускную способность, ведь GPU будет реже обращаться к локальной видеопамяти за данными. Также это дополнительно улучшает общую энергоэффективность.

Подсистема памяти в архитектуре Ada несколько отличается от того, что мы видели в предыдущих архитектурах компании. Все GPU новой архитектуры имеют заметно больший объем кэш-памяти второго уровня по сравнению с предыдущими семействами. Так, AD106 имеет L2-кэш объемом 32 МБ, что снижает передаваемый по шине памяти объем данных и обеспечивает лучшее сочетание производительности и потребления энергии. В графических процессорах семейства Ampere и всех предыдущих, объем L2-кэша был не слишком большим, и они должны были иметь высокую пропускную способность памяти, чтобы получать необходимый объем данных.

Напомним, что система кэширования данных GPU состоит из двух уровней: кэша данных первого уровня (L1) и второго (L2). Каждый мультипроцессор SM включает кэш данных первого уровня — он отличается очень низкой задержкой доступа, так как расположен рядом с вычислительными ядрами, и GPU ищет необходимые данные именно там. Но L1-кэш не может быть слишком большим, так как он располагается максимально близко к ядрам. И если необходимые данные не найдены в L1-кэше, то GPU запрашивает второй уровень кэша данных — L2. Эта подсистема также находится на самом кристалле GPU и подключается через высокоскоростные каналы данных к кластерам обработки графики GPC, каждый из которых содержит по несколько мультипроцессоров SM (см. диаграмму графического процессора). Если нужная информация есть в уже куда более объемном L2-кэше (попадание кэша), то эти данные довольно быстро и эффективно передаются вычислительным ядрам. А вот если данных нет и в L2-кэше (промах кэша), то GPU должен получить их по шине памяти во внешней видеопамяти, которая куда медленнее. Каждый промах кэш-памяти приводит к снижению производительности и эффективности.

И тут мы переходим к одному из важных нововведений подсистемы памяти графических процессоров архитектуры Ada — увеличенный L2-кэш. По сравнению Ampere, в Ada в несколько раз больший объем L2-кэша. Если сравнивать RTX 4060 Ti и RTX 3060 Ti, то в 8 раз, а если сравнивать GPU с 128-битной шиной памяти, то и 16 раз. Кроме этого, пропускная способность L2-кэша в графических процессорах Ada была еще и значительно увеличена, что также позволяет быстрее передавать большие объемы данных между кэшем и вычислительными ядрами. В итоге изменения привели к большему количеству попаданий в кэш второго уровня, что снизило передачу данных из локальной видеопамяти.

Для сравнения эффективности увеличенного L2-кэша Nvidia привела данные RTX 4060 Ti с 32 МБ L2-кэша и специальной версией такой же видеокарты со всего лишь 2 МБ кэша — как в 128-битных графических процессорах предыдущего поколения с 512 КБ L2-кэша на каждый 32-битный контроллер памяти. Как видно на иллюстрации, наличие 32 МБ кэша снизило передачу данных из памяти на 40%—60% по сравнению с вариантом с 2 МБ. А среднее сокращение трафика на 50% позволяет GPU использовать пропускную способность памяти вдвое эффективнее, и в результате всех улучшений графический процессор в RTX 4060 Ti с пропускной способностью памяти в 288 ГБ/с демонстрирует вдвое бо́льшую эффективную производительность — 554 ГБ/с (теоретический показатель). В общем, увеличенный объем кэша в Ada повышает производительность и улучшает общую энергоэффективность — при необходимости использовать более узкую шину памяти.

Что касается объема видеопамяти «всего лишь» в 8 ГБ — да, это столько же, что и у RTX 3060 Ti в прошлом поколении, хотя прошло уже два года. Многие утверждают, что 8 ГБ уже слишком мало и невозможно играть с этим количеством видеопамяти, а нужно минимум 12 ГБ. Конечно же, это не так. Для начала, нужно правильно оценивать потребности игр в объеме видеопамяти. Применять показатели «использования видеопамяти» в инструментах измерения производительности некорректно — это число означает скорее занятый объем видеопамяти, а не используемый. А игры и игровые движки работают по-разному, некоторые выделяют куда больший объем памяти себе, чем используют. Часто движки просто забивают имеющийся объем памяти даже если им это не нужно, запрашивая больше памяти по возможности. И точно узнать, сколько конкретно видеопамяти нужно, на деле просто невозможно, да и это значение постоянно меняется от кадра к кадру. Проще всего оценивать такие параметры частоты кадров как минимальная частота кадров или минимальная частота кадров для 0,1% (или 1%) худших кадров.

Конечно, лучше бы RTX 4060 Ti имела больше видеопамяти, с этим никто не спорит. Но на нее физически невозможно поставить что-то среднее между 8 ГБ и 16 ГБ, а второй вариант будет скоро доступен. Но для подавляющего большинства игр в разрешении Full HD, даже 8 ГБ будет вполне достаточно, а большее количество видеопамяти ничего не даст. Да, некоторые новые игры, такие как Hogwarts Legacy, Resident Evil 4, The Last of Us Part I и Star Wars Jedi: Survivor могут выделять очень много видеопамяти, но это еще не означает, что эти данные постоянно используются каждый кадр. Случаи нехватки 8 ГБ найти можно, но для GPU такого ценового уровня вполне нормально ставить качество текстур на высокое, а не ультра, и тогда всё будет в полном порядке. Ну а если вам всё же хочется больше памяти, то ждите RTX 4060 Ti 16 ГБ вариант в июле — посмотрим, сколько покупателей захочет заплатить лишние $100 за мнимые улучшения производительности и потенциал на будущее.

А почему на первый вариант RTX 4060 Ti вообще установили именно 8 ГБ видеопамяти, а не больше? Выпускаемые чипы GDDR6X- и GDDR6-памяти поставляются в виде 8 Гбит (1 ГБ) и 16 Гбит (2 ГБ) микросхем. Каждый чип может использовать два отдельных 16-битных канала памяти для подключения к 32-битному контроллеру памяти, или два 8-битных канала, чтобы две микросхемы подключились к одному 32-битному контроллеру. Так что к GPU с 128-битной шиной памяти (четыре 32-битных контроллера) можно присоединить или четыре или восемь чипов памяти. Смешивать чипы разной плотности в принципе возможно, но имеет свои недостатки. Так что для простоты будем считать, что по 128-битной шине можно получить 4 ГБ, 8 ГБ или 16 ГБ, но не 10 ГБ или 12 ГБ, к примеру. В модели GeForce RTX 4060 Ti с 8 ГБ используются четыре микросхемы GDDR6-памяти по 16 Гбит, а в 16 ГБ модели — восемь таких же чипов.

Остальные архитектурные улучшения семейства Ada Lovelace были разобраны нами в теоретическом обзоре, там же подробно описаны все изменения в RT-ядрах новой архитектуры, включая аппаратные блоки Opacity Micromap Engine и Displaced Micro-Mesh Engine, а также дополнительный планировщик для изменения порядка выполнения шейдеров Shader Execution Reordering, позволяющие повысить эффективность аппаратной трассировки лучей.

Осталось вкратце упомянуть возможности GeForce RTX 4060 Ti по работе с видеоданными. Они не отличаются от таковых у других моделей серии — в специализированном аппаратном кодировщике NVEnc восьмого поколения появилась поддержка кодирования видео в формате AV1, кодировщик AV1 в Ada на 40%-50% эффективнее кодировщика H.264, используемого в графических процессорах предыдущей серии, и новый формат AV1 позволит увеличить разрешение видеопотока при стриминге с 1080p до 1440p при том же битрейте. Все представленные графические процессоры Ada имеют по два аппаратных кодировщика NVEnc на борту, что позволяет кодировать видеоданные с разрешением 8K при 60 FPS или сразу четыре видеопотока разрешения 4K при 60 FPS — и при этом быстрее, чем на RTX 3090 Ti.

Кроме NVEnc, в графические процессоры архитектуры Ada включен аппаратный декодер пятого поколения NVDec, который появился в Ampere. Он поддерживает декодирование видеоданных с аппаратным ускорением в форматах: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и AV1. Также полностью поддерживается и декодирование видеоданных в разрешении 8K при 60 FPS.

Предварительная оценка производительности

Одним из явных преимуществ GeForce RTX 4060 Ti перед аналогичными по мощности GPU предыдущего поколения и конкурирующими решениями AMD является поддержка генерации (интерполяции) кадров в составе технологии DLSS 3, которой лишены все видеокарты RTX 30. За счет этого RTX 4060 Ti может обеспечить большую частоту кадров даже по сравнению с более мощными видеокартами серии RTX 30. В режиме рендеринга с трассировкой пути, появившемся наконец-то в игре Cyberpunk 2077, эта видеокарта сможет обеспечить комфортную игру именно вместе с DLSS 3, пусть и в невысоком разрешении.

Технология генерации промежуточных кадров DLSS 3 появилась в нынешнем поколении GeForce RTX 40 и уже поддерживается в нескольких десятках игр и приложений (вместе с еще не вышедшими, но уже анонсированными их около 50 штук), большая часть из которых также поддерживают и трассировку лучей. Практически все они обеспечивают приемлемый комфорт при игре в Full HD-разрешении и на GeForce RTX 4060 Ti, и количество игр с поддержкой технологии постоянно растет.

Те разработчики игр, которые использовали специализированный пакет Nvidia Streamline SDK для внедрения DLSS 2, с легкостью смогли интегрировать в свои проекты и DLSS 3, включая все компоненты технологии: масштабирование разрешения (что мы знаем как DLSS 2), генерацию промежуточных кадров (известна как DLSS 3) и технология снижения задержек, работающая совместно с предыдущими — Reflex. Более того, поддержка DLSS 3 скоро появится в самом популярном движке Unreal Engine 5.2. Еще в феврале 2021 года разработчики компании Nvidia выпустили бесплатный плагин для внедрения DLSS 2 в Unreal Engine, и он сделал добавление технологии в проекты, использующие этот движок, весьма простым. Теперь компания обещает релиз DLSS 3 в Unreal Engine Marketplace для версии движка Unreal Engine 5.2, что позволит получить доступ к технологии всем разработчикам, использующим Unreal Engine.

Что касается производительности, то вот данные Nvidia о среднем приросте частоты кадров от включения DLSS 3 в 18 игровых проектах на ПК с Intel Core i9-12900K в разрешении Full HD, при включенной трассировке лучей там, где она поддерживается. Если без учета генерации кадров увеличение частоты кадров составляет не слишком впечатляющие 15% при сравнении с RTX 3060 Ti, то с DLSS 3 будет уже 1,7 раза. Сравнение довольно спорное, не всем нравится DLSS, поэтому перейдем к сравнению теоретических показателей видеокарт, что позволит оценить потенциальную разницу между решениями разных поколений.

С точки зрения теоретических показателей всё вроде бы неплохо — и шейдерная производительность у новинки значительно выше, и производительность трассировки лучей и тензорных ядер. Но это — лишь пиковые показатели в определенных условиях. В большинстве игр же все эти решения будут друг к другу куда ближе. Тем более, что по пропускной способности памяти новинка даже отстает, хотя эффективная ПСП у нее вроде как выше (это мы проверим далее). А вот по какому параметру точно есть преимущество, так это по сниженному потреблению энергии, а вместе с ним и повышенной энергоэффективности. Тут вопросов нет, новинка значительно лучше решений предыдущих поколений.

Что касается производительности в играх, то GeForce RTX 4060 Ti предлагает скорость рендеринга где-то между RTX 3060 Ti и RTX 3070 с возможностью дополнительного увеличения частоты кадров в играх с поддержкой технологии DLSS 3. На системе с процессором Intel Core i9-12900K в Full HD-разрешении при максимальных настройках и с включенными трассировкой лучей и DLSS в играх с их поддержкой, новая модель показывает следующую производительность относительно своих предшественниц: RTX 3060 Ti и RTX 2060 Super (по данным Nvidia):

По производительности RTX 4060 Ti располагается примерно между RTX 3070 и RTX 3060 Ti. В играх, где применяется трассировка лучей, новинка ближе к RTX 3070, а в менее продвинутых графически — к младшей модели предыдущего поколения. Многие ожидали большего прироста производительности по отношению к линейке RTX 30 — по ожиданиям, хотя бы RTX 3070 должна была оставаться позади всегда, чтобы переход с младших видеокарт прошлого поколения имел смысл. Но Nvidia в целом и не позиционирует RTX 4060 Ti как продукт для таких покупателей, эта видеокарта ориентирована на владельцев устаревших игровых ПК на основе среднебюджетных моделей GTX 10, GTX 16 и младших видеокарт серии RTX 20.

В среднем при Full HD-разрешении в современных играх с использованием трассировки лучей, GeForce RTX 4060 Ti почти равна с RTX 3070 предыдущего поколения и аналогична еще более старой RTX 2080 Ti. Но прирост производительности от поколения к поколению очень невелик — около 15%, это заметно меньше того, что дали старшие модели линейки GeForce RTX 40 по сравнению с аналогами из RTX 30. Если сравнивать с AMD Radeon, то новая RTX 4060 Ti превосходит по скорости Radeon RX 6750 XT, а в некоторых играх с трассировкой она быстрее RX 6800 и даже RX 6800 XT. В Full HD-разрешении и при максимальных настройках, GeForce RTX 4060 Ti обычно достигает 60 кадров в секунду и более практически во всех играх, кроме самых требовательных. Новинка также вполне способна запускать многие игры и в разрешении 2560x1440, но иногда может потребоваться некоторое снижение настроек.

Наиболее важным преимуществом GeForce RTX 4060 Ti является поддержка генерации промежуточных кадров DLSS 3 — алгоритм создает дополнительный кадр на основе двух соседних по перемещению объектов в них. Если просматривать видеозапись замедленно и искать попиксельно, то некоторые проблемы и артефакты заметить можно, но при обычной игре вы вряд ли заметите какую-либо разницу, особенно при высоком FPS и разрешении, но только когда задержка не слишком велика. Возможность увеличить частоту кадров почти бесплатно — отличная возможность, с ее помощью можно включить ту же ресурсоемкую трассировку лучей или просто максимальные настройки качества. Единственный недостаток — количество игр с поддержкой DLSS 3, их пока что менее 50 штук. Зато ничего похожего у соперников до сих пор нет, хотя AMD и заявляли о разработке FSR 3, но мы не видели даже соответствующих демонстраций.

RTX 3060 Ti вышла два года назад, имела такую же цену в $399 и получила отличное соотношение цены и производительности для своего времени. И через два года Nvidia выпустила лишь чуть более производительную RTX 4060 Ti по той же рекомендованной цене и даже с тем же объемом видеопамяти. Так что вполне можно понять тех, кто был разочарован столь небольшим приростом производительности, если не учитывать улучшенную энергоэффективность и технологию генерации кадров DLSS3, конечно же. Но если сравнивать RTX 4060 Ti с существующими на рынке продуктами, то эта видеокарта не так уж плоха — она точно лучше аналогов в своем классе, и по производительности и по энергоэффективности.

Другое дело, что ожиданиям потенциальных покупателей этот уровень не совсем соответствует, и тут нужно вспомнить, что рынок есть рынок и он отреагирует соответствующим образом — если спрос будет ниже ожидаемого уровня, то Nvidia придется снижать цены, и это может сделать RTX 4060 Ti более интересным вариантом для покупки. Хотя модель RTX 3070 нужно было опережать во всех условиях, конечно же. На этом с теоретической частью мы закончили и переходим к рассмотрению практических особенностей видеокарты GeForce RTX 4060 Ti в исполнении компании Palit.

Особенности карты Palit GeForce RTX 4060 Ti Dual 8 ГБ

Сведения о производителе: Компания Palit Microsystems (торговая марка Palit) основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира — в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики — в Китае. На рынке в России — с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты начали идти только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после, по сути, банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, направленный на продажи в Китае. На сегодня внутри Palit Group сосредоточено еще несколько торговых марок и брендов.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Palit GeForce RTX 4060 Ti Dual 8 ГБ 128-битной GDDR6

Palit GeForce RTX 4060 Ti Dual 8 ГБ 128-битной GDDR6
Параметр Значение Номинальное значение (референс)
GPU GeForce RTX 4060 Ti (AD106)
Интерфейс PCI Express x8 4.0
Частота работы GPU (ROPs), МГц 2535(Boost)—2790(Max) 2535(Boost)—2790(Max)
Частота работы памяти (физическая (эффективная)), МГц 2250 (18000) 2250 (18000)
Ширина шины обмена с памятью, бит 128
Число вычислительных блоков в GPU 34
Число операций (ALU/CUDA) в блоке 128
Суммарное количество блоков ALU/CUDA 4352
Число блоков текстурирования (BLF/TLF/ANIS) 136
Число блоков растеризации (ROP) 48
Число блоков Ray Tracing 34
Число тензорных блоков 136
Размеры, мм 250×123×40 250×110×40
Количество слотов в системном блоке, занимаемые видеокартой 2 2
Цвет текстолита черный черный
Энергопотребление пиковое в 3D, Вт 166 160
Энергопотребление в режиме 2D, Вт 30 30
Энергопотребление в режиме «сна», Вт 11 11
Уровень шума в 3D (максимальная нагрузка), дБА 31,1 35,0
Уровень шума в 2D (просмотр видео), дБА 18,0 18,0
Уровень шума в 2D (в простое), дБА 18,0 18,0
Видеовыходы 1×HDMI 2.1, 3×DisplayPort 1.4a 1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы нет
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 4
Питание: 8-контактные разъемы 1 0
Питание: 6-контактные разъемы 0 0
Питание: 16-контактные разъемы 0 1
Вес карты с комплектом поставки (брутто), кг 0,94 1,3
Вес карты чистый (нетто), кг 0,62 0,9
Максимальное разрешение/частота, DisplayPort 3840×2160@144 Гц, 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI 3840×2160@144 Гц, 7680×4320@60 Гц
Средняя цена карты Palit 44 тысячи рублей на момент публикации обзора

Память

Карта имеет 8 ГБ памяти GDDR6 SDRAM, размещенной в 4 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Samsung (K4ZAF325BC-SC20) рассчитаны на номинальную частоту работы в 2500 (20000) МГц.

Особенности карты и сравнение с Palit GeForce RTX 4070 Dual (12 ГБ)

Palit GeForce RTX 4060 Ti Dual (8 ГБ) Palit GeForce RTX 4070 Dual (12 ГБ)
вид спереди
вид сзади

Мы сравниваем нынешнюю карту из серии Dual с GeForce RTX 4070 Ti из той же серии Palit, чтобы показать, как кардинально могут отличаться соседние продукты в линейке. Наше мнение заключается в том, что в современных реалиях высоких требований к объему локальной видеопамяти (и ПСП) даже в среднебюджетных решениях опускаться ниже 12 ГБ при 192-битной шине обмена с памятью — недопустимо. Даже с учетом всех оптимизаций и кэшей у серии GeForce RTX 40. Однако у Nvidia свое ви́дение, и мы имеем PCB уже со 128-битной шиной (которую не имели счастья лицезреть очень давно, аж со времен серии GeForce GTX 1600) и 8 ГБ видеопамяти на борту. Далее в материале мы еще будет разбирать последствия таких решений.

Ядро имеет маркировку AD106-350, дата выпуска — 2-я неделя 2023 года.

Прекрасно видно, что установлено обрезанное на 2 блока ядро (34 из 36), потому и маркировка «-350» (у полновесных ядер обычно «-400»).

Суммарное количество фаз питания у карты Palit GeForce RTX 4060 Ti Dual — 7 (6+1).

Зеленым цветом отмечена схема питания ядра, красным — памяти. Все ШИМ-контроллеры расположены на оборотной стороне PCB.

6 фазами питания ядра управляет ШИМ-контроллер uP9512R (uPI Semiconductor). Он рассчитан максимум на 12 фаз.

Питанием микросхем памяти управляет ШИМ-контроллер под заказной маркировкой 7212 (On Semiconductor).

В преобразователе питания ядра, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае NCP302150 (On Semi), каждая из которых рассчитана максимально на 50 А.

В схеме питания микросхем памяти применены уже не сборки DrMOS, а полевые МОП-транзисторы Sinopower SM4377/4503 (50 A).

На лицевой стороне платы имеется контроллер uS5650Q (uPI Semi), который отвечает за мониторинг карты (отслеживание напряжений и температуры).

Подсветка у карты очень простая, контроль за ней возложен на сам GPU, так что посадочное место под контроллер подсветки пустует.

Штатные частоты ядра и памяти равны референсным значениям.

Энергопотребление карты Palit в тестах доходило до 166 Вт.

Предел лимита энергопотребления у данной карты поднять нельзя, так что пробовать ручной разгон я не стал.

Питание на карту Palit подается через обычный 8-контактный разъем питания стандарта PCIe 2.0.

Габариты данной карты невелики, особенно по толщине: 4 см. В результате видеокарта занимает 2 слота в системном блоке.

Управление работой карты обеспечивается с помощью фирменной утилиты Thunder Master.

Панель разгона позволяет настроить частоты работы карты, а также задать параметры авторазгона
Панель управления вентиляторами
Панель мониторинга состояния карты

Нагрев и охлаждение

Мы видим кулер, уже традиционно выполненный по концепции сквозного продува хвостовой части радиатора. Основой СО является многосекционный пластинчатый никелированный весьма плоский радиатор с тепловыми трубками, распределяющими тепло по ребрам радиатора.

Трубки припаяны к большой медной никелированной пластине, которая охлаждает как ядро, так и микросхемы памяти (через термопрокладки). А для охлаждения преобразователей питания VRM имеется своя подошва на радиаторе.

Задняя пластина служит только элементом защиты PCB и является составной частью общей концепции дизайна.

Поверх радиатора установлен кожух с двумя вентиляторами ∅100 мм, работающими на единой частоте вращения (по умолчанию; через программу ThunderMaster можно настроить их работу раздельно).

Остановка вентиляторов при малой нагрузке видеокарты происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти — ниже 80 градусов. Разумеется, СО при этом становится бесшумной. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются.

Мониторинг температурного режима:

После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 68 градусов (самой горячей точки — 82 °C), что является отличным результатом для видеокарт такого уровня. Энергопотребление карты доходило до 166 Вт.

Мы засняли и ускорили в 50 раз 8-минутный прогрев

Максимальный нагрев наблюдался в центральной части PCB, а также около разъема питания.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

  • менее 20 дБА: условно бесшумно
  • от 20 до 25 дБА: очень тихо
  • от 25 до 30 дБА: тихо
  • от 30 до 35 дБА: отчетливо слышно
  • от 35 до 40 дБА: громко, но терпимо
  • выше 40 дБА: очень громко

В режиме простоя в 2D температура была не выше 42 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось.

В режиме максимальной нагрузки в 3D температура достигала 68/82 °C (ядро/hot spot). Вентиляторы при этом раскручивались до 1584 оборотов в минуту, шум вырастал до 31,1 дБА: это уже отчетливо слышно, но еще не громко. Аудиозапись шума — здесь.

Спектрограмма шума:

Подсветка

Карта имеет очень скромную подсветку в виде ломаной линии на верхнем торце карты. В качестве некоторого «утешения» для любителей моддинговых штучек компания Palit предлагает возможность модификации кожуха СО с помощью концепции «Автор» (Maker).

Владельцы видеокарт GeForce RTX 40 серии GamingPro и Dual могут скачать с сайта Palit варианты образцов дизайна кожуха. Более того, можно добавить что-то свое, изменить шаблон, проявить творчество, сохранить в виде проектов, затем отнести их в 3D-печать или распечатать на своем принтере, затем раскрасить. Ну а потом снять штатный кожух (он крепится на защелках) и установить свой вариант кожуха.

Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой ThunderMaster. Режимов крайне мало, они просты.

Комплект поставки и упаковка

В комплекте поставки кроме карты ничего больше нет.

Тестирование: синтетические тесты

Мы провели тестирование новой модели видеокарты Nvidia со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Мы постоянно стараемся расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Из более-менее новых бенчмарков мы начали использовать несколько дополнительных тестов для измерения производительности трассировки лучей и, а также технологий масштабирования разрешения и увеличения производительности: DLSS, FSR и XeSS. В качестве полусинтетических тестов у нас также используется набор подтестов из довольно популярного пакета 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др. А вот примеры приложений DirectX 11 и 12, входящие в различные SDK, пришлось убрать — последнее время они всё чаще давали некорректные результаты.

Синтетические тесты проводились на следующих видеокартах:

  • GeForce RTX 4060 Ti со стандартными параметрами (RTX 4060 Ti)
  • GeForce RTX 4070 со стандартными параметрами (RTX 4070)
  • GeForce RTX 3070 со стандартными параметрами (RTX 3070)
  • GeForce RTX 3060 Ti со стандартными параметрами (RTX 3060 Ti)
  • Radeon RX 6800 со стандартными параметрами (RX 6800)
  • Radeon RX 6750 XT со стандартными параметрами (RX 6750 XT)

Для анализа производительности видеокарты GeForce RTX 4060 Ti мы взяли модель, которая стоит на ступень выше и основана на старшей модели GPU — RTX 4070. По этому сравнению будет понятно, насколько графический процессор AD106 медленнее урезанного AD104. Также в тесты вошла пара видеокарт компании Nvidia из предыдущего поколения — по сравнению с ними мы поймем, насколько новая видеокарта улучшила показатели производительности GPU данного ценового сегмента.

Прямого конкурента для новинки компания AMD в своем текущем поколении еще не выпустила, поэтому нам пришлось взять два варианта из прошлого, близкие по цене. Мы сравним новинку с условными конкурентами на основе предыдущей архитектуры в виде Radeon RX 6800 и RX 6750 XT — первая модель продается чуть дороже RTX 4060 Ti, а вторая чуть дешевле. На деле же рассматриваемой сегодня видеокарте в будущем придется конкурировать с решениями на основе RDNA3, но их пока не видно на горизонте.

 
Тесты из 3DMark Vantage
 
Тесты Direct3D 12
 
Тесты трассировки лучей
 
Вычислительные тесты
 
Тесты технологий DLSS/XeSS/FSR

Тестирование: игровые тесты

Конфигурация тестового стенда

 
Конфигурация тестового стенда

Список инструментов тестирования

Во всех игровых тестах использовалось максимальное качество графики в настройках.

  • Marvel’s Spider-Man Miles Morales (Insomniac Games/Sony Interactive)
  • Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 1.61 (DLSS 3.0)
  • God of War (Sony IE/Sony IE)
  • Call of Duty: Modern Warfare II (Infinity Ward/Activision)
  • Marvel’s Guardians of the Galaxy (Eldos/Square Enix)
  • The Medium (Bloober/Bloober)
  • A Plague Tale: Requiem (Asobo Studio/Focus Entertainment)
  • Hogwarts Legacy (Avalance Software/Warner Bros)
  • Far Cry 6 (Ubisoft/Ubisoft)
  • Atomic Heart (Mundfish/VK)

Кратко о производительности в 3D-играх

Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Всё это нами субъективно оценивается по шкале из пяти градаций.

Игры без использования трассировки лучей (классическая растеризация):

Производительность GeForce RTX 4060 Ti находится примерно между GeForce RTX 3060 Ti и GeForce RTX 3070. Эта карта будет обеспечивать отменный комфорт во всех играх на максимальных настройках качества при отключенных трассировке лучей и технологиях масштабирования в разрешении до 2.5K включительно (правда, для сохранения высочайшего комфорта в некоторых играх придется понижать либо настройки графики, либо разрешение). Ближайшие конкуренты — AMD Radeon RX 6700 XT и Intel Arc A770.

Игры с использованием трассировки лучей и DLSS/FSR/XeSS:

C учетом некоторого падения производительности при активации в играх трассировки лучей (при этом появляется всё больше и больше игр с поддержкой Nvidia DLSS, а эта технология масштабирования позволяет резко поднять производительность, в том числе компенсируя падение от включения RT), а также того факта, что у видеокарт Radeon RX 6000 падение FPS куда более драматичное, новинка GeForce RTX 4060 Ti смотрится довольно убедительно. К тому же, приобретая GeForce RTX 4060 Ti, игрок получает и поддержку DLSS 3, так что в соответствующих играх можно будет вообще никогда не отключать трассировку лучей. Однако это относится уже только к разрешению 1080p (Full HD). В разрешении 2.5K отменный комфорт можно получить лишь без трассировки лучей и с DLSS 3.0 (а эта технология пока применена всего в нескольких десятках игр) или по крайней мере с DLSS 2.0.

Результаты тестирования в 3D-играх

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1080, 2560×1440 и 3840×2160

 
Marvel’s Spider-Man Miles Morales
 
Cyberpunk 2077
 
God of War
 
Call of Duty: Modern Warfare II
 
Marvel’s Guardians of the Galaxy
 
The Medium
 
A Plague Tale: Requiem
 
Hogwarts Legacy
 
Far Cry 6
 
Atomic Heart

Результаты тестов со включенной аппаратной трассировкой лучей и/или DLSS/FSR/XeSS в разрешениях 1920×1080, 2560×1440 и 3840×2160

 
Cyberpunk 2077, RT
 
Cyberpunk 2077, RT + DLSS/FSR
 
God of War, DLSS/FSR
 
Call of Duty: Modern Warfare II, DLSS/XeSS
 
Marvel’s Guardians of the Galaxy, RT
 
Marvel’s Guardians of the Galaxy, RT + DLSS/FSR
 
The Medium, RT
 
The Medium, RT + DLSS/FSR
 
Hogwarts Legacy, RT
 
Hogwarts Legacy, RT + DLSS/FSR/XeSS
 
Far Cry 6, RT
 
Far Cry 6, RT + FSR
 
Atomic Heart, DLSS/XeSS

Рейтинг iXBT.com

 
Методика расчета рейтингов

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:

  1. Вариант рейтинга iXBT.com без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по наиболее слабому ускорителю из группы карт — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%). Рейтинги ведутся по 29 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят GeForce RTX 4060 Ti и его конкуренты.

Рейтинг приведен суммарно для всех трех разрешений.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
14 RX 6800 16 ГБ, 2105—2271/16000 413 83 50 000
15 RTX 3070 Ti 8 ГБ, 1770—1935/19000 396 94 42 000
16 RTX 3070 8 ГБ, 1725—1950/14000 356 96 37 000
17 RX 6750 XT 12 ГБ, 2600—2724/18000 353 93 38 000
18 RTX 4060 Ti 8 ГБ, 2535—2790/18000 329 75 44 000
19 RX 6700 XT 12 ГБ, 2581—2643/16000 327 96 34 000
20 Arc A770 16 ГБ, 2100—2400/17500 314 112 28 000
21 RTX 3060 Ti 8 ГБ, 1665—2010/14000 313 98 32 000

Мы хорошо видим, что новинка в лице GeForce RTX 4060 Ti в целом лишь на 5%—8% быстрее формального предшественника в лице GeForce RTX 3060 Ti, и это совсем не впечатляет и даже разочаровывает. При этом GeForce RTX 4060 Ti отстает от GeForce RTX 3070, находится на уровне Radeon RX 6700 XT и отстает от Radeon RX 6750 XT, хотя оба ускорителя AMD значительно дешевле.

  1. Вариант рейтинга iXBT.com с включением RT/DLSS/FSR/XeSS

Рейтинг составлен по 9 тестам, в которых используется технология трассировки лучей и одновременно технология Nvidia DLSS, AMD FSR или Intel XeSS. Этот рейтинг нормирован по самому слабому ускорителю в данной группе — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%).

Рейтинг приведен суммарно для всех трех разрешений.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
14 RTX 3070 Ti 8 ГБ, 1770—1935/19000 577 137 42 000
15 RTX 4060 Ti 8 ГБ, 2535—2790/18000 541 123 44 000
16 RX 6800 16 ГБ, 2105—2271/16000 524 105 50 000
17 RTX 3070 8 ГБ, 1725—1950/14000 518 140 37 000
18 RTX 3060 Ti 8 ГБ, 1665—2010/14000 450 141 32 000
19 Arc A770 16 ГБ, 2100—2400/17500 447 159 28 000
20 RX 6750 XT 12 ГБ, 2600—2724/18000 442 116 38 000
21 RX 6700 XT 12 ГБ, 2581—2643/16000 412 121 34 000

Безусловно, включение RT сильно бьет по семейству Radeon, и даже использование масштабирования FSR не сильно помогает картам AMD. Плюс GeForce RTX 4060 Ti поддерживает DLSS 3.0, что может оказаться козырем не только против ускорителей AMD, но и против решений семейства GeForce RTX 30. Однако на сегодня игр с поддержкой DLSS 3.0 крайне мало, не более нескольких десятков названий.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Для расчета рейтинга полезности использованы розничные цены на конец мая 2023 года.

  1. Вариант рейтинга полезности без включения RT
Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
03 Arc A770 16 ГБ, 2100—2400/17500 112 314 28 000
06 RTX 3060 Ti 8 ГБ, 1665—2010/14000 98 313 32 000
07 RTX 3070 8 ГБ, 1725—1950/14000 96 356 37 000
08 RX 6700 XT 12 ГБ, 2581—2643/16000 96 327 34 000
11 RTX 3070 Ti 8 ГБ, 1770—1935/19000 94 396 42 000
12 RX 6750 XT 12 ГБ, 2600—2724/18000 93 353 38 000
15 RX 6800 16 ГБ, 2105—2271/16000 83 413 50 000
18 RTX 4060 Ti 8 ГБ, 2535—2790/18000 75 329 44 000

Тут к описанному ранее не впечатляющему уровню производительности у GeForce RTX 4060 Ti добавляется капитальный удар по новинке в виде крайне завышенной стоимости. Можете сами всё увидеть — это явный провал.

  1. Вариант рейтинга полезности с включением RT/DLSS/FSR/XeSS
Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
02 Arc A770 16 ГБ, 2100—2400/17500 159 447 28 000
04 RTX 3060 Ti 8 ГБ, 1665—2010/14000 141 450 32 000
05 RTX 3070 8 ГБ, 1725—1950/14000 140 518 37 000
07 RTX 3070 Ti 8 ГБ, 1770—1935/19000 137 577 42 000
12 RTX 4060 Ti 8 ГБ, 2535—2790/18000 123 541 44 000
13 RX 6700 XT 12 ГБ, 2581—2643/16000 121 412 34 000
17 RX 6750 XT 12 ГБ, 2600—2724/18000 116 442 38 000
20 RX 6800 16 ГБ, 2105—2271/16000 105 524 50 000

Да, включение RT и сопутствующих «костылей» в виде технологий масштабирования помогает новинке оказаться чуть-чуть более привлекательной против Radeon RX 6700 XT/6750 XT, но именно чуть-чуть. Еще присутствующие на рынке в достаточном количестве GeForce RTX 3070/3060 Ti и даже GeForce RTX 3070 Ti не оставляют GeForce RTX 4060 Ti никакой надежды на успех при тех ценах, которые эта карта имеет на сегодня. Intel Arc A770 можно не учитывать из-за крайне слабого присутствия на рынке, но капитальный проигрыш предыдущему поколению GeForce RTX — это очень грустно.

Выводы

Nvidia GeForce RTX 4060 Ti (8 ГБ) — пятый по счету и по старшинству представитель нового поколения GeForce RTX 40 (Ada Lovelace), и, наверное, самый спорный и невразумительный.

В целом наблюдается явная тенденция к сокращению разрыва между соответствующими уровнями ускорителей двух поколений: GeForce RTX 4070 Ti — это, по сути, GeForce RTX 3090 Ti (опережение на 3 уровня); GeForce RTX 4070 — это, по сути, GeForce RTX 3080 (10 ГБ), то есть опережение уже всего на 1 уровень; а в случае с GeForce RTX 4060 Ti даже и такого нет: до GeForce RTX 3070 эта карта просто не дотягивает.

Получается, это попытка просто заполнить линейку GeForce RTX 40 любой ценой, переведя производство кристаллов с Samsung на TSMC. Что дальше? GeForce RTX 4060 будет медленнее, чем GeForce RTX 3060, имея даже меньший объем памяти (8 против 12 ГБ)? Про GeForce RTX 4050 даже думать боязно. За кого ведущий производитель принимает своих покупателей? Подпоркой в виде DLSS 3.0 сейчас можно заманить только совсем уж неграмотных. Не секрет, что до сих пор колоссальный процент игр на рынке вообще не имеет поддержки ни трассировки лучей, ни технологий масштабирования. Реально складывается ощущение, что в погоне за более прибыльным рынком устройств для реализации ИИ компания уже стала отмахиваться от геймеров, причем именно от массовых геймеров, которые явно не приобретают дорогущие GeForce RTX 4090/4080/4070 Ti: им предлагаются по довольно высоким ценам сомнительные решения, не демонстрирующие однозначного превосходства над картами предыдущего поколения.

Наши исследования показали, что GeForce RTX 4060 Ti имеет относительно привлекательное соотношение цены и производительности в своей группе исключительно в играх с применением технологии трассировки лучей и масштабирования DLSS 3.0 — тогда он еще худо-бедно дотягивается до GeForce RTX 3070/Ti. В остальных случаях это уровень чуть выше GeForce RTX 3060 Ti, максимум — посредине между последним и GeForce RTX 3070.

На момент подготовки нашего обзора продажи GeForce RTX 4060 Ti уже начались, поэтому мы делаем свои выводы не на основе условных оценок примерной стоимости, а на основании реальных ценников. И даже с учетом нынешнего курса рубля эти цены, как нам кажется, чрезмерно высокие, если учесть, что сейчас на маркетплейсах типа Озон или Авито можно купить новые карты GeForce RTX 3070 за 35-37 тысяч рублей (и не ждать, пока DLSS 3.0 завоюет хотя бы четверть рынка игр).

Разумеется, широкое внедрение DLSS 3.0 поможет GeForce RTX 4060 Ti стать намного более популярным ускорителем, но только в случае реально массового внедрения этой технологии масштабирования. Ну и ждем адекватного снижения цен, ибо факты говорят о том, что такие карты сейчас мало кто покупает.

Очевидны и два узких места у нового продукта, главное их которых — объем памяти в 8 ГБ (в интернете полно исследований на тему минимально требуемого на сегодня объема памяти для ускорителей, претендующих на комфорт в разрешениях выше Full HD, и это явно не 8 ГБ, а минимум 10-11, так что 12 ГБ были бы весьма полезны в случае с 4060 Ti). Второе узкое место вытекает из первого: шина обмена с памятью. Да, в ускорителе применен один из самых быстрых на сегодня типов памяти GDDR6, но всё равно ПСП оказывается удавкой. Опять же, если бы карту укомплектовали 12 гигабайтами памяти, то и шина была бы 192-битная.

Безусловно, у всего семейства GeForce RTX 40 заметно повышена эффективность блоков трассировки лучей, обновлены тензорные ядра, так что чем больше та или иная игра использует возможности RT, тем заметнее будет превосходство нового поколения, ведь в новой архитектуре Ada Lovelace возможности указанных блоков были серьезно улучшены, особенно это касается аппаратной трассировки лучей. Само определение пересечений луча и треугольника в третьем поколении RT-ядер было ускорено вдвое, но еще интереснее дополнительные аппаратные блоки в RT-ядрах: Opacity Micromap Engine, ускоряющий обработку полупрозрачных объектов, вроде языков пламени и листьев, и Displaced Micro-Mesh Engine, способный снизить время построения структур BVH и сократить требования к объему геометрических данных для очень сложных объектов. Еще одна важная новая возможность — переупорядочивание выполнения шейдеров при трассировке лучей — Shader Execution Reordering. Специальный планировщик способен на лету оптимизировать загрузку вычислительных блоков мультипроцессора SM, что потенциально может обеспечить двух-трехкратное ускорение для многих алгоритмов трассировки лучей.

И еще раз надо сказать про новую версию DLSS 3.0, использующую ускоритель оптического потока Optical Flow Accelerator, улучшенный в архитектуре Ada Lovelace. DLSS 3 использует как масштабирование разрешения из DLSS 2, так и удвоение частоты кадров при помощи вставки промежуточных, используя поле оптического потока. Данные из него комбинируются с векторами движения, и искусственный интеллект при помощи тензорных ядер генерирует промежуточные кадры, чтобы видеоряд был плавнее. А для того чтобы задержки при этом не слишком увеличивались, используется известная технология компании Reflex. В результате игрок может получить вдвое больше кадров в секунду при визуальном качестве, сравнимом с DLSS 2.

И всё это было бы прекрасно, если бы у маркетологов Nvidia не было проблем с реальной оценкой рынка ПК и спроса на компоненты в настоящее время.

Конкретная протестированная карта Palit GeForce RTX 4060 Ti Dual (8 ГБ) имеет плюс в виде сравнительно компактных габаритов: у нее двухслотовое размещение в системном блоке, и при этом СО не слишком шумная. Заметим, что для карты Palit можно самостоятельно модифицировать кожух СО с помощью фирменной концепции «Maker» — с последующей печатью на 3D-принтере.

Карта может потреблять до 170 Вт и имеет стандартный 8-контактный разъем питания.

Производитель декларирует наличие 3-летней гарантии на эту карту.

Отметим еще раз, что GeForce RTX 4060 Ti отлично подходит для игры в разрешении 1080p с максимальным качеством графики с трассировкой лучей с поддержкой DLSS/FSR/XeSS, а также неплохо смотрится в разрешении 2.5K без RT.

Также отметим поддержку стандарта HDMI 2.1, позволяющего выводить 4K-изображение со 120 FPS или 8K-разрешение при помощи одного кабеля, поддержку аппаратного декодирования видеоданных в формате AV1, технологию RTX IO, способную обеспечить быструю передачу и распаковку данных с накопителей прямо в GPU, а также технологию снижения задержек Reflex, полезную для киберспортсменов.

Справочные материалы:

30 мая 2023 Г.