Обзор видеоускорителя Nvidia GeForce RTX 4070 Ti (12 ГБ) на основе карты Palit GeForce RTX 4070 Ti GameRock Classic OC

В ушедшем году компания Nvidia анонсировала сразу три видеокарты на основе новой графической архитектуры Ada Lovelace, которая продолжила дело предыдущих поколений Turing и Ampere, обеспечив значительно более высокую производительность в графических и неграфических применениях. Мы уже рассмотрели ранее две видеокарты этой серии, и новые графические процессоры флагманского уровня оказались в полтора-два раза производительнее предыдущих аналогов при растеризации и трассировке лучей, а также они выделяются новой технологией увеличения производительности — DLSS 3, которая позволяет дополнительно повысить частоту кадров. Главное нововведение DLSS 3 заключается в генерации дополнительных кадров на основе существующих, для чего используется аппаратный движок Optical Flow Accelerator, интерполирующий соседние кадры и создающий на их основе еще один.

Да и в остальном улучшений хватает: RT-ядра новой архитектуры обеспечивают вдвое бо́льшую пиковую производительность теста пересечения луча и треугольника, а также имеют дополнительные аппаратные блоки: Opacity Micromap Engine — ускоряющий трассировку полупрозрачной геометрии до двух раз, и Displaced Micro-Mesh Engine — использующий микротреугольники для достижения большей геометрической сложности. Еще одним важным изменением новой архитектуры является изменяемый порядок шейдерных вычислений — Shader Execution Reordering, который может дать до 40%-50% прироста производительности при интенсивной трассировке лучей.

Создать заметно более сложные и большие GPU с увеличенной производительностью при сохранившемся уровне потреблении энергии, позволил новый техпроцесс — модифицированный под потребности Nvidia процесс TSMC 4N с технологическими нормами 5 нм. Обзор двух старших моделей GPU новой линейки у нас был, и сегодня мы рассмотрим младшую из трех анонсированных видеокарт, основанную на чипе AD104. Видеокарта GeForce RTX 4070 Ti имеет пиковую вычислительную производительность более 40 терафлопс, что в теории соответствует возможностям флагмана прошлой линейки — GeForce RTX 3090 Ti, и это при более чем полуторакратной разнице в энергопотреблении. А если использовать технологии семейства Ada Lovelace, направленные на дальнейшее повышение производительности, то эта разница еще увеличится.

Модель GeForce RTX 4070 Ti обеспечит огромный скачок производительности при модернизации игровой системы с таких моделей видеокарт, как GeForce RTX 2080 и GeForce GTX 1080 Ti. Новая видеокарта предназначена для игроков, которые хотят получить функциональность новой архитектуры и очень высокую производительность, но при меньшей цене по сравнению с двумя верхними моделями новой линейки. Рассматриваемая сегодня видеокарта официально предназначена для разрешения 2560×1440 при максимальных графических настройках, включая трассировку лучей, а также для 4K-разрешения при условии использования DLSS. Новинка обеспечивает достаточно высокую производительность и в играх с продвинутой графикой с применением трассировки пути (path tracing): Portal with RTX и обновления Cyberpunk 2077 в режиме Overdrive RT.

GeForce RTX 4070 Ti неплохо подходит и для применения в профессиональных задачах по созданию цифрового контента — она достаточно производительная, имеет тензорные ядра, которые способны ускорять инструменты на основе искусственного интеллекта, а также аппаратные блоки для ускорения трассировки лучей, работа которых поддерживается в таких 3D-пакетах и движках, как Blender Cycles, Redshift, V-Ray, Octane и т. д. Все это позволит ускорить визуализацию сложных сцен и эффективнее работать над проектами.

Графическая архитектура Ada Lovelace во многом схожа с архитектурой Ampere, на которой основаны различные модификации чипов GA10x, обе эти архитектуры имеют достаточно много общего и с предыдущими архитектурами Turing и Volta, и перед прочтением материала будет полезно ознакомиться с нашими предыдущими статьями по теме:

Графический ускоритель GeForce RTX 4070 Ti
Кодовое имя чипа	AD104
Технология производства	5 нм (TSMC 4N)
Количество транзисторов	35,8 млрд (AD103 — 45,9 млрд)
Площадь ядра	294,5 мм² (AD103 — 378,6 мм²)
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти	192-битная: 6 независимых 32-битных контроллеров памяти с поддержкой памяти типа GDDR6X
Частота графического процессора	до 2610 МГц
Вычислительные блоки	60 потоковых мультипроцессоров, включающих 7680 CUDA-ядер для целочисленных расчетов INT32 и вычислений с плавающей запятой FP16/FP32/FP64
Тензорные блоки	240 тензорных ядер для матричных вычислений INT4/INT8/FP16/FP32/BF16/TF32
Блоки трассировки лучей	60 RT-ядер для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования	240 блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	10 широких блоков ROP на 80 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка HDMI 2.1 и DisplayPort 1.4a (со сжатием DSC 1.2a)

Спецификации видеокарты GeForce RTX 4070 Ti
Частота ядра	2310/2610 МГц
Количество универсальных процессоров	7680
Количество текстурных блоков	240
Количество блоков блендинга	80
Эффективная частота памяти	21 ГГц
Тип памяти	GDDR6X
Шина памяти	192 бита
Объем памяти	12 ГБ
Пропускная способность памяти	504 ГБ/с
Вычислительная производительность (FP32)	до 40,1 терафлопс
Теоретическая максимальная скорость закраски	209 гигапикселей/с
Теоретическая скорость выборки текстур	626 гигатекселей/с
Шина	PCI Express 4.0 x16
Разъемы	по выбору производителя
Энергопотребление	до 285 Вт
Дополнительное питание	один 16-контактный разъем
Число слотов, занимаемых в системном корпусе	по выбору производителя
Рекомендуемая цена	$799

Название сегодняшней новинки из нового семейства в целом более-менее соответствует принципу наименования решений компании, особенно после того, как Nvidia изменила ее первое название «RTX 4080 12 ГБ» на RTX 4070 Ti. Именовать две абсолютно разные видеокарты на базе чипов разной мощности было неудачной идеей, как показала практика, и название второго варианта позднее решили поменять на более подходящее. Теперь она и по наименованию стоит на ступень ниже RTX 4080, а не почти наравне с «RTX 4080 16 ГБ».

На рынке видеокарт главным конкурентом RTX 4070 Ti является младшее из пары уже вышедших топовых видеокарт нового семейства AMD Radeon RX 7000. Причем в этот раз уже не конкурент стоит дешевле GeForce, а решение Nvidia отличается меньшей ценой, по сравнению с RX 7900 XT. Мы совсем скоро протестируем новинку AMD в том числе и в тестах трассировки лучей, но пока что очень похоже, что даже новое поколение Radeon по эффективности аппаратной трассировки догнало только Ampere, но не Ada. А производительность трассировки лучей стала важнейшим показателем для графических процессоров, так как скорости растеризации топовых GPU уже давно и так достаточно.

По объему видеопамяти для новой видеокарты у Nvidia в соответствии с шириной шины был выбор между 12 ГБ и 24 ГБ, и для RTX 4070 Ti первый вариант кажется вполне достаточным на данный момент. Прямо сейчас наличие 20 ГБ видеопамяти против 12 ГБ не принесет преимущества конкуренту новинки в виде Radeon RX 7900 XT — в существующих играх и типичных условиях. Но хотя пока что 12 ГБ памяти будет вполне достаточно при любых графических настройках, это все же можно считать потенциальным недостатком новинки Nvidia, который может негативно сказаться в будущем.

Для питания видеокарт новой модели используется все тот же 16-контактный разъем питания PCIe 5.0, ставший стандартом для ATX 3.0, который мы видели еще на GeForce RTX 3090 Ti. Блоки питания с подобным разъемом представлены на рынке, также можно применить переходник с пары более привычных 8-контактных разъемов. Редкие проблемы пользователей RTX 4090 с оплавлением этих разъемов касаются только топовой модели, а конкретно RTX 4070 Ti это вряд ли коснется, так как уровень энергопотребления для нее установлен в 285 Вт, и проблем возникнуть не должно.

В отличие от RTX 4090 и RTX 4080, модель RTX 4070 Ti не будет предлагаться рынку в варианте самой Nvidia — в виде решений специального издания Founders Edition. А вот партнеры компании уже анонсировали и выпустили на рынок по несколько решений собственного дизайна, включая разогнанные варианты, имеющие улучшенные системы питания и охлаждения. Модели GeForce RTX 4070 Ti уже доступны в разных модификациях у партнеров компании: Asus, Colorful, Gainward, Galaxy, Gigabyte, Innovision 3D, MSI, Palit, PNY, Zotac и других.

Особенности архитектуры

В линейке видеокарт GeForce RTX 40 применяются графические процессоры AD10x, основанные на графической архитектуре Ada Lovelace. Инженеры компании Nvidia спроектировали графическую архитектуру, которая не только повысила производительность операций трассировки лучей и машинного вычисления на тензорных ядрах, но и предоставила некоторые новые возможности, позволяющие улучшить эффективность, также заметно повлиял переход на современный технологический процесс тайваньской компании TSMC, позволивший разместить в чипах большое количество исполнительных блоков. Новые GPU получились заметно более сложными, но при этом они работают на высокой тактовой частоте, по сравнению с решениями предыдущих серий.

Графический процессор AD104 включает в себя все возможности и особенности AD102 флагманского решения, включая RT-ядра третьего поколения и тензорные ядра четвертого — то есть, поддерживает все улучшения трассировки лучей, а также технологию увеличения производительности DLSS 3 и новый ускоритель оптического потока OFA. Кристалл AD104 в составе модели видеокарты GeForce RTX 4070 Ti обеспечивает достаточно высокий уровень производительности — почти на уровне флагманского решения RTX 3090 Ti, основанного на чипе GA102 предыдущего поколения, но при гораздо меньшем уровне энергопотребления.

Как и все графические процессоры компании Nvidia, чип AD104 состоит из укрупненных кластеров Graphics Processing Cluster (GPC), которые включают несколько кластеров текстурной обработки Texture Processing Cluster (TPC), содержащих потоковые процессоры Streaming Multiprocessor (SM), блоки растеризации ROP и контроллеры памяти. Как и в предыдущих архитектурах, кластер GPC самостоятельно производит все основные вычисления внутри кластера, и включает свой движок растеризации Raster Engine, шесть кластеров TPC, состоящих из 12 мультипроцессоров SM. Рассмотрим диаграмму графического процессора в полной конфигурации:

Модель видеокарты GeForce RTX 4070 Ti выполнена на основе полной версии графического процессора AD104, который содержит 35,8 миллиардов транзисторов и включает 5 вычислительных кластеров GPC, 30 кластеров текстурной обработки TPC, 60 потоковых мультипроцессоров SM и шесть 32-битных контроллеров памяти (192-бит в целом). Всего полноценный GPU содержит 7680 CUDA-ядер, 60 RT-ядер, 240 тензорных ядер, 240 текстурных блоков TMU и 80 блоков ROP. Подсистема памяти включает 7680 КБ L1-кэша, 15360 КБ регистрового файла и 48 МБ L2-кэша.

Каждый мультипроцессор в чипах AD10x содержит по 128 CUDA-ядер, по одному RT-ядру третьего поколения, по четыре тензорных ядра четвертого поколения, по четыре текстурных блока TMU, регистровый файл на 256 КБ и 128 КБ L1-кэша или разделяемой памяти, объем которых конфигурируется по необходимости. Количество блоков текстурирования и заполнения возросло по сравнению с аналогичными графическими процессорами семейства Ampere, что должно сказаться при упоре в скорость текстурных выборок и заполнения, что иногда встречается в играх.

Память в GeForce RTX 4070 Ti применяется уже знакомая — GDDR6X, и в случае рассматриваемой модели ее эффективная рабочая частота составляет 21 ГГц — общая пропускная способность памяти в этом случае превышает 500 ГБ/с, что аж вдвое меньше, чем у RTX 3090 Ti из предыдущего поколения, схожей с новинкой по теоретическим показателям производительности. Общий объем видеопамяти составляет 12 ГБ, что хоть и достаточно для решения такого уровня, но это также вдвое меньше, чем у RTX 3090 (Ti). Нехватка ПСП и сравнительно небольшой объем видеопамяти — это немногочисленные потенциальные недостатки новой видеокарты, ведь во многих случаях общая производительность рендеринга может упираться именно в это.

Возможно, часть проблем решат улучшения в подсистеме кэширования. Всего RTX 4070 Ti содержит 7680 КБ кэш-памяти первого уровня, по сравнению с 10752 КБ в топовой версии прошлого поколения — RTX 3090 Ti, зато значительно вырос объем кэш-памяти второго уровня — тут его целых 48 МБ, в отличие от всего лишь 6 МБ в той же RTX 3090 Ti. Это должно частично нивелировать нехватку ПСП, да и многие приложения получат преимущество от большого объема кэш-памяти — он положительно сказывается в сложных вычислительных задачах, вроде аппаратной трассировки лучей и растеризации — в играх и тестах с большим количеством полупрозрачных частиц, вроде бенчмарка 3DMark FireStrike.

Сравним теоретические показатели пары выпущенных моделей видеокарт серии GeForce RTX 40, основанных на разных чипах линейки AD10x, с некоторыми из моделей предыдущей линейки Ampere, что позволит наглядно оценить разницу между ними.

	RTX 4080	RTX 4070 Ti	RTX 3090 Ti	RTX 3080 Ti	RTX 3070 Ti
Кристалл	AD103	AD104	GA102	GA102	GA104
Кол-во транзисторов, млрд.	45,9	35,8	28,3	28,3	17,4
Площадь, мм²	379	295	628	628	393
CUDA-ядра	9728	7680	10752	10240	6144
Тензорные ядра	304	240	336	320	192
RT-ядра	76	60	84	80	48
Базовая частота, ГГц	2,21	2,31	1,56	1,37	1,58
Турбо-частота, ГГц	2,51	2,61	1,86	1,67	1,77
Производительность FP32, ТФлопс	48,7	40,1	40,0	34,1	21,8
Текстурирование, ГТекс/с	762	626	625	533	340
Скорость заполнения, ГПикс/с	281	209	208	187	170
Объем памяти, ГБ	16	12	24	12	8
Шина памяти, бит	256	192	384	384	256
ПСП, ГБ/с	717	504	1008	912	608
Потребление, Вт	320	285	450	350	290

Если сравнивать RTX 4070 Ti (бывшая «RTX 4080 12 ГБ») и RTX 4080 (бывшая «RTX 4080 16 ГБ»), то между ними налицо большая разница по количеству исполнительных блоков, по их теоретической производительности, а также по ПСП. Если RTX 4090 — бескомпромиссный флагман, то RTX 4080 подходит для большего количества пользователей, а RTX 4070 Ti — это еще более массовый продукт. При теоретической производительности по большинству показателей на уровне RTX 3090 Ti, новинка имеет более чем в полтора раза меньшее потребление энергии и вдвое меньшую площадь кристалла — все это благодаря новому 5-нанометровому техпроцессу. В целом, RTX 4070 Ti должна быть более чем в полтора раза энергоэффективнее, чем RTX 3090 Ti, и примерно на одном уровне с ней по производительности.

Рассматриваемую сегодня модель Nvidia явно делала для того, чтобы создать полный аналог RTX 3090 Ti по скорости. Из таблицы видно, что это им удалось — почти по всем важным показателям пиковой теоретической производительности они идентичны. Но именно что почти по всем — кроме пропускной способности видеопамяти, которая у RTX 4070 Ti ровно вдвое ниже! Да что там, даже у RTX 4090 она осталась на уровне RTX 3090 Ti, а 504 ГБ/с у новинки на фоне 1008 ГБ/с у флагманской видеокарты предыдущей серии вообще не воодушевляют. Надеемся на то, что увеличившийся в 8 раз объем кэш-памяти второго уровня позволит нивелировать этот недостаток, но уж очень он велик, и наверняка в жизни встретятся случаи, когда этого добиться не удастся.

Хотя по тестам самой Nvidia все шоколадно, конечно же — новая RTX 4070 Ti в худших случаях наравне с RTX 3090 Ti, а в лучших — вдвое-втрое быстрее. Но это уже явно с применением DLSS 3, да и вообще — где тот давно обещанный режим Overdrive для Cyberpunk 2077?

Все архитектурные улучшения семейства Ada Lovelace были разобраны нами в теоретическом обзоре, там подробно описаны все изменения в RT-ядрах новой архитектуры, включая аппаратные блоки Opacity Micromap Engine и Displaced Micro-Mesh Engine, а также дополнительный планировщик для изменения порядка выполнения шейдеров Shader Execution Reordering, позволяющие повысить эффективность аппаратной трассировки лучей.

Там же подробно расписана и работа технологии DLSS 3, которая стала не просто технологией масштабирования разрешения, как DLSS 2, а приобрела возможность вставки дополнительных кадров на основе информации из существующих, что увеличивает их частоту и плавность видеоряда в итоге. DLSS 3 состоит из трех частей: генерация кадров Frame Generation, увеличение разрешения Super Resolution (то, что мы знаем под именем DLSS 2) и технология снижения задержек Reflex. Видеокарты серии RTX 40 поддерживают все три, а предыдущие модели — две, за исключением генерации кадров, и DLSS в играх будет работать на всех GPU, просто с разными возможностями. Важно, что DLSS 3 сразу получила поддержку большого количества игровых разработчиков и игровых движков.

Возможности GeForce RTX 4070 Ti по работе с видеоданными не отличаются от таковых у флагманской модели — в специализированном аппаратном кодировщике NVEnc восьмого поколения появилась поддержка кодирования видео в формате AV1, кодировщик AV1 в Ada на 40%-50% эффективнее кодировщика H.264, используемого в графических процессорах предыдущей серии, и новый формат AV1 позволит увеличить разрешение видеопотока при стриминге с 1080p до 1440p при том же битрейте. Кроме этого, представленные графические процессоры Ada имеют по два аппаратных кодировщика NVEnc на борту, что позволяет кодировать видеоданные с разрешением 8K при 60 FPS или сразу четыре видеопотока разрешения 4K при 60 FPS — и при этом быстрее, чем на RTX 3090 Ti.

Кроме NVEnc, в графические процессоры архитектуры Ada включен аппаратный декодер пятого поколения NVDec, который появился в Ampere. Он поддерживает декодирование видеоданных с аппаратным ускорением в форматах: MPEG-2, VC-1, H.264 (AVCHD), H.265 (HEVC), VP8, VP9 и AV1. Также полностью поддерживается и декодирование видеоданных в разрешении 8K при 60 FPS. На этом с теоретической частью мы закончили и переходим к рассмотрению практических особенностей видеокарты GeForce RTX 4070 Ti в исполнении компании Palit.

Особенности карты Palit GeForce RTX 4070 Ti GameRock Classic OC 12 ГБ

Сведения о производителе: Компания Palit Microsystems (торговая марка Palit) основана в 1988 году в Китайской Республике (Тайвань). Штаб-квартира — в Тайбэе/Тайвань, крупный центр по логистике — в Гонконге, второй офис (по продажам в Европе) — в Германии. Фабрики — в Китае. На рынке в России — с 1995 года (начинались продажи как безымянных продуктов, так называемых Noname, а под маркой Palit продукты начали идти только после 2000 года). В 2005 году компания приобрела торговую марку и ряд активов Gainward (после, по сути, банкротства одноименной компании), после чего был образован холдинг Palit Group. Был открыт еще один офис в Шеньжене, направленный на продажи в Китае. На сегодня внутри Palit Group сосредоточено еще несколько торговых марок и брендов.

Объект исследования: серийно выпускаемый ускоритель трехмерной графики (видеокарта) Palit GeForce RTX 4070 Ti GameRock Classic OC 12 ГБ 192-битной GDDR6X

Palit GeForce RTX 4070 Ti GameRock Classic OC 12 ГБ 192-битной GDDR6X
Параметр	Значение	Номинальное значение (референс)
GPU	GeForce RTX 4070 Ti (AD104)
Интерфейс	PCI Express x16 4.0
Частота работы GPU (ROPs), МГц	BIOS P: 2760(Boost)—2850(Max) BIOS S: 2610(Boost)—2805(Max)	2610(Boost)—2805(Max)
Частота работы памяти (физическая (эффективная)), МГц	2625 (21000)	2625 (21000)
Ширина шины обмена с памятью, бит	192
Число вычислительных блоков в GPU	60
Число операций (ALU/CUDA) в блоке	128
Суммарное количество блоков ALU/CUDA	7680
Число блоков текстурирования (BLF/TLF/ANIS)	240
Число блоков растеризации (ROP)	80
Число блоков Ray Tracing	60
Число тензорных блоков	240
Размеры, мм	310×125×63	310×130×70
Количество слотов в системном блоке, занимаемые видеокартой	4	4
Цвет текстолита	черный	черный
Энергопотребление пиковое в 3D, Вт (BIOS P/BIOS S)	293/293	285
Энергопотребление в режиме 2D, Вт	40	40
Энергопотребление в режиме «сна», Вт	11	11
Уровень шума в 3D (максимальная нагрузка), дБА (BIOS P/BIOS S)	32,5/30,8	32,0
Уровень шума в 2D (просмотр видео), дБА	18,0	18,0
Уровень шума в 2D (в простое), дБА	18,0	18,0
Видеовыходы	1×HDMI 2.1, 3×DisplayPort 1.4a	1×HDMI 2.1, 3×DisplayPort 1.4a
Поддержка многопроцессорной работы	нет
Максимальное количество приемников/мониторов для одновременного вывода изображения	4	4
Питание: 8-контактные разъемы	0	0
Питание: 6-контактные разъемы	0	0
Питание: 16-контактные разъемы	1	1
Вес карты с комплектом поставки (брутто), кг	2,2	2,5
Вес карты чистый (нетто), кг	1,7	2,0
Максимальное разрешение/частота, DisplayPort	3840×2160@144 Гц, 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI	3840×2160@144 Гц, 7680×4320@60 Гц
Средняя цена карты Palit	единичные предложения в районе 83-88 тысяч рублей на момент подготовки обзора

Память

Карта имеет 12 ГБ памяти GDDR6X SDRAM, размещенной в 6 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Micron (GDDR6X, MT61K512M32KPA-21 / D8BZC) рассчитаны на номинальную частоту работы в 2625 (21000) МГц.

Особенности карты и сравнение с Palit GeForce RTX 4080 GameRock

Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ)	Palit GeForce RTX 4080 GameRock (16 ГБ)
вид спереди

вид сзади

Мы сравниваем карту Palit с ее же продуктом на базе RTX 4080 по двум причинам: во-первых, эталонной карты Nvidia на базе RTX 4070 Ti (12 ГБ) никто из медиасообщества в РФ не получал; во-вторых, интересно сравнить рассматриваемую сейчас карту со «старшей сестрой». В целом мы видим, что карты сильно отличаются, хотя, казалось бы, можно было просто убрать с карты RTX 4080 две микросхемы памяти, получив тем самым и объем 12 ГБ, и 192-битную шину обмена с памятью. В случае поколения RTX 30 часто делалось именно так, когда карты, имеющие в качестве GPU один и тот же физический чип, использовали разводку PCB под максимальную ширину шины, а дальше уже комплектовались разным количеством микросхем памяти. Печатная плата под RTX 4080 имеет максимальную ширину шины 256 бит, и по наличию двух пустых посадочных мест для микросхем памяти на PCB RTX 4070 Ti можно предположить, что разводка карты точно такая же, под ширину шины в 256 бит, да и размеры обеих карт по сути одинаковые. Зачем тогда надо было существенно переделать PCB под RTX 4070 Ti? Ответ получен из инсайдерской среды Nvidia: разводка чипа AD104 сильно отличается от предыдущих, потому требует установки на плату со смещением на 90 градусов, и это вызывает существенные переделки в разводке.

Сбоку справа на карте мы видим посадочные места, похожие на те, куда устанавливаются 8-контактные разъемы питания. На самом деле они предназначены для подключения мощных внешних вентиляторов в системах, использующих профессиональные версии подобных видеокарт (для игровых и профессиональных видеокарт используются одни и те же GPU, разница может быть лишь в объеме памяти, конфигурации рабочих блоков и, конечно же, в программном обеспечении).

Ядро имеет маркировку AD104-400, защиты от майнинга нет, дата выпуска — 43-я неделя 2022 года (октябрь).

Суммарное количество фаз питания у карты Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) — 14, а у ее собрата на RTX 4080 — 18.

При этом распределение фаз такое: у Palit GeForce RTX 4080 GameRock — 15 фаз на ядро и 3 на микросхемы памяти, у карты Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) — 12 + 2.

Зеленым цветом отмечена схема питания ядра, красным — памяти. Обоими схемами (12+2) управляет один ШИМ-контроллер MP2891 (Monolithic Power Systems), расположенный на оборотной стороне PCB. Это новый контроллер, есть данные, что он рассчитан максимум на 16 фаз.

В преобразователе питания, традиционно для всех видеокарт Nvidia, используются транзисторные сборки DrMOS — в данном случае MP86957 (Monolithic Power Systems), каждая из которых рассчитана максимально на 70 А.

На тыльной стороне платы имеется контроллер uS5650Q (uPI Semiconductor), который отвечает за мониторинг карты (отслеживание напряжений и температуры).

Управление подсветкой традиционно возложено на контроллер Holtek.

Карта имеет два режима работы, они заложены в двух вариантах BIOS, которые переключаются с помощью переключателя на верхнем торце: P (performance / производительный, он же 1) и S (silent / тихий, он же 2). Разница между режимами не только в оборотах вентиляторов, но и в частотах работы GPU, плюс небольшая разница в лимитах: предел энергопотребления для BIOS P заложен в 330 Вт, а для BIOS S — в 285 Вт.

Штатные частоты памяти в обоих режимах BIOS равны референсным значениям. При этом Boost-значение частоты работы ядра в BIOS 1(P) выше референс-аналога почти на 6,8%. Исследования показали, что в среднем мы получили в играх прирост производительности на 5% относительно референс-карты. Частоты работы ядра в BIOS 2(S) соответствуют референс-значениям.

Энергопотребление карты Palit в пиках доходило до 293 Вт в обоих режимах BIOS.

Я попробовал ручной разгон и получил максимальные частоты 3000/23000 МГц, что обеспечило прирост в играх в разрешении 4К в среднем почти на 8% относительно референсных значений (лимит потребления можно поднять до 112%), энергопотребление карты выросло при этом до 315 Вт.

Питание на карту Palit подается через новый 16-контактный разъем питания стандарта PCIe 5.0.

В комплекте поставки карты имеется переходник на такой разъем с двух обычных 8-контактных PCIe 2.0 (хорошо всем знакомых).

Отметим приличные габариты данной карты, особенно по толщине: 6,3 см. В результате видеокарта занимает 4 слота в системном блоке.

RTX 4070 Ti не обладает поддержкой мультиграфической конфигурации, то есть технологии SLI, и у карты нет специального разъема на верхнем торце.

Карта имеет стандартный набор видеовыходов: три DP 1.4a и один HDMI 2.1.

Управление работой карты обеспечивается с помощью фирменной утилиты Thunder Master.

*Панель разгона позволяет настроить частоты работы карты, а также задать авторазгон*

Панель управления вентиляторами: три вентилятора поделены на 2 блока (2 крайних +1 центральный), ими можно управлять раздельно

Нагрев и охлаждение

В целом концепция СО у этой карты соответствует той, что рекомендовала Nvidia при выпуске серии RTX 30: компактная PCB и система охлаждения, продувающая крайним вентилятором радиатор насквозь. Собственно, инженеры Palit даже усилили такой вариант: основой кулера является огромный многосекционный пластинчатый никелированный радиатор с тепловыми трубками, распределяющими тепло по ребрам радиатора. Трубки припаяны к огромному медному плато (подошве). Испарительной камеры в данном случае нет, просто сама подошва весьма толстая.

Микросхемы памяти и преобразователи питания VRM охлаждаются с помощью этой же огромной подошвы (через термопрокладки).

Задняя пластина участвует в охлаждении оборотной стороны платы через термопрокладки, а также служит элементом защиты и усиления жесткости PCB. Концепция в целом предусматривает тройную защиту печатной платы от любых повреждений и изгибов: кроме задней пластины имеется еще и черная рама, связывающая ее с радиатором охлаждения, а также с крепежной планкой, создавая этакий монолитный каркас вокруг PCB.

Поверх радиатора установлен кожух, покрывающий три вентилятора ∅95 мм.

Остановка вентиляторов при малой нагрузке видеокарты происходит, если температура GPU опускается ниже 50 градусов, а нагрев микросхем памяти — ниже 80 градусов. При запуске ПК вентиляторы работают, однако после загрузки видеодрайвера идет опрос рабочей температуры, и они выключаются. Ниже есть видеоролик на эту тему.

Мониторинг температурного режима с помощью MSI Afterburner:

Режим BIOS 1(P):

После 2-часового прогона под нагрузкой максимальная температура ядра не превысила 68 градусов, а температура микросхем памяти — 75 градусов, что является великолепным результатом для видеокарт такого уровня! Энергопотребление карты доходило до 293 Вт. Напомним, что безопасный предел нагрева памяти GDDR6X — 105 °C.

Режим BIOS 2(S):

В этом случае максимальная температура ядра достигала 69 градусов, а микросхем памяти — 76 °C, что также является отличным результатом для видеокарт такого уровня. Энергопотребление карты почти не изменилось (293 Вт).

При ручном разгоне (режим BIOS 1(P)) при выставлении лимита потребления в 112% параметры нагрева и шума менялись мало: максимальная температура ядра достигала 70 градусов, памяти — 77 градусов, потребление вырастало до 315 Вт.

Мы засняли и ускорили в 50 раз 8-минутный прогрев (BIOS 1(P)):

Максимальный нагрев наблюдался около блока VRM и микросхем памяти.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

менее 20 дБА: условно бесшумно
от 20 до 25 дБА: очень тихо
от 25 до 30 дБА: тихо
от 30 до 35 дБА: отчетливо слышно
от 35 до 40 дБА: громко, но терпимо
выше 40 дБА: очень громко

В режиме простоя в 2D в обоих режимах BIOS температура была не выше 42 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось.

Режим BIOS 1(P):

В режиме максимальной нагрузки в 3D температура достигала 68/75 °C (ядро/память). Вентиляторы при этом раскручивались до 1707 оборотов в минуту, шум вырастал до 32,5 дБА: это отчетливо слышно, но еще не громко. В видеоролике ниже можно оценить, как вырастает шум (он фиксировался на пару секунд через каждые 30 секунд).

Режим BIOS 2(S):

В режиме максимальной нагрузки в 3D температура достигала 69/77 °C (ядро/память). Вентиляторы при этом раскручивались до 1570 оборотов в минуту, шум вырастал до 30,8 дБА: это тот же уровень, немного тише. В видеоролике ниже это продемонстрировано (шум фиксировался на пару секунд через каждые 30 секунд).

В целом относительно тихая работа системы охлаждения заслуживает похвалы.

Подсветка

Карта Palit имеет СО, доставшуюся ей «по наследству» от RTX 3090 Ti, так что мы видим хорошо знакомую нам по картам 30-й серии подсветку практически по всей площади кожуха СО, где установлены несколько десятков адресуемых светодиодов под акриловым покрытием характерного и запоминающегося вида.

Также на верхнем торце карты подсвечены логотипы серий.

Это не новый тип подсветки, такой дизайн появился в 2020 году с выходом RTX 30 в серии GameRock. Управление режимами подсветки, в том числе и ее отключением, осуществляется той же утилитой ThunderMaster.

Имеется возможность сохранения выбранного режима в самой карте, то есть при желании можно настроить подсветку один раз и больше не запускать программу.

Отметим, что в комплект поставки карт серии GameRock входит кабель для подключения к разъему ARGB (5 В) на материнской плате, чтобы синхронизировать работу подсветки с платой. В этом случае запускать утилиту ThunderMaster вообще не требуется: карта самостоятельно определит подключение, и подсветка по умолчанию будет синхронизирована.

Комплект поставки и упаковка

В комплекте поставки уже нет даже традиционного краткого руководства пользователя (все переведено в интернет!), но зато имеются: разборная металлическая подставка-штатив под карту, переходник питания, кабель синхронизации подсветки.

Стоит обратить внимание на переходник питания с двух 8-контактных разъемов на один 16-контактный.

Напомним, что данный адаптер крайне не рекомендуется сгибать в месте той самой оплетки.

И хотя данная карта потребляет не так много, то есть нагрузка на адаптер питания сравнительно невелика, все же рекомендуем приобретать полноценные БП ATX 3.0 с разъемом 12VHPWR и кабелем с 16 контактами для видеокарт новых поколений.

Подставка типа штатив, упирающаяся в дно корпуса, состоит из трех секций, на ней установлен кронштейн, регулируемый по высоте, так что можно подобрать нужный вариант. Такой способ поддержки не перекрывает слоты ниже видеокарты в системном блоке. Однако не всегда прямо под видеокартой имеется свободное пустое пространство на дне корпуса для установки такой подставки-штатива (корпуса сейчас делают очень разные). Подставка не просто подпирает угол карты, а крепится к ней.

Подставка способна поддерживать и две карты, если они установлены в одном системном блоке. Для этого имеется дополнительный кронштейн, надеваемый на опору. В целом идея отличная, ибо ранее мы видели комплектацию карт акриловым кронштейном-подставкой, который крепится под видеокартой, занимая два слота под ней.

Тестирование: синтетические тесты

Мы провели тестирование новой модели видеокарты Nvidia со стандартными частотами в нашем наборе синтетических тестов. Он продолжает меняться, иногда добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Мы постоянно стараемся расширять и улучшать набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Из более-менее новых бенчмарков мы начали использовать несколько дополнительных тестов для измерения производительности трассировки лучей и, а также технологий масштабирования разрешения и увеличения производительности: DLSS и XeSS. В качестве полусинтетических тестов у нас также используется набор подтестов из довольно популярного пакета 3DMark: Time Spy, Port Royal, DX Raytracing, Speed Way и др. А вот примеры приложений DirectX 11 и 12, входящие в различные SDK, пришлось убрать — последнее время они все чаще давали некорректные результаты.

Синтетические тесты проводились на следующих видеокартах:

GeForce RTX 4070 Ti со стандартными параметрами (RTX 4070 Ti)
GeForce RTX 4080 со стандартными параметрами (RTX 4080)
GeForce RTX 3090 Ti со стандартными параметрами (RTX 3090 Ti)
GeForce RTX 3090 со стандартными параметрами (RTX 3090)
Radeon RX 6950 XT со стандартными параметрами (RX 6950 XT)

Для анализа производительности видеокарты GeForce RTX 4070 Ti мы взяли модель, которая стоит на ступень выше в новой линейке — RTX 4080. Более того, раньше эти две видеокарты имели одно наименование — RTX 4080 и отличались лишь суффиксом, указывающим на объем памяти и модификацию. По этому сравнению будет понятно, насколько новинка на чипе AD104 медленнее решения этого же семейства на основе AD103. Также в тесты вошла и пара топовых видеокарт компании Nvidia из предыдущего поколения — они нужны чтобы узнать, насколько новая видеокарта быстрее или медленнее.

Соперник для новинки у компании AMD в виде Radeon RX 7900 XT уже вышел, но нами пока что не протестирован (хотя тесты уже на подходе — ожидайте статью в январе). Ну а пока что остается лишь один номинальный конкурент в виде Radeon RX 6950 XT — просто как самый быстрый вариант из уже протестированных нами решений на основе архитектуре RDNA2. Но не забываем, что новая видеокарта Nvidia будет напрямую конкурировать на рынке уже с решениями на основе архитектуры RDNA3.

Тесты из 3DMark Vantage

Много лет мы рассматриваем устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark обычно довольно высока, и тест показывает результаты, близкие к соответствующим теоретическим параметрам, хотя иногда они все же получаются несколько заниженными для некоторых GPU. Новый графический процессор AD104 имеет довольно большое количество текстурных модулей, работающих на высокой частоте, по сравнению с чипами предыдущих поколений и вполне ожидаемо опережает лучшего представителя семейства Ampere, пусть преимущество и не слишком велико.

А вот сравнение новинки даже с очень условным конкурентом компании AMD уже в пользу Radeon, и выигрыш RX 6950 XT уже куда заметнее. Скорость текстурирования и у предыдущего семейства Radeon довольно высока — из-за большого количества текстурных блоков они справлялись лучше видеокарт конкурента с аналогичным ценовым позиционированием в таких тестах, вот и в этот раз чип графической архитектуры Ada Lovelace не смог одолеть RX 6950 XT, которая была ранее явным лидером в этой задаче. Но новое то поколение видеокарт AMD станет еще быстрее, а соперничать RTX 4070 Ti на рынке придется уже с RX 7900 XT.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Результаты второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест измеряет именно производительность подсистемы ROP, вот и в этом случае ПСП не оказала явного влияния. Разница между парой новых моделей GeForce получилась немалой, но ожидаемой, так как GeForce RTX 4080 и в теории заметно быстрее рассматриваемой сегодня RTX 4070 Ti. Главное, что получилось опередить RTX 3090 Ti — новинка эффективнее старого GPU и в этом тесте, хотя в теории они примерно равны.

Единственный представленный в сегодняшнем сравнении Radeon показал отличную производительность и в этот раз, опередив не только лучший GeForce из предыдущего поколения Ampere, но и обе видеокарты нового поколения, включая сегодняшнюю новинку. Видеокарты компании Nvidia по пиковой скорости заполнения сцены почти всегда уступали конкуренту, поэтому RTX 4070 Ti хоть и показывает приемлемый результат, но лишь по сравнению с RTX 3090 Ti, а не с Radeon.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нем часто неплохо коррелируют с тем, что получается в игровых тестах.

Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель GeForce RTX 4070 Ti также показала неплохой для нее результат — она все так же чуть быстрее RTX 3090 Ti, хотя они и примерно равны по теоретической скорости вычислений. Это не позволило новинке из современного семейства опередить и своего очень условного соперника в виде Radeon RX 6950 XT, но ее реальным конкурентом вообще будет модель RX 7900 XT, которая может выступить еще сильнее.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте также должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы давно уже получаем явно некорректные результаты в этом тесте, поэтому учитывать результаты всех видеокарт GeForce тут просто нет смысла, они неверны. Модель RTX 4070 Ti, созданная на основе графического процессора AD104, не выделилась никак, показав значение, близкое к скорости RTX 4080, чего быть по теории не может — дело в драйверах, которые никто давно не оптимизирует для столь древнего тестового пакета. Но преимущество над RTX 3090 Ti есть, и оно связано с более высокой рабочей частотой.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты, но они уже чуть ближе к истине, чем в прошлом подтесте этого же бенчмарка. Все представленные в сравнении видеокарты Nvidia и в этот раз необъяснимо медленны, но их результаты уже куда ближе к единственной Radeon. Конкурент остался впереди, и даже RTX 4080 не смогла опередить видеокарту Radeon RX 6950 XT. Если говорить о сегодняшней новинке, то RTX 4070 Ti расположилась ровно между RTX 3090 Ti и RTX 4080, что неплохо для решения этого ценового уровня с уровнем потребления более чем в полтора раза ниже, чем у видеокарты семейства Ampere.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она обычно близка к пиковой производительности видеочипов в предельных задачах. В тесте используются операции с плавающей запятой, и новые архитектуры Nvidia должны раскрывать часть своих уникальных возможностей, но тест уже порядком устарел и не показывает все способности современных GPU.

Старшая модель видеокарты семейства Ada Lovelace показала результат ощутимо выше остальных решений, а сегодняшняя новинка с позиционированием на ступеньку ниже снова смогла обойти RTX 3090 Ti, хотя и совсем чуть-чуть. Снова получилось то, что мы ожидали — они почти наравне. Единственное представленное в тесте решение компании AMD на основе архитектуры RDNA 2 выступает чуть хуже, но мы ждем тестов Radeon RX 7900 XT из нового, более производительного семейства. А сейчас рассмотрим более современные тесты, использующие повышенную нагрузку.

Тесты Direct3D 12

Примеры из DirectX SDK компании Microsoft и из SDK компании AMD, использующие графический API Direct3D12, мы решили убрать из наших тестов, так как они давно показывают некорректные результаты в большинстве случаев. И в качестве единственного вычислительного теста с поддержкой Direct3D12 в этом разделе остался известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Для верности мы протестировали видеокарты сразу в двух графических тестах.

Если рассматривать производительность новой модели GeForce RTX 4070 Ti в этой задаче по сравнению с лучшей видеокартой на основе GPU предыдущего поколения этой же компании, то можно заметить, что новая видеокарта снова оказалась хоть и чуть, но все же быстрее — они уверенно опередила RTX 3090 Ti, хотя по теории они очень близки. А вот до RTX 4080 далековато, новинка скорее ближе к скорости RTX 3090 Ti, что очень неплохо для рассматриваемой сегодня модели. Radeon RX 6950 XT может конкурировать разве что с RTX 3090 Ti и мы ждем тестов видеокарт нового поколения RDNA для нормального сравнения.

Тесты трассировки лучей

Одним из первых тестов производительности трассировки лучей является бенчмарк Port Royal создателей известных тестов серии 3DMark. Этот тест работает на всех графических процессорах с поддержкой DirectX Raytracing API. Мы проверили несколько видеокарт в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей в двух режимах, а также традиционным для растеризации методом.

Бенчмарк показывает сразу несколько новых возможностей применения трассировки лучей через DXR API, в нем используются алгоритмы отрисовки отражений и теней с применением трассировки, но тест в целом не слишком хорошо оптимизирован и достаточно сильно загружает в том числе и мощные GPU. Но для сравнения производительности разных GPU в этой конкретной задаче тест вполне подходит.

Результаты первого же теста показывают разницу в подходах компаний AMD и Nvidia к поддержке аппаратного ускорения трассировки лучей, так как даже модель RTX 3090 Ti прошлого поколения заметно быстрее конкурирующей Radeon RX 6950 XT. Решения на основе RDNA 2 тут явно отстают, особенно в сложных условиях — трассировка лучей в исполнении решений AMD куда менее эффективна и мы ждем ее значительного улучшения в RDNA 3. Что касается сравнения Ada и Ampere, то в этом тесте новая модель RTX 4070 Ti не смогла раскрыть все свои улучшения в трассировке — она была даже чуть медленнее RTX 3090 Ti — вероятно, как раз тут и сказалась сравнительно низкая пропускная способность памяти, а большой кэш ее не спас в этом случае. Ведь при традиционном рендеринге RTX 4070 Ti оказалась быстрее RTX 3090 Ti, но при включении трассировки просела больше.

Позднее вышел еще один подтест 3DMark, направленный на тестирование производительности трассировки лучей — DirectX Raytracing. В отличие от предыдущего, он не гибридный, и не использует растеризацию вовсе, а только трассировку лучей, поэтому гораздо лучше отражает скорость GPU именно по возможностям аппаратного ускорения трассировки. Сцена в бенчмарке используется уже известная нам по другим подтестам 3DMark, и она довольно небольшая — BVH-структура в теории может поместиться в Infinity Cache, что может помочь новым видеокартам серии Radeon RX 6000 и будущим RX 7000.

А вот тут уже совсем другое дело — в этот раз рассматриваемая модель GeForce RTX 4070 Ti уже заметно опережает RTX 3090 Ti, основанную на лучшем чипе прошлого поколения. Хотя до RTX 4080 новинке очень далеко. В этом тесте велика нагрузка именно на аппаратные RT-блоки, которые были заметно улучшены в архитектуре Ada Lovelace, поэтому видеокарты серии RTX 4000 и имеют такое преимущество.

Сравнение с Radeon RX 6950 XT можно не смотреть, так как лучшая модель AMD прошлого поколения уступает новинке чуть более чем в два раза. Видеокарта AMD не может конкурировать и с RTX 3090 прошлого поколения, что уж говорить о более новых GPU. Выделенные RT-ядра Nvidia, использующие модель MIMD, выполняют заметно большую часть работы и более универсальны, они не теряют в производительности при включении трассировки так сильно, как ядра Ray Accelerator + обычные SIMD-ядра у решений AMD. Мы очень ждем тестов решений на основе архитектуры RDNA3, которые проведем уже очень скоро.

Как раз к выходу новых поколений графических процессоров Nvidia и AMD в этом году в пакете 3DMark был выпущен еще один тест с серьезной нагрузкой именно на трассировку лучей — Speed Way. По своей нагрузке на различные блоки GPU он кажется похожим на будущие игровые проекты, которые станут использовать трассировку лучей еще активнее существующих, и поэтому для нас весьма интересен.

Все видеокарты сравнения показывают играбельную частоту кадров в низком разрешении, хотя разница между GeForce и Radeon велика, и даже лучшая из Radeon прошлого поколения не может конкурировать с GeForce RTX 3090, не говоря уже о более новых моделях. Сегодняшняя новинка оказалась быстрее чем RTX 3090, но... снова уступила RTX 3090 Ti, что говорит о том, что и в этом случае ее сковывает вдвое меньшая ПСП, а кэш не вытягивает. В любом случае, сегодняшняя новинка заметно быстрее имеющегося решения конкурента, а конкурировать ей придется с видеокартой нового поколения AMD, которое мы протестируем уже совсем скоро.

Переходим к полусинтетическим бенчмаркам, которые сделаны на игровых движках. Первым таким тестом стал Boundary — один из китайских игровых проектов с поддержкой DXR и DLSS. Это бенчмарк с очень серьезной нагрузкой на GPU, трассировка лучей в нем используется весьма активно — и для сложных отражений с несколькими отскоками луча, и для мягких теней, и для глобального освещения. Также в тесте используется технология DLSS, качество которой можно настраивать, и мы протестировали два варианта — без DLSS, чтобы сравнить с AMD Radeon, и с максимально возможным качеством для DLSS.

Без включения DLSS даже в Full HD-разрешении приемлемо работают только мощные видеокарты Nvidia, а самая быстрая модель семейства RX 6000 сильно отстает от всех GeForce и показывает меньше 60 FPS. 4K-разрешение без включения масштабирования играбельно только на топовой RTX 4090 и условно на RTX 4080, которая дотягивает лишь до минимальной играбельности. Рассматриваемая сегодня RTX 4070 Ti в этот раз уже заметно обгоняет RTX 3090 Ti, что можно признать хорошим результатом на фоне предыдущих тестов с трассировкой. Показатели единственной представленной в сравнении видеокарты Radeon говорят о том, что в тестах трассировки лучей они не могут конкурировать и со старыми GPU конкурента, поэтому ждем тестов RDNA3, а пока что рассмотрим тот же тест с DLSS:

С включением масштабирования разрешения методом DLSS 2, старшие видеокарты линейки RTX 30 и в 4K-разрешении стали обеспечивать приемлемую частоту кадров, хотя до 60 FPS не дотянули. Результат новой GeForce RTX 4070 Ti снова чуть выше, чем у RTX 3090 Ti, хотя новинка и не дотянула до 60 FPS в 4K. Но она все же должна позволить играть в 4K-разрешении при максимальных настройках в самых ресурсоемких играх современности и уступает пока только топовым картам того же семейства. Ждем тестов нового поколения AMD, они будут интересны.

Рассмотрим еще один полуигровой бенчмарк, также основанный на китайской игре — Bright Memory. Интересно, что оба теста довольно похожи по результатам и по качеству изображения, хотя по тематике они совсем разные. И все же этот бенчмарк даже еще чуть более требователен, особенно конкретно к производительности трассировки лучей. Жаль, что на видеокартах AMD он не работает, требуя именно карты Nvidia GeForce RTX.

В этом тесте новая модель на базе графического процессора AD104 из нового поколения показала более-менее ожидаемый результат на уровне RTX 3090 Ti, и ситуация в целом похожа на то, что мы видели на прошлой диаграмме, но есть один интересный нюанс — в низком разрешении новинка явно быстрее, а в высоком проиграла старому GPU. Похоже, что начинает сказываться или низкая ПСП или даже недостаток 12 ГБ видеопамяти. В общем, RTX 4070 Ti близка к RTX 3090 Ti, а RTX 4080 заметно быстрее. Но в целом результат для новинки неплохой — по тестам трассировки лучей она примерно наравне с лучшей представительницей семейства Ampere, а то и чуть быстрее ее.

Вычислительные тесты

Мы продолжаем поиск бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается довольно старый и не слишком хорошо оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.

Рассматриваемая сегодня новая модель GeForce RTX 4070 Ti, созданная на основе младшего пока GPU архитектуры Ada Lovelace, имеет достаточно большое количество вычислительных блоков, повышенную тактовую частоту и огромный объем кэш-памяти, поэтому не особенно удивительно, что в этом тесте она с легкостью обошла RTX 3090 Ti из предыдущего поколения. Но интересно, что в среднем тесте ее преимущество несколько меньше, чем в 1-м и 3-м. А вот отставание от старшей RTX 4080 довольно велико. Что касается конкурента, то результат новинки во всех подтестах гораздо выше, чем у лучшего из условных соперников — Radeon RX 6950 XT. Но уже скоро будут тесты куда более актуальной модели RX 7900 XT.

Рассмотрим еще один тест вычислительной производительности графических процессоров — V-Ray Benchmark — это тоже трассировка лучей без применения аппаратного ускорения. Тест производительности на базе рендерера V-Ray раскрывает возможности GPU в сложных вычислениях и также может показать преимущества новых видеокарт. В прошлых тестах мы использовали разные версии бенчмарка: которая выдает результат в виде времени, затраченного на рендеринг и в виде количества миллионов просчитанных путей за секунду, но остался только первый вариант.

Тест также показывает программную трассировку лучей, но на решениях архитектуры RDNA2 нам не удалось запустить тест, к сожалению. Новая модель GeForce RTX 4070 Ti снова оказалась заметно быстрее RTX 3090 Ti и еще чуть больше уступила старшей модели RTX 4080, что даже чуть превзошло наши ожидания. Этот бенчмарк раскрывает особенности новой архитектуры лучше предыдущего — похоже, что программная трассировка лучей очень любит большой объем быстрой кэш-памяти, а ПСП основной видеопамяти процесс не ограничивает.

Рассмотрим еще одно приложение рендеринга — OctaneRender. Это довольно популярный рендерер, который можно использовать в большинстве приложений для создания 3D-контента, а главное, что он использует возможности CUDA и RTX, а версия OctaneRender 2020.1.5 получила поддержку Ampere. Бенчмарк на основе этого рендерера позволяет отключать RTX-ускорение и тестирует производительность сразу в нескольких тестовых сценах, отличающихся по нагрузке. Увы, но OpenCL тестом и рендерером не поддерживается. Приведем общее количество очков:

Новая модель GeForce RTX 4070 Ti ожидаемо опередила модель из прошлого семейства, но... только при включенном аппаратном ускорении RTX, которое заметно повышает результаты всех графических процессоров архитектур Ampere и Ada Lovelace. Но в случае новой архитектуры прирост получается явно выше, что в случае RTX 4080, что для сегодняшней новинки. Видны улучшения в новых графических архитектурах компании Nvidia, связанные именно с трассировкой лучей и вычислениями. В общем, во всех сложных вычислительных тестах младшая представительница новой архитектуры Ada Lovelace показала достаточно сильные результаты, немного опережая лучшую видеокарту семейства Ampere — RTX 3090 Ti.

Тесты технологий DLSS/XeSS/FSR

В этом разделе будут дополнительные тесты, связанные с различными технологиями повышения производительности. Ранее это были только технологии масштабирования разрешения (DLSS 1.x и 2.x, FSR 1.0 и 2.0, XeSS), а теперь к ним добавилась и технология генерации промежуточных кадров — DLSS 3.

Первым мы включили в свои материалы отдельный тест второй версии технологии DLSS, хотя ранее уже были проведены тесты с применением DLSS в приложениях с трассировкой лучей, мы посчитали полезным сделать и отдельное тестирование в разрешении 4K. Рассмотрим результаты четырех GPU компании Nvidia в популярном разрешении с включением технологии DLSS различных уровней качества и сразу двух версий (для RTX 4000):

Без включения DLSS 2.0, рендеринг производится в полном разрешении, что сильно сказывается на производительности, и такого уровня частоты кадров будет явно недостаточно даже в случае RTX 3090, а сегодняшняя новинка RTX 4070 Ti только-только превысила уровень 30 FPS. Этого недостаточно для комфортной игры, так как это средняя частота кадров, но DLSS как раз позволяет улучшить производительность, а заодно и качество сглаживания.

Включение технологии DLSS 2 приводит к росту FPS в два и более раза, и новая модель RTX 4070 Ti уже обеспечивает 56 FPS или 81 FPS в среднем, в зависимости от режима качества. Новая модель в этот раз не смогла опередить лучшее решение предыдущего поколения RTX 3090 Ti, хотя RTX 3090 осталась позади. Но у новинки есть еще один козырь — в видеокартах графической архитектуре Ada Lovelace появилась поддержка DLSS 3.0 — технологии, которая добавила ко всем возможностям DLSS 2.x еще и генерацию промежуточных кадров — то есть, удвоение уже имеющейся частоты кадров. Подробнее вы можете прочитать об этом в теоретической статье по RTX 4090 и RTX 4080, а на практике включение генерации промежуточных кадров дает прирост FPS еще раза в полтора.

С включением новой технологии, RTX 4070 Ti уже в качественном режиме почти достигает уровня RTX 3090 Ti в производительном. Генерация кадров позволяет повысить плавность видеоряда при незначительном увеличении задержек управления — пользователь может самостоятельно решить, что из двух зол ему выбрать. Конечно же, вопросы генерации кадров в DLSS 3.0 еще нуждаются в дополнительном практическом исследовании, которое мы постараемся провести, но во многих случаях оно может быть вполне полезным, в том числе при очень высоких разрешениях.

Нам остается рассмотреть еще один метод повышения производительности посредством рендеринга в меньшем разрешении и масштабировании картинки до более высокого — аналог DLSS 2.0, предложенный компанией Intel, который называется XeSS и также использует возможности искусственного интеллекта при восстановлении информации в кадре. А отличается он от DLSS тем, что работает не только на редких видеокартах компании-разработчика, но и на всех современных GPU, пусть и далеко не столь эффективно, как на решениях самой Intel. Для тестирования мы также взяли специализированный бенчмарк из пакета 3DMark, но в меньшем разрешении.

Включение XeSS также позволяет повысить частоту кадров — до двух раз и даже более. Radeon RX 6950 XT работает в этом случае чуть эффективнее, по сравнению со всеми видеокартами Nvidia, но разница не слишком велика. Видеокарты Intel еще лучше справляются с делом, так как умеют использовать для этого специализированные блоки — примерно как GeForce с DLSS. Понятно, что для последних во всех играх будет лучше включать DLSS (при такой возможности), но и XeSS вполне имеет право на жизнь — с учетом универсальности технологии.

Так вот, новая модель видеокарты RTX 4070 Ti в этом тесте оказалась производительнее топовой модели предшествующего поколения в виде RTX 3090 Ti, особенно в более высокопроизводительных режимах. Единственная Radeon в сегодняшнем сравнении не способна конкурировать даже с RTX 3090 Ti, и нам снова остается ждать тестов Radeon RX 7900 XT для актуального сравнения — надеемся, что в этом цикле они смогут составить сильную конкуренцию во всех случаях, включая приложения с активным применением трассировки лучей.

Тестирование: игровые тесты

Конфигурация тестового стенда

Компьютер на базе процессора Intel Core i9-12900K (Socket LGA1700):
- Платформа:
  - процессор Intel Core i9-12900K (разгон до 5,1 ГГц по всем ядрам);
  - ЖСО Asus ROG Ryujin II 360;
  - системная плата Asus ROG Maximus Z690 Extreme на чипсете Intel Z690;
  - оперативная память Kingston Fury (KF552C40BBK2-32) 32 ГБ (2×16) DDR5 4800 МГц (XMP 5200 МГц);
  - SSD Intel 760p NVMe 1 ТБ PCI-E;
  - жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
  - блок питания Gigabyte UD1000GM PG5 (1000 Вт);
  - корпус Thermaltake Level20 XT;
- операционная система Windows 11 Pro 64-битная;
- телевизор LG 55Nano956 (55″ 8K HDR, HDMI 2.1);
- драйверы AMD версии 22.12.1;
- драйверы Nvidia версии 527.56/527.62;
- VSync отключен.

Список инструментов тестирования

Во всех игровых тестах использовалось максимальное качество графики в настройках.

Marvel's Spider-Man Miles Morales (Insomniac Games/Sony Interactive)
Cyberpunk 2077 (Софтклаб/CD Projekt RED), патч 1.4 (версия 1.5 еще не тестировалась)
God of War (Sony IE/Sony IE)
Call of Duty: Modern Warfare II (Infinity Ward/Activision)
Marvel’s Guardians of the Galaxy (Eldos/Square Enix)
The Medium (Bloober/Bloober)
A Plague Tale: Requiem (Asobo Studio/Focus Entertainment)
Resident Evil Village (Capcom/Capcom)
Far Cry 6 (Ubisoft/Ubisoft)
Battlefield 2042 (DICE/EA)

Кратко о производительности в 3D-играх

Перед демонстрацией детальных тестов мы приводим краткие сведения о производительности семейства, к которому относится конкретный исследуемый ускоритель, а также его соперников. Все это нами субъективно оценивается по шкале из пяти градаций.

Игры без использования трассировки лучей (классическая растеризация):

При оценке исходим из того, что еще летом 2022 года лидерами производительности в классических играх были GeForce RTX 3090 Ti и Radeon RX 6950 XT. Учитывая, что RTX 4070 Ti в среднем находится почти на уровне (в разрешении 4K — на 1% быстрее) RTX 3090 Ti, то выводы очевидны: перед нами практически замена бывшего флагмана 3ххх серии, а значит все игры в 4K на максимальных настройках графики будут по плечу «бронзовому» финалисту нынешней гонки ускорителей.

Игры с использованием трассировки лучей и DLSS/FSR:

C учетом некоторого падения производительности при активации в играх трассировки лучей (при этом появляется все больше и больше игр с поддержкой Nvidia DLSS, а эта технология «умного» антиалиасинга позволяет резко поднять производительность, в том числе компенсируя падение от включения RT) , а также того факта, что у Radeon RX 6950 XT падение FPS куда более драматично, новинка RTX 4070 Ti смотрится еще ярче относительно былых лидеров. Опять же, в отличие от предыдущего флагмана RTX 3090 Ti нынешний равный с ним игрок в лице RTX 4070 Ti обладает DLSS 3, так что когда массово начнет внедряться эта технология, то можно будет вообще никогда отключать трассировку в играх.

Результаты тестирования в 3D-играх

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1200, 2560×1440 и 3840×2160

Marvel's Spider-Man Miles Morales

Cyberpunk 2077

God of War

Call of Duty: Modern Warfare II

Marvel’s Guardians of the Galaxy

The Medium

A Plague Tale: Requiem

Resident Evil Village

Far Cry 6

Battlefield 2042

Все регулярно тестируемые нами видеокарты сейчас поддерживают технологию RT, поэтому мы проводим тесты не только с использованием обычных методов растеризации, но и с включением RT и/или DLSS/FSR.

Результаты тестов со включенной аппаратной трассировкой лучей и/или DLSS/FSR в разрешениях 1920×1200, 2560×1440 и 3840×2160

Cyberpunk 2077, RT

Cyberpunk 2077, RT+DLSS/FSR

God of War, DLSS/FSR

Marvel’s Guardians of the Galaxy, RT

Marvel’s Guardians of the Galaxy, RT + DLSS/FSR

The Medium, RT

The Medium, RT + DLSS/FSR

Resident Evil Village, RT

Far Cry 6, RT

Far Cry 6, RT + FSR

Battlefield 2042, RT

Battlefield 2042, RT + DLSS

Результаты тестов с включенной аппаратной трассировкой лучей и DLSS/FSR в разрешении 7680×4320 (8К)

Cyberpunk 2077, RT+DLSS/FSR

God of War, DLSS/FSR

Marvel’s Guardians of the Galaxy, RT+DLSS

The Medium, RT+DLSS/FSR

Far Cry 6, RT+FSR

Сегодня нормально поиграть в таком разрешении можно только на самых флагманских и дорогих видеокартах, да и то для приемлемого комфорта требуется обязательное использование DLSS (или FSR). В итоге поиграть в таком разрешении все же можно, хотя и далеко не во все игры.

Рейтинг iXBT.com

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:

Вариант рейтинга iXBT.com без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по наиболее слабому ускорителю из группы карт — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%). Рейтинги ведутся по 25 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят GeForce RTX 4070 Ti и его конкуренты.

Рейтинг приведен суммарно для всех трех разрешений.

№	Модель ускорителя	Рейтинг iXBT.com	Рейтинг полезности	Цена, руб.
02	RTX 4080 16 ГБ, 2505—2625/22400	502	51	98 000
03	Palit RTX 4070 Ti GR OC, разгон до 3000/23000	485	57	85 000
04	Palit RTX 4070 Ti GR OC, 2790—2850/21000	478	56	85000
05	RTX 4070 Ti 12 ГБ, 2610—2805/21000	466	55	85000
06	RTX 3090 Ti 24 ГБ, 1860—1965/21000	463	47	99500
07	RX 6950 XT 16 ГБ, 2310—2525/18000	450	54	83100
08	RTX 3090 24 ГБ, 1695—1965/19500	434	47	93000

Отлично видно, что в классических играх по всем разрешениям средний прирост производительности относительно RTX 3090 Ti составляет около 1%, относительно RX 6950 XT — 3,5%, а в разрешении 4К — 2% и 5% соответственно. Карта Palit еще чуть быстрее: прирост FPS относительно RTX 3090 Ti — 3,5%, а против RX 6950 XT — 6,3%. В целом, третий по уровню производительности ускоритель последнего поколения Nvidia окончательно отправляет флагманы 2020—2022 годов на пенсию.

Вариант рейтинга iXBT.com с включением RT/DLSS/FSR

Рейтинг составлен по 9 тестам, в которых используется технология трассировки лучей и одновременно технология Nvidia DLSS, AMD FSR или Intel XeSS. Этот рейтинг нормирован по самому слабому ускорителю в данной группе — Radeon RX 6500 XT (то есть сочетание скорости и функций Radeon RX 6500 XT приняты за 100%).

Рейтинг приведен суммарно для всех трех разрешений.

№	Модель ускорителя	Рейтинг iXBT.com	Рейтинг полезности	Цена, руб.
02	RTX 4080 16 ГБ, 2505—2625/22400	875	89	98 000
03	Palit RTX 4070 Ti GR OC, разгон до 3000/23000	822	97	85 000
04	Palit RTX 4070 Ti GR OC, 2790—2850/21000	803	94	85 000
05	RTX 4070 Ti 12 ГБ, 2610—2805/21000	785	92	85 000
06	RTX 3090 Ti 24 ГБ, 1860—1965/21000	766	77	99 500
07	RTX 3090 24 ГБ, 1695—1965/19500	711	76	93 000
09	RX 6950 XT 16 ГБ, 2310—2525/18000	652	78	83 100

В данном случае превосходство RTX 4070 Ti над флагманами AMD выражено еще более ярко вследствие большего падения производительности у тех при включении RT. В среднем прирост производительности относительно RTX 3090 Ti по всем разрешениям составляет 2,5%, а в разрешении 4К — 4%. Разница же в производительности с RX 6950 XT в данном случае составляет 20% по всем разрешениям и аж 46% в 4К. Карта Palit смотрится еще более выигрышно за счет повышенных частот работы.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Для расчета рейтинга полезности использованы розничные цены на конец декабря 2022 года. Учитывая нацеленность RTX 4070 Ti на разрешение 4К, мы привели рейтинг, подсчитанный только при использовании разрешения 3840×2160. Поэтому цифры отличаются от рейтинга iXBT.com.

Вариант рейтинга полезности без включения RT

№	Модель ускорителя	Рейтинг полезности	Рейтинг iXBT.com	Цена, руб.
10	Palit RTX 4070 Ti GR OC, разгон до 3000/23000	88	745	85 000
14	Palit RTX 4070 Ti GR OC, 2790—2850/21000	86	728	85 000
16	RTX 4070 Ti 12 ГБ, 2610—2805/21000	83	704	85 000
19	RTX 4080 16 ГБ, 2505—2625/22400	81	790	98 000
21	RX 6950 XT 16 ГБ, 2310—2525/18000	77	644	83 100
23	RTX 3090 Ti 24 ГБ, 1860—1965/21000	70	698	99 500
24	RTX 3090 24 ГБ, 1695—1965/19500	68	636	93 000

Еще при изучении RTX 4080 мы обратили внимание, что цена этого ускорителя высоковата для его возможностей, однако после относительно массового появления в продаже таких карт стоимость начала падать, потому даже RTX 4080 оказался выгоднее, чем RTX 3090 Ti. Новый RTX 4070 Ti чуть лучше по выгодности, чем RTX 4080. Карта Palit еще на ступень выше за счет повышенных частот работы и занимает первое место в группе.

Вариант рейтинга полезности с включением RT

№	Модель ускорителя	Рейтинг полезности	Рейтинг iXBT.com	Цена, руб.
04	Palit RTX 4070 Ti GR OC, разгон до 3000/23000	155	1319	85 000
05	Palit RTX 4070 Ti GR OC, 2790—2850/21000	151	1282	85 000
07	RTX 4070 Ti 12 ГБ, 2610—2805/21000	146	1245	85 000
09	RTX 4080 16 ГБ, 2505—2625/22400	143	1404	98 000
18	RTX 3090 Ti 24 ГБ, 1860—1965/21000	121	1201	99 500
20	RTX 3090 24 ГБ, 1695—1965/19500	117	1086	93 000
23	RX 6950 XT 16 ГБ, 2310—2525/18000	107	892	83 100

Да, проблема карт AMD 6000-й серии (падение FPS при включении трассировки лучей) и здесь хорошо видна. Сейчас флагманы AMD 6000-й серии уже вообще нет смысла приобретать. Да и RTX 3090 Ti не столь привлекательны (если не считать, конечно, вторичный рынок). В остальном картина такая же: новый RTX 4070 Ti — лидер в группе.

Выводы

Nvidia GeForce RTX 4070 Ti (12 ГБ) — третий по старшинству ускоритель в новой линейке игровой 3D-графики для ПК, уступающий на текущий момент только GeForce RTX 4090 и GeForce RTX 4080. (Согласно данным западных медиаресурсов, Radeon RX 7900 XTX тоже быстрее, но новые ускорители AMD мы еще не изучали.)

Наши исследования показали, что GeForce RTX 4070 Ti имеет очень привлекательное соотношение цены и скорости в лидерской группе. Он продемонстрировал производительность на уровне GeForce RTX 3090 Ti, а вот стоит дешевле: прямо накануне выпуска компания Nvidia снизила MSRP до 800 долларов, так что рублевые цены могут быть весьма интересными. На момент подготовки нашего обзора продажи GeForce RTX 4070 Ti еще не начались, однако по информации дистрибьютеров уже можно было прикинуть ожидаемую розничную стоимость, и условно мы оценили ее в 85 тысяч рублей. Разумеется, по мере появления карт в продаже мы будем корректировать цены в наших материалах.

В отличие от GeForce RTX 4090, который имеет GPU с просто фантастическим количеством активных вычислительных блоков, включая текстурные, тензорные и RT-ядра, у GeForce RTX 4080, не говоря уж о GeForce RTX 4070 Ti, суммарное количество потоковых процессоров меньше, чем у GeForce RTX 3090 Ti, но все-таки даже GeForce RTX 4070 Ti быстрее топа предыдущего поколения. Здесь сыграли свою роль более тонкий техпроцесс и сильно повышенные частоты работы ядра, а также элементы новой архитектуры с увеличенными кэшами и новыми версиями блоков RT и тензорных ядер.

В случае GeForce RTX 4080 и GeForce RTX 4090 изюминкой нового ускорителя мы называли поддержку разрешения 8К, поскольку даже GeForce RTX 4080 уже обладает достаточной производительностью, чтобы некоторые игры с использованием DLSS обеспечивали игроку нормальный комфорт на максимальных настройках графики в 8К (а когда в игры массово внедрят поддержку DLSS 3, комфорт станет еще выше). GeForce RTX 4070 Ti все еще может условно входить в число ускорителей, обеспечивающих приемлемый FPS в таком разрешении, но таких игр уже наберется немного. Разумеется, широкое внедрение DLSS 3 поможет GeForce RTX 4070 Ti остаться востребованным ускорителем для 8K (полагаем, что объема памяти в 12 ГБ будет достаточно для игр даже в столь высоком разрешении).

Наши тесты показали, что у всего семейства GeForce RTX 40 заметно повышена эффективность блоков трассировки лучей, обновлены тензорные ядра, так что чем больше та или иная игра использует возможности RT, тем заметнее будет превосходство нового поколения, ведь в новой архитектуре Ada Lovelace возможности указанных блоков были серьезно улучшены, особенно это касается аппаратной трассировки лучей. Само определение пересечений луча и треугольника в третьем поколении RT-ядер было ускорено вдвое, но еще интереснее дополнительные аппаратные блоки в RT-ядрах: Opacity Micromap Engine, ускоряющий обработку полупрозрачных объектов, вроде языков пламени и листьев, и Displaced Micro-Mesh Engine, способный снизить время построения структур BVH и сократить требования к объему геометрических данных для очень сложных объектов. Еще одна важная новая возможность — переупорядочивание выполнения шейдеров при трассировке лучей — Shader Execution Reordering. Специальный планировщик способен на лету оптимизировать загрузку вычислительных блоков мультипроцессора SM, что потенциально может обеспечить двух-трехкратное ускорение для многих алгоритмов трассировки лучей.

Отдельно стоит упомянуть и новую версию DLSS 3, использующую ускоритель оптического потока Optical Flow Accelerator, улучшенный в архитектуре Ada Lovelace. DLSS 3 использует как масштабирование разрешения из DLSS 2, так и удвоение частоты кадров при помощи вставки промежуточных, используя поле оптического потока. Данные из него комбинируются с векторами движения, и искусственный интеллект при помощи тензорных ядер генерирует промежуточные кадры, чтобы видеоряд был плавнее. А для того, чтобы задержки при этом не слишком увеличивались, используется известная технология компании Reflex. В результате игрок может получить вдвое больше кадров в секунду при визуальном качестве, сравнимом с DLSS 2.

Конкретная протестированная нами карта Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) — это опять-таки очень производительное решение для энтузиастов, желающих играть как минимум в 4K при максимальных настройках графики, причем без компромиссов. Однако следует помнить, что карта имеет длину более 30 см и толщину в 4 слота, что надо учитывать при планировании апгрейда своего ПК. В комплекте поставки есть поддерживающий штатив с опорой на дно корпуса, поэтому за прогибание карты в системном блоке можно не волноваться (к тому же жесткая рама в конструкции самой карты помогает ей не провисать даже без опоры). Карта, точнее именно вариант GameRock Classic, точь-в-точь похожа на свою сестру на базе GeForce RTX 3090 Ti (в продаже будут и GeForce RTX 4070 Ti серии GameRock, имеющие более новые СО, которые мы видели у новых решений Palit на базе GeForce RTX 4080 и GeForce RTX 4090). Система охлаждения сравнительно тихая в обоих режимах BIOS. Карта может потреблять до 293 Вт (ручной разгон способен преодолеть планку в 300 Вт), она требует использовать два 8-контактных разъема питания (которые подключаются к прилагаемому переходнику на 16-контактный разъем на самой плате), так что наличие приличного БП обязательно! Особо отметим, что такой переходник питания ни в коем случае нельзя изгибать непосредственно после 16-контактного разъема.

Производитель декларирует наличие 3-летней гарантии на эту карту.

Отметим еще раз, что GeForce RTX 4070 Ti отлично подходит для игры в разрешении 4К с максимальным качеством графики с трассировкой лучей с поддержкой DLSS/FSR/XeSS. Также отметим поддержку стандарта HDMI 2.1, позволяющего выводить 4K-изображение со 120 FPS или 8K-разрешение при помощи одного кабеля, поддержку аппаратного декодирования видеоданных в формате AV1, технологию RTX IO, способную обеспечить быструю передачу и распаковку данных с накопителей прямо в GPU, а также технологию снижения задержек Reflex, полезную для киберспортсменов. Разумеется, выход RTX 40 означает начало распространения DLSS 3, но об этой технологии мы поговорим отдельно, когда в свет выйдут соответствующие патчи для популярных и используемых нами игр, а также новые игры с уже реализованной поддержкой DLSS 3.

Справочные материалы:

В номинации «Отличная поставка» карта Palit GeForce RTX 4070 Ti GameRock Classic OC (12 ГБ) получила награду: