Обзор видеоускорителя AMD Radeon RX 6800 XT: компании AMD удается догнать флагманские решения конкурента, но не во всем

Прибытие новинок, визуальное сравнение с картами Nvidia

Особенности архитектуры

С выходом линейки видеокарт Radeon RX 6000 наконец-то настало время, когда компания AMD вернулась в борьбу за сегмент топовых видеокарт. Мы ждали этого уже довольно долго, и хотя Radeon RX 480, RX 580 и RX 590 были (да и до сих пор остаются за свою цену) отличными решениями, но верхние модели линеек Vega 64 и Radeon VII всегда в чем-то уступали конкурентам, да и сложно было их назвать массовыми моделями, производство этих графических процессоров по понятным причинам было довольно ограничено.

Так что, по сути, в самом верху рынка графических процессоров несколько долгих лет безраздельно царствовала Nvidia, и конкуренция в том сегменте была скорее условной. То Vega 64 откусит небольшой кусочек, то Radeon VII. И только теперь, с выходом мощных решений семейства Radeon RX 6000, это вполне может измениться. По крайней мере, все предпосылки для этого есть, ведь AMD анонсировала сразу несколько моделей, среднюю из которых мы рассмотрим сейчас, а старшая выйдет в декабре.

Лучшие графические процессоры AMD из предыдущего поколения, в виде Radeon RX 5700 (XT), были весьма неплохи по соотношению цены и производительности, но серьезно отставали от соответствующих видеокарт Nvidia как по возможностям, не имея аппаратной поддержки трассировки лучей и других фич DirectX 12 Ultimate, так и по энергоэффективности. Ну и топовых решений архитектуры RDNA первого поколения так и не появилось, так как именно низкая энергоэффективность и не позволила создать мощный GPU с вменяемым потреблением.

Так что абсолютно очевидно, что основными задачами AMD за прошедшие с анонса RDNA 1 месяцы являлось значительное улучшение энергоэффективности в RDNA 2 при одновременном добавлении всех недостающих возможностей, появившихся в графических API. И они действительно пообещали улучшить энергоэффективность сразу на 50%, а также мы ожидали добавления поддержки DX12 Ultimate, главной из возможностей которой является аппаратная трассировка лучей, применяемая даже уже и в новых консолях (эти чипы также спроектировали в AMD, но это уже другая история). Сегодня мы подробно поговорим о том, чего и как достигли специалисты AMD в погоне за явно вырвавшимся вперед конкурентом.

Ведь в последние годы с подачи Nvidia в играх все чаще начал применяться гибридный рендеринг с эффектами, рассчитанными при помощи трассировки лучей, которые выполняют хоть и пока что не самую большую, но довольно важную часть отрисовки сцены, вроде отражений или теней. И делают это с большей реалистичностью, по сравнению с любыми хитрыми хаками растеризации, выдуманными за эти годы. И архитектура RDNA 2 как раз включает полную поддержку DX12 Ultimate, включая трассировку лучей и другие возможности, которые или уже используются или вскоре будут использоваться в будущих играх, включая мультиплатформенные.

Среди других важных особенностей новых решений семейства Radeon RX 6000 отметим внедрение совершенно новой кэш-памяти последнего уровня Infinity Cache объемом в космические 128 МБ (для сравнения, все предыдущие GPU имеют ну пусть по 4 МБ кэш-памяти, не больше), что может во многом поменять подход к разработке приложений, а также пусть и не особенно новую принципиально, но ставшую доступной только теперь возможность доступа системы ко всей видеопамяти при помощи технологии Smart Access Memory, о которой мы подробно поговорим далее. А заодно, AMD заявляет о практически удвоенной производительности новых решений относительно Radeon RX 5700 XT, и это касается как игр, так и профессиональных приложений.

Основой рассматриваемой сегодня модели видеокарты Radeon RX 6800 XT стал графический процессор Navi 21, также известный как Big Navi, основанный на новой архитектуре RDNA второго поколения, которая тесно связана как с RDNA 1, так и с GCN последних поколений. И перед прочтением статьи будет полезно ознакомиться с нашими предыдущими материалами по видеокартам компании AMD:

Графический ускоритель Radeon RX 6800 XT
Кодовое имя чипа	Navi 21
Технология производства	7 нм TSMC
Количество транзисторов	26,8 млрд (у Navi 10 — 10,3 млрд )
Площадь ядра	519,8 мм² (у Navi 10 — 251 мм²)
Архитектура	унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX	DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти	256-битная: 4 независимых 64-битных контроллера памяти с поддержкой GDDR6
Частота графического процессора	до 2250 МГц
Вычислительные блоки	72 (из 80) вычислительных блока CU, состоящих в целом из 4608 (из 5120) ALU для целочисленных расчетов и расчетов с плавающей запятой (поддерживаются форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки трассировки лучей	72 (из 80) блока Ray Accelerator для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования	288 (из 320) блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP)	16 широких блоков ROP на 128 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов	поддержка до шести мониторов, подключенных по интерфейсам HDMI 2.1 и DisplayPort 1.4a

Спецификации референсной видеокарты Radeon RX 6800 XT
Частота ядра (игровая/пиковая)	2015/2250 МГц
Количество универсальных процессоров	4608
Количество текстурных блоков	288
Количество блоков блендинга	128
Эффективная частота памяти	16 ГГц
Тип памяти	GDDR6
Шина памяти	256-бит
Объем памяти	16 ГБ
Пропускная способность памяти	512 ГБ/с
Вычислительная производительность (FP16)	до 41,5 терафлопс
Вычислительная производительность (FP32)	до 20,7 терафлопс
Теоретическая максимальная скорость закраски	288 гигапикселей/с
Теоретическая скорость выборки текстур	648 гигатекселей/с
Шина	PCI Express 4.0
Разъемы	один HDMI 2.1, два DisplayPort 1.4a и один USB Type C
Энергопотребление	до 300 Вт
Дополнительное питание	два 8-контактных разъема
Число слотов, занимаемых в системном корпусе	2,5
Рекомендуемая цена	$649 (59 990 рублей)

Наименование новой модели видеокарты соответствует принятому ранее принципу наименования решений компании — это следующее поколение после Radeon RX 5000, поэтому поменялась первая цифра, и это более высокий уровень производительности, поэтому вторая цифра — 8. Конкретно у модели RX 6800 XT есть как младшая сестра на том же чипе — RX 6800, так и старшая RX 6900 XT на полной версии Big Navi, которая заодно станет и топовой видеокартой AMD, когда выйдет 8 декабря.

Рекомендованная цена для Radeon RX 6800 XT составляет $649, а ценовая рекомендация для российского рынка — 59 990 рублей, что кажется выгодным предложением, но... судя по всему, новинку не минуют проблемы с дефицитом, как из-за повышенного интереса покупателей, так и не слишком больших поставок в розницу. Так что вполне вероятно, что доступность и у Radeon RX 6800 XT будет низкой, а цены останутся высокими как минимум еще какое-то время. Как и у конкурирующей GeForce RTX 3080, впрочем.

К слову о конкуренции. Именно RTX 3080 и представляется прямым конкурентом для новинки, хотя и имеет на несколько тысяч рублей большую цену. Но речь идет о рекомендованных производителями ценах, а что происходит на рынке в реальности, вы и сами наверняка знаете. RTX 3080 если и находятся в продаже, то заметно дороже рекомендованной цены. А RX 6800 XT в продаже пока что и вовсе не замечена. Но мы будем считать их прямыми ценовыми конкурентами, учитывая потенциально чуть более низкую цену видеокарты AMD.

Есть довольно важная разница между Radeon RX 6800 XT и конкурирующей GeForce RTX 3080 — объем видеопамяти. У видеокарты AMD ее 16 ГБ, а у Nvidia только 10 ГБ, что может быть потенциальным недостатком, если рассчитывать на несколько лет вперед. Пока что игры даже в 4K-разрешении при максимальных настройках и с трассировкой лучей не требуют большего объема памяти. Они могут занимать его, но ускорения при увеличении объема от 8-10 до 16 ГБ обычно не наблюдается. Правда, уже вышли консоли нового поколения с большим объемом памяти и быстрыми SSD, и в будущем некоторые мультиплатформенные или портированные с консолей игры могут начать требовать большего, чем 10 ГБ локальной видеопамяти, и по этому параметру новые видеокарты AMD явно имеют некий запас прочности.

Референсный дизайн карты RX 6800 XT выгодно отличается от карт предыдущих поколений, длина печатной платы составляет стандартные 267 мм и карта занимает два с половиной слота в корпусе. Предлагается весьма эффективная система охлаждения с большим радиатором и тремя большими вентиляторами. Новый кулер тише на 6 дБА, по сравнению с решением в Radeon RX 5700 XT. Общее потребление энергии платой ограничено значением в 300 Вт, а для подведения питания используются два стандартных 8-контактных разъема питания, в отличие от конкурента, который представил разъем собственного стандарта.

Стоит добавить немного слов и о нововведениях, связанных с разгоном. В настройках драйвера Radeon Software Adrenalin 2020 Edition есть три профиля работы видеокарты: Quiet, Balanced и Rage — тихий, сбалансированный и авторазгон соответственно. Эти профили автоматически меняют уровни питания и работы вентиляторов для достижения более тихой или быстрой работы GPU. Режим Rage доступен для RX 6800 XT и RX 6900 XT, но не для RX 6800.

Сбалансированный режим используется по умолчанию, а тихий вариант снижает энергопотребление и шум от кулеров (на 6%-9%) при незначительном ухудшении производительности (всего на 1%-2%). Режим разгона Rage повышает лимиты потребления и частоту вращения кулеров, чтобы получить небольшой прирост в скорости — также порядка пары процентов. Ничего особенно это не изменит, но в условиях близости показателей производительности с конкурирующими решениями каждый процент прироста FPS на счету.

Частотные характеристики Radeon RX 6800 XT в соответствующих режимах меняются от менее чем 2000 МГц до 2310 МГц, и разница по возможным частотам достигает 6%, хотя общая производительность чаще всего упирается в потребление, температуру GPU и другие показатели, а достичь подобной рабочей частоты не так уж просто, и графический процессор чаще всего работает на меньшей частоте.

Архитектурные особенности

При производстве графического процессора Big Navi используется уже известный нам техпроцесс 7 нм компании TSMC, который мы знаем по предыдущим решениям AMD. Чип содержит 26,8 миллиарда транзисторов и имеет площадь 519,8 мм² — сравните это с GA102 у Nvidia, для производства которого применяется техпроцесс 8 нм Samsung и который имеет 28,3 млрд транзисторов при площади в 628,4 мм² (все данные о сложности и площади — официальные числа AMD и Nvidia).

То есть при близкой сложности этих GPU техпроцесс TSMC явно выглядит получше по плотности размещения транзисторов, чем 8-нанометровый вариант Samsung, хотя разница между ними оказалась меньше ранее предполагавшейся — ведь техпроцесс Samsung является производным от более старого техпроцесса 10 нм и должен бы отставать сильнее. Тем более, что GA100, производимый на TSMC, получился еще более плотным, чем Big Navi.

Но для производительности важнее то, что по возможности достижения максимальных частот и энергопотреблению 7 нм TSMC также должен быть лучше, и тут явное преимущество у AMD. Другое дело — доступность, выход годных кристаллов, а значит и себестоимость. Для производства таких немаленьких чипов наверняка дешевле обходится продукция завода Samsung, не зря же Nvidia выбрала его для массовой продукции, хотя их большой вычислительный чип GA100 также использует производственные мощности TSMC.

Графический процессор Navi 21 (Big Navi) основан на архитектуре RDNA второго поколения (далее — RDNA 2), основной задачей при разработке которой было достижение максимально возможной энергоэффективности и внедрение всех необходимых функциональных возможностей. Базовые блоки чипа — все те же вычислительные блоки Compute Unit (CU), из которых собраны все графические процессоры AMD последних лет. Каждый CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память и полноценный текстурный конвейер с блоками выборки и фильтрации. Каждый из таких блоков самостоятельно занимается планированием и распределением работы.

Как видите, архитектура RDNA 2 очень похожа на RDNA 1, хотя она и была серьезно переделана и обновлена. Полная версия Navi 21 содержит 80 вычислительных блоков CU (ровно вдвое больше, чем у Navi 10), которые состоят из 5120 блоков ALU, 320 блоков TMU, 128 блоков ROP и четырех асинхронных вычислительных движков. В версии Radeon RX 6800 XT их чуть меньше — отключены 8 блоков CU, поэтому осталось 4608 ALU и 288 TMU, а вот по ROP урезаний нет.

В общем, новый графический процессор Big Navi выглядит как удвоенный практически по всем блокам чип Navi 10, известный нам по Radeon RX 5700 (XT), так что подробности об особенностях вычислительных блоков RDNA (и 1 и 2) вы можете прочитать в соответствующем обзоре, а сегодня мы будем говорить об отличиях, вроде новых блоков для поддержки трассировки лучей и прочего.

Итак, важнейшей задачей компании, кроме добавления функциональности DX12 Ultimate, стало повышение энергоэффективности RDNA 2. Ведь если Radeon RX 5700 XT уже потребляет до 225 Вт, то вдвое более жирный GPU явно не впихнуть в рамки 300—350 Вт. Для улучшения энергоэффективности специалисты AMD переделали все блоки, перебалансировали конвейер, нашли и устранили все узкие места, переделали линии передачи данных, обработку геометрии внутри чипа, а также использовали опыт проектирования CPU с высокой рабочей частотой и в результате всей этой кропотливой работы получили действительно потрясающие результаты.

Новинка AMD до двух раз быстрее Radeon RX 5700 XT в 4K-разрешении, имеет на 30% бо́льшую тактовую частоту при том же потреблении энергии на каждый блок CU, что дает нам даже более чем обещанные +50% улучшения энергоэффективности — реальный прирост в определенных условиях составил, по оценке компании, 54%, что весьма неплохо и даже немного неожиданно после не слишком то энергоэффективной RDNA 1. Мы далее проверим эти данные, но за физическую реализацию GPU уже в любом случае можно похвалить AMD — проведена отличная работа!

Что касается более высокого уровня, то в вычислительных блоках RDNA 2 явно просматриваются корни предыдущей версии архитектуры, и улучшены они были скорее в смысле физической реализации, чем логической, которая слабо изменилась с первой версии RDNA. Хотя новые функциональные блоки для ускорения трассировки лучей и новый уровень кэша Infinity Cache также стали довольно важными изменениями.

О новом кэше и реализации блоков трассировки мы еще поговорим ниже, а из других отмеченных нами изменений — переделка блоков ROP. Каждый укрупненный блок ROP теперь обрабатывает по восемь 32-битных пикселей за такт, что вдвое больше того, что было раньше — вполне возможно, что это потребовалось из-за увеличения эффективной пропускной способности из-за большого кэша Infinity Cache. Добавили также и возможность использования переменной частоты затенения VRS, что стало дополнительной причиной переделки ROP, по всей вероятности.

Поддержка аппаратной трассировки лучей

Для аппаратного ускорения трассировки лучей, которая уже получила поддержку в играх, в RDNA 2 пришлось внедрять специализированные блоки Ray Accelerator. Хотя трассировку можно делать и полностью в шейдерах, но это очень сложная задача и без очень быстрой аппаратной обработки хотя бы части вычислений, общая скорость будет слишком низкой. На аппаратные блоки можно перенести хоть всю работу по трассировке лучей, но это будет дорого с точки зрения расходуемой площади чипа, и не всегда эффективно. Чаще всего лишь часть работы при трассировке лучей отдается специализированным блокам, но объем этой работы может быть разным в каждой конкретной реализации.

В случае RDNA 2 аппаратные ускорители трассировки занимаются поиском пересечений лучей и геометрии, и каждый из этих блоков способен за такт вычислить до четырех пересечений луча и ограничивающих объемов или одно пересечение луча и треугольника. Эти блоки достаточно эффективно вычисляют пересечения лучей и геометрии сцены, представленной в виде ускоряющих структур Bounding Volume Hierarchy, о которых мы вам неоднократно рассказывали в обзорах видеокарт GeForce RTX, и возвращают информацию шейдерам для дальнейшего обхода сцены или шейдинга.

Такой подход позволяет ускорить обработку пересечений лучей и геометрии в разы (AMD заявляет о более чем 10-кратной разнице), по сравнению с полностью программным методом, но это уступает решению Nvidia, в котором несколько бо́льшая часть работы делается в специализированных MIMD-блоках, а не обычными шейдерными SIMD, как в случае Radeon. То есть Ray Accelerators в RDNA 2 хоть и аппаратно выделенные блоки, но они несколько проще RT-ядер в графических процессорах семейств Ampere и Turing у конкурента. Зато такие упрощенные блоки занимают меньше места в GPU, хотя и должны несколько медленнее справляться с работой, особенно в случае большого количества некогерентных лучей. Ведь отдельные MIMD-ядра для трассировки подходят для этого куда лучше.

Трассировка лучей работает на RDNA 2, используя шейдерные SIMD-ядра, и хотя это не блокирует параллельное исполнение других вычислений, но свободных мощностей под операции затенения пикселей и другие задачи остается меньше. Та же трассировка лучей пока что использует малое количество лучей на пиксель и поэтому требует активного шумоподавления, а такие постфильтры весьма ресурсоемки и требуют немалых вычислительных мощностей.

Если подводить некий теоретический итог, то можно сказать, что RT-ядра у Nvidia сложнее и универсальнее (не требуют предварительной сортировки лучей для эффективной обработки, например), а у AMD они выполнены практичнее на сегодняшний день, так как занимают в GPU меньше места, что особенно важно с учетом ограниченности применения трассировки лучей на консолях и в будущих мультиплатформенных играх. Также, в AMD наверняка будут проводить работу с разработчиками игр для оптимизации трассировки под их решения, и хорошо бы это не вылилось в упрощение эффектов, в которых применяется трассировка.

К слову, большой кэш Infinity Cache способен вместить большую часть ускоряющей структуры BVH, что в теории должно позволить выполнять сложную трассировку более эффективно, с меньшими задержками при получении данных. Даже несмотря на то, что в играх BVH-структуры занимают от полугигабайта до нескольких гигабайт видеопамяти, не обязательно весь BVH помещать в кэш, и даже если ускорить доступ лишь к наиболее часто требуемым данным этой ускоряющей структуры, то быстрый кэш все равно должен помогать.

Мы проверим все это далее в синтетических и игровых тестах, а пока что посмотрите на данные самой AMD для рассматриваемой сегодня модели Radeon RX 6800 XT в нескольких играх с эффектами, выполненными с трассировкой лучей при разрешении рендеринга в 2560×1440 пикселей. Судя по этим результатам, получается, что Radeon RX 6800 XT вполне справляется с обеспечением комфортной игры при средней частоте кадров более 60 FPS при гибридном рендеринге. При этом настройки качества выбраны максимальные, хотя в представленных играх трассировка используется для одного из эффектов, а не сразу нескольких. То есть в других проектах мощи Big Navi может и не хватить.

Полная поддержка DirectX 12 Ultimate

Продолжая тему новых возможностей, отметим, что в Radeon RX 6000 появилась полная поддержка DirectX 12 Ultimate — нового стандарта качественной графики для ПК и консолей нового поколения, включающей уже упомянутую трассировку лучей через DirectX Raytracing, увеличение производительности при помощи переменной частоты затенения Variable Rate Shading, более эффективной поддержки стриминга текстур при помощи Sampler Feedback, а также возможности создания более детализированных игровых миров с новым геометрическим конвейером Mesh Shaders. Также ожидается поддержка и DirectStorage API для быстрого и прямого доступа GPU к данным на накопителях, но это будет позже.

Так уж получилось, что обо всех новых возможностях DirectX 12 Ultimate мы уже подробно рассказывали ранее в своих статьях о решениях Nvidia, и не видим смысла повторяться — кто заинтересуется, тот легко найдет наши объяснения того, как все это работает. Но вкратце все же расскажем. Например, еще одной интересной технологией, поддержку которой получила архитектура RDNA 2, стала переменная частота затенения Variable Rate Shading, которая уже поддерживается конкурирующими решениями с поколения Turing.

Эта возможность позволяет использовать отличающееся качество затенения для разных фрагментов изображения — там, где изображение не обязательно должно быть четким (например, применяется motion blur или эффект глубины резкости) вполне можно снизить качество расчетов шейдинга без видимых потерь, и наоборот — в важных местах оставить нормальное затенение с максимальным качеством и четкостью.

VRS в варианте AMD предполагает возможность выбора переменных частот затенения: 1×1, 2×1 и 1×2, а также 2×2 — отдельно для каждого из блоков 8×8 пикселей. Это позволяет достаточно подробно определить, какие участки кадра будут отрисовываться с меньшим качеством и большей производительностью. То есть затенение указанных участков производится с вдвое или вчетверо сниженным качеством, но повышенной скоростью. Проще всего визуализировать работу этого алгоритма на примере гоночных игр с эффектом motion blur на периферии кадра, но VRS можно использовать и иначе:

Красным на скриншоте показаны фрагменты с полным затенением, желтым — с половинным, а зеленым — с вчетверо меньшим качеством. Эта возможность уже используется в некоторых играх, включая совсем свежий проект Dirt 5, и это позволяет повысить производительность при шейдинге в теории до четырех раз для каждого из блоков 8×8 пикселей, но в целом для игрового кадра это будет несколько процентов снижения времени рендеринга кадра, и все это при незаметной для глаза потере в качестве.

Раз уж мы заговорили об аппаратно-программных особенностях, появившихся в RDNA 2, то отметим и пакет технологий с открытым кодом AMD FidelityFX, входящий в инициативу GPUOpen. Он помогает разработчикам игр внедрять хорошо оптимизированные эффекты в игры, для обеспечения отличного баланса качества и производительности. Первым таким эффектом стал фильтр улучшения четкости Contrast Adaptive Sharpening (CAS), полезный для игр, использующих сглаживание методом TAA, теряющим детали, а в текущем году были добавлены в пакет еще четыре эффекта: Ambient Occlusion, Screen Space Reflections, HDR Mapper и Downsampler (для ускорения генерации мип-уровней текстур шейдерами).

На видеокартах серии Radeon RX 6000 для расчета некоторых из них может применяться и трассировка лучей, а в качестве запасной опции всегда можно применить отражения в экранном пространстве или привычный расчет Ambient Occlusion, работающий также в экранном пространстве. С появлением на рынке решений нового семейства, добавляются еще два новых эффекта: Variable Shading и Denoiser, они используют новые возможности архитектуры RDNA 2 и помогают оптимизировать производительность и качество картинки.

Эти эффекты уже добавлены в такие игры, как Dirt 5 и The Riftbreaker, и скоро появятся на GPUOpen. Про Variable Shading мы уже писали, а шумоподавление при помощи Denoiser очень важно для гибридного рендеринга с трассировкой лучей, так как из-за большой ресурсоемкости используется малое количество лучей на пиксель, что вызывает очень шумную картинку, которую нужно серьезно улучшать.

Эффекты AMD FidelityFX уже используются в 35 играх, а самые новые или появились или вот-вот появятся в выходящих проектах, включая трассировку лучей и VRS в пяти играх. Также в будущем планируется добавить FidelityFX Super Resolution — вероятно, некий аналог Nvidia DLSS, особых подробностей о реализации которого пока что мало что известно. Технология важна уже потому, что многие игры последних лет в любом случае используют тот или иной метод повышения производительности в высоких разрешениях, включая временную реконструкцию, шахматный рендеринг, динамическое изменение разрешения рендеринга и т. д. Иногда это вызывает визуальные артефакты и точно увеличивает сложность внедрения подобных алгоритмов.

Для решения таких проблем и разрабатывается технология Super Resolution, которая точно будет использовать информацию из нескольких предыдущих кадров, аналогично DLSS, но как именно затем будет перестраиваться изображение в более высоком разрешении — мы пока что не знаем. Возможно, AMD применит открытый стандарт DirectML для работы умной нейросети, но им будет непросто обеспечить требуемую производительность без выделенных ядер, исполняющих тензорные вычисления, как у Nvidia. Ведь если на универсальные SIMD-ядра будут покушаться традиционные задачи растеризации и вычислений, к ним прибавятся вычисления, связанные с трассировкой лучей и повышением разрешения Super Resolution, то этих самых ресурсов может и не хватить.

Новая подсистема кэширования — Infinity Cache

Пожалуй, самой интересной особенностью семейства Radeon RX 6000 стал абсолютно новый уровень кэша, находящийся перед видеопамятью, позволяющий обеспечить быстрый доступ к данным и увеличивающий эффективную пропускную способность. В остальном все более-менее так же, как и у других GPU, L0-кэш расположен в каждом блоке CU, L1-кэш размещен в каждом движке шейдинга Shader Engine, и имеет эксклюзивный доступ к L2-кэшу, общий объем составляет 1 МБ, а L2-кэш объемом в 4 МБ, который расположен между движками Shader Engine и командным процессором.

На схеме сразу же выделяется очень большой Infinity Cache объемом в 128 МБ, который присоединяется к четырем 64-битным контроллерам памяти. Это новый тип кэш-памяти, которого ранее не было в GPU. Давайте разберемся, зачем он нужен и почему появился именно сейчас. Инженеры AMD стояли перед задачей обеспечения высокой пропускной способности, ведь в графическом процессоре Big Navi было удвоено число потоковых вычислительных блоков CU при увеличенной на треть частоте, по сравнению с Radeon RX 5700 XT, а пропускную способность видеопамяти так сильно повысить непросто.

Как прокормить все эти блоки данными? Нужно или расширять шину памяти до 512-битной или хотя бы 384-битной шины с одновременным увеличением частоты работы памяти. Но возможности GDDR6 почти полностью исчерпаны, у AMD нет доступа к более производительному типу памяти GDDR6X, который был разработан Micron и Nvidia, как минимум пока что, а HBM2 слишком дорога и ее применение вряд ли будет оправдано с экономической точки зрения.

В целом, повысить ширину шины памяти было вполне возможно, но не так просто с учетом более тонкого техпроцесса и меньшей площади чипа, но самое главное — при этом был бы сильный рост потребления энергии, и добиться заявленного прироста в энергоэффективности у инженеров бы просто не получилось. Поэтому в AMD и решили сделать еще один уровень кэш-памяти — последний уровень, стоящий прямо перед видеопамятью.

Кэширование решает вопрос пропускной способности, но это всегда компромисс, и обычно L2-кэши в GPU имеют небольшой объем в 2-4 МБ — в таком случае будет много промахов при доступе к данным, большинство их придется доставать из медленной видеопамяти, и только увеличение кэша до 64 МБ и более способно помочь в деле достаточного повышения эффективной ПСП. Но внедрение статической памяти такого объема обойдется слишком дорого в смысле занимаемой типичной кэш-памятью площади на кристалле.

Помогло то, что у AMD уже есть опыт по размещению большого объема статической памяти в серверных процессорах EPYC, в которых 32 МБ L3-кэша упакованы в 27 мм² — а это вчетверо больший объем на единицу площади, по сравнению с типичным кэшем второго уровня в GPU. Соответственно, AMD использовали разработки другого подразделения и разместили в Big Navi оптимизированный для нужд GPU кэш объемом аж в 128 МБ.

Передача данных происходит по 16 каналам шириной 64-бит (всего 1024-бит) на частоте до 1,94 ГГц, что дает почти вчетверо большую ПСП, чем у типичной GDDR6, присоединенной по 256-битной шине. В результате получили более чем вдвое большую эффективную ПСП, по сравнению с 384-битной шиной, и при этом улучшили энергоэффективность, ведь доступ к кэш-памяти требует в 5-6 меньших затрат энергии. В общем, по оценкам AMD получилась более чем вдвое лучшая энергоэффективность для 4К-разрешения в типичных играх, по сравнению с обычной 384-битной шиной.

Подобная подсистема памяти потребляет где-то на 10% меньше энергии при более чем вдвое большей эффективной ПСП. Внедрение подобного быстрого и объемного кэша не только позволило решить проблемы с ПСП, но и привело к раскрытию потенциала высокопроизводительных GPU — с ростом частоты работы графического процессора толк от Infinity Cache лишь увеличивается. Большинство необходимых данных при рендеринге достается из кэша, имеющего более высокую ПСП, что обеспечивает в среднем на треть меньшие задержки, по сравнению с доступом к GDDR6.

Также интересно то, что частота Infinity Cache изменяется в зависимости от потребности приложения в каждый момент времени. Когда оно требовательно к ПСП, частота работы кэша может расти, аналогично частоте GPU. В общем, подобная инновационная подсистема памяти приводит как к повышению пропускной способности и снижению задержек, так и одновременному снижению потребления энергии, что весьма важно для мощных GPU.

Внедрение Infinity Cache полезно для эффектов, требующих высокой частоты заполнения, вроде объемного освещения — вполне возможно, что таких эффектов в играх будущего станет больше, по крайней мере в играх с поддержкой AMD. Но сразу же возникает вопрос — а можно ли управлять этим большим кэшем? Например, жестко закрепить какие-то данные в определенном его участке, чтобы доступ к ним всегда был быстрым. AMD пока что подобных возможностей открывать не планирует, хотя видеодрайвер, конечно же, может управлять кэшем в целях оптимизации.

Для разработчиков приложений же этот кэш полностью прозрачный и автоматический, а управление им возможно разве что как в CPU — при помощи префетчей и т. д., что дает меньше контроля, но более универсальное. Ведь существуют GPU вообще без кэша, вышли с 128 МБ, а в будущем может появятся и с другим объемом — писать для всех отдельный код не кажется правильным решением, это же не консоли с фиксированной конфигурацией. Но AMD не отвергает возможности появления некоего контроля над кэшем для разработчиков ПО в будущем.

Начало ли это внедрения кэш-памяти последнего уровня во многие GPU, или просто костыль для нивелирования меньшей ПСП при 256-битной шине и GDDR6-памяти? Пойдет ли индустрия в эту сторону, будет ли Infinity Cache развиваться самой AMD, появится ли аналог в будущих решениях Nvidia? И что было бы лучше, потратить большую площадь GPU на подобный кэш или на большее количество функциональных блоков разного назначения (например, более сложные RT-ядра или тензорные ядра) и более производительную память? Увы, ответы на все эти вопросы мы пока не знаем. Любой кэш — это компромисс, всегда ведь лучше иметь доступ максимально быстрый и с минимальными задержками сразу ко всем данным. Но это невозможно, поэтому и приходится делать кэши из нескольких уровней. CPU прошли по этому пути, идут и GPU.

Smart Access Memory — улучшенный доступ к памяти

Еще одной из интересных новых возможностей стала технология Smart Access Memory — она позволяет системе получить полный доступ к видеопамяти по шине PCI Express. Ранее давался доступ лишь к куску 256 МБ видеопамяти, чего явно недостаточно для современных условий, а SAM позволяет расширить этот кусок до полного объема видеопамяти Radeon RX 6000 — до 16 ГБ. В некоторых играх это дает очень приличный прирост производительности, но в среднем это примерно 3%-5%.

Возможность изменения объема видеопамяти, к которой получает доступ система, существует в стандарте PCI Express уже давно. Она называется «Resizable BAR» (изменяемый Base Address Register) и доступна в драйверной модели WDDM 2 много лет, так что не очень понятно, почему AMD решили вытащить ее именно сейчас и так жестко ограничить возможность ее включения исключительно своей платформой, предоставив ее только редким владельцам процессоров Zen 3.

AMD говорит, что хотя Resizable BAR действительно доступна для широкого круга решений, но на данный момент они сосредоточились на оптимизации и проверке работы их собственного программного и аппаратного обеспечения из конкретного списка — только видеокарты Radeon RX 6000, процессоры серии Ryzen 5000 и чипсеты 500-й серии, а также требуется обновление BIOS с AGESA 1.1.0.0 и свежий видеодрайвер версии 20.11.2 или новее.

Технология Smart Access Memory включается из настроек BIOS при помощи опции вроде «Re-Size BAR Support», также нужно сначала включить опцию «Above 4G Decoding» в разделе «PCIe Subsystem». Все системные платы на основе чипсета X570 должны получить соответствующее обновление BIOS не позднее 18 ноября. И на данный момент нет планов для реализации поддержки SAM для предыдущих платформ AMD, и это можно понять. Но также важно понимать то, что технических ограничений нет, и AMD это подтверждает.

Итак, возможность не новая, но она требует поддержки в BIOS системных плат. Она должна включаться в настройках UEFI (Unified Extensible Firmware Interface) с отключенным режимом CSM (Compatibility Support Module), предназначенным для поддержки старого аппаратного обеспечения в UEFI. И тут есть очень важное уточнение — для работы SAM, операционная система должна быть установлена именно в режиме UEFI, а CSM должен был быть отключен изначально, но многие производители систем и материнских плат не включают UEFI по умолчанию. И есть ненулевая вероятность того, что ваша ОС была установлена в режиме совместимости — в таком случае отключение CSM и включение SAM приведет к ее неработоспособности.

Но что же она дает на практике? Приросты от включения Smart Access Memory зависят от игры, нагрузки на память, от разрешения рендеринга, настроек качества изображения, и могут быть разными для различных моделей видеокарт. В среднем, по данным компании AMD, прирост может быть от 0%-3% в таких играх, как Battlefield V, F1 2020, Shadow of the Tomb Raider и Wolfenstein: Youngblood, до очень приличных 10%-15% в Forza Horizon 4, Borderlands 3 и Resident Evil 3.

Но это по данным AMD, которые мы еще проверим далее. Важно понимать, что SAM не работает эффективно во всех случаях, в некоторых играх может даже наблюдаться некоторое падение производительности — особенно в случаях, когда производительность ограничена возможностями CPU. Вполне вероятно, что центральный процессор тратит время и на дополнительную обработку данных. В итоге, есть игры, в которых SAM ничего не дает вообще, а в некоторых, вроде Forza Horizon 4 или Gears 5, технология обеспечивает ощутимое преимущество.

Интересно, что наибольшие приросты от включения SAM наблюдаются в портированных с консолей играх. Это лишь наше предположение, но вполне возможно, что это означает то, что такой рендерер просто не слишком хорошо оптимизирован под ПК, недостаточно переделан с точки зрения доступа к оперативной и видеопамяти, ведь в консолях она общая. На игровых приставках можно делать многие вещи в унифицированной памяти, что противопоказано на ПК из-за медлительности доступа CPU к видеопамяти через шину PCI Express с явно меньшей пропускной способностью, по сравнению с ПСП любой памяти. И в случае недостаточно хорошо портированных на ПК проектов, можно вылезти за пределы 256 МБ куска, выделенного по умолчанию при стандартном BAR. До недавнего времени проектов, упирающихся в задержки доступа по PCI Express, просто не было, но они начали появляться, и именно в виде портированных с консолей игр, выходящих при поддержке AMD. Совпадение?

Мы не знаем точно, но становится не так удивительно, что раньше этой возможностью никто особо не пользовался, хотя Nvidia заявляет, что они исследовали ее и ранее, получая очень небольшое преимущество — возможно, поэтому и не стали продолжать. Главный же вопрос к AMD — почему SAM можно включить только на последнем поколении Ryzen? Они говорят, что максимум производительности обеспечивает лишь PCI-E 4.0, но ведь такая поддержка есть и у предыдущих процессоров Ryzen 3000, так почему на них нельзя включить эту возможность? В общем, эти ограничения кажутся надуманными и искусственными.

Будет очень интересно посмотреть на более универсальное решение Nvidia — как оно заработает на «старых» PCI-E 3.0 платформах и новых процессорах Intel с поддержкой четвертой версии PCI-E, которые выйдут в следующем году. Говорят, что решение Nvidia не будет зависеть от производителей системных плат и не будет требовать обновления их BIOS, а будет включаться у всех поддерживаемых GPU только для тех игр, которые получают преимущество от этой возможности. То есть достаточно будет обновить драйвер, и всё. Они давно работали над этой возможностью, и она даже работает в некоторых рабочих станциях, основанных на решениях Nvidia, а также серверах GeForce Now, но так как приросты небольшие и сильно зависят от условий, то не особенно развивали ее для игровых GPU. Но теперь Nvidia явно получила мотивацию для внедрения собственного решения, которое ожидается в начале следующего года или в конце этого. Ну а мы в практической части статьи проверим приросты от включения варианта AMD.

Вывод изображения и обработка видеоданных

Решения нового семейства Radeon RX 6000 поддерживают все популярные кодеки: H.264 (кодирование до 4K при 90 FPS и декодирование 4K до 150 FPS), H.265 (кодирование до 4K при 60 FPS и декодирование 4K до 90 FPS и 8K до 24 FPS), VP9 (только декодирование 4K при 90 FPS и 8K при 24 FPS) и AV1 (только декодирование до 8K при 30 FPS). Из нового тут отметим поддержку набирающего популярность формата AV1, аналогичные возможности по декодированию которого появились и у Nvidia, а значит, распространение видеоформата лишь расширится.

Для вывода изображения на экраны Radeon RX 6800 XT поддерживает долгожданный формат HDMI 2.1, позволяющий выводить изображение в разрешении 8K с частотой в 60 Гц или 4K с частотой 144 Гц по одному кабелю. Также поддерживается технология FreeSync и переменная частота кадров HDMI VRR. Вместо одного из DisplayPort разъемов на карту установлен разъем USB Type C с поддержкой подключения шлемов виртуальной реальности по одному проводу, но его также можно использовать и для подключения четвертого монитора.

Мы это проверили в практической части обзора, возможность отлично работает. В общем, со всеми теоретическими данными и потенциальными возможностями новых видеокарт компании AMD мы познакомились, самое время посмотреть на них вживую.

Особенности видеокарты AMD Radeon RX 6800 XT

Сведения о производителе: Компания ATI Technologies (торговая марка ATI) основана в 1985 году в Канаде как Array Technology Inc. В том же году была переименована в ATI Technologies. Штаб-квартира в г. Маркхам (Торонто). C 1987 года компания сконцентрировалась на выпуске графических решений для ПК. Начиная с 2000 года основным брендом графических решений ATI становится Radeon, под которым выпускаются GPU как для настольных ПК, так и для ноутбуков. В 2006 году компанию ATI Technologies покупает компания AMD, в которой образуется подразделение AMD Graphics Products Group (AMD GPG). C 2010 года AMD отказывается от бренда ATI, оставив лишь Radeon. Штаб-квартира AMD в Саннивейл (Калифорния), а у AMD GPG остается главным офисом бывший офис AMD в Маркхаме (Канада). Своего производства нет. Общая численность сотрудников AMD GPG (включая региональные офисы) — около 2000 человек .

Установка в тестовый стенд. Тестирование проводилось в закрытом продуваемом корпусе

Объект исследования: ускоритель трехмерной графики (видеокарта) AMD Radeon RX 6800 XT 16 ГБ 256-битной GDDR6

Характеристики карты

AMD Radeon RX 6800 XT 16 ГБ 256-битной GDDR6
GPU	Radeon RX 6800 XT (Navi 21)
Интерфейс	PCI Express x16 4.0
Частота работы GPU (ROPs), МГц	2015—2250(Boost)—2401(Max)
Частота работы памяти (физическая (эффективная)), МГц	4000 (16000)
Ширина шины обмена с памятью, бит	256
Число вычислительных блоков в GPU	72
Число операций (ALU) в блоке	64
Суммарное количество блоков ALU	4608
Число блоков текстурирования (BLF/TLF/ANIS)	288
Число блоков растеризации (ROP)	128
Число блоков Ray Tracing	выделенных нет
Число тензорных блоков	—
Размеры, мм	270×110×55
Количество слотов в системном блоке, занимаемые видеокартой	3
Цвет текстолита	черный
Энергопотребление пиковое в 3D, Вт	269 (с разовыми всплесками до 360)
Энергопотребление в режиме 2D, Вт	25
Энергопотребление в режиме «сна», Вт	4
Уровень шума в 3D (максимальная нагрузка), дБА	31,7
Уровень шума в 2D (просмотр видео), дБА	18,0
Уровень шума в 2D (в простое), дБА	18,0
Видеовыходы	1×HDMI 2.1, 2×DisplayPort 1.4a, 1×USB Type-C (USB 3.2 Gen2)
Поддержка многопроцессорной работы	нет данных
Максимальное количество приемников/мониторов для одновременного вывода изображения	4 (включая вывод через USB Type-C)
Питание: 8-контактные разъемы	2
Питание: 6-контактные разъемы	0
Максимальное разрешение/частота, Display Port	7680×4320@60 Гц
Максимальное разрешение/частота, HDMI	7680×4320@60 Гц
Ожидаемая розничная стоимость карты	70 тысяч рублей (поскольку рекомендованная AMD стоимость — 59 990 рублей)

Память

Карта имеет 16 ГБ памяти GDDR6 SDRAM, размещенной в 8 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Samsung (GDDR6, K4Z80325BC-HC16) рассчитаны на условную номинальную частоту работы в 4000 (16000) МГц.

Особенности карты и сравнение с AMD Radeon VII

AMD Radeon RX 6800 XT 16 ГБ	AMD Radeon VII 16 ГБ
вид спереди

вид сзади

Прежде всего: почему мы сравниваем с Radeon VII? Несмотря на то, что у этих карт принципиально разные подходы по организации локальной видеопамяти (Radeon VII имеет встроенную в единую упаковку с GPU память типа HBM2, когда как у Radeon RX 6800 XT — внешняя GDDR6-память), формально Radeon RX 6000 все же являются преемниками прошлого флагмана Radeon VII. Ну и еще есть сходство в техпроцессах кристаллов GPU. Хотя мы все понимаем, что сравнение очень условное, карты совершенно разные.

Впервые компания AMD использует столь емкие микросхемы памяти в 16 Гбит. Поэтому удалось разместить всю память на лицевой стороне платы, что позволило упростить систему охлаждения с оборотной стороны.

Суммарное количество фаз питания у Radeon VII — 12, а у RX 6800 XT — 15.

Зеленым цветом отмечена схема питания ядра, красным — памяти. Посмотрим, кто за что отвечает. В принципе, все просто: AMD использует весьма дорогой 16-фазный ШИМ-контроллер XDPE132G5D (Infineon), который управляет 12 фазами питания GPU (сам контроллер расположен на оборотной стороне PCB). Имеется место под еще одну фазу, то есть PCB изначально рассчитана на 13 фаз для GPU (суммарно — 16). Вероятно, полностью все фазы используются в RX 6900 XT.

Также на оборотной стороны платы расположен и ШИМ-контроллер IR35217 (International Rectifier, которая сейчас также входит в состав Infineon). Он управляет тремя фазами питания микросхем памяти.

Синим цветом отмечен контроллер CYPD5137 (Cypress Semiconductor), он отвечает за USB-разъем, через который организован вывод изображения.

В преобразователе питания, традиционно для всех современных видеокарт, используются транзисторные сборки DrMOS — в данном случае TDA21472 (все того же IR/Infineon).

Сама печатная плата очень сложная, имеет 14 слоев, включая 4 медных слоя.

Карта имеет два обычных 8-контактных разъема питания. А вот по видеовыходам есть новшество. Мы уже отмечали, что у платы привычное количество видеовыходов: 4. Однако вместо привычных 3 DP мы видим всего 2, а один из них заменен на USB Type-C. Благодаря вышеупомянутому контроллеру Cypress этот разъем можно использовать как USB 3.2 Gen2, однако основное его предназначение — универсальный вывод изображения на приемники разного формата: от шлемов VR до мониторов/телевизоров с подобными входами. Также к нему через переходники/разветвители с USB Type-C на HDMI или на DP можно легко подключить мониторы или телевизоры с привычными входами. Например, мне удалось подключить к данной видеокарте телевизор через разъем USB Type-C и переходник-разветвитель на HDMI.

По умолчанию в 4К включается частота вертикальной развертки 30 Гц, надо зайти в настройки Windows 10 и поменять частоту на 60 Гц. Правда, HDR при таком выводе будет недоступен.

Что касается размеров карты Radeon RX 6800 XT, то они стандартные для видеокарт последнего десятилетия: 270×110×40 мм, что наглядно показано в начальном видеоролике. Там же есть и визуальное сравнение Radeon RX 6800 XT с конкурентом в лице GeForce RTX 3080. На фото ниже можно увидеть, что карта Nvidia имеет двухслотовое исполнение, в отличие от трехслотового Radeon RX 6800 XT, но при этом GeForce RTX 3080 FE ниже и длиннее.

Впрочем, эти любопытные факты вряд ли будут иметь какое-то значение в реальности, ведь GeForce RTX 3080 FE в продаже не найти, а референс-карты Radeon RX 6800 XT будут присутствовать в продаже (разумеется, под маркой Gigabyte, Asus, MSI, Sapphire и так далее) лишь первые полтора месяца, а затем (как заведено у AMD) производство референс-карт будет свернуто, и в продаже останутся только карты партнеров AMD с собственным дизайном.

Вот за что надо похвалить AMD, так это за потрясающую панель управления в драйверах. Во-первых, в отличие от драйверов конкурента, здесь есть вкладка с доступом к частотам и иным параметрам, позволяющим осуществлять разгон — не надо даже задумываться о сторонних утилитах для этих целей. Во-вторых, есть предустановки, позволяющие не ломать голову над тонкими настройками того же разгона. В-третьих, есть мониторинг состояния карты, что всегда полезно. Да, у Nvidia есть отдельная утилита GeForce Experience для задания настроек в играх, однако такой информации в ней нет.

Нагрев и охлаждение

Система охлаждения построена по классической схеме без новшеств типа сквозной продувки через карту, как придумала Nvidia. Но при этом в кулере нет тепловых трубок, так как любимая тема AMD — использование испарительных камер в СО. В данном случае применяется одна очень большая испарительная камера — узкая запаянная емкость с легкоиспаряющейся жидкостью внутри, одной стенкой прижатая к нагревающимся элементам, а второй припаянная к радиатору. В общем, очень схоже с принципом тепловых трубок, просто иной формы.

Основной радиатор, судя по весу, выполнен из медного сплава (и покрашен). Одной стороной он припаян к испарительной камере, другой соприкасается с кожухом. Ребра выполнены в поперечном направлении, поэтому горячий воздух выдувается через длинные торцы видеокарты вверх от нее и вниз — на материнскую плату. Длина видеокарты не запредельная, однако если под ее слотом установлен чипсет, накопитель в слоте M.2 или иной компонент системы, то он будет дополнительно нагреваться видеокартой. Испарительная камера соприкасается непосредственно с GPU и с большой рамой (через термоинтерфейс), на которой уже есть свои площадки для охлаждения микросхем памяти и силовых преобразователей питания VRM. Задняя пластина выполняет лишь чисто защитные функции (хотя она металлическая, а не пластиковая). Отметим, что для GPU используется графитовый термоинтерфейс — опять же, это в традициях AMD, потому что для испарительных камер лучше иметь интерфейс более толстый, нежели слой жидкой термопасты.

Кожух несет на себе три вентилятора (∅90 мм), у которых лопасти соединены кольцами (мы ранее уже видели подобные конструкции).

Мы давно привыкли к тому, что видеокарты среднего и топового классов останавливают свои вентиляторы в простое, при работе в 2D, если температура GPU опускается ниже примерно 55-60 градусов, и СО при этом становится бесшумной. Точно так же работает и данная видеокарта. Ниже есть видеоролик на эту тему.

Мониторинг температурного режима с помощью MSI Afterburner:

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 82 градусов, что выше, чем мы привыкли видеть, но все же является приемлемым результатом для видеокарты такого уровня.

Мы засняли и ускорили в 25 раз 8-минутный прогрев:

Максимальный нагрев наблюдался в районе преобразователей питания и самого GPU.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

менее 20 дБА: условно бесшумно
от 20 до 25 дБА: очень тихо
от 25 до 30 дБА: тихо
от 30 до 35 дБА: отчетливо слышно
от 35 до 40 дБА: громко, но терпимо
выше 40 дБА: очень громко

В режиме простоя в 2D температура была не выше 33 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось, поэтому шум сохранялся на прежнем уровне.

В режиме максимальной нагрузки в 3D температура достигала 82 °C. Вентиляторы при этом раскручивались до 1500 оборотов в минуту, шум вырастал до 31,7 дБА: это отчетливо слышно, но не громко. В видеоролике ниже видно, как растет шум (шум фиксировался пару секунд через каждые 30 секунд).

В сравнении с тем, как шумели референсные карты предыдущих поколений (с «турбиной»), данный вариант можно считать настоящим прорывом.

Подсветка

Подсветка у карты имеется лишь в виде логотипа на скошенном верхне-переднем торце. Кстати, этот скос частично перекрывает выход воздуха из радиатора.

Так что в ПК без иных вариантов подсветки видеокарта будет мощно светить красным «Radeon» в темноте. Подсветка не регулируется и не выключается. У владельцев моддинговых ПК сей факт не вызовет разочарований.

Комплект поставки и упаковка

Комплект поставки, понятно, условный, ведь карты собственного выпуска компания AMD не продает (в отличие от конкурента), поэтому никто, кроме прессы и блогеров, такие упаковки не увидит.

Однако упаковка смотрится очень симпатично и стильно (в начальном видеоролике она представлена во всей красе).

Тестирование: синтетические тесты

Конфигурация тестового стенда

Компьютер на базе процессора Intel Core i9-10900K (Socket LGA1200):
- Платформа:
  - процессор Intel Core i9-10900K (разгон 5,1 ГГц по всем ядрам);
  - ЖСО Cougar Helor 240;
  - системная плата Asus ROG Maximus XII Extreme на чипсете Intel Z490;
  - оперативная память Corsair UDIMM (CMT32GX4M4C3200C14) 32 ГБ (4×8) DDR4 (XMP 3200 МГц) ;
  - SSD Intel 760p NVMe 1 ТБ PCI-E;
  - жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
  - блок питания Seasonic Prime 1300 W Platinum (1300 Вт);
  - корпус Thermaltake Level20 XT;
- операционная система Windows 10 Pro 64-битная; DirectX 12 (v.20H2);
- телевизор LG 43UK6750 (43″ 4K HDR);
- драйверы AMD версии 20.11.2/20.11.6;
- драйверы Nvidia версии 457.09;
- VSync отключен.

Тесты проводились в закрытом, хорошо продуваемом корпусе.

Мы также собрали тестовый стенд на базе процессора AMD Ryzen 9 5950X для исследования влияния AMD Smart Access Memory (SAM) на производительность в играх в разрешении 4К (процессор получили в последний момент, поэтому по остальным разрешениям пройтись не успели).

Получение самого быстрого на сегодня игрового процессора, самого дефицитного и самого дорогого

Для этих целей на время сменили материнскую плату на Asus Prime X570-Pro на базе чипсета AMD X570 с установленной последней версией BIOS, позволяющей включить SAM. Ниже все расскажем.

Мы провели тестирование видеокарты Radeon RX 6800 XT со стандартными частотами в нашем наборе синтетических тестов. Он продолжает постоянно меняться, добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Мы полностью отказались от ранее активно использовавшихся нами тестов RightMark3D, так как они устарели слишком сильно, и на столь мощных GPU или не запускаются вообще, или упираются в различные ограничители, не загружая работой блоки графического процессора и не показывая его истинную производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы все еще оставили в полном составе, так как заменить их попросту нечем, хотя и они уже изрядно устарели.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько разнообразных тестов для измерения производительности трассировки лучей, программной и аппаратной. В качестве полусинтетического теста у нас также используется и довольно популярный 3DMark Time Spy, а также некоторые другие — например, DX Raytracing.

Синтетические тесты проводились на следующих видеокартах:

Radeon RX 6800 XT со стандартными параметрами (RX 6800 XT)
Radeon VII со стандартными параметрами (Radeon VII)
Radeon RX 5700 XT со стандартными параметрами (RX 5700 XT)
GeForce RTX 3080 со стандартными параметрами (RTX 3080)
GeForce RTX 3070 со стандартными параметрами (RTX 3070)
GeForce RTX 2080 Ti со стандартными параметрами (RTX 2080 Ti)

Для анализа производительности новой видеокарты Radeon мы выбрали несколько видеокарт компании AMD из разных поколений. Аналогов по позиционированию в предыдущем поколении Radeon не было, но Radeon VII мы взяли в качестве самого быстрого решения, хоть уже и давно исчезнувшего из продажи, а вот Radeon RX 5700 XT выступает как наиболее производительный графический процессор архитектуры RDNA первого поколения.

Прямым соперником для нового Radeon у компании Nvidia является GeForce RTX 3080, и без него мы обойтись никак не можем. Дополнительно взяли еще и менее и более производительные решения из последнего же поколения RTX 30. Ну и также сравним новинку с GeForce RTX 2080 Ti, как с наиболее производительным графическим процессором архитектуры Turing из предыдущего поколения.

Тесты из 3DMark Vantage

Мы традиционно рассматриваем устаревшие синтетические тесты из пакета 3DMark Vantage, ведь в них зачастую можно найти что-то интересное, чего нет в других, более современных тестах. Feature тесты из этого тестового пакета имеют поддержку DirectX 10, они до сих пор более-менее актуальны и при анализе результатов новых видеокарт мы всегда делаем какие-то полезные выводы.

Feature Test 1: Texture Fill

Первый тест измеряет производительность блоков текстурных выборок. Используется заполнение прямоугольника значениями, считываемыми из маленькой текстуры с использованием многочисленных текстурных координат, которые изменяются каждый кадр.

Эффективность работы видеокарт AMD и Nvidia в текстурном тесте компании Futuremark довольно высока, и тест обычно показывает результаты, близкие к соответствующим теоретическим параметрам, хотя иногда они все же получаются несколько заниженными для некоторых GPU. В этом тесте чуть урезанный Big Navi в исполнении RX 6800 XT выступил просто отлично, обогнав всех. В случае с RX 5700 XT чуть ли не вдвое, что соответствует теории. Да и Radeon VII в этом тесте хорош.

Если сравнивать новинку с конкурентами компании Nvidia, то можно отметить высокую скорость текстурирования у нового Radeon, имеющего довольно большое количество текстурных блоков, что обычно для Radeon, которые всегда справляются с такими задачами несколько лучше видеокарт конкурента того же ценового позиционирования. Вот и в этот раз прямой конкурент RTX 3080 остался далеко позади.

Feature Test 2: Color Fill

Вторая задача — тест скорости заполнения. В нем используется очень простой пиксельный шейдер, не ограничивающий производительность. Интерполированное значение цвета записывается во внеэкранный буфер (render target) с использованием альфа-блендинга. Используется 16-битный внеэкранный буфер формата FP16, наиболее часто используемый в играх, применяющих HDR-рендеринг, поэтому такой тест является вполне современным.

Цифры из второго подтеста 3DMark Vantage должны показывать производительность блоков ROP, без учета величины пропускной способности видеопамяти, и тест обычно измеряет именно производительность подсистемы ROP. Но в случае сравнения с Radeon RX 5700 XT, который имеет отличные теоретические показатели, двойного преимущества у RX 6800 XT не получилось. Возможно, как раз из-за того, что Infinity Cache в таких условиях не смог поддержать возможности GPU в виде большого количества блоков ROP. А вот видеокарты компании Nvidia по скорости заполнения сцены не так хороши, и даже GeForce RTX 3090 в этом тесте оказалась медленнее не только новой модели архитектуры RDNA 2, но уступила и RDNA 1 в виде RX 5700 XT.

Feature Test 3: Parallax Occlusion Mapping

Один из самых интересных feature-тестов, так как подобная техника давно используется в играх. В нем рисуется один четырехугольник (точнее, два треугольника) с применением специальной техники Parallax Occlusion Mapping, имитирующей сложную геометрию. Используются довольно ресурсоемкие операции по трассировке лучей и карта глубины большого разрешения. Также эта поверхность затеняется при помощи тяжелого алгоритма Strauss. Это тест очень сложного и тяжелого для видеочипа пиксельного шейдера, содержащего многочисленные текстурные выборки при трассировке лучей, динамические ветвления и сложные расчеты освещения по Strauss.

Результаты этого теста из пакета 3DMark Vantage не зависят исключительно от скорости математических вычислений, эффективности исполнения ветвлений или скорости текстурных выборок, а от нескольких параметров одновременно. Для достижения высокой скорости в этой задаче важен правильный баланс GPU, а также эффективность выполнения сложных шейдеров. Это довольно полезный тест, так как результаты в нем нередко хорошо коррелируют с тем, что получается в игровых тестах.

Тут важны и математическая и текстурная производительность, и в этой «синтетике» из 3DMark Vantage новая модель видеокарты Radeon RX 6800 XT показала просто отличный результат, уступив только дорогущей RTX 3090! Что касается быстрейших плат из предыдущих поколений, то и они также оказались позади (RX 5700 XT уступила вдвое) — высокая эффективность сегодняшней новинки явно сказывается на результатах. Графические процессоры AMD в этом тесте и ранее показывали достаточно сильные результаты, а удвоение всего в Navi 21 по сравнению с Navi 10 дало результат. И Infinity Cache не подкачал в этом случае.

Feature Test 4: GPU Cloth

Четвертый тест интересен тем, что в нем рассчитываются физические взаимодействия (имитация ткани) при помощи GPU. Используется вершинная симуляция, при помощи комбинированной работы вершинного и геометрического шейдеров, с несколькими проходами. Используется stream out для переноса вершин из одного прохода симуляции к другому. Таким образом, тестируется производительность исполнения вершинных и геометрических шейдеров и скорость stream out.

Скорость рендеринга в этом тесте должна зависеть сразу от нескольких параметров, и основными факторами влияния должны являться производительность обработки геометрии и эффективность выполнения геометрических шейдеров. Сильные стороны чипов Nvidia должны были проявиться, но мы в который раз получаем явно некорректные результаты в этом тесте, поэтому учитывать результаты всех видеокарт GeForce тут просто нет смысла, они неверны. Так что сравниваем только Radeon между собой. И получаем интересный результат — Radeon VII далеко позади, а вот RX 5700 XT уступает новинке не так уж и сильно. Похоже на упор в скорость обработки геометрии.

Feature Test 5: GPU Particles

Тест физической симуляции эффектов на базе систем частиц, рассчитываемых при помощи графического процессора. Используется вершинная симуляция, где каждая вершина представляет одиночную частицу. Stream out используется с той же целью, что и в предыдущем тесте. Рассчитывается несколько сотен тысяч частиц, все анимируются отдельно, также рассчитываются их столкновения с картой высот. Частицы отрисовываются при помощи геометрического шейдера, который из каждой точки создает четыре вершины, образующие частицу. Больше всего загружает шейдерные блоки вершинными расчетами, также тестируется stream out.

Во втором геометрическом тесте из 3DMark Vantage мы также видим далекие от теории результаты, но они чуть ближе к истине, чем в прошлом подтесте этого же бенчмарка. Видеокарты Nvidia и в этот раз необъяснимо медленны, но хотя бы не так сильно отстают. Новенькая Radeon RX 6800 XT стала победителем, заметно обогнав не только RTX 3080, но и старшую RTX 3090.

Feature Test 6: Perlin Noise

Последний feature-тест пакета Vantage является математически-интенсивным тестом GPU, он рассчитывает несколько октав алгоритма Perlin noise в пиксельном шейдере. Каждый цветовой канал использует собственную функцию шума для большей нагрузки на видеочип. Perlin noise — это стандартный алгоритм, часто применяемый в процедурном текстурировании, он использует много математических вычислений.

В этом математическом тесте производительность решений хоть и не совсем соответствует теории, но она обычно ближе к пиковой производительности видеочипов в предельных задачах. В тесте используются операции с плавающей запятой, но новая архитектура Ampere не раскрывает свои уникальные возможности.

Вышедшее на днях решение компании AMD на основе архитектуры RDNA 2 хоть и не достает RTX 3090, но чуть-чуть обгоняет прямого соперника в виде RTX 3080, а это главное. Radeon VII и тут неплоха, а вот RX 5700 XT сильно отстал от всех, пусть и не вдвое, как могло быть, исходя из теории. Рассмотрим более современные тесты, использующие повышенную нагрузку на GPU.

Тесты Direct3D 11

Переходим к Direct3D11-тестам из пакета разработчиков SDK Radeon. Первым на очереди будет тест под названием FluidCS11, в котором моделируется физика жидкостей, для чего рассчитывается поведение множества частиц в двухмерном пространстве. Для симуляции жидкостей в этом примере используется гидродинамика сглаженных частиц. Число частиц в тесте устанавливаем максимально возможное — 64 000 штук.

В первом Direct3D11-тесте новая Radeon RX 6800 XT ожидаемо опередила Radeon VII и RX 5700 XT, хотя и не так сильно, как хотелось бы. RTX 3090 лишь совсем немного впереди, и новинка явно быстрее конкурирующей модели на чипе GA102. Подтвердились наши предположения о том, что новинки компании AMD выиграли соперничество в этом тесте. Хотя, судя по крайне высокой частоте кадров, вычисления в этом примере из SDK уже слишком просты для столь мощных видеокарт, и лучше рассматривать другие тесты.

Второй D3D11-тест называется InstancingFX11, в этом примере из SDK используются DrawIndexedInstanced-вызовы для отрисовки множества одинаковых моделей объектов в кадре, а их разнообразие достигается при помощи использования текстурных массивов с различными текстурами для деревьев и травы. Для увеличения нагрузки на GPU мы использовали максимальные настройки: число деревьев и плотность травы.

Производительность рендеринга в этом тесте больше всего зависит от оптимизации драйвера и командного процессора GPU, но не только. С этим дела отлично обстоят у решений Nvidia, но видеокарты семейства RDNA 1 чуть улучшили позиции конкурирующей компании, а RDNA 2 догнали и обогнали конкурента. Если рассматривать RX 6800 XT по сравнению с топовым решением Ampere, то разница и в этот раз в пользу Radeon, хотя разница и невелика.

Ну и третий D3D11-пример — VarianceShadows11. В этом тесте из SDK AMD используются теневые карты (shadow maps) с тремя каскадами (уровнями детализации). Динамические каскадные карты теней сейчас широко применяются в играх с растеризацией, поэтому тест довольно любопытный. При тестировании мы использовали настройки по умолчанию.

Производительность в этом примере из SDK зависит как от скорости блоков растеризации, так и от пропускной способности памяти. Новая видеокарта Radeon RX 6800 XT показала результат выше, чем у пары устаревших Radeon, но двукратным превосходством над RX 5700 XT не пахнет, а все карты GeForce слишком далеко впереди. Снова обращаем ваше внимание на то, что частота кадров и тут снова слишком высока — очередная задача является слишком простой, особенно для современных GPU из топовых серий.

Тесты Direct3D 12

Переходим к примерам из DirectX SDK компании Microsoft — все они используют последнюю версию графического API — Direct3D12. Первым тестом стал Dynamic Indexing (D3D12DynamicIndexing), использующий новые функции шейдерной модели Shader Model 5.1. В частности — динамическое индексирование и неограниченные массивы (unbounded arrays) для отрисовки одной модели объекта несколько раз, при этом материал объекта выбирается динамически по индексу.

Этот пример активно использует целочисленные операции для индексации, поэтому особенно интересен нам для тестирования графических процессоров семейства Turing. Для увеличения нагрузки на GPU мы модифицировали пример, увеличив число моделей в кадре относительно оригинальных настроек в 100 раз.

Общая производительность рендеринга в этом тесте зависит от видеодрайвера, командного процессора и эффективности работы мультипроцессоров GPU в целочисленных вычислениях. Все решения Nvidia отлично справились с такими операциями, а вот все Radeon в разы хуже любой из GeForce — вероятнее всего, дело в недостатке программной оптимизации или какой-то ошибки в драйвере. Дальнейшие тесты на других моделях серии RX 6000 это подтверждают.

Очередной пример из Direct3D12 SDK — Execute Indirect Sample, он создает большое количество вызовов отрисовки при помощи ExecuteIndirect API, с возможностью модификации параметров отрисовки в вычислительном шейдере. В тесте используется два режима. В первом на GPU выполняется вычислительный шейдер для определения видимых треугольников, после чего вызовы отрисовки видимых треугольников записываются в UAV-буфер, откуда запускаются посредством ExecuteIndirect-команд, таким образом на отрисовку отправляются только видимые треугольники. Второй режим отрисовывает все треугольники подряд без отбрасывания невидимых. Для увеличения нагрузки на GPU число объектов в кадре увеличено с 1024 до 1 048 576 штук.

Еще один странный результат. Да, в этом тесте видеокарты Nvidia доминировали всегда, производительность в нем зависит от драйвера, командного процессора и мультипроцессоров GPU, и наш опыт говорит также о большом влиянии программной оптимизации драйвера на результаты теста. Поэтому видеокартам AMD похвастать тут нечем.

И последний пример подраздела с поддержкой D3D12 — известный тест nBody Gravity. В этом примере из SDK показана расчетная задача гравитации N-тел (N-body) — симуляция динамической системы частиц, на которую воздействуют такие физические силы, как гравитация. Для увеличения нагрузки на GPU число N-тел в кадре было увеличено с 10 000 до 64 000.

А тут вообще налицо явно некорректная работа теста. Один из интересных тестов, но Big Navi тут явно не работает в полную силу. Вряд ли это объяснимо плохой работой Infinity Cache, больше похоже на недостаток оптимизации драйвера, ведь RDNA 2 это совсем свежая архитектура и программные проблемы вполне логичны. Не может быть так, что RX 6800 XT вдвое уступает RX 5700 XT, это просто невозможно ничем логически обосновать.

В качестве дополнительного вычислительного теста с поддержкой Direct3D12 мы взяли известный бенчмарк Time Spy из 3DMark. В нем нам интересно не только общее сравнение GPU по мощности, но и разница в производительности с включенной и отключенной возможностью асинхронных вычислений, появившихся в DirectX 12. Для верности мы протестировали видеокарты сразу в двух графических тестах.

Если рассматривать производительность новой модели Radeon RX 6800 XT в этой задаче по сравнению с RX 5700 XT и Radeon VII, то тут все по теории — новинка вдвое быстрее решения архитектуры RDNA первого поколения. Сравнение с видеокартами Nvidia GeForce RTX интереснее, новинка во всех условиях выступила вровень со своим прямым конкурентом в виде RTX 3080. Такое впечатление, что именно по 3DMark Time Spy производители GPU и оценивают свои произведения. Ускорение при включении асинхронного исполнения у всех решений примерно аналогичное.

Тесты трассировки лучей

Специализированных тестов трассировки лучей выходит все больше. Одним из первых таких тестов производительности трассировки лучей стал бенчмарк Port Royal создателей известных тестов серии 3DMark. Полноценный бенчмарк работает на всех графических процессорах с поддержкой DXR API. Мы проверили несколько видеокарт в разрешении 2560×1440 при различных настройках, когда отражения рассчитываются при помощи трассировки лучей (в двух режимах), а также традиционным для растеризации методом.

Бенчмарк показывает сразу несколько новых возможностей применения трассировки лучей через DXR API, в нем используются алгоритмы отрисовки отражений и теней с применением трассировки, но тест в целом не слишком хорошо оптимизирован и очень сильно загружает в том числе и мощные GPU, даже на GeForce RTX 3090 с трудом была достигнут уровень производительности 60 FPS в среднем. Но для сравнения производительности разных GPU в этой конкретной задаче тест подходит.

Тест очень наглядно показывает разницу между ускорением трассировки в версиях AMD и Nvidia. Если на GeForce включение среднего уровня трассировки вызывает небольшое падение производительности, то на Radeon RX 6800 XT оно гораздо больше. Настолько, что она приближается скорее к RTX 3070, чем к RTX 3080. Правда, высокий уровень трассировки в этом тесте не приносит Radeon большего падения скорости, тут он справляется неплохо. Впрочем, в этом тесте трассировки не так уж много, он разрабатывался давно и реалиям не соответствует. В любом случае, трассировка лучше удается решениям конкурента. Также отметим, что хотя сцены 3DMark Port Royal требовательны к объему видеопамяти, но в этом разрешении рендеринга недостатка 8-10 ГБ у RTX 3070 и RTX 3080 просто не видно.

Совсем недавно вышел еще один подтест 3DMark, направленный на тестирование производительности трассировки лучей — DirectX Raytracing. В отличие от предыдущего, он не гибридный, и не использует растеризацию вовсе, а только трассировку лучей, поэтому гораздо лучше отражает скорость GPU именно по возможностям аппаратного ускорения трассировки. Сцена в бенчмарке используется уже известная нам по другим подтестам 3DMark, и она довольно небольшая — BVH-структура в теории может поместиться в Infinity Cache. Но поможет ли это новой видеокарте Radeon?

Увы, по скорости трассировки лучей решения архитектуры RDNA 2 явно уступают Ampere и Turing, ведь новая Radeon RX 6800 XT показала уровень производительности где-то RTX 2080 Super, а то и простой RTX 2080. Конкурирующая с новинкой RTX 3080 гораздо быстрее в этом тесте — вплоть до двух раз! Вот и подтвердились наши тревожные ожидания при оценке реализации аппаратной трассировки в исполнении AMD. RT-ядра у Nvidia явно берут на себя больше работы и они более универсальны, так как не теряют в производительности так сильно.

Для закрепления рассмотрим полусинтетический бенчмарк, который сделан на игровом движке, соответствующий игровой проект должен выйти в скором времени. Это Boundary — один из китайских игровых проектов с поддержкой RTX. Они выпустили бенчмарк с очень серьезной нагрузкой на GPU, трассировка лучей в нем используется весьма активно — и для сложных отражений с несколькими отскоками луча, и для мягких теней, и для глобального освещения. Также в тесте используется технология DLSS, качество которой можно настраивать, и мы выбрали максимально возможное.

Результат новой Radeon RX 6800 XT тут примерно повторяет то, что мы уже видели в предыдущем тесте. А ведь у Nvidia в кармане припрятан еще один козырь — DLSS. Его включение принесет полный разгром для Radeon RX 6800 XT, скорости которой еле хватает на комфортную частоту кадров в Full HD-разрешении. Впрочем, скорости в 4K не хватает вообще ни одному GPU, старшие видеокарты линейки RTX 30 способны обеспечить приемлемую частоту кадров, но только вместе с включением DLSS.

В общем, графические процессоры Nvidia заметно быстрее конкурентов во всех тестах с применением аппаратной трассировки лучей, и даже прошлое семейство Turing эффективнее исполняет такие задачи. А более продвинутым решениям Ampere помогают улучшенные RT-ядра и удвоенный темп FP32-вычислений, и улучшенное кэширование. Увы, но RDNA 2 именно по трассировке не впечатляет, даже уровень RTX 2080 Ti для нее недостижим.

Увы, но еще один полуигровой бенчмарк, также основанный на грядущей китайской игре — Bright Memory, на Radeon не запускается, требуя GeForce RTX. Мы бы понадеялись, что подобная ситуация не повторится с релизами игр, но уже в вышедшей недавно игре Godfall трассировка поддерживается пока только на видеокартах AMD, а в игре Watch Dogs Legion трассированные отражения на Radeon хоть и отрисовываются, но некорректно. Это нормально в начале жизненного пути аппаратной трассировки на Radeon, а в будущем разработчики игр будут ориентироваться сразу на Nvidia и AMD.

Вычислительные тесты

Мы продолжаем поиск бенчмарков, использующих OpenCL для актуальных вычислительных задач, чтобы включить их в состав нашего пакета синтетических тестов. Пока что в этом разделе остается довольно старый и не слишком хорошо оптимизированный тест трассировки лучей (не аппаратной) — LuxMark 3.1. Этот кроссплатформенный тест основан на LuxRender и использует OpenCL.

Новая модель Radeon RX 6800 XT показала неплохой результат в LuxMark, но... только если сравнивать ее с Radeon RX 5700 XT. даже Radeon VII в двух из трех тестов была очень близка к новинке. Похоже, что математически-интенсивные нагрузки с большим влиянием кэширования для архитектур RDNA не очень подходят — не зря мы волновались об этом, глядя на скорость RDNA 1. Этот тест лучше всего исполняется на новой архитектуре Ampere, в одном из подтестов новый GPU AMD уступил прямому конкуренту GeForce RTX 3080 почти вдвое!

Увы, но еще два теста вычислительной производительности графических процессоров: V-Ray Benchmark и OctaneRender, просто не заработали на видеокартах Radeon. Производительность трассировки лучей без применения аппаратного ускорения в профессиональных 3D-приложениях вообще сравнить непросто, так что придется пока что обойтись без таких тестов. Зато мы решили добавить интересное приложение — hashcat. Это очень быстрый инструмент для «восстановления паролей» (ну или их взлома, хотя такое наименование разработчики не любят, конечно). Программное обеспечение использует как возможности CPU, так и GPU при помощи OpenCL, а алгоритмов хеширования поддерживаются очень много, среди них хеши Microsoft LM, MD4, MD5, семейство SHA, форматы Unix Crypt, MySQL и Cisco PIX.

Многие алгоритмы можно взломать («восстановить») за короткое время при помощи ускорения подбора на графическом процессоре. Кроме банальной атаки «грубой силой» (brute-force), поддерживаются маски — например, стандартная маска для многих паролей в виде первой заглавной буквы и двух или четырех цифр в конце, обозначающих год. На GPU подобные задачи исполняются очень быстро — заметно быстрее, чем на CPU, и ненадежные пароли взломать становится гораздо проще.

Результаты получились небезынтересными. Во-первых, сразу отметим отставание Radeon RX 6800 XT от прямого конкурента GeForce RTX 3080, разница между ними получилась довольно существенной — в пользу решения Nvidia. Во-вторых, отметим большую разницу между RTX 2060 Super и RTX 2080 Super, а также то, что RTX 2080 Super обошла RTX 3070 — похоже, в этом тесте преимущества Ampere по исполнению инструкций в двойном темпе просто не работают, а GPU прошлого поколения имеет достаточно высокую тактовую частоту.

Тесты технологии Smart Access Memory

Наконец, настало время проверить прирост скорости в играх, получаемый при помощи включения адресации всего объема видеопамяти для доступа со стороны центрального процессора системы. Технология Smart Access Memory работает только на последних поколениях CPU и GPU производства компании AMD, а также требует определенных изменений в BIOS системных плат на базе чипсета X570, который вам также придется обновить.

Обо всем этом читайте в теоретической части, а сейчас мы рассмотрим практический прирост в нашем наборе игровых тестов в наиболее интересном 4K-разрешении. Да, толку от SAM в более низких разрешениях может быть больше, но играть на такой мощной видеокарте в Full HD мы считаем малоосмысленным занятием в принципе. У AMD в материалах прирост достигал 15%, а в среднем получилось 6%. Что выйдет у нас? Заодно мы сравним со скоростью GeForce RTX 3080 на той же системе с процессором Ryzen 9 5950X:

Ну что ж, можно сказать, что у нас среднегеометрическая разница получилось меньшей — лишь 3%. Причем в двух играх разницы не было, еще в шести она составила 1%-2%, и лишь в паре игр оказалась больше. Не подвела Red Dead Redemption 2, как типичный консольный порт: 6% прибавки в средней частоте кадров. А вот почему SAM так сильно выступила в Control?.. 10% разницы — это довольно много.

Новая технология действительно помогает Radeon RX 6800 XT подобраться по скорости к GeForce RTX 3080, без нее она явно уступает решению Nvidia побольше. А вот если использовать системную плату на чипсете X570 и процессор Ryzen 5000, включить SAM и авторазгон Rage Mode, то может даже догнать конкурента. Ждем, что представит соперничающая компания, и если ее вариант будет эффективно работать на любых современных платформах, то мы только порадуемся этому.

Тестирование: игровые тесты

Список инструментов тестирования

Во всех играх использовалось максимальное качество графики в настройках.

Gears 5 (Xbox Game Studios/The Coalition)
Wolfenstein: Youngblood (Bethesda Softworks/MachineGames/Arkane Studios)
Death Stranding (505 Games/Kojima Productions)
Red Dead Redemption 2 (Rockstar)
Watch Dogs: Legion (Ubisoft/Ubisoft)
Control (505 Games/Remedy Entertainment)
Deliver Us The Moon (Wired Productions/KeokeN Interactive)
Resident Evil 3 (Capcom/Capcom)
Shadow of the Tomb Raider (Eidos Montreal/Square Enix), HDR включен
Metro Exodus (4A Games/Deep Silver/Epic Games)

Специалисты AMD рекомендовали использовать для Radeon RX 6800 XT режим автоматического повышения частот Rage Mode (в локализованном варианте — «Ярость»). Мы провели отдельные тесты с «Яростью».

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1200, 2560×1440 и 3840×2160

Gears 5

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	−2,3	−9,1	−11,8
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+12,8	+19,3	+25,0
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	0	+0,8	+2,7

Wolfenstein: Youngblood

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	+0,3	−3,4	−5,3
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+2,4	+35,7	+36,1
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	+1,3	+1,1	+2,5

Death Stranding

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	+0,6	−4,2	−2,1
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+3,9	+11,4	+26,7
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	+1,3	+1,5	+2,1

Red Dead Redemption 2

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	−4,5	−9,5	−11,4
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+19,1	+19,4	+26,5
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	+1,9	+1,2	+1,6

Watch Dogs: Legion

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	−4,5	−4,1	−10,0
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+10,5	+18,3	+18,4
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	+1,2	+1,4	+4,4

Control

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	−10,4	−11,5	−16,3
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+19,8	+18,1	+17,1
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	+1,7	+2,4	+2,4

Deliver Us The Moon

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	+0,7	−2,7	−7,7
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+2,0	+21,0	+23,5
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	+1,3	+2,8	+4,8

Resident Evil 3

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	−3,3	−4,5	−7,2
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+4,0	+30,8	+30,4
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	+1,4	+2,9	+6,7

Shadow of the Tomb Raider

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	+2,5	−5,0	−4,2
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+6,0	+30,7	+31,4
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	+1,6	+1,7	+3,3

Metro Exodus

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
Radeon RX 6800 XT	GeForce RTX 3080	0	−1,9	−4,2
Radeon RX 6800 XT	GeForce RTX 2080 Ti	+5,1	+10,9	+23,6
Radeon RX 6800 XT Rage	Radeon RX 6800 XT	+0,8	+1,0	+2,9

Поскольку ранее выпущенные видеокарты AMD не поддерживают технологии трассировки лучей, а также у них нет поддержки «умных» технологий антиалиасинга типа Nvidia DLSS, мы вынуждены для массового тестирования отключать как трассировку, так и DLSS для получения адекватного сравнения всех карт. Однако на сегодня уже половина из 28 регулярно тестируемых нами видеокарт поддерживает технологию RT, поэтому мы приняли решение, что будем проводить тесты не только с использованием обычных методов растеризации, но и с включением RT. Разумеется, пока в этом списке только видеокарты Nvidia серии RTX и AMD Radeon RX 6800/6800 XT.

Результаты тестов с включенной аппаратной трассировкой лучей в разрешениях 1920×1200, 2560×1440 и 3840×2160

Watch Dogs: Legion, RT

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
RX 6800 XT	GeForce RTX 3080	−22,8	−27,1	−25,9
RX 6800 XT	GeForce RTX 3070	−2,2	−7,9	−9,1
RX 6800 XT	GeForce RTX 2080 Super	+12,8	+25,0	+25,0

Control, RT

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
RX 6800 XT	GeForce RTX 3080	−38,6	−46,7	−46,7
RX 6800 XT	GeForce RTX 3070	−11,5	−25,6	−23,8
RX 6800 XT	GeForce RTX 2080 Super	+14,9	0	−5,9

Shadow of the Tomb Raider, RT

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
RX 6800 XT	GeForce RTX 3080	−35,1	−48,2	−43,3
RX 6800 XT	GeForce RTX 3070	−22,2	−18,5	−19,0
RX 6800 XT	GeForce RTX 2080 Super	−12,5	−6,4	−15,0

Metro Exodus, RT

Исследуемая карта	в сравнении с	1920×1200	2560×1440	3840×2160
RX 6800 XT	GeForce RTX 3080	−26,8	−25,8	−38,5
RX 6800 XT	GeForce RTX 3070	−13,0	−7,5	−11,1
RX 6800 XT	GeForce RTX 2080 Super	+5,3	+19,5	+9,1

К сожалению, у новинок AMD наблюдается серьезное падение производительности при активизации технологии RT.

Рейтинг iXBT.com

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:

Вариант рейтинга iXBT.com без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по самому слабому ускорителю — Radeon RX 560 (то есть сочетание скорости и функций Radeon RX 560 приняты за 100%). Рейтинги ведутся по 28 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят Radeon RX 6800 XT и его конкуренты.

Рейтинг приведен суммарно для всех трех разрешений.

№	Модель ускорителя	Рейтинг iXBT.com	Рейтинг полезности	Цена, руб.
02	RTX 3080 10 ГБ, 1440—1995/19000	1030	124	83 000
03	RX 6800 XT 16 ГБ, Rage Mode	1000	143	70 000
04	RX 6800 XT 16 ГБ, 2015—2401/16000	980	140	70 000
07	RTX 2080 Ti 11 ГБ, 1350—1950/14000	830	108	77 000

Если взять чистую производительность в играх без участия трассировок лучей и иных «умных» проприетарных технологий, то новый Radeon RX 6800 XT выступает практически на уровне конкурента GeForce RTX 3080, лишь чуть-чуть уступая ему в среднем. Включение режима Rage Mode помогает незначительно и не меняет расклад принципиально. Мы исследовали влияние AMD Smart Access Memory, которое также проявляется в считанных процентах прироста производительности (там разброс по играм более существенный), и вполне возможно, что если в компьютере у пользователя используется процессор Ryzen 5000 (что пока крайне сомнительно) и он включил SAM на постоянной основе, то в итоге будет полный паритет. Однако Nvidia работает над собственным вариантом SAM (работа уже в завершающей стадии), что может вновь склонить чашу весов в ее пользу.

Вариант рейтинга iXBT.com с включением RT

Рейтинг составлен по 4 тестам с применением технологии трассировки лучей. На сегодня она поддерживается ускорителями серии Nvidia GeForce RTX и AMD Radeon RX 6000. Этот рейтинг нормирован по самому слабому ускорителю в группе — GeForce RTX 2060 (то есть сочетание скорости и функций GeForce RTX 2060 приняты за 100%).

Рейтинг приведен суммарно для всех трех разрешений.

№	Модель ускорителя	Рейтинг iXBT.com	Рейтинг полезности	Цена, руб.
02	RTX 3080 10 ГБ, 1440—1995/19000	300	36	83 000
03	RTX 3070 8 ГБ, 1440—1950/14000	230	43	53 500
04	RTX 2080 Ti 11 ГБ, 1350—1950/14000	220	29	77 000
05	RX 6800 XT 16 ГБ, Rage Mode	200	29	70 000
06	RX 6800 XT 16 ГБ, 2015—2401/16000	190	27	70 000

А вот здесь для Radeon RX 6800 XT все печально, даже очень печально. Ведь флагман AMD проиграл не только GeForce RTX 3080, но и более дешевому GeForce RTX 3070. Более того, в ряде игр при использовании видеокарты AMD наблюдаются артефакты, например некорректная отрисовка отражений в Watch Dogs: Legion.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Учитывая возможности Radeon RX 6800 XT и ее явную нацеленность на использование в высоких разрешениях, приводим рейтинг только для разрешения 4К (поэтому цифры в рейтинге iXBT.com иные). Для расчета рейтинга полезности использованы розничные цены на середину ноября 2020 года.

Вариант рейтинга полезности без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по самому слабому ускорителю — Radeon RX 560 (то есть сочетание скорости и функций Radeon RX 560 приняты за 100%). В данном случае из общего списка выбрана группа карт для анализа, в которую входят Radeon RX 6800 XT и его конкуренты.

№	Модель ускорителя	Рейтинг полезности	Рейтинг iXBT.com	Цена, руб.
02	RTX 3070 8 ГБ, 1440—1950/14000	241	1287	53 500
03	RX 6800 XT 16 ГБ, Rage Mode	238	1666	70 000
05	RX 6800 XT 16 ГБ, 2015—2401/16000	230	1613	70 000
08	RTX 3080 10 ГБ, 1440—1995/19000	211	1755	83 000
13	RTX 2080 Ti 11 ГБ, 1350—1950/14000	166	1282	77 000

Рекомендованная розничная цена Radeon RX 6800 XT, объявленная AMD для российского рынка — 59 990 рублей. Учитывая новизну и дефицит данных видеокарт, мы прибавили к рекомендованной цене 10 тысяч рублей, которые торговые компании стопроцентно приплюсуют. Потому в качестве условной стоимости Radeon RX 6800 XT мы взяли 70 000. Поскольку цены на GeForce RTX 3080 до сих пор очень далеки от рекомендованных (65 тысяч рублей), то и начальный ценник на Radeon RX 6800 XT может быть сильно выше даже этих 70 тысяч. Так или иначе, для составления рейтинга нам надо остановиться на какой-то цифре, и если предположить, что новинку можно будет приобрести за 70 тысяч, то для потребителей, не заинтересованных в трассировке лучей как технологии (или не заинтересованных в конкретных имеющихся играх с ее реализацией), приобретение Radeon RX 6800 XT окажется интереснее, нежели GeForce RTX 3080. Однако с рядом оговорок.

Вариант рейтинга полезности с включением RT

№	Модель ускорителя	Рейтинг полезности	Рейтинг iXBT.com	Цена, руб.
01	RTX 3070 8 ГБ, 1440—1950/14000	51	275	53 500
04	RTX 3080 10 ГБ, 1440—1995/19000	46	379	83 000
09	RTX 2080 Ti 11 ГБ, 1350—1950/14000	34	261	77 000
10	RX 6800 XT 16 ГБ, Rage Mode	33	231	70 000
11	RX 6800 XT 16 ГБ, 2015—2401/16000	33	231	70 000

Упомянутые выше оговорки заключаются в том, что как только потребитель столкнется с игрой, поддерживающей RT (а таких становится все больше, и дальше будет только больше, потому что новые консоли поддерживают RT, а отдельно для ПК сейчас мало кто выпускает игры, все идут по универсальному пути мультиплатформы), то здесь уже не только GeForce RTX 3080, но и старый добрый GeForce RTX 2080 Ti (сравнимый по цене с новыми Radeon RX 6800 XT при условии, что вы найдете эти карты в рознице) опережает новый ускоритель AMD. Увы, это ахиллесова пята нового семейства Radeon.

Выводы

Как мы говорили ранее, Nvidia GeForce RTX 3080 уже позволяет комфортно играть в 4К при максимальных настройках графики. Radeon RX 6800 XT находится почти на уровне соперника, так что то же самое справедливо и для него.

В целом AMD Radeon RX 6800 XT значительно превышает результаты прежнего лидера этого семейства — Radeon VII (а также результаты Radeon RX 5700 XT). Он открывает игрокам разрешение 4К, обеспечивая в нем отменную производительность при высоких настройках графики, но при условии, что игрок не будет включать трассировку лучей!

Ранее мы не раз писали про перспективы трассировки лучей в играх. Всем очевидно, что индустрия приняла данную технологию как стандарт, и будет появляться все больше игр с RT. Казалось бы, выход новых решений AMD, поддержавших этот стандарт, должен еще больше подстегнуть применение RT. Однако сильное падение производительности в играх с трассировкой лучей у новых решений AMD немного умеряет оптимизм. Впрочем, это лишь первое подобное решение у AMD. Вспомним, как более 2 лет назад после выхода Nvidia GeForce RTX 20 в играх обнаруживалось аналогичное сильнейшее падение скорости при включении RT, и сколько копий тогда было сломано в обсуждениях, кому оно надо такое красивое...

Но жизнь идет, как и работа над ошибками, и теперь мы видим, что у Nvidia вышли новые решения, которые меньше теряют от включения RT, плюс усовершенствована технология DLSS, позволяющая играть с RT вообще без потери производительности. Ждем нечто подобное и у AMD. Но самое главное, что теперь аппаратная трассировка лучей и другие возможности DX12 Ultimate поддерживаются решениями обоих основных производителей GPU, а также есть поддержка в вышедших консолях, поэтому не осталось никаких преград для внедрения новых эффектов в игры.

Наличие 16 ГБ локальной памяти должно обеспечить Radeon RX 6800 XT некоторое преимущество, особенно если держать в уме будущие игры. Понятно, что потребителю нравятся большие числа на коробках, и чем эти числа выше, тем охотнее он приобретет такую видеокарту. Но так сильно ли проиграла Nvidia, предложив всего 10 ГБ памяти у своего GeForce RTX 3080 против 16 ГБ у соперника? Не думаем. Опыт показывает, что пока даже в 4К при максимальных настройках графики потребление памяти играми едва превышает 8 ГБ, поэтому 10 ГБ у GeForce RTX 3080 хватит на пару лет точно, а через год выйдут «рефреши» типа Super, которые смогут предложить больше памяти за те же деньги. На сегодня 16 ГБ совершенно не требуется (разве что для профессионального применения).

Что касается конкретной видеокарты AMD Radeon RX 6800 XT (16 ГБ), то она хороша с точки зрения потребительских характеристик: плата стандартная по длине, хоть и занимает три слота в системном блоке (формально 2,5, но де-факто 3). Шум невысокий, и в сравнении с референсными картами прошлых поколений (особенно Radeon RX 5700 XT и Radeon RX 5700) это большой прогресс. Однако при этом крайне желательна хорошая продувка корпуса, потому что все выделяемое видеокартой тепло остается внутри системного блока. Впрочем, карты, основанные на референс-образцах, в любом случае пробудут на рынке очень недолго — их можно будет встретить только в первых партиях видеокарт партнеров AMD. Далее в продажу поступят видеокарты их собственной разработки и дизайна. Сама же AMD референс-карты конечным потребителям не продает.

Следует также обратить внимание на ряд сопутствующих семейству Radeon RX 6000 новых интересных решений AMD, включая поддержку стандарта HDMI 2.1, позволяющего выводить 4K-изображение с частотой 120 Гц или 8K-изображение при помощи одного кабеля. Также отметим поддержку аппаратного декодирования видеоданных в формате AV1, технологию Smart Access Memory, способную обеспечить небольшой прирост производительности при совместной работе новых ускорителей с процессорами Ryzen 5000, а также технологию снижения задержек Radeon Anti-Lag, полезную для киберспортсменов. Будет интересно посмотреть на работу Infinity Cache в нестандартных условиях — вполне возможны игры и настройки, при которых он будет работать недостаточно эффективно.

В заключение еще раз констатируем: Radeon RX 6800 XT отлично подходит для игры в разрешении 4К с высоким качеством графики, но при включении RT новый ускоритель способен обеспечить приемлемый комфорт в таком разрешении лишь в некоторых играх. А вот в разрешении 2.5К эта видеокарта легко потянет игры с максимальным качеством графики с трассировкой лучей.

Еще раз отметим, что сегодня 4К-приемники (как мониторы, так и телевизоры) сильно упали в цене. Сейчас они представлены уже не только в премиальном ценовом сегменте, как это было 2-3 года назад, когда 4К-мониторы и 4К-телевизоры с реальным HDR имели стоимость около 100 тысяч рублей или выше.

В номинации «Оригинальный дизайн» карта AMD Radeon RX 6800 XT (16 ГБ) получила награду:

Благодарим компанию AMD Russia
и лично Ивана Мазнева
за предоставленные на тестирование видеокарты

Для тестового стенда:
блок питания Seasonic Prime 1300 W Platinum предоставлен компанией Seasonic