Обзор видеоускорителя AMD Radeon RX 6800 XT: компании AMD удается догнать флагманские решения конкурента, но не во всем

Прибытие новинок, визуальное сравнение с картами Nvidia

Особенности архитектуры

С выходом линейки видеокарт Radeon RX 6000 наконец-то настало время, когда компания AMD вернулась в борьбу за сегмент топовых видеокарт. Мы ждали этого уже довольно долго, и хотя Radeon RX 480, RX 580 и RX 590 были (да и до сих пор остаются за свою цену) отличными решениями, но верхние модели линеек Vega 64 и Radeon VII всегда в чем-то уступали конкурентам, да и сложно было их назвать массовыми моделями, производство этих графических процессоров по понятным причинам было довольно ограничено.

Так что, по сути, в самом верху рынка графических процессоров несколько долгих лет безраздельно царствовала Nvidia, и конкуренция в том сегменте была скорее условной. То Vega 64 откусит небольшой кусочек, то Radeon VII. И только теперь, с выходом мощных решений семейства Radeon RX 6000, это вполне может измениться. По крайней мере, все предпосылки для этого есть, ведь AMD анонсировала сразу несколько моделей, среднюю из которых мы рассмотрим сейчас, а старшая выйдет в декабре.

Лучшие графические процессоры AMD из предыдущего поколения, в виде Radeon RX 5700 (XT), были весьма неплохи по соотношению цены и производительности, но серьезно отставали от соответствующих видеокарт Nvidia как по возможностям, не имея аппаратной поддержки трассировки лучей и других фич DirectX 12 Ultimate, так и по энергоэффективности. Ну и топовых решений архитектуры RDNA первого поколения так и не появилось, так как именно низкая энергоэффективность и не позволила создать мощный GPU с вменяемым потреблением.

Так что абсолютно очевидно, что основными задачами AMD за прошедшие с анонса RDNA 1 месяцы являлось значительное улучшение энергоэффективности в RDNA 2 при одновременном добавлении всех недостающих возможностей, появившихся в графических API. И они действительно пообещали улучшить энергоэффективность сразу на 50%, а также мы ожидали добавления поддержки DX12 Ultimate, главной из возможностей которой является аппаратная трассировка лучей, применяемая даже уже и в новых консолях (эти чипы также спроектировали в AMD, но это уже другая история). Сегодня мы подробно поговорим о том, чего и как достигли специалисты AMD в погоне за явно вырвавшимся вперед конкурентом.

Ведь в последние годы с подачи Nvidia в играх все чаще начал применяться гибридный рендеринг с эффектами, рассчитанными при помощи трассировки лучей, которые выполняют хоть и пока что не самую большую, но довольно важную часть отрисовки сцены, вроде отражений или теней. И делают это с большей реалистичностью, по сравнению с любыми хитрыми хаками растеризации, выдуманными за эти годы. И архитектура RDNA 2 как раз включает полную поддержку DX12 Ultimate, включая трассировку лучей и другие возможности, которые или уже используются или вскоре будут использоваться в будущих играх, включая мультиплатформенные.

Среди других важных особенностей новых решений семейства Radeon RX 6000 отметим внедрение совершенно новой кэш-памяти последнего уровня Infinity Cache объемом в космические 128 МБ (для сравнения, все предыдущие GPU имеют ну пусть по 4 МБ кэш-памяти, не больше), что может во многом поменять подход к разработке приложений, а также пусть и не особенно новую принципиально, но ставшую доступной только теперь возможность доступа системы ко всей видеопамяти при помощи технологии Smart Access Memory, о которой мы подробно поговорим далее. А заодно, AMD заявляет о практически удвоенной производительности новых решений относительно Radeon RX 5700 XT, и это касается как игр, так и профессиональных приложений.

Основой рассматриваемой сегодня модели видеокарты Radeon RX 6800 XT стал графический процессор Navi 21, также известный как Big Navi, основанный на новой архитектуре RDNA второго поколения, которая тесно связана как с RDNA 1, так и с GCN последних поколений. И перед прочтением статьи будет полезно ознакомиться с нашими предыдущими материалами по видеокартам компании AMD:

Графический ускоритель Radeon RX 6800 XT
Кодовое имя чипа Navi 21
Технология производства 7 нм TSMC
Количество транзисторов 26,8 млрд (у Navi 10 — 10,3 млрд )
Площадь ядра 519,8 мм² (у Navi 10 — 251 мм²)
Архитектура унифицированная, с массивом процессоров для потоковой обработки любых видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX DirectX 12 Ultimate, с поддержкой уровня возможностей Feature Level 12_2
Шина памяти 256-битная: 4 независимых 64-битных контроллера памяти с поддержкой GDDR6
Частота графического процессора до 2250 МГц
Вычислительные блоки 72 (из 80) вычислительных блока CU, состоящих в целом из 4608 (из 5120) ALU для целочисленных расчетов и расчетов с плавающей запятой (поддерживаются форматы INT4, INT8, INT16, FP16, FP32 и FP64)
Блоки трассировки лучей 72 (из 80) блока Ray Accelerator для расчета пересечения лучей с треугольниками и ограничивающими объемами BVH
Блоки текстурирования 288 (из 320) блоков текстурной адресации и фильтрации с поддержкой FP16/FP32-компонент и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
Блоки растровых операций (ROP) 16 широких блоков ROP на 128 пикселей с поддержкой различных режимов сглаживания, в том числе программируемых и при FP16/FP32-форматах буфера кадра
Поддержка мониторов поддержка до шести мониторов, подключенных по интерфейсам HDMI 2.1 и DisplayPort 1.4a
Спецификации референсной видеокарты Radeon RX 6800 XT
Частота ядра (игровая/пиковая) 2015/2250 МГц
Количество универсальных процессоров 4608
Количество текстурных блоков 288
Количество блоков блендинга 128
Эффективная частота памяти 16 ГГц
Тип памяти GDDR6
Шина памяти 256-бит
Объем памяти 16 ГБ
Пропускная способность памяти 512 ГБ/с
Вычислительная производительность (FP16) до 41,5 терафлопс
Вычислительная производительность (FP32) до 20,7 терафлопс
Теоретическая максимальная скорость закраски 288 гигапикселей/с
Теоретическая скорость выборки текстур 648 гигатекселей/с
Шина PCI Express 4.0
Разъемы один HDMI 2.1, два DisplayPort 1.4a и один USB Type C
Энергопотребление до 300 Вт
Дополнительное питание два 8-контактных разъема
Число слотов, занимаемых в системном корпусе 2,5
Рекомендуемая цена $649 (59 990 рублей)

Наименование новой модели видеокарты соответствует принятому ранее принципу наименования решений компании — это следующее поколение после Radeon RX 5000, поэтому поменялась первая цифра, и это более высокий уровень производительности, поэтому вторая цифра — 8. Конкретно у модели RX 6800 XT есть как младшая сестра на том же чипе — RX 6800, так и старшая RX 6900 XT на полной версии Big Navi, которая заодно станет и топовой видеокартой AMD, когда выйдет 8 декабря.

Рекомендованная цена для Radeon RX 6800 XT составляет $649, а ценовая рекомендация для российского рынка — 59 990 рублей, что кажется выгодным предложением, но... судя по всему, новинку не минуют проблемы с дефицитом, как из-за повышенного интереса покупателей, так и не слишком больших поставок в розницу. Так что вполне вероятно, что доступность и у Radeon RX 6800 XT будет низкой, а цены останутся высокими как минимум еще какое-то время. Как и у конкурирующей GeForce RTX 3080, впрочем.

К слову о конкуренции. Именно RTX 3080 и представляется прямым конкурентом для новинки, хотя и имеет на несколько тысяч рублей большую цену. Но речь идет о рекомендованных производителями ценах, а что происходит на рынке в реальности, вы и сами наверняка знаете. RTX 3080 если и находятся в продаже, то заметно дороже рекомендованной цены. А RX 6800 XT в продаже пока что и вовсе не замечена. Но мы будем считать их прямыми ценовыми конкурентами, учитывая потенциально чуть более низкую цену видеокарты AMD.

Есть довольно важная разница между Radeon RX 6800 XT и конкурирующей GeForce RTX 3080 — объем видеопамяти. У видеокарты AMD ее 16 ГБ, а у Nvidia только 10 ГБ, что может быть потенциальным недостатком, если рассчитывать на несколько лет вперед. Пока что игры даже в 4K-разрешении при максимальных настройках и с трассировкой лучей не требуют большего объема памяти. Они могут занимать его, но ускорения при увеличении объема от 8-10 до 16 ГБ обычно не наблюдается. Правда, уже вышли консоли нового поколения с большим объемом памяти и быстрыми SSD, и в будущем некоторые мультиплатформенные или портированные с консолей игры могут начать требовать большего, чем 10 ГБ локальной видеопамяти, и по этому параметру новые видеокарты AMD явно имеют некий запас прочности.

Референсный дизайн карты RX 6800 XT выгодно отличается от карт предыдущих поколений, длина печатной платы составляет стандартные 267 мм и карта занимает два с половиной слота в корпусе. Предлагается весьма эффективная система охлаждения с большим радиатором и тремя большими вентиляторами. Новый кулер тише на 6 дБА, по сравнению с решением в Radeon RX 5700 XT. Общее потребление энергии платой ограничено значением в 300 Вт, а для подведения питания используются два стандартных 8-контактных разъема питания, в отличие от конкурента, который представил разъем собственного стандарта.

Стоит добавить немного слов и о нововведениях, связанных с разгоном. В настройках драйвера Radeon Software Adrenalin 2020 Edition есть три профиля работы видеокарты: Quiet, Balanced и Rage — тихий, сбалансированный и авторазгон соответственно. Эти профили автоматически меняют уровни питания и работы вентиляторов для достижения более тихой или быстрой работы GPU. Режим Rage доступен для RX 6800 XT и RX 6900 XT, но не для RX 6800.

Сбалансированный режим используется по умолчанию, а тихий вариант снижает энергопотребление и шум от кулеров (на 6%-9%) при незначительном ухудшении производительности (всего на 1%-2%). Режим разгона Rage повышает лимиты потребления и частоту вращения кулеров, чтобы получить небольшой прирост в скорости — также порядка пары процентов. Ничего особенно это не изменит, но в условиях близости показателей производительности с конкурирующими решениями каждый процент прироста FPS на счету.

Частотные характеристики Radeon RX 6800 XT в соответствующих режимах меняются от менее чем 2000 МГц до 2310 МГц, и разница по возможным частотам достигает 6%, хотя общая производительность чаще всего упирается в потребление, температуру GPU и другие показатели, а достичь подобной рабочей частоты не так уж просто, и графический процессор чаще всего работает на меньшей частоте.

Архитектурные особенности

При производстве графического процессора Big Navi используется уже известный нам техпроцесс 7 нм компании TSMC, который мы знаем по предыдущим решениям AMD. Чип содержит 26,8 миллиарда транзисторов и имеет площадь 519,8 мм² — сравните это с GA102 у Nvidia, для производства которого применяется техпроцесс 8 нм Samsung и который имеет 28,3 млрд транзисторов при площади в 628,4 мм² (все данные о сложности и площади — официальные числа AMD и Nvidia).

То есть при близкой сложности этих GPU техпроцесс TSMC явно выглядит получше по плотности размещения транзисторов, чем 8-нанометровый вариант Samsung, хотя разница между ними оказалась меньше ранее предполагавшейся — ведь техпроцесс Samsung является производным от более старого техпроцесса 10 нм и должен бы отставать сильнее. Тем более, что GA100, производимый на TSMC, получился еще более плотным, чем Big Navi.

Но для производительности важнее то, что по возможности достижения максимальных частот и энергопотреблению 7 нм TSMC также должен быть лучше, и тут явное преимущество у AMD. Другое дело — доступность, выход годных кристаллов, а значит и себестоимость. Для производства таких немаленьких чипов наверняка дешевле обходится продукция завода Samsung, не зря же Nvidia выбрала его для массовой продукции, хотя их большой вычислительный чип GA100 также использует производственные мощности TSMC.

Графический процессор Navi 21 (Big Navi) основан на архитектуре RDNA второго поколения (далее — RDNA 2), основной задачей при разработке которой было достижение максимально возможной энергоэффективности и внедрение всех необходимых функциональных возможностей. Базовые блоки чипа — все те же вычислительные блоки Compute Unit (CU), из которых собраны все графические процессоры AMD последних лет. Каждый CU имеет выделенное локальное хранилище данных для обмена данными или расширения локального регистрового стека, а также кэш-память и полноценный текстурный конвейер с блоками выборки и фильтрации. Каждый из таких блоков самостоятельно занимается планированием и распределением работы.

Как видите, архитектура RDNA 2 очень похожа на RDNA 1, хотя она и была серьезно переделана и обновлена. Полная версия Navi 21 содержит 80 вычислительных блоков CU (ровно вдвое больше, чем у Navi 10), которые состоят из 5120 блоков ALU, 320 блоков TMU, 128 блоков ROP и четырех асинхронных вычислительных движков. В версии Radeon RX 6800 XT их чуть меньше — отключены 8 блоков CU, поэтому осталось 4608 ALU и 288 TMU, а вот по ROP урезаний нет.

В общем, новый графический процессор Big Navi выглядит как удвоенный практически по всем блокам чип Navi 10, известный нам по Radeon RX 5700 (XT), так что подробности об особенностях вычислительных блоков RDNA (и 1 и 2) вы можете прочитать в соответствующем обзоре, а сегодня мы будем говорить об отличиях, вроде новых блоков для поддержки трассировки лучей и прочего.

Итак, важнейшей задачей компании, кроме добавления функциональности DX12 Ultimate, стало повышение энергоэффективности RDNA 2. Ведь если Radeon RX 5700 XT уже потребляет до 225 Вт, то вдвое более жирный GPU явно не впихнуть в рамки 300—350 Вт. Для улучшения энергоэффективности специалисты AMD переделали все блоки, перебалансировали конвейер, нашли и устранили все узкие места, переделали линии передачи данных, обработку геометрии внутри чипа, а также использовали опыт проектирования CPU с высокой рабочей частотой и в результате всей этой кропотливой работы получили действительно потрясающие результаты.

Новинка AMD до двух раз быстрее Radeon RX 5700 XT в 4K-разрешении, имеет на 30% бо́льшую тактовую частоту при том же потреблении энергии на каждый блок CU, что дает нам даже более чем обещанные +50% улучшения энергоэффективности — реальный прирост в определенных условиях составил, по оценке компании, 54%, что весьма неплохо и даже немного неожиданно после не слишком то энергоэффективной RDNA 1. Мы далее проверим эти данные, но за физическую реализацию GPU уже в любом случае можно похвалить AMD — проведена отличная работа!

Что касается более высокого уровня, то в вычислительных блоках RDNA 2 явно просматриваются корни предыдущей версии архитектуры, и улучшены они были скорее в смысле физической реализации, чем логической, которая слабо изменилась с первой версии RDNA. Хотя новые функциональные блоки для ускорения трассировки лучей и новый уровень кэша Infinity Cache также стали довольно важными изменениями.

О новом кэше и реализации блоков трассировки мы еще поговорим ниже, а из других отмеченных нами изменений — переделка блоков ROP. Каждый укрупненный блок ROP теперь обрабатывает по восемь 32-битных пикселей за такт, что вдвое больше того, что было раньше — вполне возможно, что это потребовалось из-за увеличения эффективной пропускной способности из-за большого кэша Infinity Cache. Добавили также и возможность использования переменной частоты затенения VRS, что стало дополнительной причиной переделки ROP, по всей вероятности.

Поддержка аппаратной трассировки лучей

Для аппаратного ускорения трассировки лучей, которая уже получила поддержку в играх, в RDNA 2 пришлось внедрять специализированные блоки Ray Accelerator. Хотя трассировку можно делать и полностью в шейдерах, но это очень сложная задача и без очень быстрой аппаратной обработки хотя бы части вычислений, общая скорость будет слишком низкой. На аппаратные блоки можно перенести хоть всю работу по трассировке лучей, но это будет дорого с точки зрения расходуемой площади чипа, и не всегда эффективно. Чаще всего лишь часть работы при трассировке лучей отдается специализированным блокам, но объем этой работы может быть разным в каждой конкретной реализации.

В случае RDNA 2 аппаратные ускорители трассировки занимаются поиском пересечений лучей и геометрии, и каждый из этих блоков способен за такт вычислить до четырех пересечений луча и ограничивающих объемов или одно пересечение луча и треугольника. Эти блоки достаточно эффективно вычисляют пересечения лучей и геометрии сцены, представленной в виде ускоряющих структур Bounding Volume Hierarchy, о которых мы вам неоднократно рассказывали в обзорах видеокарт GeForce RTX, и возвращают информацию шейдерам для дальнейшего обхода сцены или шейдинга.

Такой подход позволяет ускорить обработку пересечений лучей и геометрии в разы (AMD заявляет о более чем 10-кратной разнице), по сравнению с полностью программным методом, но это уступает решению Nvidia, в котором несколько бо́льшая часть работы делается в специализированных MIMD-блоках, а не обычными шейдерными SIMD, как в случае Radeon. То есть Ray Accelerators в RDNA 2 хоть и аппаратно выделенные блоки, но они несколько проще RT-ядер в графических процессорах семейств Ampere и Turing у конкурента. Зато такие упрощенные блоки занимают меньше места в GPU, хотя и должны несколько медленнее справляться с работой, особенно в случае большого количества некогерентных лучей. Ведь отдельные MIMD-ядра для трассировки подходят для этого куда лучше.

Трассировка лучей работает на RDNA 2, используя шейдерные SIMD-ядра, и хотя это не блокирует параллельное исполнение других вычислений, но свободных мощностей под операции затенения пикселей и другие задачи остается меньше. Та же трассировка лучей пока что использует малое количество лучей на пиксель и поэтому требует активного шумоподавления, а такие постфильтры весьма ресурсоемки и требуют немалых вычислительных мощностей.

Если подводить некий теоретический итог, то можно сказать, что RT-ядра у Nvidia сложнее и универсальнее (не требуют предварительной сортировки лучей для эффективной обработки, например), а у AMD они выполнены практичнее на сегодняшний день, так как занимают в GPU меньше места, что особенно важно с учетом ограниченности применения трассировки лучей на консолях и в будущих мультиплатформенных играх. Также, в AMD наверняка будут проводить работу с разработчиками игр для оптимизации трассировки под их решения, и хорошо бы это не вылилось в упрощение эффектов, в которых применяется трассировка.

К слову, большой кэш Infinity Cache способен вместить большую часть ускоряющей структуры BVH, что в теории должно позволить выполнять сложную трассировку более эффективно, с меньшими задержками при получении данных. Даже несмотря на то, что в играх BVH-структуры занимают от полугигабайта до нескольких гигабайт видеопамяти, не обязательно весь BVH помещать в кэш, и даже если ускорить доступ лишь к наиболее часто требуемым данным этой ускоряющей структуры, то быстрый кэш все равно должен помогать.

Мы проверим все это далее в синтетических и игровых тестах, а пока что посмотрите на данные самой AMD для рассматриваемой сегодня модели Radeon RX 6800 XT в нескольких играх с эффектами, выполненными с трассировкой лучей при разрешении рендеринга в 2560×1440 пикселей. Судя по этим результатам, получается, что Radeon RX 6800 XT вполне справляется с обеспечением комфортной игры при средней частоте кадров более 60 FPS при гибридном рендеринге. При этом настройки качества выбраны максимальные, хотя в представленных играх трассировка используется для одного из эффектов, а не сразу нескольких. То есть в других проектах мощи Big Navi может и не хватить.

Полная поддержка DirectX 12 Ultimate

Продолжая тему новых возможностей, отметим, что в Radeon RX 6000 появилась полная поддержка DirectX 12 Ultimate — нового стандарта качественной графики для ПК и консолей нового поколения, включающей уже упомянутую трассировку лучей через DirectX Raytracing, увеличение производительности при помощи переменной частоты затенения Variable Rate Shading, более эффективной поддержки стриминга текстур при помощи Sampler Feedback, а также возможности создания более детализированных игровых миров с новым геометрическим конвейером Mesh Shaders. Также ожидается поддержка и DirectStorage API для быстрого и прямого доступа GPU к данным на накопителях, но это будет позже.

Так уж получилось, что обо всех новых возможностях DirectX 12 Ultimate мы уже подробно рассказывали ранее в своих статьях о решениях Nvidia, и не видим смысла повторяться — кто заинтересуется, тот легко найдет наши объяснения того, как все это работает. Но вкратце все же расскажем. Например, еще одной интересной технологией, поддержку которой получила архитектура RDNA 2, стала переменная частота затенения Variable Rate Shading, которая уже поддерживается конкурирующими решениями с поколения Turing.

Эта возможность позволяет использовать отличающееся качество затенения для разных фрагментов изображения — там, где изображение не обязательно должно быть четким (например, применяется motion blur или эффект глубины резкости) вполне можно снизить качество расчетов шейдинга без видимых потерь, и наоборот — в важных местах оставить нормальное затенение с максимальным качеством и четкостью.

VRS в варианте AMD предполагает возможность выбора переменных частот затенения: 1×1, 2×1 и 1×2, а также 2×2 — отдельно для каждого из блоков 8×8 пикселей. Это позволяет достаточно подробно определить, какие участки кадра будут отрисовываться с меньшим качеством и большей производительностью. То есть затенение указанных участков производится с вдвое или вчетверо сниженным качеством, но повышенной скоростью. Проще всего визуализировать работу этого алгоритма на примере гоночных игр с эффектом motion blur на периферии кадра, но VRS можно использовать и иначе:

Красным на скриншоте показаны фрагменты с полным затенением, желтым — с половинным, а зеленым — с вчетверо меньшим качеством. Эта возможность уже используется в некоторых играх, включая совсем свежий проект Dirt 5, и это позволяет повысить производительность при шейдинге в теории до четырех раз для каждого из блоков 8×8 пикселей, но в целом для игрового кадра это будет несколько процентов снижения времени рендеринга кадра, и все это при незаметной для глаза потере в качестве.

Раз уж мы заговорили об аппаратно-программных особенностях, появившихся в RDNA 2, то отметим и пакет технологий с открытым кодом AMD FidelityFX, входящий в инициативу GPUOpen. Он помогает разработчикам игр внедрять хорошо оптимизированные эффекты в игры, для обеспечения отличного баланса качества и производительности. Первым таким эффектом стал фильтр улучшения четкости Contrast Adaptive Sharpening (CAS), полезный для игр, использующих сглаживание методом TAA, теряющим детали, а в текущем году были добавлены в пакет еще четыре эффекта: Ambient Occlusion, Screen Space Reflections, HDR Mapper и Downsampler (для ускорения генерации мип-уровней текстур шейдерами).

На видеокартах серии Radeon RX 6000 для расчета некоторых из них может применяться и трассировка лучей, а в качестве запасной опции всегда можно применить отражения в экранном пространстве или привычный расчет Ambient Occlusion, работающий также в экранном пространстве. С появлением на рынке решений нового семейства, добавляются еще два новых эффекта: Variable Shading и Denoiser, они используют новые возможности архитектуры RDNA 2 и помогают оптимизировать производительность и качество картинки.

Эти эффекты уже добавлены в такие игры, как Dirt 5 и The Riftbreaker, и скоро появятся на GPUOpen. Про Variable Shading мы уже писали, а шумоподавление при помощи Denoiser очень важно для гибридного рендеринга с трассировкой лучей, так как из-за большой ресурсоемкости используется малое количество лучей на пиксель, что вызывает очень шумную картинку, которую нужно серьезно улучшать.

Эффекты AMD FidelityFX уже используются в 35 играх, а самые новые или появились или вот-вот появятся в выходящих проектах, включая трассировку лучей и VRS в пяти играх. Также в будущем планируется добавить FidelityFX Super Resolution — вероятно, некий аналог Nvidia DLSS, особых подробностей о реализации которого пока что мало что известно. Технология важна уже потому, что многие игры последних лет в любом случае используют тот или иной метод повышения производительности в высоких разрешениях, включая временную реконструкцию, шахматный рендеринг, динамическое изменение разрешения рендеринга и т. д. Иногда это вызывает визуальные артефакты и точно увеличивает сложность внедрения подобных алгоритмов.

Для решения таких проблем и разрабатывается технология Super Resolution, которая точно будет использовать информацию из нескольких предыдущих кадров, аналогично DLSS, но как именно затем будет перестраиваться изображение в более высоком разрешении — мы пока что не знаем. Возможно, AMD применит открытый стандарт DirectML для работы умной нейросети, но им будет непросто обеспечить требуемую производительность без выделенных ядер, исполняющих тензорные вычисления, как у Nvidia. Ведь если на универсальные SIMD-ядра будут покушаться традиционные задачи растеризации и вычислений, к ним прибавятся вычисления, связанные с трассировкой лучей и повышением разрешения Super Resolution, то этих самых ресурсов может и не хватить.

Новая подсистема кэширования — Infinity Cache

Пожалуй, самой интересной особенностью семейства Radeon RX 6000 стал абсолютно новый уровень кэша, находящийся перед видеопамятью, позволяющий обеспечить быстрый доступ к данным и увеличивающий эффективную пропускную способность. В остальном все более-менее так же, как и у других GPU, L0-кэш расположен в каждом блоке CU, L1-кэш размещен в каждом движке шейдинга Shader Engine, и имеет эксклюзивный доступ к L2-кэшу, общий объем составляет 1 МБ, а L2-кэш объемом в 4 МБ, который расположен между движками Shader Engine и командным процессором.

На схеме сразу же выделяется очень большой Infinity Cache объемом в 128 МБ, который присоединяется к четырем 64-битным контроллерам памяти. Это новый тип кэш-памяти, которого ранее не было в GPU. Давайте разберемся, зачем он нужен и почему появился именно сейчас. Инженеры AMD стояли перед задачей обеспечения высокой пропускной способности, ведь в графическом процессоре Big Navi было удвоено число потоковых вычислительных блоков CU при увеличенной на треть частоте, по сравнению с Radeon RX 5700 XT, а пропускную способность видеопамяти так сильно повысить непросто.

Как прокормить все эти блоки данными? Нужно или расширять шину памяти до 512-битной или хотя бы 384-битной шины с одновременным увеличением частоты работы памяти. Но возможности GDDR6 почти полностью исчерпаны, у AMD нет доступа к более производительному типу памяти GDDR6X, который был разработан Micron и Nvidia, как минимум пока что, а HBM2 слишком дорога и ее применение вряд ли будет оправдано с экономической точки зрения.

В целом, повысить ширину шины памяти было вполне возможно, но не так просто с учетом более тонкого техпроцесса и меньшей площади чипа, но самое главное — при этом был бы сильный рост потребления энергии, и добиться заявленного прироста в энергоэффективности у инженеров бы просто не получилось. Поэтому в AMD и решили сделать еще один уровень кэш-памяти — последний уровень, стоящий прямо перед видеопамятью.

Кэширование решает вопрос пропускной способности, но это всегда компромисс, и обычно L2-кэши в GPU имеют небольшой объем в 2-4 МБ — в таком случае будет много промахов при доступе к данным, большинство их придется доставать из медленной видеопамяти, и только увеличение кэша до 64 МБ и более способно помочь в деле достаточного повышения эффективной ПСП. Но внедрение статической памяти такого объема обойдется слишком дорого в смысле занимаемой типичной кэш-памятью площади на кристалле.

Помогло то, что у AMD уже есть опыт по размещению большого объема статической памяти в серверных процессорах EPYC, в которых 32 МБ L3-кэша упакованы в 27 мм² — а это вчетверо больший объем на единицу площади, по сравнению с типичным кэшем второго уровня в GPU. Соответственно, AMD использовали разработки другого подразделения и разместили в Big Navi оптимизированный для нужд GPU кэш объемом аж в 128 МБ.

Передача данных происходит по 16 каналам шириной 64-бит (всего 1024-бит) на частоте до 1,94 ГГц, что дает почти вчетверо большую ПСП, чем у типичной GDDR6, присоединенной по 256-битной шине. В результате получили более чем вдвое большую эффективную ПСП, по сравнению с 384-битной шиной, и при этом улучшили энергоэффективность, ведь доступ к кэш-памяти требует в 5-6 меньших затрат энергии. В общем, по оценкам AMD получилась более чем вдвое лучшая энергоэффективность для 4К-разрешения в типичных играх, по сравнению с обычной 384-битной шиной.

Подобная подсистема памяти потребляет где-то на 10% меньше энергии при более чем вдвое большей эффективной ПСП. Внедрение подобного быстрого и объемного кэша не только позволило решить проблемы с ПСП, но и привело к раскрытию потенциала высокопроизводительных GPU — с ростом частоты работы графического процессора толк от Infinity Cache лишь увеличивается. Большинство необходимых данных при рендеринге достается из кэша, имеющего более высокую ПСП, что обеспечивает в среднем на треть меньшие задержки, по сравнению с доступом к GDDR6.

Также интересно то, что частота Infinity Cache изменяется в зависимости от потребности приложения в каждый момент времени. Когда оно требовательно к ПСП, частота работы кэша может расти, аналогично частоте GPU. В общем, подобная инновационная подсистема памяти приводит как к повышению пропускной способности и снижению задержек, так и одновременному снижению потребления энергии, что весьма важно для мощных GPU.

Внедрение Infinity Cache полезно для эффектов, требующих высокой частоты заполнения, вроде объемного освещения — вполне возможно, что таких эффектов в играх будущего станет больше, по крайней мере в играх с поддержкой AMD. Но сразу же возникает вопрос — а можно ли управлять этим большим кэшем? Например, жестко закрепить какие-то данные в определенном его участке, чтобы доступ к ним всегда был быстрым. AMD пока что подобных возможностей открывать не планирует, хотя видеодрайвер, конечно же, может управлять кэшем в целях оптимизации.

Для разработчиков приложений же этот кэш полностью прозрачный и автоматический, а управление им возможно разве что как в CPU — при помощи префетчей и т. д., что дает меньше контроля, но более универсальное. Ведь существуют GPU вообще без кэша, вышли с 128 МБ, а в будущем может появятся и с другим объемом — писать для всех отдельный код не кажется правильным решением, это же не консоли с фиксированной конфигурацией. Но AMD не отвергает возможности появления некоего контроля над кэшем для разработчиков ПО в будущем.

Начало ли это внедрения кэш-памяти последнего уровня во многие GPU, или просто костыль для нивелирования меньшей ПСП при 256-битной шине и GDDR6-памяти? Пойдет ли индустрия в эту сторону, будет ли Infinity Cache развиваться самой AMD, появится ли аналог в будущих решениях Nvidia? И что было бы лучше, потратить большую площадь GPU на подобный кэш или на большее количество функциональных блоков разного назначения (например, более сложные RT-ядра или тензорные ядра) и более производительную память? Увы, ответы на все эти вопросы мы пока не знаем. Любой кэш — это компромисс, всегда ведь лучше иметь доступ максимально быстрый и с минимальными задержками сразу ко всем данным. Но это невозможно, поэтому и приходится делать кэши из нескольких уровней. CPU прошли по этому пути, идут и GPU.

Smart Access Memory — улучшенный доступ к памяти

Еще одной из интересных новых возможностей стала технология Smart Access Memory — она позволяет системе получить полный доступ к видеопамяти по шине PCI Express. Ранее давался доступ лишь к куску 256 МБ видеопамяти, чего явно недостаточно для современных условий, а SAM позволяет расширить этот кусок до полного объема видеопамяти Radeon RX 6000 — до 16 ГБ. В некоторых играх это дает очень приличный прирост производительности, но в среднем это примерно 3%-5%.

Возможность изменения объема видеопамяти, к которой получает доступ система, существует в стандарте PCI Express уже давно. Она называется «Resizable BAR» (изменяемый Base Address Register) и доступна в драйверной модели WDDM 2 много лет, так что не очень понятно, почему AMD решили вытащить ее именно сейчас и так жестко ограничить возможность ее включения исключительно своей платформой, предоставив ее только редким владельцам процессоров Zen 3.

AMD говорит, что хотя Resizable BAR действительно доступна для широкого круга решений, но на данный момент они сосредоточились на оптимизации и проверке работы их собственного программного и аппаратного обеспечения из конкретного списка — только видеокарты Radeon RX 6000, процессоры серии Ryzen 5000 и чипсеты 500-й серии, а также требуется обновление BIOS с AGESA 1.1.0.0 и свежий видеодрайвер версии 20.11.2 или новее.

Технология Smart Access Memory включается из настроек BIOS при помощи опции вроде «Re-Size BAR Support», также нужно сначала включить опцию «Above 4G Decoding» в разделе «PCIe Subsystem». Все системные платы на основе чипсета X570 должны получить соответствующее обновление BIOS не позднее 18 ноября. И на данный момент нет планов для реализации поддержки SAM для предыдущих платформ AMD, и это можно понять. Но также важно понимать то, что технических ограничений нет, и AMD это подтверждает.

Итак, возможность не новая, но она требует поддержки в BIOS системных плат. Она должна включаться в настройках UEFI (Unified Extensible Firmware Interface) с отключенным режимом CSM (Compatibility Support Module), предназначенным для поддержки старого аппаратного обеспечения в UEFI. И тут есть очень важное уточнение — для работы SAM, операционная система должна быть установлена именно в режиме UEFI, а CSM должен был быть отключен изначально, но многие производители систем и материнских плат не включают UEFI по умолчанию. И есть ненулевая вероятность того, что ваша ОС была установлена в режиме совместимости — в таком случае отключение CSM и включение SAM приведет к ее неработоспособности.

Но что же она дает на практике? Приросты от включения Smart Access Memory зависят от игры, нагрузки на память, от разрешения рендеринга, настроек качества изображения, и могут быть разными для различных моделей видеокарт. В среднем, по данным компании AMD, прирост может быть от 0%-3% в таких играх, как Battlefield V, F1 2020, Shadow of the Tomb Raider и Wolfenstein: Youngblood, до очень приличных 10%-15% в Forza Horizon 4, Borderlands 3 и Resident Evil 3.

Но это по данным AMD, которые мы еще проверим далее. Важно понимать, что SAM не работает эффективно во всех случаях, в некоторых играх может даже наблюдаться некоторое падение производительности — особенно в случаях, когда производительность ограничена возможностями CPU. Вполне вероятно, что центральный процессор тратит время и на дополнительную обработку данных. В итоге, есть игры, в которых SAM ничего не дает вообще, а в некоторых, вроде Forza Horizon 4 или Gears 5, технология обеспечивает ощутимое преимущество.

Интересно, что наибольшие приросты от включения SAM наблюдаются в портированных с консолей играх. Это лишь наше предположение, но вполне возможно, что это означает то, что такой рендерер просто не слишком хорошо оптимизирован под ПК, недостаточно переделан с точки зрения доступа к оперативной и видеопамяти, ведь в консолях она общая. На игровых приставках можно делать многие вещи в унифицированной памяти, что противопоказано на ПК из-за медлительности доступа CPU к видеопамяти через шину PCI Express с явно меньшей пропускной способностью, по сравнению с ПСП любой памяти. И в случае недостаточно хорошо портированных на ПК проектов, можно вылезти за пределы 256 МБ куска, выделенного по умолчанию при стандартном BAR. До недавнего времени проектов, упирающихся в задержки доступа по PCI Express, просто не было, но они начали появляться, и именно в виде портированных с консолей игр, выходящих при поддержке AMD. Совпадение?

Мы не знаем точно, но становится не так удивительно, что раньше этой возможностью никто особо не пользовался, хотя Nvidia заявляет, что они исследовали ее и ранее, получая очень небольшое преимущество — возможно, поэтому и не стали продолжать. Главный же вопрос к AMD — почему SAM можно включить только на последнем поколении Ryzen? Они говорят, что максимум производительности обеспечивает лишь PCI-E 4.0, но ведь такая поддержка есть и у предыдущих процессоров Ryzen 3000, так почему на них нельзя включить эту возможность? В общем, эти ограничения кажутся надуманными и искусственными.

Будет очень интересно посмотреть на более универсальное решение Nvidia — как оно заработает на «старых» PCI-E 3.0 платформах и новых процессорах Intel с поддержкой четвертой версии PCI-E, которые выйдут в следующем году. Говорят, что решение Nvidia не будет зависеть от производителей системных плат и не будет требовать обновления их BIOS, а будет включаться у всех поддерживаемых GPU только для тех игр, которые получают преимущество от этой возможности. То есть достаточно будет обновить драйвер, и всё. Они давно работали над этой возможностью, и она даже работает в некоторых рабочих станциях, основанных на решениях Nvidia, а также серверах GeForce Now, но так как приросты небольшие и сильно зависят от условий, то не особенно развивали ее для игровых GPU. Но теперь Nvidia явно получила мотивацию для внедрения собственного решения, которое ожидается в начале следующего года или в конце этого. Ну а мы в практической части статьи проверим приросты от включения варианта AMD.

Вывод изображения и обработка видеоданных

Решения нового семейства Radeon RX 6000 поддерживают все популярные кодеки: H.264 (кодирование до 4K при 90 FPS и декодирование 4K до 150 FPS), H.265 (кодирование до 4K при 60 FPS и декодирование 4K до 90 FPS и 8K до 24 FPS), VP9 (только декодирование 4K при 90 FPS и 8K при 24 FPS) и AV1 (только декодирование до 8K при 30 FPS). Из нового тут отметим поддержку набирающего популярность формата AV1, аналогичные возможности по декодированию которого появились и у Nvidia, а значит, распространение видеоформата лишь расширится.

Для вывода изображения на экраны Radeon RX 6800 XT поддерживает долгожданный формат HDMI 2.1, позволяющий выводить изображение в разрешении 8K с частотой в 60 Гц или 4K с частотой 144 Гц по одному кабелю. Также поддерживается технология FreeSync и переменная частота кадров HDMI VRR. Вместо одного из DisplayPort разъемов на карту установлен разъем USB Type C с поддержкой подключения шлемов виртуальной реальности по одному проводу, но его также можно использовать и для подключения четвертого монитора.

Мы это проверили в практической части обзора, возможность отлично работает. В общем, со всеми теоретическими данными и потенциальными возможностями новых видеокарт компании AMD мы познакомились, самое время посмотреть на них вживую.

Особенности видеокарты AMD Radeon RX 6800 XT

Сведения о производителе: Компания ATI Technologies (торговая марка ATI) основана в 1985 году в Канаде как Array Technology Inc. В том же году была переименована в ATI Technologies. Штаб-квартира в г. Маркхам (Торонто). C 1987 года компания сконцентрировалась на выпуске графических решений для ПК. Начиная с 2000 года основным брендом графических решений ATI становится Radeon, под которым выпускаются GPU как для настольных ПК, так и для ноутбуков. В 2006 году компанию ATI Technologies покупает компания AMD, в которой образуется подразделение AMD Graphics Products Group (AMD GPG). C 2010 года AMD отказывается от бренда ATI, оставив лишь Radeon. Штаб-квартира AMD в Саннивейл (Калифорния), а у AMD GPG остается главным офисом бывший офис AMD в Маркхаме (Канада). Своего производства нет. Общая численность сотрудников AMD GPG (включая региональные офисы) — около 2000 человек .

Установка в тестовый стенд. Тестирование проводилось в закрытом продуваемом корпусе

Объект исследования: ускоритель трехмерной графики (видеокарта) AMD Radeon RX 6800 XT 16 ГБ 256-битной GDDR6

Характеристики карты

AMD Radeon RX 6800 XT 16 ГБ 256-битной GDDR6
GPU Radeon RX 6800 XT (Navi 21)
Интерфейс PCI Express x16 4.0
Частота работы GPU (ROPs), МГц 2015—2250(Boost)—2401(Max)
Частота работы памяти (физическая (эффективная)), МГц 4000 (16000)
Ширина шины обмена с памятью, бит 256
Число вычислительных блоков в GPU 72
Число операций (ALU) в блоке 64
Суммарное количество блоков ALU 4608
Число блоков текстурирования (BLF/TLF/ANIS) 288
Число блоков растеризации (ROP) 128
Число блоков Ray Tracing выделенных нет
Число тензорных блоков
Размеры, мм 270×110×55
Количество слотов в системном блоке, занимаемые видеокартой 3
Цвет текстолита черный
Энергопотребление пиковое в 3D, Вт 269 (с разовыми всплесками до 360)
Энергопотребление в режиме 2D, Вт 25
Энергопотребление в режиме «сна», Вт 4
Уровень шума в 3D (максимальная нагрузка), дБА 31,7
Уровень шума в 2D (просмотр видео), дБА 18,0
Уровень шума в 2D (в простое), дБА 18,0
Видеовыходы 1×HDMI 2.1, 2×DisplayPort 1.4a, 1×USB Type-C (USB 3.2 Gen2)
Поддержка многопроцессорной работы нет данных
Максимальное количество приемников/мониторов для одновременного вывода изображения 4 (включая вывод через USB Type-C)
Питание: 8-контактные разъемы 2
Питание: 6-контактные разъемы 0
Максимальное разрешение/частота, Display Port 7680×4320@60 Гц
Максимальное разрешение/частота, HDMI 7680×4320@60 Гц
Ожидаемая розничная стоимость карты 70 тысяч рублей (поскольку рекомендованная AMD стоимость — 59 990 рублей)

Память

Карта имеет 16 ГБ памяти GDDR6 SDRAM, размещенной в 8 микросхемах по 16 Гбит на лицевой стороне PCB. Микросхемы памяти Samsung (GDDR6, K4Z80325BC-HC16) рассчитаны на условную номинальную частоту работы в 4000 (16000) МГц.

Особенности карты и сравнение с AMD Radeon VII

AMD Radeon RX 6800 XT 16 ГБ AMD Radeon VII 16 ГБ
вид спереди
вид сзади

Прежде всего: почему мы сравниваем с Radeon VII? Несмотря на то, что у этих карт принципиально разные подходы по организации локальной видеопамяти (Radeon VII имеет встроенную в единую упаковку с GPU память типа HBM2, когда как у Radeon RX 6800 XT — внешняя GDDR6-память), формально Radeon RX 6000 все же являются преемниками прошлого флагмана Radeon VII. Ну и еще есть сходство в техпроцессах кристаллов GPU. Хотя мы все понимаем, что сравнение очень условное, карты совершенно разные.

Впервые компания AMD использует столь емкие микросхемы памяти в 16 Гбит. Поэтому удалось разместить всю память на лицевой стороне платы, что позволило упростить систему охлаждения с оборотной стороны.

Суммарное количество фаз питания у Radeon VII — 12, а у RX 6800 XT — 15.

Зеленым цветом отмечена схема питания ядра, красным — памяти. Посмотрим, кто за что отвечает. В принципе, все просто: AMD использует весьма дорогой 16-фазный ШИМ-контроллер XDPE132G5D (Infineon), который управляет 12 фазами питания GPU (сам контроллер расположен на оборотной стороне PCB). Имеется место под еще одну фазу, то есть PCB изначально рассчитана на 13 фаз для GPU (суммарно — 16). Вероятно, полностью все фазы используются в RX 6900 XT.

Также на оборотной стороны платы расположен и ШИМ-контроллер IR35217 (International Rectifier, которая сейчас также входит в состав Infineon). Он управляет тремя фазами питания микросхем памяти.

Синим цветом отмечен контроллер CYPD5137 (Cypress Semiconductor), он отвечает за USB-разъем, через который организован вывод изображения.

В преобразователе питания, традиционно для всех современных видеокарт, используются транзисторные сборки DrMOS — в данном случае TDA21472 (все того же IR/Infineon).

Сама печатная плата очень сложная, имеет 14 слоев, включая 4 медных слоя.

Карта имеет два обычных 8-контактных разъема питания. А вот по видеовыходам есть новшество. Мы уже отмечали, что у платы привычное количество видеовыходов: 4. Однако вместо привычных 3 DP мы видим всего 2, а один из них заменен на USB Type-C. Благодаря вышеупомянутому контроллеру Cypress этот разъем можно использовать как USB 3.2 Gen2, однако основное его предназначение — универсальный вывод изображения на приемники разного формата: от шлемов VR до мониторов/телевизоров с подобными входами. Также к нему через переходники/разветвители с USB Type-C на HDMI или на DP можно легко подключить мониторы или телевизоры с привычными входами. Например, мне удалось подключить к данной видеокарте телевизор через разъем USB Type-C и переходник-разветвитель на HDMI.

По умолчанию в 4К включается частота вертикальной развертки 30 Гц, надо зайти в настройки Windows 10 и поменять частоту на 60 Гц. Правда, HDR при таком выводе будет недоступен.

Что касается размеров карты Radeon RX 6800 XT, то они стандартные для видеокарт последнего десятилетия: 270×110×40 мм, что наглядно показано в начальном видеоролике. Там же есть и визуальное сравнение Radeon RX 6800 XT с конкурентом в лице GeForce RTX 3080. На фото ниже можно увидеть, что карта Nvidia имеет двухслотовое исполнение, в отличие от трехслотового Radeon RX 6800 XT, но при этом GeForce RTX 3080 FE ниже и длиннее.

Впрочем, эти любопытные факты вряд ли будут иметь какое-то значение в реальности, ведь GeForce RTX 3080 FE в продаже не найти, а референс-карты Radeon RX 6800 XT будут присутствовать в продаже (разумеется, под маркой Gigabyte, Asus, MSI, Sapphire и так далее) лишь первые полтора месяца, а затем (как заведено у AMD) производство референс-карт будет свернуто, и в продаже останутся только карты партнеров AMD с собственным дизайном.

Вот за что надо похвалить AMD, так это за потрясающую панель управления в драйверах. Во-первых, в отличие от драйверов конкурента, здесь есть вкладка с доступом к частотам и иным параметрам, позволяющим осуществлять разгон — не надо даже задумываться о сторонних утилитах для этих целей. Во-вторых, есть предустановки, позволяющие не ломать голову над тонкими настройками того же разгона. В-третьих, есть мониторинг состояния карты, что всегда полезно. Да, у Nvidia есть отдельная утилита GeForce Experience для задания настроек в играх, однако такой информации в ней нет.

Нагрев и охлаждение

Система охлаждения построена по классической схеме без новшеств типа сквозной продувки через карту, как придумала Nvidia. Но при этом в кулере нет тепловых трубок, так как любимая тема AMD — использование испарительных камер в СО. В данном случае применяется одна очень большая испарительная камера — узкая запаянная емкость с легкоиспаряющейся жидкостью внутри, одной стенкой прижатая к нагревающимся элементам, а второй припаянная к радиатору. В общем, очень схоже с принципом тепловых трубок, просто иной формы.

Основной радиатор, судя по весу, выполнен из медного сплава (и покрашен). Одной стороной он припаян к испарительной камере, другой соприкасается с кожухом. Ребра выполнены в поперечном направлении, поэтому горячий воздух выдувается через длинные торцы видеокарты вверх от нее и вниз — на материнскую плату. Длина видеокарты не запредельная, однако если под ее слотом установлен чипсет, накопитель в слоте M.2 или иной компонент системы, то он будет дополнительно нагреваться видеокартой. Испарительная камера соприкасается непосредственно с GPU и с большой рамой (через термоинтерфейс), на которой уже есть свои площадки для охлаждения микросхем памяти и силовых преобразователей питания VRM. Задняя пластина выполняет лишь чисто защитные функции (хотя она металлическая, а не пластиковая). Отметим, что для GPU используется графитовый термоинтерфейс — опять же, это в традициях AMD, потому что для испарительных камер лучше иметь интерфейс более толстый, нежели слой жидкой термопасты.

Кожух несет на себе три вентилятора (∅90 мм), у которых лопасти соединены кольцами (мы ранее уже видели подобные конструкции).

Мы давно привыкли к тому, что видеокарты среднего и топового классов останавливают свои вентиляторы в простое, при работе в 2D, если температура GPU опускается ниже примерно 55-60 градусов, и СО при этом становится бесшумной. Точно так же работает и данная видеокарта. Ниже есть видеоролик на эту тему.

Мониторинг температурного режима с помощью MSI Afterburner:

После 6-часового прогона под нагрузкой максимальная температура ядра не превысила 82 градусов, что выше, чем мы привыкли видеть, но все же является приемлемым результатом для видеокарты такого уровня.

Мы засняли и ускорили в 25 раз 8-минутный прогрев:

Максимальный нагрев наблюдался в районе преобразователей питания и самого GPU.

Шум

Методика измерения шума подразумевает, что помещение шумоизолировано и заглушено, снижены реверберации. Системный блок, в котором исследуется шум видеокарт, не имеет вентиляторов, не является источником механического шума. Фоновый уровень 18 дБА — это уровень шума в комнате и уровень шумов собственно шумомера. Измерения проводятся с расстояния 50 см от видеокарты на уровне системы охлаждения.

Режимы измерения:

  • Режим простоя в 2D: загружен интернет-браузер с сайтом iXBT.com, окно Microsoft Word, ряд интернет-коммуникаторов
  • Режим 2D с просмотром фильмов: используется SmoothVideo Project (SVP) — аппаратное декодирование со вставкой промежуточных кадров
  • Режим 3D с максимальной нагрузкой на ускоритель: используется тест FurMark

Оценка градаций уровня шума следующая:

  • менее 20 дБА: условно бесшумно
  • от 20 до 25 дБА: очень тихо
  • от 25 до 30 дБА: тихо
  • от 30 до 35 дБА: отчетливо слышно
  • от 35 до 40 дБА: громко, но терпимо
  • выше 40 дБА: очень громко

В режиме простоя в 2D температура была не выше 33 °C, вентиляторы не работали, уровень шума был равен фоновому — 18 дБА.

При просмотре фильма с аппаратным декодированием ничего не менялось, поэтому шум сохранялся на прежнем уровне.

В режиме максимальной нагрузки в 3D температура достигала 82 °C. Вентиляторы при этом раскручивались до 1500 оборотов в минуту, шум вырастал до 31,7 дБА: это отчетливо слышно, но не громко. В видеоролике ниже видно, как растет шум (шум фиксировался пару секунд через каждые 30 секунд).

В сравнении с тем, как шумели референсные карты предыдущих поколений (с «турбиной»), данный вариант можно считать настоящим прорывом.

Подсветка

Подсветка у карты имеется лишь в виде логотипа на скошенном верхне-переднем торце. Кстати, этот скос частично перекрывает выход воздуха из радиатора.

Так что в ПК без иных вариантов подсветки видеокарта будет мощно светить красным «Radeon» в темноте. Подсветка не регулируется и не выключается. У владельцев моддинговых ПК сей факт не вызовет разочарований.

Комплект поставки и упаковка

Комплект поставки, понятно, условный, ведь карты собственного выпуска компания AMD не продает (в отличие от конкурента), поэтому никто, кроме прессы и блогеров, такие упаковки не увидит.

Однако упаковка смотрится очень симпатично и стильно (в начальном видеоролике она представлена во всей красе).

Тестирование: синтетические тесты

Конфигурация тестового стенда

  • Компьютер на базе процессора Intel Core i9-10900K (Socket LGA1200):
    • Платформа:
      • процессор Intel Core i9-10900K (разгон 5,1 ГГц по всем ядрам);
      • ЖСО Cougar Helor 240;
      • системная плата Asus ROG Maximus XII Extreme на чипсете Intel Z490;
      • оперативная память Corsair UDIMM (CMT32GX4M4C3200C14) 32 ГБ (4×8) DDR4 (XMP 3200 МГц) ;
      • SSD Intel 760p NVMe 1 ТБ PCI-E;
      • жесткий диск Seagate Barracuda 7200.14 3 ТБ SATA3;
      • блок питания Seasonic Prime 1300 W Platinum (1300 Вт);
      • корпус Thermaltake Level20 XT;
    • операционная система Windows 10 Pro 64-битная; DirectX 12 (v.20H2);
    • телевизор LG 43UK6750 (43″ 4K HDR);
    • драйверы AMD версии 20.11.2/20.11.6;
    • драйверы Nvidia версии 457.09;
    • VSync отключен.

Тесты проводились в закрытом, хорошо продуваемом корпусе.

Мы также собрали тестовый стенд на базе процессора AMD Ryzen 9 5950X для исследования влияния AMD Smart Access Memory (SAM) на производительность в играх в разрешении 4К (процессор получили в последний момент, поэтому по остальным разрешениям пройтись не успели).

Получение самого быстрого на сегодня игрового процессора, самого дефицитного и самого дорогого

Для этих целей на время сменили материнскую плату на Asus Prime X570-Pro на базе чипсета AMD X570 с установленной последней версией BIOS, позволяющей включить SAM. Ниже все расскажем.

Мы провели тестирование видеокарты Radeon RX 6800 XT со стандартными частотами в нашем наборе синтетических тестов. Он продолжает постоянно меняться, добавляются новые тесты, а устаревшие постепенно убираются. Мы бы хотели добавить еще больше примеров с вычислениями, но с этим есть определенные сложности. Постараемся расширить и улучшить набор синтетических тестов, и если у вас есть четкие и обоснованные предложения — напишите их в комментариях к статье или отправьте авторам.

Мы полностью отказались от ранее активно использовавшихся нами тестов RightMark3D, так как они устарели слишком сильно, и на столь мощных GPU или не запускаются вообще, или упираются в различные ограничители, не загружая работой блоки графического процессора и не показывая его истинную производительность. А вот синтетические Feature-тесты из набора 3DMark Vantage мы все еще оставили в полном составе, так как заменить их попросту нечем, хотя и они уже изрядно устарели.

Из более-менее новых бенчмарков мы начали использовать несколько примеров, входящих в DirectX SDK и пакет SDK компании AMD (скомпилированные примеры применения D3D11 и D3D12), а также несколько разнообразных тестов для измерения производительности трассировки лучей, программной и аппаратной. В качестве полусинтетического теста у нас также используется и довольно популярный 3DMark Time Spy, а также некоторые другие — например, DX Raytracing.

Синтетические тесты проводились на следующих видеокартах:

  • Radeon RX 6800 XT со стандартными параметрами (RX 6800 XT)
  • Radeon VII со стандартными параметрами (Radeon VII)
  • Radeon RX 5700 XT со стандартными параметрами (RX 5700 XT)
  • GeForce RTX 3080 со стандартными параметрами (RTX 3080)
  • GeForce RTX 3070 со стандартными параметрами (RTX 3070)
  • GeForce RTX 2080 Ti со стандартными параметрами (RTX 2080 Ti)

Для анализа производительности новой видеокарты Radeon мы выбрали несколько видеокарт компании AMD из разных поколений. Аналогов по позиционированию в предыдущем поколении Radeon не было, но Radeon VII мы взяли в качестве самого быстрого решения, хоть уже и давно исчезнувшего из продажи, а вот Radeon RX 5700 XT выступает как наиболее производительный графический процессор архитектуры RDNA первого поколения.

Прямым соперником для нового Radeon у компании Nvidia является GeForce RTX 3080, и без него мы обойтись никак не можем. Дополнительно взяли еще и менее и более производительные решения из последнего же поколения RTX 30. Ну и также сравним новинку с GeForce RTX 2080 Ti, как с наиболее производительным графическим процессором архитектуры Turing из предыдущего поколения.

 
Тесты из 3DMark Vantage
 
Тесты Direct3D 11
 
Тесты Direct3D 12
 
Тесты трассировки лучей
 
Вычислительные тесты
 
Тесты технологии Smart Access Memory

Тестирование: игровые тесты

Список инструментов тестирования

Во всех играх использовалось максимальное качество графики в настройках.

  • Gears 5 (Xbox Game Studios/The Coalition)
  • Wolfenstein: Youngblood (Bethesda Softworks/MachineGames/Arkane Studios)
  • Death Stranding (505 Games/Kojima Productions)
  • Red Dead Redemption 2 (Rockstar)
  • Watch Dogs: Legion (Ubisoft/Ubisoft)
  • Control (505 Games/Remedy Entertainment)
  • Deliver Us The Moon (Wired Productions/KeokeN Interactive)
  • Resident Evil 3 (Capcom/Capcom)
  • Shadow of the Tomb Raider (Eidos Montreal/Square Enix), HDR включен
  • Metro Exodus (4A Games/Deep Silver/Epic Games)

Специалисты AMD рекомендовали использовать для Radeon RX 6800 XT режим автоматического повышения частот Rage Mode (в локализованном варианте — «Ярость»). Мы провели отдельные тесты с «Яростью».

Стандартные результаты тестов без использования аппаратной трассировки лучей в разрешениях 1920×1200, 2560×1440 и 3840×2160

 
Gears 5
 
Wolfenstein: Youngblood
 
Death Stranding
 
Red Dead Redemption 2
 
Watch Dogs: Legion
 
Control
 
Deliver Us The Moon
 
Resident Evil 3
 
Shadow of the Tomb Raider
 
Metro Exodus

Поскольку ранее выпущенные видеокарты AMD не поддерживают технологии трассировки лучей, а также у них нет поддержки «умных» технологий антиалиасинга типа Nvidia DLSS, мы вынуждены для массового тестирования отключать как трассировку, так и DLSS для получения адекватного сравнения всех карт. Однако на сегодня уже половина из 28 регулярно тестируемых нами видеокарт поддерживает технологию RT, поэтому мы приняли решение, что будем проводить тесты не только с использованием обычных методов растеризации, но и с включением RT. Разумеется, пока в этом списке только видеокарты Nvidia серии RTX и AMD Radeon RX 6800/6800 XT.

Результаты тестов с включенной аппаратной трассировкой лучей в разрешениях 1920×1200, 2560×1440 и 3840×2160

 
Watch Dogs: Legion, RT
 
Control, RT
 
Shadow of the Tomb Raider, RT
 
Metro Exodus, RT

К сожалению, у новинок AMD наблюдается серьезное падение производительности при активизации технологии RT.

Рейтинг iXBT.com

Рейтинг ускорителей iXBT.com демонстрирует нам функциональность видеокарт друг относительно друга и представлен в двух вариантах:

  1. Вариант рейтинга iXBT.com без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по самому слабому ускорителю — Radeon RX 560 (то есть сочетание скорости и функций Radeon RX 560 приняты за 100%). Рейтинги ведутся по 28 ежемесячно исследуемым нами акселераторам в рамках проекта Лучшая видеокарта месяца. В данном случае из общего списка выбрана группа карт для анализа, в которую входят Radeon RX 6800 XT и его конкуренты.

Рейтинг приведен суммарно для всех трех разрешений.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
02 RTX 3080 10 ГБ, 1440—1995/19000 1030 124 83 000
03 RX 6800 XT 16 ГБ, Rage Mode 1000 143 70 000
04 RX 6800 XT 16 ГБ, 2015—2401/16000 980 140 70 000
07 RTX 2080 Ti 11 ГБ, 1350—1950/14000 830 108 77 000

Если взять чистую производительность в играх без участия трассировок лучей и иных «умных» проприетарных технологий, то новый Radeon RX 6800 XT выступает практически на уровне конкурента GeForce RTX 3080, лишь чуть-чуть уступая ему в среднем. Включение режима Rage Mode помогает незначительно и не меняет расклад принципиально. Мы исследовали влияние AMD Smart Access Memory, которое также проявляется в считанных процентах прироста производительности (там разброс по играм более существенный), и вполне возможно, что если в компьютере у пользователя используется процессор Ryzen 5000 (что пока крайне сомнительно) и он включил SAM на постоянной основе, то в итоге будет полный паритет. Однако Nvidia работает над собственным вариантом SAM (работа уже в завершающей стадии), что может вновь склонить чашу весов в ее пользу.

  1. Вариант рейтинга iXBT.com с включением RT

Рейтинг составлен по 4 тестам с применением технологии трассировки лучей. На сегодня она поддерживается ускорителями серии Nvidia GeForce RTX и AMD Radeon RX 6000. Этот рейтинг нормирован по самому слабому ускорителю в группе — GeForce RTX 2060 (то есть сочетание скорости и функций GeForce RTX 2060 приняты за 100%).

Рейтинг приведен суммарно для всех трех разрешений.

Модель ускорителя Рейтинг iXBT.com Рейтинг полезности Цена, руб.
02 RTX 3080 10 ГБ, 1440—1995/19000 300 36 83 000
03 RTX 3070 8 ГБ, 1440—1950/14000 230 43 53 500
04 RTX 2080 Ti 11 ГБ, 1350—1950/14000 220 29 77 000
05 RX 6800 XT 16 ГБ, Rage Mode 200 29 70 000
06 RX 6800 XT 16 ГБ, 2015—2401/16000 190 27 70 000

А вот здесь для Radeon RX 6800 XT все печально, даже очень печально. Ведь флагман AMD проиграл не только GeForce RTX 3080, но и более дешевому GeForce RTX 3070. Более того, в ряде игр при использовании видеокарты AMD наблюдаются артефакты, например некорректная отрисовка отражений в Watch Dogs: Legion.

Рейтинг полезности

Рейтинг полезности тех же карт получается, если показатель предыдущего рейтинга разделить на цены соответствующих ускорителей. Учитывая возможности Radeon RX 6800 XT и ее явную нацеленность на использование в высоких разрешениях, приводим рейтинг только для разрешения 4К (поэтому цифры в рейтинге iXBT.com иные). Для расчета рейтинга полезности использованы розничные цены на середину ноября 2020 года.

  1. Вариант рейтинга полезности без включения RT

Рейтинг составлен по всем тестам без использования технологий трассировки лучей. Этот рейтинг нормирован по самому слабому ускорителю — Radeon RX 560 (то есть сочетание скорости и функций Radeon RX 560 приняты за 100%). В данном случае из общего списка выбрана группа карт для анализа, в которую входят Radeon RX 6800 XT и его конкуренты.

Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
02 RTX 3070 8 ГБ, 1440—1950/14000 241 1287 53 500
03 RX 6800 XT 16 ГБ, Rage Mode 238 1666 70 000
05 RX 6800 XT 16 ГБ, 2015—2401/16000 230 1613 70 000
08 RTX 3080 10 ГБ, 1440—1995/19000 211 1755 83 000
13 RTX 2080 Ti 11 ГБ, 1350—1950/14000 166 1282 77 000

Рекомендованная розничная цена Radeon RX 6800 XT, объявленная AMD для российского рынка — 59 990 рублей. Учитывая новизну и дефицит данных видеокарт, мы прибавили к рекомендованной цене 10 тысяч рублей, которые торговые компании стопроцентно приплюсуют. Потому в качестве условной стоимости Radeon RX 6800 XT мы взяли 70 000. Поскольку цены на GeForce RTX 3080 до сих пор очень далеки от рекомендованных (65 тысяч рублей), то и начальный ценник на Radeon RX 6800 XT может быть сильно выше даже этих 70 тысяч. Так или иначе, для составления рейтинга нам надо остановиться на какой-то цифре, и если предположить, что новинку можно будет приобрести за 70 тысяч, то для потребителей, не заинтересованных в трассировке лучей как технологии (или не заинтересованных в конкретных имеющихся играх с ее реализацией), приобретение Radeon RX 6800 XT окажется интереснее, нежели GeForce RTX 3080. Однако с рядом оговорок.

  1. Вариант рейтинга полезности с включением RT

Рейтинг составлен по 4 тестам с применением технологии трассировки лучей. На сегодня она поддерживается ускорителями серии Nvidia GeForce RTX и AMD Radeon RX 6000. Этот рейтинг нормирован по самому слабому ускорителю в группе — GeForce RTX 2060 (то есть сочетание скорости и функций GeForce RTX 2060 приняты за 100%).

Модель ускорителя Рейтинг полезности Рейтинг iXBT.com Цена, руб.
01 RTX 3070 8 ГБ, 1440—1950/14000 51 275 53 500
04 RTX 3080 10 ГБ, 1440—1995/19000 46 379 83 000
09 RTX 2080 Ti 11 ГБ, 1350—1950/14000 34 261 77 000
10 RX 6800 XT 16 ГБ, Rage Mode 33 231 70 000
11 RX 6800 XT 16 ГБ, 2015—2401/16000 33 231 70 000

Упомянутые выше оговорки заключаются в том, что как только потребитель столкнется с игрой, поддерживающей RT (а таких становится все больше, и дальше будет только больше, потому что новые консоли поддерживают RT, а отдельно для ПК сейчас мало кто выпускает игры, все идут по универсальному пути мультиплатформы), то здесь уже не только GeForce RTX 3080, но и старый добрый GeForce RTX 2080 Ti (сравнимый по цене с новыми Radeon RX 6800 XT при условии, что вы найдете эти карты в рознице) опережает новый ускоритель AMD. Увы, это ахиллесова пята нового семейства Radeon.

Выводы

Как мы говорили ранее, Nvidia GeForce RTX 3080 уже позволяет комфортно играть в 4К при максимальных настройках графики. Radeon RX 6800 XT находится почти на уровне соперника, так что то же самое справедливо и для него.

В целом AMD Radeon RX 6800 XT значительно превышает результаты прежнего лидера этого семейства — Radeon VII (а также результаты Radeon RX 5700 XT). Он открывает игрокам разрешение 4К, обеспечивая в нем отменную производительность при высоких настройках графики, но при условии, что игрок не будет включать трассировку лучей!

Ранее мы не раз писали про перспективы трассировки лучей в играх. Всем очевидно, что индустрия приняла данную технологию как стандарт, и будет появляться все больше игр с RT. Казалось бы, выход новых решений AMD, поддержавших этот стандарт, должен еще больше подстегнуть применение RT. Однако сильное падение производительности в играх с трассировкой лучей у новых решений AMD немного умеряет оптимизм. Впрочем, это лишь первое подобное решение у AMD. Вспомним, как более 2 лет назад после выхода Nvidia GeForce RTX 20 в играх обнаруживалось аналогичное сильнейшее падение скорости при включении RT, и сколько копий тогда было сломано в обсуждениях, кому оно надо такое красивое...

Но жизнь идет, как и работа над ошибками, и теперь мы видим, что у Nvidia вышли новые решения, которые меньше теряют от включения RT, плюс усовершенствована технология DLSS, позволяющая играть с RT вообще без потери производительности. Ждем нечто подобное и у AMD. Но самое главное, что теперь аппаратная трассировка лучей и другие возможности DX12 Ultimate поддерживаются решениями обоих основных производителей GPU, а также есть поддержка в вышедших консолях, поэтому не осталось никаких преград для внедрения новых эффектов в игры.

Наличие 16 ГБ локальной памяти должно обеспечить Radeon RX 6800 XT некоторое преимущество, особенно если держать в уме будущие игры. Понятно, что потребителю нравятся большие числа на коробках, и чем эти числа выше, тем охотнее он приобретет такую видеокарту. Но так сильно ли проиграла Nvidia, предложив всего 10 ГБ памяти у своего GeForce RTX 3080 против 16 ГБ у соперника? Не думаем. Опыт показывает, что пока даже в 4К при максимальных настройках графики потребление памяти играми едва превышает 8 ГБ, поэтому 10 ГБ у GeForce RTX 3080 хватит на пару лет точно, а через год выйдут «рефреши» типа Super, которые смогут предложить больше памяти за те же деньги. На сегодня 16 ГБ совершенно не требуется (разве что для профессионального применения).

Что касается конкретной видеокарты AMD Radeon RX 6800 XT (16 ГБ), то она хороша с точки зрения потребительских характеристик: плата стандартная по длине, хоть и занимает три слота в системном блоке (формально 2,5, но де-факто 3). Шум невысокий, и в сравнении с референсными картами прошлых поколений (особенно Radeon RX 5700 XT и Radeon RX 5700) это большой прогресс. Однако при этом крайне желательна хорошая продувка корпуса, потому что все выделяемое видеокартой тепло остается внутри системного блока. Впрочем, карты, основанные на референс-образцах, в любом случае пробудут на рынке очень недолго — их можно будет встретить только в первых партиях видеокарт партнеров AMD. Далее в продажу поступят видеокарты их собственной разработки и дизайна. Сама же AMD референс-карты конечным потребителям не продает.

Следует также обратить внимание на ряд сопутствующих семейству Radeon RX 6000 новых интересных решений AMD, включая поддержку стандарта HDMI 2.1, позволяющего выводить 4K-изображение с частотой 120 Гц или 8K-изображение при помощи одного кабеля. Также отметим поддержку аппаратного декодирования видеоданных в формате AV1, технологию Smart Access Memory, способную обеспечить небольшой прирост производительности при совместной работе новых ускорителей с процессорами Ryzen 5000, а также технологию снижения задержек Radeon Anti-Lag, полезную для киберспортсменов. Будет интересно посмотреть на работу Infinity Cache в нестандартных условиях — вполне возможны игры и настройки, при которых он будет работать недостаточно эффективно.

В заключение еще раз констатируем: Radeon RX 6800 XT отлично подходит для игры в разрешении 4К с высоким качеством графики, но при включении RT новый ускоритель способен обеспечить приемлемый комфорт в таком разрешении лишь в некоторых играх. А вот в разрешении 2.5К эта видеокарта легко потянет игры с максимальным качеством графики с трассировкой лучей.

Еще раз отметим, что сегодня 4К-приемники (как мониторы, так и телевизоры) сильно упали в цене. Сейчас они представлены уже не только в премиальном ценовом сегменте, как это было 2-3 года назад, когда 4К-мониторы и 4К-телевизоры с реальным HDR имели стоимость около 100 тысяч рублей или выше.

В номинации «Оригинальный дизайн» карта AMD Radeon RX 6800 XT (16 ГБ) получила награду:

Благодарим компанию AMD Russia
и лично Ивана Мазнева
за предоставленные на тестирование видеокарты

Для тестового стенда:
блок питания Seasonic Prime 1300 W Platinum предоставлен компанией Seasonic

21 ноября 2020 Г.