AMD Radeon R9 290X

Дотянись до Гавайев! Получишь новые вершины скорости и функциональности


Содержание

Вот представьте себе, вы: на берегу моря, даже океана… Белый песок, шум прибоя, пенный прилив… Где-то вдали огромные замки кучевых облаков. И никого… Взгляд невольно скользит по песку и замечает тружеников крабов, которые самоотверженно в короткое время, пока волны отступают на время отлива, производят тысячи шариков из песка. Глаза остановились на двух крабах, метрах в двух друг от друга… Один, зеленоватого цвета, делает большие шарики, но в норку не кидает, а оставляет. Зато сделав один большой, он затем быстро ваяет мелкие шарики и один за другим кидает в свою норку. А второй, красноватого цвета, делает большие и малые шарики, при этом его большие шары — поменьше, чем у зеленоватого сородича. Уже устав, он сделал очень большой шар и на исходе сил толкнул его в норку. При этом зеленоватый краб просто взял ранее сделанный такой же большой шар и легким движением клешки отправил его в свою нору.

Глядя на эту незатейливую картину, я вдруг поймал себя на мысли, что это все — полная аналогия ситуации с 3D-ускорителями. Стоит лишь представить, что норки — это рынок тех самых видеокарт. Кто зеленоватый, а кто красноватый краб — читатель может догадаться и сам. И ведь так и есть на самом деле…

Собственно, об одном «очень большом» шаре «красноватого краба» мы сегодня и расскажем. Не случайно сочетаются кодовое имя Гавайи и пришедшая на ум аналогия на пляже… И ведь «красноватый краб» не зря так трудился. В свет вышел очень мощный и солидный продукт, разбивающий в пух и прах соперника в лице Geforce GTX 780. Вот об этом и материал.

Часть 1: Теория и архитектура

Мы уже выпустили подробный теоретический материал о новой линейке графических решений компании AMD, состоящей из семейств Radeon R7 и R9. Но тогда были официально анонсированы лишь те видеокарты, которые оказались переименованными решениями предыдущего поколения. И хотя они отличаются весьма привлекательными ценами, технически это — всё те же давно известные видеокарты серии Radeon HD 7000, и почти все представленные тогда видеокарты имеют близнецов из ближайшего прошлого.

И вот наконец-то AMD решилась анонсировать и старшее решение своей линейки — Radeon R9 290X, которое интересно применённым в нём новым графическим чипом под кодовым названием Hawaii. Профильной прессе оно было представлено на острове Оаху — одном из Гавайских островов, которые отличаются прекрасным климатом и шикарными условиями для отдыха у берегов Тихого океана.

Но работники самой компании AMD смогли отдохнуть лишь после анонса новых решений, а до выпуска нового топового GPU им пришлось серьёзно над ним поработать. Ведь потребление энергии предыдущим топовым чипом Tahiti (почему-то на Таити нас не возили, кстати), который лёг в основу видеокарты Radeon HD 7970, и так уже близко к предельному, возможному при условии подключения привычного набора разъёмов дополнительного питания: 6- и 8-контактного.

Энергоэффективность топовых видеочипов Nvidia текущего поколения явно выше, чем у Tahiti, поэтому конкурент AMD выпустил не только модель Geforce GTX 780, но и GTX Titan, которые превосходили Radeon HD 7970 GHz по производительности. Компании AMD нужно было ответить чем-то если не на Titan, который стоит слишком дорого и предназначен для редких энтузиастов, но на GTX 780, которая стала довольно популярной среди небедных любителей ПК-игр.

Поэтому в Hawaii разработчикам из AMD пришлось заметно увеличивать количество исполнительных устройств, но повышать энергопотребление было уже почти некуда. Точнее, его нужно было удержать в определённых рамках, повысив, но не настолько, насколько возросла производительность. То есть, главной задачей при разработке нового GPU стало повышение той самой энергоэффективности, от которой сейчас зависит всё. Справились ли они с задачей? Выяснить это — и есть основная цель нашего материала.

Напомним, какие видеокарты входят в новые семейства видеокарт AMD Radeon. Линейка компании теперь содержит несколько серий: серии R9 и R7 (в будущем ожидается и бюджетная серия R5, но для игроков она не особенно интересна). Новая линейка компании содержит следующие модели, закрывающие большинство рыночных сегментов:

Итак, видеокарты моделей R7 250 и R7 260X предназначены для ценового диапазона $90—$140 (цены на рынке США), R9 270X продаётся за $200, а R9 280X — за $300. Что же касается флагмана линейки — модели R9 290X — то его рекомендованная цена на рынке США составляет всего лишь $549, и это — достаточно сильный ход AMD, с учётом того, что та же Geforce GTX 780 стоит дороже.

Посмотрим, что думает сама AMD по поводу позиционирования своего нового решения верхнего уровня. Для этого они традиционно берут бенчмарк Fire Strike из последней версии Futuremark 3DMark, в двух разных версиях: Performance и Extreme. Благодаря тому, что этот бенчмарк отлично подходит для современных видеокарт компании AMD, количество очков, набранное в нём видеокартой Radeon R9 290X (о двух режимах работы мы поговорим позднее) позволяет заметно превзойти по производительности своего главного конкурента — Geforce GTX 780.

Так как новая модель видеоплаты Radeon R9 290X во многом повторяет особенности предыдущей серии Radeon HD 7000, то перед прочтением данного материала будет полезно ознакомиться с подробной информацией о ранних решениях компании AMD:

Переходим к описанию технических характеристик анонсированной недавно топовой видеокарты из нового семейства, основанной на новом GPU с кодовым названием «Hawaii».

Графический ускоритель Radeon R9 290X

  • Кодовое имя чипа: «Hawaii»
  • Технология производства: 28 нм
  • 6,2 млрд. транзисторов (у «Tahiti» в Radeon HD 7970 — 4,3 млрд.)
  • Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
  • Аппаратная поддержка DirectX 11.2, в том числе шейдерной модели Shader Model 5.0
  • 4 геометрических процессора
  • 512-битная шина памяти: восемь контроллеров шириной по 64 бита, с поддержкой памяти GDDR5
  • Частота ядра до 1000 МГц (динамическая)
  • 44 вычислительных блока GCN, включающих 176 SIMD-ядер, состоящих в целом из 2816 ALU для расчётов с плавающей запятой (поддерживаются целочисленные и плавающие форматы, с точностью FP32 и FP64)
  • 176 текстурных блоков, с поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
  • 64 блока ROP с поддержкой режимов полноэкранного сглаживания с возможностью программируемой выборки более чем 16 сэмплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 64 отсчетов за такт, а в режиме без цвета (Z only) — 256 отсчетов за такт
  • Интегрированная поддержка до шести мониторов, подключённых по интерфейсам DVI, HDMI и DisplayPort

Спецификации видеокарты Radeon R9 290X

  • Частота ядра: до 1000 МГц
  • Количество универсальных процессоров: 2816
  • Количество текстурных блоков: 176, блоков блендинга: 64
  • Эффективная частота памяти: 5000 МГц (4×1250 МГц)
  • Тип памяти: GDDR5
  • Объем памяти: 4 гигабайта
  • Пропускная способность памяти: 320 гигабайт в сек.
  • Вычислительная производительность (FP32) 5,6 терафлопс
  • Теоретическая максимальная скорость закраски: до 64 гигапикселей в сек.
  • Теоретическая скорость выборки текстур: до 176 гигатекселей в сек.
  • Шина PCI Express 3.0
  • Два разъема Dual Link DVI, один HDMI, один DisplayPort
  • Энергопотребление до 275 Вт
  • Один 8-контактный и один 6-контактный разъёмы питания;
  • Двухслотовый дизайн
  • Рекомендуемая цена для рынка США — $549 (для России — 19990 руб).

Из названия новинки понятно, что система наименований у видеокарт AMD изменилась и она неидеальна, на наш взгляд. Её введение частично оправдано тем, что подобная система давно применяется и в APU собственного производства (семейства A8 и A10, к примеру), да и другими производителями (например, Intel Core i5 и i7 имеют схожую систему наименования процессоров), но для видеокарт предыдущая система наименований была явно логичнее и понятнее. Интересно, что заставило AMD сменить её именно сейчас, хотя в запасе у них была как минимум линейка Radeon HD 9000, да и приставку «HD» можно было поменять на другую.

Остается не совсем понятным для нас и разделение на семейства R7 и R9: почему 260X принадлежит ещё к семейству R7, а 270X уже относится к R9? Впрочем, с рассматриваемой в материале Radeon R9 290X всё несколько логичнее, она относится к топовому семейству R9 и имеет максимальный порядковый номер в серии — 290. Но зачем нужно было затевать ещё и чехарду с суффиксами «X»? Почему нельзя было обойтись цифрами, как это было в предыдущем семействе? Если мало трёх разрядов, а цифры вроде 285 и 295 не нравятся, то можно было оставить четыре цифры в названии: R9 2950 и R9 2970. Но тогда бы система не сильно отличалась от предыдущей, а маркетологам нужно как-то оправдывать свои рабочие места. Ну да ладно, название видеокарты — дело десятое, лишь бы товар хорошим был и свою цену оправдывал.

И с этим нет никаких проблем, рекомендованная цена на Radeon R9 290X ниже, чем у соответствующего топового решения конкурента из этого же ценового сегмента. Выпуск Radeon R9 290X явно нацелен на то, чтобы бороться с Nvidia Geforce GTX 780, основанной на чипе GK110, которая является топовой платой конкурента (Geforce GTX Titan в расчёт не берём, так как эта модель всегда была отдельным, чисто имиджевым решением) и пока что имеет чуть более высокую рекомендованную цену. Впрочем, есть большая вероятность того, что так долго не продлится, может выйти как ещё более производительный вариант Geforce, так и могут быть снижены цены на текущие топовые модели от Nvidia.

Новая модель видеокарты AMD, которую мы сегодня рассматриваем, имеет память GDDR5 объёмом в четыре гигабайта. Так как графический чип Hawaii имеет 512-битную шину памяти, то на неё теоретически можно было бы поставить и 2 ГБ, но такой объём GDDR5-памяти для топового решения уже слишком мал, тем более, что Radeon HD 7970 отличалась 3 ГБ памятью, да и современные проекты вроде Battlefield 4 уже рекомендуют не менее 3 ГБ видеопамяти. А уж четырёх гигабайт точно хватит в любых современных играх при самых высоких настройках и разрешениях.

Что касается потребления энергии, то вопрос этот непростой. Хотя на бумаге энергопотребление новой модели не слишком выросло, по сравнению с Radeon HD 7970 GHz, тут есть нюансы. Как и некоторые предыдущие топовые решения, AMD Radeon R9 290X имеет специальный переключатель на карте, которые позволяет выбирать одну из двух прошивок BIOS. Этот переключатель размещён на торце видеокарты рядом с монтажной планкой с видеовыходами. Естественно, после переключения потребуется перезагрузка ПК для того, чтобы изменения возымели эффект. Фабрично на всех Radeon R9 290X прошиты две версии BIOS и эти режимы заметно отличаются друг от друга по энергопотреблению.

«Quiet Mode» (Тихий режим) — положение переключателя «один», ближнее к монтажной планке видеокарты. Этот режим предназначен для игроков, которые озабочены шумностью игровой системы. К примеру — играющие в наушниках в помещении, где нужно соблюдать тишину и имеющие ПК с тихими системами охлаждения.

«Uber Mode» (Супер режим или нормальный режим) — положение переключателя «два», дальнее от монтажной планки с видеовыходами. Этот режим предназначен для получения максимальной производительности в играх, тестирования и CrossFire-систем. По названию режимов понятно, что тихий обеспечивает меньший шум от системы охлаждения ценой слегка пониженной производительности, а суперрежим обеспечивает максимум возможного при большем энергопотреблении и шумности от вентилятора системы охлаждения видеокарты. Хорошо, что у пользователя есть возможность выбора и он волен использовать любой из режимов по своим потребностям без ограничений.

Архитектурные особенности

Новый графический чип Hawaii, который лежит в основе видеокарты AMD Radeon R9 290X, основан на уже известной нам архитектуре Graphics Core Next (GCN), которая была слегка модифицирована по вычислительным способностям и для полной поддержки всех возможностей DirectX 11.2, как это было ранее сделано в чипе Bonaire (Radeon HD 7790), который также стал основой и для Radeon R7 260X. Архитектурные изменения в Bonaire и Hawaii относятся к улучшениям вычислительных возможностей (поддержка большего количества одновременно исполняемых потоков) и новой версии технологии AMD PowerTune, о которой мы ещё расскажем ниже.

Новые возможности DirectX 11.2 включают тайловые ресурсы, которые используют аппаратные особенности Hawaii по огранизации виртуальной памяти GPU, называемые partially-resident textures (PRT). Используя виртуальную видеопамять, легко получить эффективную аппаратную поддержку алгоритмов, позволяющих применять в приложениях огромные объёмы текстур и их подкачку (streaming) в видеопамять. PRT позволяет повысить эффективность использования видеопамяти в таких задачах и подобные техники уже применяются в некоторых игровых движках.

Мы уже описывали PRT в материале, посвящённом выходу Radeon HD 7970, но в Bonaire и Hawaii эти возможности были расширены. Этими видеочипами поддерживаются все дополнительные возможности, которые были добавлены в DirectX 11.2, связанные в основном с алгоритмами уровня детализации (LOD) и текстурной фильтрации.

Несмотря на то, что возможности GCN были расширены, главной задачей AMD при проектировании нового топового GPU было улучшение энергоэффективности чипа, так как Tahiti уже потреблял слишком много энергии, а в Hawaii включили больше вычислительных блоков. Давайте посмотрим, что удалось сделать инженерам компании AMD, чтобы выставить на рынок конкурентоспособный продукт:

Новый графический процессор логически разделён на четыре части (Shader Engine), каждая из которых содержит по 11 укрупнённых вычислительных блоков (Compute Unit), включающих и текстурные модули, по одному геометрическому процессору и растеризатору, а также по несколько блоков ROP. Иными словами, блок-схема самого современного чипа AMD стала ещё больше похожа на схему чипов Nvidia, также имеющих подобную организацию.

Всего в состав графического чипа Hawaii входит: 44 вычислительных блока Compute Units, содержащих 2816 потоковых процессоров, 64 блока ROP и 176 блоков TMU. Рассматриваемый GPU имеет 512-битную шину памяти, состоящую из восьми 64-битных контроллеров, а также 1 МБ кэш-памяти второго уровня. Он производится на всё том же 28 нм техпроцессе, что и Tahiti, но содержит уже 6.2 млрд. транзисторов (у Tahiti — 4.3 млрд.).

Рассмотрим блок-схему шейдерного движка, из которых состоит графический процессор Hawaii. Это крупноблочная часть чипа, который содержит четыре таких движка:

Каждый из Shader Engine включает по одному геометрическому процессору и растеризатору, которые способны обрабатывать по одному геометрическому примитиву за такт. Похоже, что геометрическая производительность Hawaii не только выросла, но и должна быть неплохо сбалансированной, по сравнению с предыдущими GPU компании AMD.

Шейдерный движок архитектуры GCN может содержать до четырёх укрупнённых блоков Render Back-ends (RB), которые включают по четыре блока ROP каждый. Количество вычислительных блоков Compute Unit в составе шейдерного движка также может быть разным, но в данном случае их 11 штук, хотя кэши для инструкций и констант разделяются на каждые четыре блока Compute Unit. То есть, логичнее было бы включение в состав Shader Engine не 11, а 12 вычислительных блоков, но похоже, что такое количество уже не входило в пределы по энергопотреблению Hawaii.

Вычислительный блок архитектуры GCN включает различные функциональные блоки: модули текстурных выборок (16 штук), модули текстурной фильтрации (четыре штуки), блок предсказания ветвлений, планировщик, вычислительные блоки (четыре векторных и один скалярный), кэш-память первого уровня (16 КБ на вычислительный блок), память для векторных и скалярных регистров, а также разделяемая память (64 КБ на каждый Compute Unit).

Так как шейдерных движков в графическом процессоре Hawaii четыре, то всего он имеет четыре блока обработки геометрии и движков растеризации. Соответственно, новый топовый GPU компании AMD умеет обрабатывать до четырёх геометрических примитивов за такт. Кроме этого, в Hawaii улучшена буферизация геометрических данных и увеличены кэши для параметров геометрических примитивов. Всё вместе это обеспечивает серьёзный рост производительности при больших объёмах расчётов в геометрических шейдерах и активном использовании тесселяции.

Также некоторые изменения претерпели и вычислительные способности нового, пусть и графического, но всё же процессора. В состав чипа входят два DMA-движка, которые обеспечивают полное использование возможностей шины PCI Express 3.0, заявлена двунаправленная пропускная способность в 16 ГБ/с. Сравнительно новой можно назвать и возможность асинхронных вычислений, которая осуществляется при помощи восьми (в случае чипа Hawaii) вычислительных движков Asynchronous Compute Engines (ACE).

Блоки ACE работают параллельно с графическим командным процессором и каждый из них способен управлять восемью потоками команд. Такая организация обеспечивает независимое планирование и работу в многозадачной среде, доступ к данным в глобальной памяти и L2-кэше, а также быстрое переключение контекста. Это особенно важно в вычислительных задачах, а также в игровых приложениях при использовании GPU и для графических и для общих вычислений. Также это нововведение теоретически может быть преимуществом при использовании низкоуровневого доступа к возможностям GPU при помощи таких API как Mantle.

Вернёмся к возможностям Hawaii, которые применимы к графическим вычислениям. Из-за роста требований к разрешению с ожидаемым распространением UltraHD-мониторов, становится необходимым повышение вычислительных возможностей блоков растровых операций — ROP. В чип Hawaii включено 16 блоков Render Back End (RBE), что в два раза больше, чем у Tahiti. Шестнадцать RBE содержат 64 блока ROP, которые способны обрабатывать до 64 пикселей за такт, и это может быть очень полезно в некоторых случаях.

Что касается подсистемы памяти, то Hawaii имеет 1 мегабайт кэш-памяти второго уровня, который поделён на 16 разделов по 64 КБ. Заявлено как 33%-ное увеличение объёма кэш-памяти, так и повышение внутренней пропускной способности на треть. Общая пропускная способность L2/L1-кэшей заявлена равной 1 ТБ/с.

Доступ к памяти осуществляется при помощи восьми 64-битных контроллеров, что вместе составляет 512-битную шину. Микрохемы памяти в Radeon R9 290X работают на частоте в 5.0 ГГц, что даёт общую пропускную способность памяти в 320 ГБ/с, что более чем на 20% выше, чем у Radeon HD 7970 GHz. При этом площадь чипа, занимаемую контроллером памяти, удалось снизить на 20%, по сравнению с 384-битным контроллером в Tahiti.

Низкоуровневый графический API Mantle

Мы уже писали об этом API в статье по новому семейству видеокарт AMD и тут лишь вкратце повторимся, дополнив информацию несколькими мыслями. Представление нового графического API, получившего название Mantle, было довольно неожиданным. Компания AMD вошла в сферу интересов Microsoft с их DirectX, и решилась на некоторое… скажем так, противостояние. Конечно, причиной шага стало то, что для следующего поколения игровых консолей компания AMD является поставщиком всех GPU для Sony, Microsoft и Nintendo, и от этого AMD захотелось получить осязаемое преимущество.

AMD решилась на выпуск данного API во многом из-за влияния DICE и EA, выпускающих игровой движок Frostbite, лежащий в основе игры Battlefield и некоторых других. Технические специалисты из DICE, который занимаются движком Frostbite, считают ПК отличной игровой платформой, основной для DICE. Они давно работают вместе с AMD по разработке и внедрению новых технологий в движок Frostbite 3 — новый движок компании, который является основой для более чем 15 игр серий: Battlefield, Need for Speed, Star Wars, Mass Effect, Command & Conquer, Dragon Age, Mirror’s Edge и др.

Немудрено, что AMD уцепилась за такую возможность, как глубокая оптимизация Frostbite для их графических процессоров. Этот игровой движок очень современный и поддерживает все важные возможности DirectX 11 (даже 11.1), но разработчикам захотелось полнее использовать возможности ПК-систем, отойти от ограничений DirectX и OpenGL и использовать CPU и GPU более эффективно, так как некоторая функциональность, превосходящая спецификации DirectX и OpenGL, остается неиспользуемой разработчиками.

Графический API Mantle предлагает использовать все аппаратные возможности видеокарт AMD, не ограничиваясь нынешними программными лимитами и используя более «тонкую» программную оболочку между игровым движком и аппаратными ресурсами GPU подобно тому, как это делается на игровых консолях. И с учётом того, что все будущие игровые консоли «настольного» формата (Playstation 4 и Xbox One, прежде всего) основаны на графических решениях компании AMD, имеющих в основе архитектуру GCN, знакомую по ПК, у AMD и игровых разработчиков появилась интересная возможность — специальный графический API, который позволит программировать игровые движки на ПК в том же стиле, что и на консолях, с минимальным влиянием API на код игрового движка.

По предварительным данным, использование Mantle обеспечивает девятикратное преимущество по времени исполнения вызовов функций отрисовки (draw calls) по сравнению с другими графическими API, что снижает нагрузку на CPU. Подобное многократное преимущество возможно лишь в искусственных условиях, но некоторое превосходство будет обеспечиваться и в типичных условиях 3D-игр.

Этот низкоуровневый высокопроизводительный графический API был разработан в AMD при значительном участии ведущих игровых разработчиков, особенно DICE, и практически уже вышедшая игра Battlefield 4 является первым проектом, который будет использовать Mantle, а другие игровые разработчики получат возможность использования этого API в будущем — пока что неизвестно, когда именно.

Релизная версия Battlefield 4 будет поддерживать только DirectX 11.1, а появление поддержки Mantle API запланировано на декабрь, когда выйдет бесплатное обновление, дополнительно оптимизированное для видеокарт AMD Radeon. На ПК-системах с видеокартами архитектуры GCN движок Frostbite 3 будет использовать Mantle, позволяющий снизить нагрузку на CPU, распараллелив работу на восемь вычислительных ядер, внесёт специальные низкоуровневые оптимизации производительности при помощи полного доступа к аппаратным возможностям GCN.

По Mantle у публики остаётся больше вопросов, чем ответов. Например, не очень понятно, каким образом будет работать низкоуровневый драйвер Mantle с его прямым доступом к ресурсам GPU в операционной системе Windows с DirectX, которые обычно сами распоряжаются ресурсами графического процессора, и как будут делиться эти ресурсы между игровым приложением под управлением Mantle и системой Windows. Ответы на все вопросы ожидается получить в середине ноября на AMD Developer Summit, на котором обнародуют технические детали реализации Mantle, список партнеров и даже покажут демонстрационные программы.

Но кое-что мы знаем уже сейчас. Теперь, когда с момента объявления компанией AMD инициативы с их графическим API Mantle уже прошло некоторое время, кое-что уже прояснилось. Хотя изначально в среде энтузиастов были ожидания по поводу того, что консоли будущего поколения также будут поддерживать Mantle, этому не быть в реальности просто потому, что это не нужно и не выгодно разработчикам консолей.

Так, у Microsoft есть собственный графический API и эта компания уже подтвердила то, что их Xbox One будет использовать исключительно DirectX 11.x, близкий по возможностям к DirectX 11.2, также поддерживаемому современными видеочипами AMD. Другие графические API, такие как OpenGL и Mantle, в Xbox One просто не будут доступны — и это официальная позиция Microsoft. Вероятно, то же самое касается и Sony PlayStation 4, хотя представители этой компании ничего ещё официально не заявляли по этому поводу.

Кроме этого, по некоторым данным, Mantle не будет доступен игровым разработчикам, кроме DICE, ещё несколько месяцев. И если сложить всю имеющуюся информацию вместе, то перспективы Mantle на данный момент действительно выглядят туманно. Компания AMD же, в свою очередь, заявляет, что Mantle и не предназначался для использования в консолях, что это просто низкоуровневый API, «похожий» на консольные. Чем он похожий, если API всё-таки разные — не очень понятно. Ну разве только «низким» уровнем и близостью к железу, но это явно нужно не всем разработчикам и потребует дополнительного времени на разработку.

В итоге, при отсутствии поддержки Mantle на консолях, этот графический API может использоваться исключительно на ПК, что снижает интерес к нему. Многие даже вспоминают такие графические API далёкого прошлого, как Glide. И хотя разница с Mantle велика, есть большая вероятность того, что без поддержки на консолях и на двух третях выделенных графических процессоров (примерно такую долю занимают соответствующие решения компании Nvidia уже несколько лет), данный API так и не станет действительно популярным. Вероятно, его будут использовать отдельные игровые разработчики, которые проявят интерес к низкоуровневому программированию GPU и получат соответствующую поддержку от AMD.

Главным вопросом является то, насколько близок Mantle к низкоуровневым API консолей и действительно ли он позволяет снизить стоимость разработки или портирования. Также остаётся непонятным и то, насколько велико в реальности преимущество от перехода к низкоуровневому программированию GPU и много ли возможностей графических чипов не раскрыты в существующих популярных API, которые можно использовать вместе с Mantle.

Технология обработки звука TrueAudio

Про эту технологию мы также уже рассказывали максимально подробно в теоретическом материале, посвящённом выходу новой линейки компании AMD. С выходом серий Radeon R7 и R9 компания представила миру технологию AMD TrueAudio — программируемый аудиодвижок, поддержка которого есть только на AMD Radeon R7 260X и R9 290(X). Именно чипы Bonaire и Hawaii являются новейшими с точки зрения технологий, они имеют архитектуру GCN 1.1 и другие нововведения, в том числе — поддержку TrueAudio.

TrueAudio — это встроенный программируемый аудиодвижок в GPU производства AMD, первым из которых стал чип Bonaire, на котором основан Radeon R7 260X, а вторым — Hawaii . TrueAudio обеспечивает гарантированную обработку звуковых задач в реальном времени на системе с совместимым GPU вне зависимости от установленного центрального процессора. Для этого в чипы Hawaii и Bonaire интегрировано несколько DSP-ядер Tensilica HiFi EP Audio DSP, а также и другая обвязка:

Доступ к возможностям TrueAudio осуществляется при помощи популярных библиотек по обработке звука, разработчики которых могут использовать ресурсы встроенного аудиодвижка при помощи специального AMD TrueAudio API. В случае подобных новых технологий важнейшим является вопрос партнёрства с разработчиками аудиодвижков и библиотек по работе со звуком. Компания AMD плотно сотрудничает со многими компаниями, известными по своим разработкам в этой сфере: игровые разработчики (Eidos Interactive, Creative Assembly, Xaviant, Airtight Games), разработчики аудио-middleware (FMOD, Audiokinetic), разработчики аудиоалгоритмов (GenAudio, McDSP), и т.д.

Технология TrueAudio весьма интересна с учётом застоя в сфере аппаратной обработки звука на ПК. Остаётся вопрос актуальности решения на данный момент. Сомневаемся, что игровые разработчики кинутся встраивать данную технологию в свои проекты с учётом крайне ограниченной совместимости (на данный момент TrueAudio поддерживается только на трёх видеокартах: Radeon HD 7790, R7 260X и R9 290X) без дополнительной мотивации со стороны AMD. Но мы приветствуем все нововведения в сфере сложной обработки звука и надеемся, что технология получит распространение.

Улучшенное управление питанием PowerTune и настройки разгона

Некоторые усовершенствования в видеокарте Radeon R9 290X от компании AMD получила и технология управления питанием PowerTune. Мы уже писали об этих улучшениях в обзоре Radeon HD 7790, для более эффективного управления питанием последние графические чипы AMD имеют несколько состояний с различными значениями частоты и напряжения, что позволяет добиться более высокой тактовой частоты, чем ранее. При этом GPU всегда работает с оптимальными напряжением и частотой для текущих загрузки GPU и потребления энергии видеочипом, на которых и основывается переключение между состояниями.

В чипе Hawaii интегрирован последовательный интерфейс регулятора напряжения питания (serial VID interface) второго поколения — SVI2. Такой регулятор напряжения имеют все последние GPU и APU, включая Hawaii и Bonaire, а также все APU с разъёмом Socket FM2. Точность регулятора напряжения составляет 6.25 мВ, между напряжениями 0.00 В и 1.55 В поместились 255 возможных значений. Регулятор напряжения способен управлять несколькими линиями питания.

В новом алгоритме, известном со времён Bonaire, технологии PowerTune не обязательно резко сбрасывать частоту при превышении уровня потребления, плюс вместе с ней снижается ещё и напряжение. Переходы между состояниями стали очень быстрыми, чтобы не превышать установленный предел по потреблению даже на короткое время, GPU переключает состояния PowerTune 100 раз в секунду. Поэтому какой-то единой рабочей частоты у Hawaii просто нет, есть лишь средняя за какой-то промежуток времени. Такой подход помогает «выжать все соки» из имеющихся аппаратных решений, улучшает энергоэффективность и снижает шумность систем охлаждения.

Соответственно, и в настройках драйвера Catalyst Control Center во вкладке OverDrive появились новые возможности — она была полностью переработана для того, чтобы получить максимум от нововведений в PowerTune для решений серии R9 290.

Первое, что можно заметить — связь ограничителя питания (Power Limit) и частоты графического процессора (GPU clock). Эти параметры теперь связаны между собой на диаграмме потребления энергии и тепловыделения. Из-за того, что потребление и производительность напрямую связаны в новом алгоритме PowerTune в Hawaii, подобный интерфейс делает настройку разгона более интуитивной и понятной.

Кроме того, она отражает появившееся в решениях серии R9 290 полностью динамическое управление частотой GPU. Разгон теперь указывается при помощи увеличения соответствующей величины (GPU Clock) на определённый процент, а возможностей предыдущих решений в виде указания конкретной частоты теперь нет.

Второе, что серьёзно изменено в новом интерфейсе OverDrive — управление скоростью вентилятора. Эта настройка была также полностью переработана. В предыдущих поколениях на вкладке OverDrive пользователю можно было лишь задать фиксированную частоту вращения вентилятора, которая поддерживалась постоянно. В новом интерфейсе эта настройка поменялась и называется она — максимальная частота вращения («Maximum Fan Speed»), которая устанавливает верхний предел частоты вращения для вентилятора, который будет максимальным. Но частота вращения вентилятора при этом будет изменяться, исходя из загрузки GPU и его температуры, а не останется фиксированной, как это было ранее.

По умолчанию, частота вращения кулера на Radeon R9 290X зависит от текущих настроек загруженной прошивки BIOS. Ручное же изменение максимальной скорости вращения вентилятора позволяет выбрать любое другое значение. И при разгоне желательно учитывать не только настройки питания и частоты, но и увеличивать предел частоты вращения для вентилятора, иначе максимальная производительность будет ограничена температурой GPU и его охлаждением.

Изменения в технологии AMD CrossFire

Одним из самых интересных аппаратных нововведений в видеокартах серии AMD Radeon R9 290 стала поддержка технологии AMD CrossFire без необходимости подключения видеокарт друг к другу при помощи специальных мостиков. Вместо выделенных линий связи, GPU обмениваются друг с другом данными по шине PCI Express, используя аппаратный DMA движок. При этом, производительность и качество изображения обеспечивается ровно такое же, что и с соединительными мостиками. Такое решение намного удобнее, и AMD утверждает, что проблем совместимости на разных системных платах им не встречались.

Важно, что для максимальной производительности в режиме AMD CrossFire на всех видеокартах Radeon R9 290X переключатель BIOS желательно установить в суперрежим «Uber Mode», и охлаждение для всех плат должно обеспечиваться хорошее, так как в противном случае новомодная технология PowerTune будет понижать тактовые частоты GPU, что приведёт к падению производительности.

Технология CrossFire обеспечивает прекрасное масштабирование в многочиповых системах с R9 290X, если брать в расчёт среднюю частоту кадров (для CrossFire до сих пор есть вопросы к плавности видеоряда, что мы исследовали ранее). На следующей диаграмме показана сравнительная производительность одиночной AMD Radeon R9 290X и двух таких карт, работающих над рендерингом совместно, по технологии AMD CrossFire.

Во всех играх, показанных на диаграмме, обеспечивается отличный прирост в средней частоте кадров, при подключении второй видеокарты — вплоть до двухкратного. В худшем случае в указанных приложениях показана 80% эффективность CrossFire, а в среднем получается 87%.

При добавлении к системе CrossFire третьей платы AMD Radeon R9 290X эффективность ожидаемо падает ещё ниже, но три такие видеокарты всё же обеспечивают 2.6-кратный прирост в скорости, относительно одиночной платы, что также довольно неплохо.

Технология AMD Eyefinity и поддержка UltraHD-разрешения

Компания AMD является одним из лидеров в сфере вывода информации на устройства отображения, они были среди первых, кто внедрил поддержку DVI Dual Link для мониторов с разрешением 2560×1600 пикселей, поддержку DisplayPort, сделал вывод на три и более монитора с одного GPU (технология Eyefinity), вывод по HDMI с разрешением 4K и т.д.

Разрешение 4K, также известное как Ultra HD, соответствует значению 3840×2160 пикселей, то есть ровно вчетверо большее, чем Full HD (1920×1080), и оно очень важно для индустрии. Остаётся проблема в малой распространённости Ultra HD-мониторов и телевизоров в настоящее время. 4K-телевизоры продаются только очень большие и дорогие, а соответствующие мониторы крайне редки и также сверхдороги. Но ситуация вот-вот должна измениться по прогнозам аналитиков, предсказывающих Ultra HD-устройствам светлое будущее.

Компания AMD обеспечивает подключение двух возможных вариантов Ultra HD-дисплеев: телевизоров, имеющих поддержку лишь 30 Гц и ниже при разрешении 3840×2160 и подключающихся по HDMI или DisplayPort, а также мониторов, изображение которых поделено на две половинки разрешением 1920×2160 при 60 Гц. Второй тип мониторов поддерживается также и при помощи MST-хабов DisplayPort 1.2, которые недавно поступили в продажу.

Для поддержки разделённых мониторов был внедрен новый стандарт VESA Display ID 1.3, в котором описываются дополнительные возможности дисплея. Новый VESA-стандарт позволит автоматически «склеивать» изображение для таких мониторов, если это поддерживается как монитором, так и драйвером. Это планируется в будущем, а пока что подобным тайловым 4K-мониторам требуется ручная конфигурация. AMD говорит о том, что в последних версиях драйвера Catalyst уже есть возможность автоматической конфигурации для наиболее популярных моделей мониторов.

Кроме этого, видеокарты AMD Radeon будут поддерживать и третий тип Ultra HD-дисплеев, которым нужен лишь один поток для работы в ультравысоком разрешении при частоте обновления в 60 Гц. Radeon R9 290X обеспечивает достаточную 3D-производительность для многомониторных конфигураций, которая весьма важна при максимальных игровых настройках и высочайших разрешениях рендеринга в таких системах. Также, у AMD Radeon R9 290X есть преимущество перед Nvidia Geforce GTX 780, выраженное в большем объёме видеопамяти, которая важна в разрешениях вроде 5760x1080 пикселей и 4K.

Видеокарта модели AMD Radeon R9 290X поддерживает UltraHD разрешения и по HDMI 1.4b (с низкой частотой обновления, не превышающей 30 Гц) и по DisplayPort 1.2. Причём, производительность нового решения даёт возможность играть при максимальных настройках в этом разрешении, получая приемлемую частоту кадров практически в любых играх.

Возможность использования нескольких мониторов также весьма важна для энтузиастов компьютерных игр. Технология Eyefinity в серии видеокарт Radeon R9 была обновлена, и новая видеоплата Radeon R9 290X поддерживает конфигурации до шести дисплеев. Серия AMD Radeon R9 поддерживает до трёх HDMI/DVI-дисплеев при работе с технологией AMD Eyefinity.

Для работы этой функции требуется набор из трёх одинаковых дисплеев, поддерживающих идентичные тайминги, настройка вывода осуществляется при старте системы, и при этом не поддерживается «горячее» подключение дисплея для третьего HDMI/DVI-подключения. Для того, чтобы воспользоваться возможностью подключения более чем трёх дисплеев на AMD Radeon R9 290X, нужны или мониторы с поддержкой DisplayPort или сертифицированные DisplayPort-адаптеры.

Теоретическая оценка производительности

Для начала давайте рассмотрим теоретические показатели. Попробуем прикинуть, насколько новая видеокарта Radeon R9 290X должна быть быстрее предыдущей топовой платы модели Radeon HD 7970 GHz. Пока что мы не берём в расчёт возможное улучшение эффективности, связанное с небольшими архитектурными изменениями в GCN, но если считать все блоки в R9 290X и HD 7970 идентичными, то получаем следующую картину:

При не такой уж большой разнице в площади и теоретически почти одинаковом уровне энергопотребления (его в таблице нет), пиковая скорость обработки геометрии возросла почти вдвое, вычислительная и текстурная производительность выросли на 30%, пропускная способность видеопамяти — на 20%, а скорость заполнения (филлрейт) — на целых 90%! Последнее значение будет весьма важно с учётом планируемой популяризации разрешения UltraHD в ближайшем будущем, ведь количество пикселей на экране заметно возрастёт.

Все проведённые улучшения позволили улучшить эффективную производительность в расчёте на миллиметр площади. Было бы интересно узнать и об увеличении энергоэффективности, но AMD не любит указывать уровень TDP для своих современных топовых решений, а официальная цифра в 275 Вт для новой платы вызывает сомнение. Остаётся лишь надеяться, что энергоэффективность не ухудшилась. Зато производительность точно должна улучшиться минимум на 20-30%, по сравнению с Radeon HD 7970, а в некоторых случаях и больше.

Как бы в подтверждение увеличившимся возможностям, особенно по скорости заполнения, AMD приводит показатели средней частоты кадров, достигнутые в новейшей игре Battlefield 4, которая выходит на днях. Battlefield 4 — это продолжение популярнейшего сериала Battlefield, которое разработано компанией DICE и именно эта игра является, пожалуй, самой ожидаемой игрой года.

Для нас важно, что игра Battlefield 4 и её разработчик DICE являются частью партнёрской программы AMD Gaming Evolved, и поэтому никаких проблем с оптимизацией Battlefield 4 под графические процессоры архитектуры GCN точно не будет. Более того, новый игровой движок Frostbite 3, на котором основан проект Battlefield 4, использует многие из самых современных возможностей видеочипов компании AMD, а в декабре ожидается и версия с поддержкой API Mantle. Ну а пока что посмотрим на производительность в обычной версии игры:

Как можно заметить, даже в «тихом» режиме, Radeon R9 290X явно опережает конкурирующую Geforce GTX 780 в обеих режимах с разным разрешением. Впрочем, есть теоретическая возможность того, что видеокарте Nvidia в таких высоких разрешениях мешает нехватка видеопамяти, которой у неё меньше, чем у R9 290X. Конечно, больший объём видеопамяти также является достоинством новинки от AMD, но было бы интересно посмотреть сравнение и в меньшем разрешении, где это не является определяющим фактором.

Мы проверим производительность нового решения в нашем наборе игр в третьей части статьи. Подводя же итоги теоретической части, можно отметить, что представленная модель видеокарты AMD Radeon R9 290X должна стать одним из самых производительных одночиповых 3D-ускорителей вообще, и довольно удачным приобретением в топовом ценовом сегменте, предназначенном для энтузиастов. Новинка от компании AMD обеспечивает некоторые новые возможности и отличную производительность за свою цену.

Выводы по теоретической части

Итак, в конце октября 2013 года компания AMD предложила рынку модель видеокарты Radeon R9 290X с весьма конкурентоспособной ценой и возможностями. Исходя из озвученных выше теоретических характеристик и рекомендуемой цены, даже без проверки в играх можно с уверенностью утверждать, что представленная топовая модель видеокарты от AMD имеет отличное соотношение цены, производительности и функциональности.

Функциональность новинки дополнительно усилена весьма интересными инициативами компании AMD: встроенным в современные чипы звуковым DSP-движком в виде технологии TrueAudio и новым графическим API Mantle низкого уровня. Их разработка стала возможна во многом благодаря тому, что компания AMD занимает роль поставщика графических решений для всех игровых консолей следующего поколения. И пусть перспективы этих инициатив в ПК-играх пока что туманны и они не получили особого распространение в среде игровых разработчиков, но это лишь начало, и при должном подходе AMD к продвижению своих технологий, всё у них получится.

В предыдущей статье мы отмечали, что AMD ещё не сказала главного слова в виде топовой видеокарты новой линейки, известной под названием Radeon R9 290X, а сегодня мы говорим о том, что это решение, основанное на новейшем графическом процессоре Hawaii, стало мощным локомотивом, который должен тащить за собой и новые технологии в виде Mantle и TrueAudio, и всю современную продуктовую линейку компании. Видеокарты верхнего ценового диапазона являются теми продуктами, которые помогают продавать все остальные. И Radeon R9 290X должен неплохо справляться с этой ролью. Единственным спорным моментом кажется вероятное высокое энергопотребление новинки, но если её системы питания и охлаждения справляются с задачей, то это не слишком большая проблема.

После того, как мы познакомились с характеристиками и возможностями видеокарты Radeon R9 290X в теоретической части материала, самое время перейти к практике. Следующая часть материала будет посвящена исследованию скорости рендеринга новой топовой видеокарты компании AMD в нашем наборе привычных синтетических тестов. Будет весьма интересно сравнить производительность новинки из верхнего ценового сегмента с топовыми платами линейки Radeon HD 7000, а также со скоростью конкурирующих видеокарт компании Nvidia.



AMD Radeon R9 290X — Часть 2: видеоплаты и синтетические тесты →



Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.