Polaris — следующая графическая архитектура AMD Radeon

Введение
Исторические параллели и архитектурные изменения
Производственные вопросы
Прикидки энергоэффективности и выводы

Введение

В самый разгар новогодних каникул, когда как минимум наша страна ещё вовсю празднует и отдыхает, IT-журналистам не даёт расслабиться проходящая в Лас-Вегасе ежегодная выставка достижений всенародного хозяйства — CES 2016. Хотя подобные мероприятия в последние годы потеряли часть своего блеска, привлекая всё меньше реальных анонсов и первых показов каких-то продуктов, выставки и конференции остаются полезными для привлечения внимания к продуктам и технологиям.

Вот и компания AMD решила приурочить выдачу небольшой порции информации о своих будущих решениях именно к этой выставке. Производители микроэлектронных чипов наладят массовое производство с применением новых FinFET-техпроцессов для таких сложных и крупных чипов, как графические процессоры, лишь ближе к середине года. Поэтому раскрываемая в самом начале года часть информации будет очень небольшой и весьма поверхностной. Какие-то данные AMD пока что просто не хочет раскрывать, а какие-то ещё до конца не определены и самой компанией. Но кое-что о грядущем поколении графических процессоров мы вам сегодня всё же расскажем.

На самом деле, узкому кругу журналистов рассказали об этом ещё в начале декабря — на специальном мероприятии выделенного подразделения компании AMD — Radeon Technologies Group (RTG), которое сфокусировано именно на графических решениях компании. Мы уже публиковали на нашем сайте заметку о нескольких новых технологиях и улучшениях, связанных с выводом изображения на экран.

Тогда была объявлена поддержка планируемых к выходу дисплеев, предназначенных для вывода HDR-изображений, анонсированы некоторые нововведения в технологии динамической частоты обновления FreeSync, было объявлено и о поддержке разъёмов HDMI 2.0a и DisplayPort 1.3 следующим поколением графических процессоров компании AMD, хотя остальные подробности о них остались нераскрытыми. Ещё чуть позже группа RTG анонсировала инициативу GPUOpen, отмеченную в новостях нашего сайта. Ну а теперь пришло время поговорить и о самой следующей графической архитектуре компании AMD, раскрыв пока что лишь некоторые подробности.

Исторические параллели и архитектурные изменения

Чтобы понимать всю важность следующего поколения графической архитектуры для графического подразделения Radeon Technologies Group и компании AMD в целом, нужно держать в голове не самые лучшие финансовые показатели компании за последние несколько кварталов, а также вспомнить былые успехи компании, когда выход новых GPU давал сильный толчок к развитию и положительно сказывался как на доходах, так и на рыночной доле компании.

Сама Radeon Technologies Group вспоминает такой случай из своего уже довольно далёкого прошлого, когда новые модели Radeon становились весьма успешными на рынке. Вышедшая ещё в 2001 году видеокарта ATI Radeon 7000 (не путать с куда более поздней серией AMD Radeon HD 7000), также известная как Radeon VE, была основана на бюджетном видеочипе RV100, производимом при помощи 180 нм техпроцесса (заодно оцените прогресс — в текущем году мы ожидаем 14 и 16 нм продукты). Видеочип этой модели имел 64-битный интерфейс, всего один пиксельный конвейер и один блок ROP, а также три текстурных блока. А при 30 миллионах транзисторов площадь кристалла была равна 97 мм².

Упомянутая модель видеокарты конкурировала с царствующей тогда в бюджетном секторе GeForce2 MX от NVIDIA, и имела некоторые преимущества (поддержку двух мониторов, например), принеся немало денег компании. Но вышедшие в 2002 году видеокарты Radeon 9700 стали ещё более серьёзным подспорьем для компании ATI, многие из сотрудников которой теперь трудятся в AMD. Тогдашняя новинка была основана уже на чипе R300, который производился по 150 нм техпроцессу, и при чуть более чем вдвое большей площади и втрое большей сложности, имел поддержку DirectX 9.0, 256-битный интерфейс памяти, по восемь блоков пиксельных шейдеров, блоков ROP и текстурных, а также имел аппаратную поддержку расчётов трансформации и освещения (один конвейер для выполнения вершинных шейдеров).

Radeon 9700 в то время выступил на рынке очень сильно, как и вся последующая серия на видеочипах семейства R3xx. При сравнительной слабости конкурента в то время, выпустившей GeForce FX 5800 на основе чипа NV30, это семейство ATI стало, пожалуй, самым успешным в истории Radeon, завоевав большую долю рынка выделенных графических решений. Вероятно, специалисты Radeon Technologies Group считают, что и следующая графическая архитектура может стать таким же шагом вперёд для компании, и они возлагают на неё определённые надежды.

Итак, встречайте новую графическую архитектуру 2016-го года под наименованием Polaris (Полярная звезда). Название архитектуры идёт от одноименной звезды — пожалуй, самой известной, за исключением Солнца. В отличие от других звезд, Полярная почти не меняет своего положения на небе, в дополнение к тому, что она весьма яркая, и по этим причинам удобна для ориентирования. Но не только это привлекло компанию AMD. Считается, что звёзды являются самыми эффективными генераторами фотонов во Вселенной, а именно энергоэффективность и должна была отразиться в названии новой архитектуры, по мнению специалистов RTG.

Но это не только графическая архитектура. Начиная с Polaris, компания AMD планирует показать, что современный графический процессор — нечто большее, чем просто графическое ядро. Нынешние GPU содержат множество ядер, блоков и движков: мультимедийных, дисплейных, кэшей, контроллеров памяти, управления питанием и т.д. Это уже получается практически готовая система-на-чипе (SoC — system-on-chip), и вся она идёт под именем Polaris, а не только графическая её часть.

Хотя функциональных изменений в Polaris не слишком много, о чём говорят даже сами представители компании AMD, но кое-что всё же изменилось. Основными особенностями новой архитектуры, с точки зрения графических задач, являются следующие изменения: четвёртое поколение архитектуры GCN, блок для ускорения отбрасывания геометрических примитивов, аппаратный планировщик, предвыборка команд (prefetch), улучшенная эффективность исполнения шейдеров, новые алгоритмы сжатия данных в памяти.

Пока что компания AMD по понятным причинам не раскрывает каких-либо подробностей обо всех этих улучшениях, приводя лишь схематичный слайд о тех аппаратных блоках, которые изменятся в графических процессорах архитектуры Polaris:

Кроме уже указанного ранее, все графические процессоры следующего поколения получат и новые движки для вывода информации на дисплеи, поддерживающие как HDMI 2.0a, так и DisplayPort 1.3 — об этом мы писали в отдельной статье. Также, в графические процессоры Polaris будет включен и новый блок для обработки видеоданных, поддерживающий декодирование роликов в формате H.265 с профилем Main 10 и разрешением вплоть до 4K (3840x2160 пикселей), и кодированием видеоданных в тот же формат H.265 4K-разрешения с частотой кадров 60 FPS.

Когда AMD говорит о двукратном или даже большем увеличении производительности Polaris относительно решений текущего поколения, каждый задаётся логичным вопросом: какая часть из этого прироста обеспечивается применением куда более совершенного техпроцесса, а какая — архитектурными изменениями? Конечно, пока что слишком рано отвечать на этот вопрос, но технический директор AMD Джо Макри (Joe Macri) оценивает прирост от техпроцесса примерно в 75%. То есть, основной вклад в возросшую производительность принесёт именно техпроцесс, о котором мы поговорим ниже.

По поводу же поддержки разных типов видеопамяти хочется отметить следующее. Пока что AMD публично не раскрывает данные о том, какая память будет использоваться в Polaris, но кое-какие соображения у нас есть. Этот вопрос довольно важен потому, что контроллеры памяти для HBM и GDDR5 абсолютно разные сами по себе. Если для топовых решений будет применяться быстрая High Bandwidth Memory, скорее всего, уже второго поколения (как минимум — в топовых решениях), то в мобильных чипах Polaris, вероятно, будет использоваться всё та же давно знакомая нам GDDR5-память — хотя бы из экономических соображений.

Производственные вопросы

И всё же главное в Polaris — вовсе даже не модифицированные и даже не какие-то новые аппаратные блоки. Ещё больший шаг в производительности, а значит и энергоэффективности, обеспечивается применением совершенно нового техпроцесса в производстве GPU будущего поколения — с использованием транзисторов с вертикально расположенным затвором (FinFET — Fin Field Effect Transistor), также известных как транзисторы с трёхмерной структурой затвора или 3D-транзисторы.

На иллюстрации схематично показано условное изменение размеров одного и того же GPU, произведённого с применением различных техпроцессов (для FinFET-техпроцессов не указаны точные значения разрешающей способности в нанометрах, это 14 или 16 нм в зависимости от фабрики — об этом мы поговорим чуть позже).

Архитектура Polaris изначально разрабатывалась под возможности FinFET-техпроцессов, и должна использовать все их возможности, позволяющие достичь технологических норм в 16 нм и ниже. Для понимания разницы между различными технологиями приведём иллюстрацию, на которой схематично изображены планарный транзистор и FinFET:

Если говорить вкратце, то FinFET-транзистор — это транзистор с каналом, окружённым затвором через прослойку в виде изолятора с трёх сторон — по сравнению с планарным, где поверхность сопряжения — это одна плоскость. Как видно даже на схеме, FinFET-транзисторы имеют более сложное устройство, и трудностей при реализации новой технологии было предостаточно. Первые данные о таком устройстве появились ещё в 1989 году, так они были названы лишь в 2000, а до производства первой их довела компания Intel — в уже далёком 2012 году.

Остальным же пришлось ждать, пока с новыми технологиями справятся и другие производители микросхем: TSMC, Samsung, GlobalFoundries. И обратите внимание на то, сколько времени понадобилось для освоения различных техпроцессов — если раньше требовалось 1-2 года, то между 28 нм и 14/16 нм прошло целых пять лет! Но игра стоит свеч — новая форма транзисторов обеспечивает больший выход годных, а главное — меньшие утечки и заметно лучшую энергоэффективность, что является основной задачей современной микроэлектроники.

Количество транзисторов в графических процессорах на квадратный миллиметр площади удваивалось примерно каждые два года, вместе с этим удвоились и статические утечки (static leakage). Для решения части этих проблем использовались специальные средства, вроде островков из транзисторов с разным напряжением питания и схем управления тактовыми сигналами (clock gating), которые помогали снизить токи утечек в режимах простоя или сна. Но эти техники не помогают при активных состояниях работы и способны снизить максимальную производительность.

В FinFET-процессах многие проблемы решены, что позволяет добиться революционного улучшения в производительности и потреблении энергии, по сравнению с предыдущими чипами, произведёнными при помощи традиционных технологий. Новые техпроцессы позволяют не просто повысить производительность, но и снизить вариативность характеристик (разницу в характеристиках всех произведённых чипов одной модели) — сравните разброс параметров для неназванного FinFET-техпроцесса и привычного 28 нм (вероятно, TSMC):

На этой диаграмме нас больше всего волнует даже не большая средняя производительность для FinFET-продуктов и меньшие утечки в среднем же, но меньший разброс, как в показателях производительности, так и величине утечек для разных образцов. Улучшение вариативности этих характеристик для GPU в случае FinFET означает, что можно повысить итоговую частоту для всех продуктов, в то время как для планарных транзисторов приходилось обращать большее внимание на худшие показатели и снижать референсные характеристики для всех конечных продуктов.

В итоге графические процессоры, произведённые при помощи техпроцессов с применением FinFET-транзисторов, обеспечивают фундаментальный рост характеристик производительности и энергоэффективности, по сравнению с аналогами, в производстве которых были использованы традиционные планарные транзисторы. По оценке специалистов AMD, применение FinFET-техпроцессов позволяет обеспечить или на 50-60% меньшее потребление энергии, или на 20-35% большую производительность при прочих равных (а если ещё добавить побольше транзисторов, что позволяют новые технологии, то разница будет ещё большей).

Новые техпроцессы с применением FinFET-транзисторов помогают не только снизить потребление энергии и значительно улучшить энергоэффективность, но и открыть новые форм-факторы и форматы для применения будущих графических процессоров. Так, в будущем возможно появление относительно тонких и лёгких игровых ноутбуков, которые не будут требовать значительного снижения настроек качества 3D-графики, достаточно мощных настольных ПК ультракомпактного размера, ну а привычные игровые видеокарты смогут обходиться меньшим количеством разъёмов питания (впрочем, вряд ли это справедливо для топовых решений, которые всегда берут максимум от имеющихся возможностей).

Но какой конкретно FinFET-техпроцесс планирует применять AMD в производстве? Сначала они утверждали, что работают со всеми производителями, и хотя конкретный партнёр для выпуска будущих GPU уже выбран, объявить его они пока не могут. Вообще, надо сказать, что разные FinFET-техпроцессы довольно близки по характеристикам и отличий в конечных продуктах, произведённых с их применением, будет не так уж много. Куда важнее сроки освоения и готовности к массовому производству и выход годных чипов.

Компании GlobalFoundries и Samsung ещё в конце 2014 года анонсировали начало массового производства, обогнав TSMC в освоении FinFET с техпроцессами 14 нм LPE (Low Power Early) и LPP (Low Power Plus). Конечно же, речь тогда не шла о больших объёмах производства, да ещё таких крупных чипах, как графические процессоры. К весне 2015 GlobalFoundries объявила уже о производстве с применением LPE и LPP, а выход годных первого техпроцесса уже достиг уровня начала массового производства.

Более продвинутый 14 нм LPP был сертифицирован несколько позднее, он обеспечивает дополнительные возможности, достаточные для производства даже относительно сложных чипов с расширенной сферой применения. LPP уже вполне подходит не только для мобильных решений, но и высокопроизводительных чипов, включая CPU и GPU следующих поколений от компании AMD. И у них есть преимущество перед той же NVIDIA, так как GloFo имеет старые связи с AMD. Но и NVIDIA теоретически может использовать процесс 14 нм для Tegra и GPU, пусть и в исполнении Samsung — у которых и лицензировала технологии компания GloFo.

В сентябре прошлого года GlobalFoundries объявила о том, что выход годных чипов, произведённых по техпроцессу 14LPE, превзошёл их начальные ожидания и сопоставим с аналогичными характеристиками на фабрике их партнёра Samsung, который производит с применением этого техпроцесса свой массовый чип Exynos 7420. Но AMD планирует использовать более продвинутый техпроцесс 14LPP. В ноябре были выпущены первые образцы таких чипов с применением этой модификации техпроцесса для AMD. Техпроцесс LPP способен обеспечить ещё на 10% большую производительность, по сравнению с LPE, и должен выйти на полномасштабное производство в течение нескольких месяцев.

Ранее сотрудники AMD говорили, что к выпуску FinFET-решений они будут привлекать новых подрядчиков, а возможно, выпуском разных решений будут заниматься разные компании. Есть вероятность, что в наступившем году компании Samsung Electronics и GlobalFoundries разделят заказы на выпуск 14 нм центральных и графических процессоров компании AMD, так как техпроцесс у них одинаковый и наладить одновременное производство не составит большого труда. А разделить между ними заказы можно исходя из различных условий, вроде выхода годных чипов. Это позволит AMD не волноваться по поводу проблем с недостаточными объёмами производства, которые часто возникают в начале производства новых решений.

Прикидки энергоэффективности и выводы

Специалисты Radeon Technologies Group довольно оптимистично настроены по поводу своих будущих графических процессоров анонсированной архитектуры Polaris. Они заявляют о том, что даже ранние образцы таких GPU показывают очень хорошие результаты по производительности и энергоэффективности, по сравнению с нынешним поколением графических карт. Более того, выход Polaris они называют самым большим скачком в энергоэффективности за всю свою историю! И это — только начало, ведь улучшения в будущих GPU продолжатся (тут можно вспомнить, чего добился их конкурент в рамках одного лишь 28 нм техпроцесса).

Мы уже писали выше, что графические процессоры AMD новой архитектуры отлично подойдут для ПК малых форм-факторов и мобильных решений, требующих достаточно мощных графических ядер. Как тут не вспомнить и игровые консоли, требующие применения GPU-ядер не слишком большого размера, но максимально энергоэффективных. Вот и с Polaris компания AMD целится на обеспечение тонких и лёгких игровых ноутбуков 3D-производительностью, не уступающей нынешним консолям.

Есть некоторые предположения, что одними из самых важных первых графических процессоров архитектуры Polaris будут именно такие чипы — не топовые, а средней мощности, но весьма энергоэффективные и ориентированные на подобные устройства: лёгкие игровые ноутбуки и компактные игровые ПК. Тем более, что производители ноутбуков уже выбирают поставщиков GPU для моделей, запланированных на конец 2016 года и даже на 2017 год. Неудивительно, что именно такой GPU и был продемонстрирован на мероприятии — когда в игре Star Wars Battlefront сравнивался один из GPU архитектуры Polaris и весьма энергоэффективная видеокарта GeForce GTX 950 от NVIDIA:

Внутреннее тестирование было проведено в лаборатории AMD в начале декабря, использовалась система на базе процессора Intel Core i7 4790K с 16 ГБ памяти под управлением Microsoft Windows 10. Для тестов использовалась карта X-wing Training Map, разрешение FullHD при средних настройках качества графики, а подсчёт средней частоты кадров производился при помощи утилиты Fraps. Собственно, частота кадров была заблокирована на 60 FPS, а основная разница была даже не в производительности, а в потреблении энергии.

Так, видеокарта Radeon на основе графического процессора архитектуры Polaris, обеспечила 60 FPS при потреблении всей системой порядка 86 Вт (цифры 85-90 Вт на приборе автор видел лично), а GeForce GTX 950 в этих же условиях смогла обеспечить потребление в 140 Вт (140-150 Вт на том же стенде), а это почти вдвое больше. Кроме этого, чип AMD ещё и физически примерно вдвое меньшей площади, по сравнению с GM206 (что неудивительно, ведь при его производстве применялся 14 нм FinFET-техпроцесс). И в целом, это весьма неплохой результат для новой графической архитектуры компании AMD, если бы не два но...

Первое — модель GeForce GTX 950 основана на урезанном по количеству функциональных блоков GPU модели GM206, и ради чистоты эксперимента было бы лучше сравнивать с GeForce GTX 960, имеющей полноценный графический процессор этой же модели, вместе с более высоким энергопотреблением. Хотя GTX 950 имеет меньшее типичное энергопотребление, чип с такими же характеристиками (а не применением более мощного урезанного), можно было бы сделать более экономичным.

Второе соображение — графический процессор GM206 производится при помощи старого доброго 28 нм техпроцесса на фабрике TSMC, и даже если его просто перенести на FinFET-техпроцесс без каких-либо архитектурных улучшений, то он получит вдвое, а то и большее улучшение энергоэффективности просто так. А значит, может догнать и протестированное решение AMD на основе первого графического процессора Polaris. Даже без возможных дальнейших улучшений энергоэффективности со стороны инженеров NVIDIA, которые явно последуют в их будущей графической архитектуре, также предназначенной для производства с помощью более совершенных техпроцессов.

Интересно, как именно глава группы RTG Раджа Кодури (Raja Koduri) ответил на вопрос, не догонят ли Polaris даже аналогичные чипы Maxwell второго поколения, просто переведённые на новые FinFET-техпроцессы. Он сказал, что отвечает лишь за работу своего подразделения и полностью доволен ей, ну а по поводу решений других компаний ничего не может утверждать. Такие слова можно считать просто искренним ответом, или начать сомневаться в уверенности главного графического инженера компании AMD в их собственных будущих продуктах. Время покажет.

К слову, о времени. По понятным причинам, в AMD хотели бы выпустить Polaris на рынок как можно раньше. Но из-за технических вопросов с массовостью производства на FinFET-фабриках, на данный момент выход первых решений архитектуры Polaris запланирован лишь на середину наступившего года. То есть, даже при оптимистичном варианте мы увидим новое решение группы RTG, при производстве которого использовался новый FinFET-техпроцесс, дающий отличные характеристики энергоэффективности, только где-то в начале лета.

Можно сказать, что наступивший 2016 год должен стать решающим для компании AMD. Компания должна показать индустрии, что они всё ещё могут быть сильными конкурентами на рынках центральных и графических процессоров для Intel и NVIDIA. И графическое подразделение компании Radeon Technologies Group серьёзно работает над тем, чтобы вернуть свои позиции на рынке видеокарт, изрядно растерянные за последние годы относительного застоя.

Даже несмотря на то, что FinFET-техпроцесс способен обеспечить значительное улучшение энергоэффективности сам по себе, достичь заявленного 2.5-кратного улучшения эффективности одним только переходом на более совершенный процесс невозможно, так что работу по улучшению будущей графической архитектуры Polaris можно назвать вполне успешной. Мы ждём серьёзного рыночного сражения между AMD и NVIDIA к середине наступившего года, когда обе компании должны выпустить несколько совершенно новых решений. Постараемся держать вас в курсе всех новостей, это должно быть интересно.