AMD Llano Tech Day

Презентация «мейнстримовой» мобильной платформы на APU-процессорах второго поколения

В середине мая, за месяц до официального анонса новой мобильной платформы, журналисты ведущих изданий были приглашены на закрытую презентацию, которая на этот раз состоялась в Абу-Даби, столице Объединенных Арабских Эмиратов.

Место, определенно, было выбрано со смыслом, ведь Абу-Даби не просто интересное с «курортной» точки зрения место. Здесь также базируется инвестиционная группа, которая является крупнейшим акционером Global Foundries. А успехи производственного подразделения жизненно важны для конкуренции на рынке процессоров. Какими бы инновационными ни были разработки, без отлаженного техпроцесса они так и остаются на бумаге.

Впрочем, фабрики самой Global Foundries пока расположены «за границей», и лишь в отдаленном будущем планируется построить завод и в окрестностях Абу-Даби. А в данный момент строится предприятие в Нью-Йорке, которое будет выпускать микросхемы по техпроцессам 20 нм и более тонким; его пуск намечен на 2015-й.

Тем не менее, для AMD есть еще одна родственная тематика, в Абу-Даби теперь проводится этап гонок Formula 1, и в прошлом году открылся крупнейший тематический парк развлечений под закрытым небом: Ferrari World с самыми быстрыми «американскими горками» в мире.

Впрочем, остальные аттракционы достаточно спокойные, местами даже слишком (все-таки от «гоночного» парка ожидаешь высоких скоростей и всего такого прочего), зато порадуют тех, кого «экстрим» не привлекает.

Однако пора переходить к теме! Мероприятие было насыщенным информацией и презентации действительно занимали целый день. Постараюсь охватить основное.

Итак, для тех, кто возможно пропустил, следует напомнить, что первая версия APU-процессора, сочетающего графические и вычислительные ядра на одном кристалле от AMD была выпущена в начале года. А фактически поставки наборов микросхем начались еще в конце прошлого года, и за это время было продано около 5 млн. устройств на платформе Brazos. Очень даже неплохо, если учесть, что это довольно специфическое решение, изначально ориентированное на нетбуки. Однако получившее поддержку в более широком спектре ноутбуков, моноблоков и неттопов.

Какие же цели преследуются в рамках проекта Llano? Графическое ядро должно соответствовать по производительности дискретным решениям (от младшего до среднего уровня). Для этого оно содержит до 400 графических универсальных конвейеров у старших процессоров в новой линейке.

Но это вполне ожидаемо, поскольку даже Brazos досталась достаточно мощная графика, как демонстрировали тесты. Для ее раскрытия в играх не хватало мощности именно вычислительного ядра. И если для нетбуков это нормально, то полнофункциональные ноутбуки должны отрабатывать и в играх, да и в других ресурсоемких приложениях. Поэтому вычислительная часть представлена ядрами, спроектированными по текущей «настольной» архитектуре (K10 с доработками). И в процессорах будет до 4 таких ядер. Это основное отличие от Brazos, у которого вычислительные ядра имеют особую «миниатюрную» архитектуру.

Наконец, приоритетной задачей является обеспечение экономичности. Так в простое и при «офисном» профиле работы, даже полноразмерный ноутбук должен теперь продержаться в течении целого рабочего дня на одном заряде 6-ячеечной батареи.

Так выглядит функциональная схема новой платформы Sabine, которая кроме APU-процессора, содержит интерфейсный чип с поддержкой помимо прочего 4 портов USB 3.0 (в старшей версии A70M). Это будет хорошим стимулом для производителей ноутбуков внедрять этот интерфейс, что пока задерживается из-за необходимости ставить отдельный чип. Для вывода изображения поддерживается два независимых цифровых канала и полный набор стандартных интерфейсов (а также аналоговый VGA). В качестве оперативной памяти поддерживается двухканальная DDR3 с частотой до 1600 МГц.

А это схема самого APU-чипа. Интеграция всей упомянутой функциональности стала возможна благодаря переходу на «продвинутый» 32 нм техпроцесс с поддержкой SOI и HKGM. В результате площадь кристалла, вмещающего графические, вычислительные ядра и северный мост составила 228 мм² (для сравнения 4-ядерный процессор Phenom II на 45 нм техпроцессе занимает около 200 мм²).

При этом APU-процессор вписывается в те же рамки TDP, которые ранее были характерны для «отдельных» центральных процессоров. Обратите внимание, что вычислительные ядра имеют прежнюю архитектуру K10, но она доработана (увеличенный кэш и механизм кэширования, аппаратный делитель и некоторые другие оптимизации), что позволяет говорить о приросте производительности на 6% на той же частоте. Позже в продаже появятся и процессоры для настольной платформы на аналогичном ядре, которые придут на смену Athlon II. Тогда как на смену настольным Phenom II придут модели на новом ядре Bulldozer, в которых поначалу не будет графического ядра.

Переход на более тонкий техпроцесс обычно также связывается с возможностью подъема тактовой частоты при сохранении неизменного тепловыделения. Однако с точки зрения ноутбучной платформы важно достигнуть не сохранения, а прогресса в этом вопросе, то есть снижение среднего потребления (а значит и меньший нагрев, и больший ресурс батареи).

Соответственно, фиксированное повышение частоты тут нецелесообразно. Да и уже давно не используется. Способность работать на пониженной частоте в простое впервые была применена как раз в мобильных процессорах AMD, еще во времена Athlon XP-M. Ну а сейчас пришло время внедрить и динамическое повышение частоты, включающееся когда процессорные ресурсы задействованы неравномерно. Этот козырь еще не был в полной мере задействован AMD, но, судя по всему, аналогичная аппаратная технология получилась более основательной, по сравнению с той, что используется конкурентом. Вместо аналоговых датчиков температуры и тока используются цифровые.

А главное, имеются возможности перераспределять «тепловой бюджет» между различными блоками процессора динамически и в широких пределах. В моменты, когда больше нагружено графическое ядро, его частота и напряжение будут максимальными. А если основная нагрузка ложится на вычислительные ядра, простаивающие графические конвейеры (как и модуль UVD) могут быть отключены от питания, а частота активных ядер CPU поднята до максимума, причем отдельные ядра могут быть дополнительно «разогнаны».

И, разумеется, если нагрузка с того или иного блока снимается, его частота и напряжение немедленно снижается для снижения потребления. Простаивающие вычислительные и графические ядра могут быть полностью остановлены. Что по-прежнему актуально для типичных ноутбучных сценариев работы, поскольку нагрузка даже на два ядра не является постоянной, а третье и четвертое ядра подключаются и вовсе лишь эпизодически. Ну а графическое ядро в любом компьютере нагружается по-максимуму лишь в играх и 3D-приложениях.

Эффективность схемы энергосбережения в простое демонстрирует этот слайд. Потребляемая мощность в типичном офисном режиме должна составить порядка 10% от работы с максимальной нагрузкой. Вероятно, это и позволяет говорить о 10-часовом цикле работы от батарей.

Давайте, взглянем и на структуру графических ядер в новом APU. Фактически в основе несколько обновленный дизайн Redwood, знакомый нам по текущей среднебюджетной графике. Поддержка DirectX 11, OpenGL 4.1 и OpenCL 1.1. Разумеется, пришлось переделать интерфейс для доступа к памяти, появился режим доступа, не требующей копирования из основного массива памяти в видеобуфер (Zero Copy), что будет особенно полезно для программ, использующих ресурсы графических ядер для вычислений.

Модуль UVD3 справляется с декодированием не только форматов VC-1, H.264 и MPEG2, но и видео с дисков Blu-ray 3D, а также MPEG-4, запакованные популярными DivX/XviD-кодеками.

Наконец, реализовано и то, что напрашивалось еще с тех времен, когда достаточно мощная графика начала появляться в чипсетах. Почему бы не объединить ее ресурсы с дискретным видеоядром, если уж оно установлено? Для настольных компьютеров, возможно, это и не так актуально, проще сразу поставить мощную видеокарту. Ну а в ноутбуках было бы неплохо использовать все имеющиеся ресурсы. Как видите, теперь режим Dual Graphics имеется. И, конечно же, если будет работать, как обещано, должен добавить плюсов в копилку AMD-платформы. На конкурирующей платформе возможно лишь переключение на внешнее ядро, которое само по себе обеспечивает ускорение, но ресурсы, интегрированного в процессор видеоядра при этом никак не используются.

Само по себе графическое ядро у модели из старшей серии (A8) должно «разобраться» со своим конкурентом из серии i5 (причем поддержка DirectX 11 обещает быть уже не формальной строчкой в спецификации, ее действительно можно будет задействовать в ряде игр, в частности, в Dirt3, имея не только визуально привлекательную картинку, но и достаточную для игры частоту кадров).

А вот так выглядит позиционирование линейки APU-процессоров. Предполагается, что основная масса ноутбуков будет основана на процессорах из серии A6 и ориентированы они будут на конкуренцию с моделями на Intel Core i3. Это логично, учитывая что этот сегмент и является на сегодняшний день самым массовым среди «классических» ноутбуков.

Вот так выглядит линейка APU-процессоров (нажмите на слайд для увеличения), составляющая новую A-серию. Как видим, отличия заключаются в частотах (обратите внимание, как теперь обозначается частота вычислительных ядер: помимо стандартной, указана и максимальная, соответствующая работе аппаратной Turbo Core), а также количестве ядер (2-4 вычислительных ядра и 240-400 графических конвейеров).

И, наконец, взглянем на новую систему обозначений. С названиями процессоров все очевидно, а вот логотипы во втором ряду будут отмечать в явном виде количество ядер (вычислительных: 2 или 4) и тип графического решения (Dual Graphics — ноутбуки с дискретной видеокартой вдобавок к интегрированной в процессор). Такая маркировка выглядит универсальнее предыдущей. Действительно, не совсем очевидно: почему Ultimate из прежней схемы обозначений был лучше, чем Premium, ну а цифры знакомы всем.




14 июня 2011 Г.

Sabine APU- Llano

AMD Llano Tech Day

«» APU-

, , , -, .

, , , - «» . , Global Foundries. . , .

, Global Foundries « », -. -, 20 ; 2015-.

, AMD , - Formula 1, : Ferrari World « » .

, , (- «» ), , «» .

! . .

, , , , APU-, AMD . , 5 . Brazos. , , , . , .

Llano? ( ). 400 .

, Brazos , . . , , . , «» (K10 ). 4 . Brazos, «» .

, . «» , 6- .

Sabine, APU-, 4 USB 3.0 ( A70M). , - . ( VGA). DDR3 1600 .

APU-. «» 32 SOI HKGM. , , 228 ² ( 4- Phenom II 45 200 ²).

APU- TDP, «» . , K10, ( , ), 6% . , Athlon II. Phenom II Bulldozer, .

. , , ( , ).

, . . AMD, Athlon XP-M. , . AMD, , , , , . .

, « » . , , . , ( UVD) , CPU , «».

, , , . . - , , . - 3D-.

. 10% . , 10- .

, APU. Redwood, . DirectX 11, OpenGL 4.1 OpenCL 1.1. , , , (Zero Copy), , .

UVD3 VC-1, H.264 MPEG2, Blu-ray 3D, MPEG-4, DivX/XviD-.

, , , . , ? , , , . . , Dual Graphics . , , , , AMD-. , , , .

(A8) «» i5 ( DirectX 11 , , , Dirt3, , ).

APU-. , A6 Intel Core i3. , «» .

APU- ( ), A-. , ( , : , , Turbo Core), (2-4 240-400 ).

, , . , (: 2 4) (Dual Graphics — ). . , : Ultimate , Premium, .