Обзор мобильной платформы AMD Trinity

Первое знакомство с новыми APU на примере модели A10-4600M


Компания AMD запустила свою марку VISION ещё в сентябре 2009 года, а в 2011-м компания представила так называемые APU (Accelerated Processing Unit), выпустив на рынок чипы AMD серий C и E на базе платформы «Brazos». Они объединили мощь GPU и CPU в одном кристалле, став одними из наиболее энергоэффективных ультрамобильных решений. А ещё позже в прошлом году AMD анонсировала серию A — платформу гибридных решений с кодовым именем Llano, которая была предназначена для основной части (mainstream) рынка ПК.

Предыдущие серии APU от компании AMD под названием Brazos и Llano были очень неплохо приняты рынком и оказались довольно успешными для компании. Они не хватали звёзд с неба в плане максимальной производительности (особенно в CPU части), но предлагали неплохой баланс: достаточно мощные для большинства пользователей универсальные вычислительные ядра и очень неплохую графическую производительность для интегрированных решений. Вместе с невысоким потреблением энергии это привело к выдающейся энергоэффективности первых APU.

И уже совсем недавно — 15 мая 2012 года — AMD представила обновленную серию A своих гибридных решений, ранее известную под кодовым именем Trinity, которая имеет улучшенные потребительские характеристики, по сравнению с Llano. Новые чипы сочетают два или четыре процессорных ядра «Piledriver», а также видеоядро серии «Northern Islands» с 384 вычислительными ядрами архитектуры VLIW4.

Главное преимущество APU — это высокая производительность в 3D играх. И платформа Trinity предлагает, пожалуй, лучшие возможности в своём ценовом диапазоне и при известных ограничениях потребления энергии. В новых APU было обновлено графическое ядро, теперь применяется более новая архитектура, известная нам по AMD Radeon HD 7600 (кодовое имя «Thames»). Новое видеоядро обеспечивает весьма высокую производительность, если сравнивать с другими гибридными (CPU+GPU) решениями.

Обновленная A-серия чипов включает до четырёх x86-совместимых вычислительных ядер, которые основаны на улучшенной архитектуре, впервые появившейся в процессорах «Bulldozer». А появление поддержки третьего поколения технологии AMD Turbo Core обеспечивает максимально возможную производительность CPU и GPU в условиях различной нагрузки и жёстких требований по энергопотреблению. При установленных рамках TDP, новая A-серия чипов отлично подходит для ультрапортативных и тонких ноутбуков, а также для домашних настольных ПК, хотя такие APU выйдут несколько позже. Сравним основные характеристики Llano и Trinity:

Новый чип производится по тому же 32 нм техпроцессу и имеет 1,3 миллиардов транзисторов в своём составе, что немногим больше, чем имеет Llano. Площадь кристалла равна 246 мм2, что также незначительно больше площади Llano. Для сравнения, четырёхъядерный Sandy Bridge от Intel также выполнен с применением 32 нм техпроцесса, он имеет почти столько же транзисторов и площадь кристалла, что и Llano (1,2 млрд. транзисторов и 216 мм2, соответственно). А вот в производстве Ivy Bridge уже применяется более совершенный техпроцесс 22 нм, и при сложности почти как у Trinity (1,4 млрд. транзисторов), этот процессор от компании Intel имеет значительно меньшую площадь в 160 мм2.

Преимущество компании Intel в скорости освоения техпроцессов неоспоримо, и без перехода на новый техпроцесс AMD пришлось урезать свои аппетиты в плане усложнения APU. По сравнению с Llano размер и сложность кристалла выросли незначительно, и производительность CPU и GPU частей, а также их энергоэффективность, хоть и выросли, но не так существенно, как могли бы при 28 нм производстве, к примеру. Но из-за улучшенной архитектуры и CPU и GPU, удалось повысить мощность Trinity, и этот APU является логическим развитием своего предшественника, и очень хорошим решением в целом.

Платформа Trinity

Итак, новая серия APU от компании AMD основана на чипе, состоящем из 1,3 млрд. транзисторов, выполненным на базе 32 нм HKMG техпроцесса, и имеющем площадь 246 мм2. Чип имеет два исполнения: FS1r2 722-контактный uPGA и FP2 827-контактный uBGA. Мобильный вариант Trinity имеет типичное потребление энергии (TDP) от 17 до 35 Вт, в зависимости от модели, а для настольных APU этот параметр достигает 100 Вт.

Новые чипы серии A имеют до четырёх x86-ядер, до 128 КБ кэш-памяти первого уровня (64 КБ для инструкций, 64 КБ для данных) и до 4 МБ кэш-памяти второго уровня. Тактовая частота «ноутбучных» моделей достигает 3,2 ГГц в турбо-режиме. Поддерживается оперативная память следующих типов: DDR3-1600 (1,5 В), LVDDR3-1600 (1,35 В), ULVDDR3-1333 (1,25 В) при работе в двухканальном режиме.

Графическое ядро содержит до 384 вычислительных ядер и обладает поддержкой DirectX 11 API, в состав чипа входят аппаратные блоки кодирования и декодирования видеоданных: UVD 3 и VCE. Интегрированный GPU в Trinity работает на частотах от 424 до 800 МГц. Для вывода изображения можно использовать до четырёх приёмников видеосигнала, поддерживаются выводы всех типов: Display Port, HDMI, DVI для трёх дисплеев, а четвёртый можно подключить по DisplayPort 1.2 при помощи специального хаба. Аналоговое подключение использует DAC, встроенный в чипсет.

К слову о применяемом чипсете. Новая платформа использует уже известный нам чипсет (Fusion Controller Hub) модели A70M (Hudson M3), который знаком по Llano. Чипсет пусть и не новый, производится по 65 нм техпроцессу, но он обеспечивает Trinity всем, что необходимо, поддерживая шесть SATA-III портов (с возможностью организации RAID 0/1 массивов), четыре USB 3.0 и 10 USB 2.0 портов (плюс два USB 1.1 дополнительных). Всё остальное из актуального также есть, а что до поддержки чипсетом «всего лишь» PCI Express 2.0, то в случае мобильных систем третья версия PCIe просто не нужна, так как толк от неё даже на настольных системах заметить пока что непросто. Потребление энергии чипом FCH небольшое — от 2,7 до 4,7 Вт в типичных условиях.

Вычислительные ядра Piledriver

Как вы наверняка помните, Llano APU имел четыре x86-ядра Stars, а Trinity включает два модуля Piledriver. Это улучшенные ядра по сравнению с Bulldozer, и они явно лучше тех CPU ядер, которые используются в Llano. В Piledriver подтянули некоторые слабые места Bulldozer, хотя в целом архитектура осталась той же.

Каждый модуль Piledriver содержит уже известную со времён Bulldozer комбинацию из двух целочисленных и одного ядра обработки данных с плавающей запятой. Каждое из целочисленных ядер имеет собственные планировщики, кэш-память первого уровня для данных и исполнительные устройства. Также модуль содержит и общее FP-ядро, обрабатывающее инструкции с плавающей запятой и использующее общую кэш-память.

Инженеры компании AMD модифицировали вычислительное ядро, чтобы увеличить количество исполняемых микропроцессором инструкций за такт (IPC). Сами по себе исполнительные устройства почти не изменились и стали лишь незначительно производительнее, по сравнению с Bulldozer, в некоторых операциях (таких как INT и FP деление). Более важным изменениям подверглись планировщики для целочисленных вычислений и вычислений с плавающей запятой, а также значительно улучшено предсказание ветвлений и предварительная загрузка (prefetching).

Увеличилась и эффективность использования кэш-памяти второго уровня, а L1 TLB стал большего размера. А ещё одним ожидаемым изменением в Piledriver стало обновление архитектуры набора команд (ISA) новыми инструкциями: FMA3 и F16C, в дополнение к AVX, AVX 1.1 и AES.

Технология Turbo Core 3.0

Технологии, автоматически повышающие частоту одного или нескольких ядер CPU, а также интегрированного GPU, в последнее время получили широкое распространение — теперь они есть почти везде. В Llano уже была поддержка технологии Turbo Core, но в Trinity она была значительно улучшена.

Turbo Core 3.0 поддерживает повышение частоты как для CPU ядер, так и для GPU части чипа, а в Llano могли ускоряться только первые (при наличии «свободного» энергопотребления, конечно), а графическое ядро в предыдущем APU работало всегда на базовой частоте. В Trinity же, если ядра CPU не используют весь возможный запас по потреблению (когда оно не превышает значение TDP), а GPU загружен работой, то частота работы последнего повышается. Для CPU ядер работает то же самое — если основная нагрузка идёт на одно из x86-ядер, то его частота возрастает до максимальной отметки, если энергопотребление не превышает установленного значения TDP — см. схему:

Схема управления в чипе отслеживает потребление питания всеми блоками, и в Trinity она была усложнена. В Llano, схема Turbo Core просто отслеживает лишь активность CPU и GPU, и повышает частоту CPU, если GPU не загружен работой, а в Trinity вычисляется потребление каждым блоком, исходя из их загрузки, а затем и температурный режим для них, причём точность этих расчётов достаточно высока. В результате, схема управления Turbo Core 3.0 позволяет быстрее и эффективнее управлять изменением частот, а вместе с этим растёт и общая энергоэффективность решения.

Кстати, многочисленные улучшения в эффективности и управлении питанием в Trinity привели к росту времени автономной работы. По заявлениям компании AMD, такие устройства способны проработать до 11 часов в режиме простоя. Общее среднее энергопотребление системы, включая и APU и чипсет (точнее — Fusion Controller Hub) составляет лишь 1-2 Вт в режиме простоя и всего 6 Вт в режиме просмотра видеоданных. Что получается на практике, мы проверили в одном из следующих разделов материала.

Интерфейс памяти и другие соединения

Главным теоретическим преимуществом APU является их гетерогенная архитектура Heterogeneous System Architecture (HSA), когда в едином кристалле содержатся CPU и GPU ядра, которые выполняют свои специализированные задачи, используя одну и ту же системную память, и связь между ними при этом может быть очень быстрой.

Пока что не всё это реализовано в нынешних чипах, но в ближайшем будущем станет важным преимуществом гибридных решений — одна только широкая начиповая шина между CPU и GPU облегчит многие задачи. Вот как видит AMD путь развития своих APU — если доступ к оперативной памяти у GPU уже есть, то в будущих моделях должна появиться общая адресация памяти, а также переключение контекста для GPU-вычислений:

Как и предшествующие APU, чипы Trinity содержат по два 64-битных контроллера DDR3 памяти, поддерживающих стандарты вплоть до DDR3-1866 (обеспечиваемая пропускная способность до 29,8 ГБ/с). Максимальный объём поддерживаемой памяти для мобильных чипов Trinity равен 32 ГБ, а для настольных — 64 ГБ. Из нововведений можно отметить разве что добавленную поддержку чипов памяти, работающих при пониженном до 1,25 В напряжении.

Ранее служащая для внешних соединений Hyper Transport была заменена на PCI Express. 128-битный двунаправленный интерфейс Fusion Control Link (FCL) предоставляет доступ к памяти для внешних устройств. Так, GPU с его помощью получает доступ к кэш-памяти и ОЗУ, а CPU — к выделенному фреймбуферу. Также в Trinity есть поддержка 256-битной двунаправленной шины Radeon Memory Bus (RMB) для прямого доступа к контроллерам DRAM памяти, а также для связи между CPU и GPU. RMB позволяет видеоядру получать быстрый доступ к системной памяти.

А для доступа дискретных GPU, используемых в паре с Trinity, напрямую к виртуальной памяти CPU, используется IOMMU v2. По сравнению со схемой в Llano, была упрощена передача данных в GPU, теперь не нужно копировать их из адресного пространства CPU в область ОЗУ, к которой есть доступ у графического ядра, теперь данные напрямую направляются из оперативной памяти в видеопамять, минуя лишнее копирование из одной области ОЗУ в другую.

Графическое ядро новых APU

GPU в Trinity имеет в своей основе архитектуру Cayman, впервые увиденную нами в семействе «Northern Islands». Встроенное в APU видеоядро использует VLIW4 дизайн и содержит 6 SIMD движков, в каждом из которых есть по 16 блоков VLIW4, то есть в сумме получаем 384 вычислительных ядра. Это число справедливо лишь для моделей A10, имеющих по 384 ядер, а чипы с маркировкой A8 и A6 имеют по 256 и 192 активных потоковых процессоров, соответственно.

«Northern Islands» можно назвать предыдущим поколением графической архитектуры AMD, хотя на её основе были выпущены лишь видеокарты для верхнего ценового диапазона — серия Radeon HD 6900. Недорогие варианты с VLIW4 так и не вышли. Интересно, что хотя Trinity имеет меньше вычислительных ядер в GPU, по сравнению с Llano, но переход от VLIW5 к VLIW4 повысил эффективность их использования, так как пятый блок VLIW5 был занят работой в крайне ограниченном круге задач — те же трансцендентные функции используют лишь 3-4 блока из имеющихся. Применение VLIW4 упростило и задачи планировщика и управления регистрами, что привело к дополнительному увеличению эффективности.

Кроме потоковых процессоров, GPU включает 24 текстурных блока (по 4 TMU на каждый SIMD) и 8 блоков ROP, то есть примерно четверть от Radeon HD 6970, если не учитывать более низкую частоту. Впрочем, турбо-частота графического ядра Trinity для топовых моделей равна 686 МГц, что не так уж далеко от 880 МГц у Radeon HD 6970.

Из других изменений между графическими архитектурами, применёнными в разных поколениях APU, особо отметим улучшенную производительность тесселяции в Northern Islands, а также поддержку всех известных типов полноэкранного сглаживания, в том числе SSAA, EQAA и MLAA. Естественно, что графическое ядро поддерживает DirectX 11 и OpenCL 1.1 — это одни из преимуществ AMD перед Sandy Bridge (но не Ivy Bridge). Подробнее о графической архитектуре Northern Islands можно прочитать в базовом обзоре Radeon HD 6970.

Для вывода изображения на дисплеи используется хорошо известная технология AMD Eyefinity, новыми APU поддерживается до четырёх мониторов и независимых аудиопотоков, а также DisplayPort 1.2 выходы со скоростью передачи данных до 5,4 Гб/с и поддержкой многопоточного вывода. Нужно отметить, что новый APU включает также и ускоритель обработки медиаданных HD Media Accelerator, улучшающий качество видео (постобработка) и включающий блоки видеодекодирования UVD 3 и видеокодирования VCE.

Несмотря на то, что GPU в Trinity имеет архитектуру VLIW4, блок кодирования видео был позаимствован у более поздней архитектуры Graphics Core Next. UVD третьего поколения отличается поддержкой аппаратной обработки формата MPEG-4/DivX, а также возможностью декодирования двух каналов видео в формате FullHD, что применяется и при декодировании видеоданных в стереоформате.

Технологию для перекодирования видеоданных назвали AMD Accelerated Video Converter. Многопоточный аппаратный видеокодер в формате H.264 поддерживает разрешение до FullHD, цветовую дискретизацию 4:2:0, изменяемое качество сжатия и специализированные оптимизации для разных видов изображения. Обеспечивается быстрый доступ к данным из фреймбуфера для перекодирования видео, задач видеоконференций и беспроводной передачи изображения на внешний дисплей. Аппаратный блок VCE обеспечивает энергоэффективное кодирование видеоданных со скоростью быстрее реального времени и с низкими задержками.

Кроме этого, стоит отметить технологию улучшения качества проигрывания потокового видео — AMD Quick Stream Technology, а также технологию стабилизации видеоизображения в реальном времени AMD Steady Video. Quick Stream интересна тем, что трафику потокового видео на совместимых платформах AMD выделяется максимальный приоритет перед другими задачами, использующими сетевой канал. При этом достигается плавное воспроизведение потоковых видеоданных без ожидания их подгрузки.

Технология AMD Steady Video занимается улучшением видеороликов плохого качества, снятых с рук, без использования штатива и других аналогичных средств для стабилизации изображения. Технология стабилизации видео при помощи GPU поддерживается в решениях компании AMD уже некоторое время, но в серии видеокарт Radeon HD 7000 появилась её вторая версия.

Алгоритм работы программного стабилизатора довольно прост: на основе видеопотока собирается статистика о движении камеры (сдвиг, вращение, приближение) и это движение компенсируется в текущем кадре, относительно предыдущих — изображение сдвигается, поворачивается и масштабируется так, чтобы картинка сильно не прыгала и оставалась стабильной.

Задача хоть и несложная, но весьма ресурсоёмкая, ведь пикселей в кадре два миллиона, а кадров в секунду 30-60. И чтобы отследить все возможные смещения кадра, нужно проделать много вычислений. Графические ядра с поддержкой Steady Video 2.0 способны обрабатывать случайные сдвиги с амплитудой до 32 пикселей в любом направлении и для этого требуется поддержка специализированных команд, которая теперь есть и в последнем поколении APU.

Линейка новых мобильных решений серии A

Платформа Trinity выходит на рынок в двух видах, как и Llano. Настольные решения основаны на чипах Virgo, но они выйдут на рынок позже — ближе к осени. А пока что вышли модели APU для ноутбуков, имеющие кодовое имя Comal. Мобильные решения для AMD предпочтительны по многим причинам, тем более, что Trinity имеет преимущество в энергоэффективности, важной именно для ноутбуков.

Это заметно и по установленным цифрам типичного потребления энергии. Если Llano имели лишь два варианта с TDP в 35 Вт и 45 Вт, то мобильные Trinity имеют модели с потреблением: 17 Вт, 25 Вт и 35 Вт (для настольных ПК будут уровни 65 и 100 Вт). К тому же, по данным AMD, новое поколение APU почти вдвое более энергоэффективно, по сравнению с Llano. Всего мобильных чипов Trinity вышло пять разных моделей, нацеленных на разные рынки, и все они отличаются по своим потребительским характеристикам:

Модель Модель GPU Ядер CPU Частота CPU, ГГц Кэш L2, МБ Ядер GPU Частота GPU, МГц TDP, Вт
A10-4600M HD 7660G 4 2,3 (3,2) 4 384 497 (686) 35
A8-4500M HD 7640G 4 1,9 (2,8) 4 256 497 (655) 35
A6-4400M HD 7520G 2 2,7 (3,2) 1 192 497 (686) 35
A10-4655M HD 7620G 4 2,0 (2,8) 4 384 360 (497) 25
A6-4455M HD 7500G 2 2,1 (2,6) 2 256 327 (424) 17

Как мы уже отметили выше, Trinity использует модули, содержащие по два ядра Piledriver с одним общим FP-блоком (FP/SSE). Поэтому можно сказать, что чипы Trinity — это четырёхъядерные или двухъядерные процессоры. И хотя если считать по количеству FP-блоков, то «настоящего» четырёхъядерника не получается, но само по себе количество тех или иных исполнительных устройств не так важно, как общая вычислительная производительность.

И по сравнению с решениями Llano на базе старых ядер, частоты CPU части Trinity значительно выше, это касается и базовой частоты и турбо-частоты. Топовая модель A10-4600M имеет базовую частоту более чем наполовину выше, чем модель A8-3500M из семейства Llano, а её турбо-частота выше на треть. С другой стороны, конвейер ядра Piledriver длиннее, чем в модифицированных K10, что скажется в некоторых приложениях, и разница в производительности окажется не столь впечатляющей.

GPU часть Trinity также сильно отличается от того, что мы видели в Llano. Мы уже отметили, что старые APU использовали графическое ядро с архитектурой VLIW5, известное с моделей серии Radeon HD 5000, и разные модели APU имели по 400, 320 или 240 вычислительных ядер. В Trinity же применена VLIW4 архитектура, виденная в настольных моделях серии Radeon HD 6900, и число активных потоковых ядер в новых моделях чипов равно: 384, 256 и 192.

Но, несмотря на сниженное количество вычислительных устройств в GPU, благодаря увеличенной эффективности использования ресурсов в Trinity, а также значительно более высоким (более чем наполовину) рабочим частотам для GPU в Trinity, графическая производительность новых APU выросла ещё более серьёзно, чем производительность универсальных x86-ядер.

Компания AMD противопоставляет свои новые решения соответствующим моделям от компании Intel, исходя из предполагаемой розничной стоимости конечных устройств. Так, модель A10 позиционируется между Intel Core i5 и Core i7, A8 — между Core i5 и i3, A6 — чуть ниже Core i3, а младшая A4 должна быть чуть дороже ноутбуков с Pentium, но дешевле всех Intel Core.

Интересно, что компания AMD использует маркировку A10 для своих топовых моделей на базе Trinity, ведь раньше были только менее производительные модели с названиями A8 и A6. Это и понятно, ведь по данным компании, модель A10-4600M обеспечивает примерно на 56% большую производительность GPU части и на 29% большую скорость универсальных вычислений, по сравнению с A8-3500M. Правда, со второй цифрой непонятно, идёт ли речь о производительности CPU или всё же в том числе и об универсальных вычислениях, в которых помогает и GPU.

Модель A10-4600M стала наиболее мощным APU на данный момент, она предназначена для производительных ноутбуков среднего ценового диапазона, которые неплохо предназначены для не самых сложных игровых задач, а также других типичных применений. A8-4500M более чем на треть медленнее в терминах графической производительности, а универсальные вычислительные ядра немного потеряли в частоте, зато этот APU может использоваться в более дешёвых ноутбуках, хотя в играх ему будет уже заметно тяжелее. Ну а самый простой A6-4400M содержит лишь два универсальных CPU ядра, а GPU имеет примерно половину производительности от топового решения. Всеми моделями поддерживаются типы DDR3 памяти вплоть до DDR3-1600.

Две оставшиеся модели из новой линейки APU имеют пониженное энергопотребление и предназначены для использования в тонких ноутбуках вроде HP Sleekbook — то есть, по сути, аналогах ультрабуков на базе процессоров Intel. А соответствующие настольные процессоры Trinity, когда они выйдут на рынок, могут стать основой для компактных ПК новых форм-факторов.

Более мощный A10-4655M имеет лишь на десяток процентов меньшую CPU-производительность, по сравнению с A10-4600M, и на треть меньшую скорость обработки графики. При этом подобная мощь довольствуется потреблением лишь 25 Вт энергии! Для младшей ULV-модели A6-4455M показатель TDP ещё ниже — всего 17 Вт, что полностью совпадает с аналогичными моделями от Intel. Естественно, скорость CPU и GPU в этой модели сильно урезана — в ней есть лишь два ядра Piledriver и 256 процессоров в GPU, а частоты заметно снижены. Также необходимо отметить, что малопотребляющие модели потеряли поддержку DDR3-1600 памяти, обеспечивая работу памяти стандартов до DDR3-1333 включительно.

Примерные прикидки по производительности новых APU можно сделать по данным от компании AMD, которая сравнивает Trinity с Llano по энергоэффективности в графических и других приложениях отдельно:

Сложно сказать, что подразумевается под «Productivity» производительностью, а расшифровки AMD не даёт. Вероятно, в этой колонке учитывается и скорость в приложениях с поддержкой OpenCL-ускорения. Куда интереснее сравнительные тесты с конкурирующим Intel Core i7-2720QM в DirectX 9 и 10 играх:

Правда, и тут нет конкретных цифр, а только преимущество решения AMD, указанное в процентах. И вполне естественно, что оно достаточно велико, ведь процессор конкурента имеет устаревший GPU. Процессоры Intel вплоть до Ivy Bridge (мобильные версии которых ещё не вышли) имеют интегрированное графическое ядро без поддержки DirectX 11, и для достижения приемлемой производительности в современных играх, процессорам Intel поможет только установка дискретного ускорителя от NVIDIA, что повышает цену конечного решения. Особенно по сравнению с ноутбуками на базе APU от AMD, ведь они обеспечивают подобную скорость в 3D играх без применения дополнительных чипов.

Прототип ноутбука на базе AMD Trinity

Прототип мобильного решения на базе Trinity, который был предоставлен нам компанией AMD на мероприятии для прессы, проходившем в Остине, уже больше похож на конечное решение, чем это было раньше, например с Zacate. Хотя дизайн ноутбука и разрабатывался кем-то из известных производителей, он совершенно точно не предназначен для выхода на рынок, хотя своё предназначение он выполняет неплохо — сделать выводы о платформе на его примере вполне можно.

Такое решение — чуть ли не единственная возможность для журналистов познакомиться с новинкой ещё до того, как ноутбуки на её основе попадут в розничные магазины. При этом прототип вполне функциональный, и все обычные тесты на нём проходят отлично. Интересно, что на ноутбуке есть логотипы компании AMD: на крышке, под экраном и над клавиатурой. Так как ноутбук в таком виде не попадёт на рынок, то нет смысла разбирать применённые в нём конструктивные решения — модели, которые уже пошли в розницу, совершенно иные. Да это и к лучшему, так как уж слишком просто и неэлегантно прототип выглядит, в отличие от чемоданчика, в котором он был нам выдан:

Из технических параметров, которые стоим упомянуть, отметим разве что модель APU — это A10-4600M со стандартными параметрами, которые указаны выше. Прототип ноутбука от AMD имеет приличную начинку в виде 4 ГБ памяти и SSD, достаточно ёмкую батарею и даже оптический Blu-ray комбо-привод. Конечно, он далеко не такой тонкий, как ультрабуки, но это и понятно — у прототипа просто не было такой цели. Давайте рассмотрим технические характеристики рассматриваемой сегодня модели:

  Прототип AMD Trinity
Процессор AMD A10-4600M (2,3 ГГц (Turbo Core до 3,2 ГГц), 2×2 МБ L2, 4 ядра/4 потока)
Чипсет AMD A70M (Hudson M3)
Оперативная память 4 ГБ DDR3-1600, двухканальный доступ
Экран 14″, разрешение 1366×768, матрица TN, LED-подсветка
Видеоадаптер Интегрированный в APU Radeon HD 7660G (1 ГБ выделенной DDR3-памяти)
Накопитель SSD Samsung 830 (128 ГБ, SATA-III)
Оптический привод BD-Combo PLDS DS-6E2SH (SATA-II)
Средства коммуникации Gigabit Ethernet (10/100/1000 Мбит/c), Bluetooth 2.1, Wi-Fi 802.11b/g/n
Аккумулятор литиево-полимерный шестиячеечный, ёмкостью 56 Вт·ч
Операционная система Microsoft Windows 7 Ultimate (64-битная)

Как видите, A10-4600M работает на частоте 2,3 ГГц и имеет возможность автоматического разгона до 3,2 ГГц (когда работой загружено лишь одно из имеющихся вычислительных ядер) при помощи технологии Turbo Core 3.0, а также кэш-память второго уровня объёмом 2 МБ на каждый двухъядерный модуль. Посмотрим, что интересного сможет рассказать нам диагностическая утилита CPU-Z о применяемом центральном процессоре и системе:

Ничего особенно интересного мы не заметили — утилита уже умеет определять и характеристики чипов платформы Trinity. Данные о кэш-памяти и поддерживаемых расширениях, количество физических и логических процессоров указано верно. Частота x86-ядер показана в состоянии простоя, а чипсет определился как A55/A60M.

APU имеет сравнительно высокую частоту и четырёх (или двух, смотря как считать) имеющихся ядер должно вполне хватать для большинства обычных задач, вроде офисных приложений и браузеров, кроме наиболее требовательных вычислений вроде профессиональных применений в 3D-моделировании или видеомонтаже. Да и в большинстве современных игровых приложений скорости CPU должно хватать.

В оснащение прототипа ноутбука включили 4 ГБ памяти типа DDR3, что вполне обычно для ноутбуков такого класса. Для хранения данных ноутбук AMD укомплектован быстрым, хотя и не слишком ёмким твердотельным накопителем от Samsung. Так что беспокоиться по поводу скорости загрузки и работы системы не нужно — SSD обеспечит быстрый доступ к данным и не станет ограничителем производительности.

Ещё одной важной аппаратной особенностью прототипа является интегрированная видеоподсистема, имеющаяся в составе процессора A10-4600M. Несмотря на то, что это встроенное решение, оно весьма мощное и энергоэффективное, и должно обеспечить 3D-производительность на уровне некоторых дискретных видеокарт, особенно если сравнивать с прошлыми их поколениями. А уж сравнивать с интегрированным видео от той же Intel так и вовсе неверно, так как в тех же Sandy Bridge игры если и запускаются без проблем и артефактов, то интегрированные GPU неспособны обеспечить приемлемый FPS в них даже при низких настройках.

Посмотрим, что о характеристиках графического ядра прототипа на базе Trinity сможет рассказать тестовая утилита GPU-Z:

Radeon HD 7660G

Эта утилита предназначена скорее для работы с настольными ускорителями, а в случае мобильных решений она часто показывает неполные и/или неверные данные. Так получилось и в нашем случае — много что не определено вовсе, а то, что есть не всегда указано верно. Так что показания утилиты в данном случае фактически бесполезны, ведь даже поддержку DirectX 11 и OpenCL утилита показать не смогла.

Всё остальное в предоставленном прототипе ноутбука нас волнует в гораздо меньшей степени. Коммуникационные возможности его не слишком впечатляющие, но необходимый набор интерфейсов есть: сетевой адаптер Gigabit Ethernet, беспроводные интерфейсы Wi-Fi 802.11b/g/n и Bluetooth 2.1 (даже не 3.0, как ни странно). На то он и прототип. Давайте лучше перейдём к исследованию производительности нового APU.

Производительность в синтетических тестах

Как всегда, мы начинаем рассматривать производительность с синтетических тестов, которые показывают скорость в искусственных условиях, позволяя довольно чётко ограничить влияние различных подсистем друг на друга: CPU от GPU и наоборот. В этом разделе статьи мы рассмотрим результаты синтетических тестов производительности системы в следующих тестовых пакетах: PCMark Vantage, Cinebench, 3DMark’06 и ’11, а также Heaven 3.0.

Для начала давайте посмотрим на рейтинги производительности в операционной системе Windows 7. Это наиболее простой метод определения производительности в синтетических условиях, доступный на каждой системе с установленной Windows 7 или Vista. Для сравнения мы взяли ранее протестированные по данной методике мобильные системы компаний Acer и ASUS, а также инженерный образец AMD Zacate.

Рейтинг Windows 7 AMD
Trinity
(A10-4600M
HD7660G)
Acer
M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
AMD
Zacate
(E-350
HD6310)
Процессор 6,9 6,3 7,0 6,3 3,8
Оперативная память 5,9 5,9 7,5 5,5 5,0
Графика Aero 6,7 5,7 6,9 5,1 4,0
Графика игровая 6,7 6,9 6,9 5,9 5,5
Жесткий диск 7,6 5,9 5,9 5,8 7,9

Встроенный тест Windows показывает, что производительность x86-ядер новой платформы Trinity весьма неплоха и примерно соответствует той, что получается у хоть и не нового, но всё же четырёхъядерного Core i7, кроме скорости доступа к данным из памяти, которая зависит от объёма и скорости кэш-памяти. Интересно, что A10-4600M оказался быстрее и «ультрабучного» Core i5-2467M. Ну а в тесте накопителя лидируют две тестовые системы от AMD, что объясняется применением в них полноценных SSD-накопителей, в отличие от HDD и гибридных систем у других участников теста.

Нас интересуют больше всего оценки графической производительности, и тут новый APU показал себя исключительно с хорошей стороны. В режиме «игровой» 3D-графики им был показан результат, почти соответствующий скорости таких быстрых решений, как AMD Radeon HD 5850 из позапрошлого поколения и новейшего NVIDIA GeForce GT 640M. Да и в графическом подтесте Aero отставания от указанного Radeon почти нет, а менее производительное интегрированное видеоядро Intel.

Впрочем, ничего особенного от встроенного в Windows теста мы не ждали, ведь он далёк от идеального, особенно в определении 3D-производительности, к которой мы ещё вернёмся не раз. А сейчас рассмотрим результаты общесистемного теста PCMark Vantage. Примем во внимание и итоговый результат, и отдельные по подсистемам. Подробные цифры помогут нам оценить производительность различных компонентов ноутбука, и их вклад в общую оценку.

PCMark Vantage AMD
Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
AMD
Zacate
(E-350
HD6310)
PCMark Score 10056 6106 5632 4445 3680
Memories Score 5834 4624 4134 2916 2240
TV and Movies Score 4004 2639 4029 3242 1595
Gaming Score 7272 8316 5788 3648 3722
Music Score 11570 8489 4599 4659 4916
Communications Score 9973 8181 4017 3717 3024
Productivity Score 12354 8434 4391 4087 4582
HDD Score 22013 15381 3072 2760 13809

Общий счёт в этом тесте важен скорее для энтузиастов разгона и годится разве что для сравнения рекордных результатов — забавно, что система A10-4600M оказалась чуть ли не вдвое быстрее всех. Пользы и практического смысла в таком сравнении нет, а вот подробные результаты бывают интересны, так как они сразу указывают на сильные и слабые стороны протестированных решений.

Так, в подтесте оперативной памяти новая платформа от AMD на удивление стала самой быстрой, обогнав все остальные тестовые системы. Вероятно, в этом виновата довольно быстрая DDR3 и неплохое кэширование. Результат в «TV and Movies» нормальный, на уровне четырёхъядерного ноутбука Acer, а огромная разница в остальных системных тестах в пользу сегодняшнего прототипа объясняется применением в нём SSD в качестве единственного накопителя — именно поэтому во многих тестах были показаны столь сильные результаты. Впрочем, без достаточно мощного центрального процессора их бы тоже не было.

Самый интересный «игровой» тест, в нём был получен результат между Radeon HD 5850 и GeForce GT 640M, причём ближе к последней. К сожалению, объективной эта оценка быть не может, так как сравнение портится присутствием SSD в некоторых конфигурациях, а в Gaming Score считается усреднённая оценка, замеряющая в играх и скорость загрузки данных с накопителя в том числе. И PCMark Vantage в целом слишком сильно зависит от скорости установленного накопителя.

Следующим рассмотренным тестом будет Cinebench старой версии R10, которую мы применяли с 2010 года. Это не совсем «чистая» синтетика, а скорее тест производительности, основанный на коде широко распространённого приложения Cinema 4D — профессионального пакета для создания и рендеринга трёхмерных изображений и анимаций.

Cinebench содержит три подтеста: рендеринг при использовании одного ядра CPU, всех ядер CPU (в данном случае выполняется четыре потока на двух ядрах) и самый интересный для нас подтест OpenGL, использующий рендеринг сложной трёхмерной сцены в реальном времени. Последний тест позволяет оценить производительность графической подсистемы при работе в аналогичных профессиональных пакетах, использующих OpenGL.

Cinebench R10 AMD
Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
AMD
Zacate
(E-350
HD6310)
CPU 2824 3581 3769 2495 1162
CPU (многопоточный) 8227 7133 10339 5788 2226
OpenGL 5597 5061 6860 4114 1960

Рассмотрим процессорные тесты Cinebench для начала. Рассматриваемый нами сегодня APU имеет четыре целочисленных ядра и два FP-ядра, прирост производительности от «многоядерности» в этом тесте получился почти трёхкратным, даже несмотря на влияние Turbo Core, который портит прямое сравнение. В случае процессоров Intel им помогал Hyper Threading, позволяющий выполнять четыре потока на двухъядерном процессоре и восемь на четырёхъядерном.

Весьма любопытно сравнение с Core i5-2467M. Если в однопоточном тесте выигрывает решение Intel, имеющее более производительное x86-ядро, то в многопоточном вперёд вырывается уже новинка от компании AMD — A10-4600M, имеющее большее количество ядер. То есть, само по себе каждое ядро в Trinity медленнее, но за счёт их количества получается выигрыш.

Интересен и подтест OpenGL, результаты которого говорят о том, что хотя Radeon HD 7660G и уступает мобильной версии Radeon HD 5850, но новый GeForce GT 640M остаётся позади в этом тесте, так как этот тест не является сильной стороной видеокарт NVIDIA. В общем, топовая модель чипов A-серии показала себя в Cinebench весьма неплохо.

А теперь давайте рассмотрим результаты 3DMark’06, где разница между графическими решениями различной мощности должна быть более ощутимой. Этот тест очень сильно нагружает почти исключительно видеоподсистему и зависит только от её производительности. Приведём цифры, относящиеся к тестированию именно GPU:

3DMark’06 AMD
Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
AMD
Zacate
(E-350
HD6310)
Score 7955 10504 9210 4047 2011
GT1 23,9 40,6 27,1 10,7 5,4
GT2 24,9 36,8 31,5 12,2 6,2
HDR1 34,8 48,3 38,9 15,9 8,1
HDR2 36,8 51,5 42,8 17,8 9,0

Хорошо видна разница в скорости между старыми ноутбуками и более современными, у которых цифры средней частоты кадров в тестах этого пакета уже вполне приемлемы. Даже столь мощный некогда мобильный Radeon HD 5850 лишь совсем немного обгоняет представленную недавно новинку — гибридное решение платформы Trinity. А для других встроенных в CPU графических ядер этот тест и вовсе слишком тяжёл, что можно увидеть на примере видеоядра AMD Zacate, а ведь GPU в Sandy Bridge ещё слабее.

Radeon HD 7660G справляется с задачей очень хорошо, обеспечивая скорость смены кадров порядка 25-35 FPS. Конечно, это меньше, чем у той же GeForce GT 640M, ну так на то она и дискретная графика, потребляющая вместе с CPU уже намного больше, чем A10-4600M в одиночку. Вообще, общий счёт 3DMark’06 обычно хорошо отражает производительность разных GPU. GT 640M в тесте явно лучший, затем идёт Radeon HD 5850, а почётное третье место занял наш сегодняшний герой, и это — отличный результат для гибридного процессора!

Всё это были старые синтетические тесты, результаты в которых мы привели для того, чтобы сравнить их с ранее протестированными моделями ноутбуков. С тех пор прошло много времени, вышли новые тестовые пакеты, более актуальные для оценки производительности современных видеокарт. Первым современным тестом будет 3DMark’11 всё той же Futuremark.

3DMark’11 AMD Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Score 1153 1773
Graphics 1062 1697
Physics 2642 2724
Combined 960 1494
GT1 5,28 8,27
GT2 5,07 7,94
GT3 5,93 10,26
GT4 3,22 5,06

Сравнивать результаты AMD A10-4600M в данном пакете мы будем только с цифрами недавно протестированного игрового ультрабука Acer Timeline Ultra M3, имеющего дискретную видеокарту GeForce GT 640M от NVIDIA. Потому что это первые мобильные решения, которые мы протестировали в тестовом пакете 3DMark’11.

Результат системы на базе Trinity APU в 3DMark’11 с общим счётом 1153 очков при настройках по умолчанию примерно соответствует уровню настольной видеокарты GeForce GT 430 и в полтора раза хуже, чем у AMD Radeon HD 6670. Хотя это и не такая уж высокая производительность с точки зрения настольных решений, но отличный уровень для интегрированного мобильного решения.

Производительности Radeon HD 7660G вполне хватит во многих современных играх, особенно мультиплатформенных и с не самыми высокими настройками. Но что будет в игровых приложениях, активно использующих такие возможности DirectX 11, как тесселяция, вычислительные шейдеры и др.? Чтобы это узнать, мы протестировали прототип на Trinity ещё в одном из наиболее тяжёлых 3D-тестов — Unigine Heaven 3.0.

Кроме тестов тесселяции в трёх режимах, мы также протестировали и разные уровни полноэкранного сглаживания методом MSAA и определили падение производительности при включении анизотропной фильтрации. Для удобства все результаты приведены в виде диаграммы:

Даже при пониженной сложности шейдеров, тест Heaven весьма тяжёл для ноутбуков, и уж тем более интегрированной графики. Но Radeon HD 7660G справляется с ним не так уж плохо, обеспечивая почти 30 FPS в режиме с выключенными сглаживанием, анизотропной текстурной фильтрацией и тесселяцией, а включение анизотропной фильтрации просаживает среднее количество кадров в секунду на 5%.

Посмотрим, насколько сильно падает производительность при включении полноэкранного сглаживания методом мультисэмплинга (MSAA). Конечно же, в данном случае скорость рендеринга снижается ещё сильнее, и в случае 8x MSAA падение FPS особенно велико, но уровень 2x не так уж тяжёл для графического ядра Trinity и, скорее всего, это решение сможет обеспечить играбельную частоту смены кадров в нетребовательных играх даже с включенным мультисэмплингом.

Тесселяция снижает производительность интегрированного в A10-4600M видеоядра даже ещё сильнее, поэтому вряд ли получится поиграть в DirectX 11 игры на ноутбуке с интегрированной графикой. Но почти то же самое наблюдается и в случае гораздо более мощных решений, даже минимальный уровень тесселяции значительно снижает скорость рендеринга. Что же, ничего нового — экстремальные настройки явно не для таких мобильных решений.

А мы переходим от неоднозначных общесистемных и синтетических тестов, показывающих иногда довольно странные результаты, к тестированию нового мобильного APU компании AMD, в наборе реальных игровых приложений, как современных, так и давно применяемых в наших исследованиях производительности.

Производительность в различном ПО

В предыдущих статьях, посвящённых гибридным системам компании AMD, мы часто задавались вопросом, когда же вычисления на GPU начнут применяться в программном обеспечении, которое часто применяется обычными пользователями, ну хотя бы их частью? В играх ведь вычисления на GPU уже используются, и в виде PhysX и в виде постобработки на DirectCompute. Долгое время ничего кроме игр, по сути, и не было.

Для научных вычислений и некоторых других задач вычисления на GPU давно имеют большое значение, но не для среднестатистического пользователя. Кодированием видео мало кто занимается самостоятельно, перекодированием из формата в формат тоже. Ну и монтаж с кодированием собственных видеороликов туда же — далеко не все тратят своё время на это.

В общем, тогда мы делали вывод о том, что хотя GPU-вычисления выглядят весьма перспективным направлением, но на тот момент толка от вычислений на GPU не было почти никакого. Но появление APU и других гибридных чипов дало дополнительный толчок для развития и появления такого ПО. Возможность параллельных вычислений появилась у большой части систем, не только ориентированных на игры и располагающих дискретными видеокартами. Да и развитие открытого стандарта OpenCL также помогло в увеличении числа применений вычислений на графических ядрах. Что же, давайте посмотрим, что сейчас нам предлагают вычислять на GPU

Мы давно знаем, что одной из первых реализованных задач GPGPU является обработка и кодирование видеоданных. Но развитие видеокодеров не стоит на месте, в будущих версиях известного кодека x264, который считается наиболее популярным среди H.264-кодировщиков и используется во множестве приложений, ожидается появление OpenCL-ускорения. Ну а пока что рассмотрим то ПО, где такое ускорение уже реализовано в том или ином виде.

Например, ArcSoft MediaConverter 7.5 — мощный, но простой в использовании конвертер медиафайлов. С его помощью можно легко сконвертировать видеофайлы для использования в телефонах, плеерах и других устройствах. Последние версии этого пакета используют возможности аппаратного кодера VCE видеокарт Radeon (включая тот, что есть в Trinity) при перекодировании видео — при перекодировании в формат устройств, поддерживающих H.264.

Ещё одно приложение этой же компании — Link+ 3. Это приложение для удобного доступа к мультимедийным данным (фотографии, музыка, видео) с любого устройства локальной сети. Link+ 3 автоматически объединяет возможности сетевых устройств и позволяет просматривать с них медиафайлы. Нас больше интересует поддержка технологий AMD: UVD при просмотре, VCE при перекодировании, HD Media Accelerator — для плавного и качественного воспроизведения. Технология ArcSoft SimHD использует возможности универсальных вычислений на GPU при масштабировании видео, а при его просмотре используется стабилизация при помощи Steady Video.

Есть и другие аналогичные приложения, вроде CyberLink MediaEspresso. Версия 6.5 поддерживает возможности аппаратной конвертации видео — AMD Accelerated Video Converter, используя блок VCE при транскодировании. А CyberLink PowerDirector 10 ещё более продвинут, его основной компонент — видеодвижок TrueVelocity 2, который оптимизирован для использования возможностей современных GPU компании AMD.

Это приложение также использует возможности Accelerated Video Converter при транскодировании (блок аппаратного декодирования UVD и кодирования VCE) и OpenCL-ускорение для дополнительных эффектов, таких как: Zoom In, Gaussian Blur, Color Focus и др.

Кроме приложений для обработки видео, продвинутые возможности GPU используются в медиаплеерах вроде ArcSoft TotalMedia Theatre 5. Пятая версия поддерживает OpenCL-ускорение уже упомянутой выше технологии ArcSoft SimHD, которая включает масштабирование, удаление шума, динамическую контрастность и конвертацию частоты кадров. Кроме этого, используются возможности аппаратного блока декодирования видео UVD 3 и технологии AMD HD3D для просмотра видео в стереоформате.

Почти всё это ПО по конвертации и просмотру видео уже было ранее известно. Куда интереснее приложения тех компаний, которые ранее не ускорялись при помощи графических чипов. Так, из приложений компании Adobe можно отметить Flash, где мощность GPU используется в трёхмерных приложениях, а современные версии Flash (начиная с 11.2) поддерживают очень обширные возможности для аппаратного ускорения 3D графики.

Но гораздо больше интересна совсем свежая версия графического пакета Adobe Photoshop CS 6, предлагающего возможности аппаратного ускорения на GPU для некоторых из своих функций при помощи OpenCL и OpenGL. И если с OpenGL-ускорением мы уже какое-то время были знакомы, то использование OpenCL появилось в CS6 впервые. Всего в новой версии графического пакета ускоряются более чем 30 функций, включая Liquify, Transform и Warping.

Новый движок Mercury Graphics Engine отображает результат сразу же — практически в реальном времени. А возможности OpenCL используются для ускорения вычислительно-интенсивных эффектов «Blur». Настройка ускорения на GPU «Use Graphics Processor to Accelerate Computations» включена по умолчанию. Из других GPU-ускоренных инструментов новой версии Photoshop CS6 отметим фильтр «Oil Paint», адаптивную коррекцию перспективы (для широкоугольных объективов), галерею эффектов освещения, а также инструменты трансформации и варпинга.

Фильтр Liquify ускоряется при помощи OpenGL, и в версии CS6 он полностью переделан для использования Mercury Graphics Engine в процессе загрузки, предпросмотра и итогового рендеринга. При программной обработке фильтром крупных изображений в Photoshop CS5.5 работа была заметно менее комфортной, а теперь применение фильтра практически не тормозит. Если говорить о конкретных цифрах, то AMD A10-4600M при включении GPU-ускорения более чем вдвое быстрее справляется с этой работой, и быстрее конкурирующих решений от компании Intel.

Новая галерея эффектов «Blur» предоставляет возможность быстрого применения сложных эффектов вроде Field Blur, Iris Blur и Tilt-Shift — имитация соответствующего типа объективов, когда задаётся область фокусировки, а остальное изображение замыливается. Это новая возможность, появившаяся в Photoshop CS6, она использует OpenCL при финальном рендеринге. В результате, тот же A10-4600M обеспечивает 7-кратный прирост в скорости при включенном GPU-ускорении, да и в целом заметно быстрее конкурирующих платформ, не имеющих поддержки OpenCL.

Это всё была теория лишь с несколькими цифрами, а что же получается на практике? Насколько сильно ускоряет вычисления графическое ядро в чипах Trinity? Давайте рассмотрим несколько приложений с использованием GPU. Первым будет vReveal 3.3 от MotionDSP — это простое и мощное средство для организации, простого редактирования и улучшения качества видеороликов.

Одной из наиболее интересных возможностей является функция «One-Click Fix», которая автоматически улучшает качество видеоролика, исправляя такие недостатки, как низкую контрастность, неверные цвета (баланс белого), а также стабилизирует видео. Поддерживается аппаратное кодирование видео при помощи Accelerated Video Converter и HD Media Accelerator, а OpenCL используется в других операциях.

Мы протестировали время «рендеринга» коротенького видеоролика высокого разрешения в программе vReveal, применив к ней то самое автоматическое улучшение качества. На выходе ролик действительно стал более плавным и стабилизированным, также улучшилась контрастность и насыщенность цветов. Но что со скоростью, что даёт применение GPU в этой задаче?

MotionDSP vReveal CPU GPGPU
Время операции 5:35 0:56

Как видите, разница в производительности обработки видеоролика оказалась весьма большой — с помощью GPU система справилась с обработкой ролика в 6 раз быстрее, чем при использовании только x86-ядер. Результат очень хороший, так как обработка видео отлично распараллеливается и подходит для ускорения на гибридных системах. Посмотрим, что будет дальше — в ПО иного назначения.

Мы уже упоминали выше, что и при проигрывании видеоданных могут использоваться возможности GPU, это касается как банального DXVA-ускорения, так и более продвинутых методов постобработки и стабилизации видеороликов. Одним из наиболее распространённых медиаплееров является VLC Media Player с открытым исходным кодом.

В последних версиях этот плеер поддерживает такие возможности новых APU от компании AMD, как стабилизация видео в реальном времени Steady Video 2.0, а также использует OpenCL при повышении качества проигрывания при помощи постобработки, вроде шумоподавления.

Стабилизация видео действительно работает неплохо, хотя пока и не без «детских болезней» — включается не на всех роликах, плохо работает в режиме работы от батарей и т.п., но это всё программные проблемы, которые исправят в ближайшем будущем. Интереснее возможность GPU-ускорения при декодировании видео и постобработке, её то мы и протестировали:

VLC media player CPU GPGPU
Использование CPU 30-45% 3-4%

Как и ожидалось, разница снова получилась впечатляющей — ведь задача отлично подходит для переноса части вычислений на графическое ядро. В результате подключения возможностей GPU к обработке, универсальные x86-ядра нового процессора A10-4600M были заняты работой значительно меньше, чем в чисто программном режиме, разница составила до 10 раз.

Если сложной обработкой видео и изображений занимаются далеко не все пользователи, то с архиваторами в той или иной мере знакомы почти все. Мы уже писали в обзорах новой серии видеокарт AMD Radeon HD 7000 о поддержке новых GPU архиватором WinZip 16.5. WinZip — это одна из самых популярных утилит для сжатия и кодирования файлов, а также резервного копирования. И даже с учётом того, что её популярность в последние годы упала, WinZip остаётся одним из наиболее распространённых архиваторов.

Тем интереснее, что версия WinZip 16.5 поддерживает не только многопоточное сжатие файлов на многоядерных CPU, но и OpenCL-ускоренное сжатие. Для более эффективного сжатия при помощи GPU пришлось распараллелить обработку файлов — с включенным OpenCL архиватор обрабатывает сразу несколько файлов одновременно.

Пресс-релизы компании-партнёра AMD заявляют о поддержке OpenCL-ускорения на всех совместимых продуктах AMD, начиная от APU и заканчивая дискретной графикой AMD Radeon, а также об увеличении скорости сжатия до 2,5-кратной, по сравнению с WinZip 16. То же самое касается и шифрования при помощи алгоритма AES, которое требует много вычислительных ресурсов и хорошо распараллеливается, а поэтому тоже ускоряется при помощи OpenCL.

Цифра ускорения в 2,5 раза нам кажется завышенной, да и сравнение со старой версией архиватора не так интересно, поэтому мы проверили скорость сжатия на двух наборах файлов. Первым таким набором стала игра Lost Planet, состоящая из более чем 200 файлов общим объёмом в 7,5 ГБ. Для сжатия использовался ZIPX-формат, с AES-шифрованием и без него:

WinZIP Software OpenCL
Метод ZIPX 27:25 26:16
Метод ZIPX+AES128 27:16 25:09

Никакими 2,5 разами и не пахнет! Разница в скорости у нас получилась лишь 4% и 8% для сжатия в обычном режиме и с использованием AES-шифрования. Этого явно недостаточно для того, чтобы посчитать задачу подходящей для вычислений на GPU. Очень похоже, что сжатие данных в ZIP-формат просто плохо распараллеливается и при переносе на GPU ускорение весьма слабое.

Но может быть небольшой рост производительности связан с малым количеством файлов, которые плохо распараллеливаются и сжимаются? Мы проверили второй набор файлов, состоящий из исполнимых файлов и файлов данных с различными драйверами (всего более чем 7000 файлов разного размера, общий объём — 1,3 ГБ).

WinZIP Software OpenCL
Метод ZIPX 5:31 4:46

Как видите, снова ничего похожего на многократные ускорения нет, хотя некий прирост в скорости, несомненно, наблюдается, но и тут это всего лишь 16%. То есть, для более-менее заметного ускорения процесса сжатия файлов средствами WinZip 16.5 нужно, чтобы файлов было много, и ещё желательно применять AES-шифрование. Тогда и прирост скорости в пару десятков процентов вполне возможен. Но никаких 2,5 раза у нас нет даже близко.

После не самого удачного примера, снова вернёмся к обработке изображений — но на этот раз статичным изображениям и к конкуренту Adobe Photoshop, если его можно так назвать — GNU Image Manipulation Program (GIMP) версии 2.8. Это — популярнейший редактор изображений с открытым исходным кодом, который массово используется по всему миру.

В указанной версии появилась поддержка OpenCL-ускорения, предназначенная для повышения производительности рендеринга, фильтров и прочих вычислительных задач. В текущей версии уже поддерживается OpenCL-ускорение для 19 фильтров — так называемых GEGL операций. Будущее большое обновление GIMP принесёт внедрение библиотеки GEGL в основной конвейер обработки, текущее же OpenCL-ускорение работает с GEGL фильтрами, но не конвейером GIMP в целом. Так что в полноценных релизах следующих версий пользы от OpenCL должно стать ещё больше.

Лучше всего ускорение на GPU работает для четырёхканальных изображений с 8-бит на цвет — и это наиболее востребованный формат. Причём, желательно, чтобы горизонтальное и вертикальное разрешение изображений нацело делилось на 512. Чтобы получить максимальную разницу, мы протестировали обработку изображения размером 4096x2048 пикселей.

GEGL operations CPU, МПикс/с GPGPU, МПикс/с
bilateral filter 0,106 11,441
c2g 0,109 1,685
gaussian-blur 0,297 17,924
motion-blur 0,196 20,682
noise-reduction 0,344 3,983
snn-mean 0,156 6,721

Ну вот, теперь мы снова видим приличную разницу. Причём, скорость исполнения OpenCL фильтров на CPU и GPU отличается не в 2,5 и даже не в 10 раз, а до 100! Мы получили преимущество GPU над CPU от 15 до 108 раз, в зависимости от применяемого фильтра. Понятно, что обработка изображений максимально подходит для использования мощностей графического ядра, а для CPU задача может быть просто недостаточно оптимизированной, так как OpenCL-код на CPU не всегда исполняется эффективно. В любом случае, редактирующие изображения в GIMP и использует подобные фильтры, будут довольны.

Производительность в играх

Это один из наиболее интересных разделов материала. Если по производительности в офисных задачах и ускорению видеоданных интегрированные графические ядра давно догнали дискретные решения, и разница между выделенными и встроенными видеоядрами в этих задачах не столь велика, то по 3D-производительности отставание до сих пор весьма ощутимо, даже с учётом значительного роста производительности интегрированных графических ядер в последние годы.

Тем интереснее будет посмотреть, что может дать новая платформа компании AMD в этих условиях. Ведь все APU имели преимущество именно в играх, и Trinity, скорее всего, станет лучшим гибридным чипом с встроенной графикой максимальной производительности. Хотя вряд ли кто-то будет выбирать ноутбук для игр, рассматривая модели с интегрированными видеоядрами, но такие мощные интегрированные решения вполне могут дать нетребовательным пользователям возможность игры во многие из современных 3D игр. Пусть даже пользователю и придётся снизить пару настроек качества рендеринга.

Так как это один из самых важных разделов обзора, то игровых тестов в нашем материале будет много. Сначала мы рассмотрим несколько устаревших игр при сравнительно низких игровых настройках качества, чтобы сравнить результаты прототипа ноутбука, основанного на гибридном чипе A10-4600M с ранее протестированными мобильными системами, имеющих графические решения компании AMD.

И начнём мы с не слишком требовательных по современным меркам проектов. Первой игрой в обзоре будет игра известного сериала Call of Duty — ещё первая часть Modern Warfare. Более новые игры серии Call of Duty технически не сильно отличаются от MW, да и движок у них почти одинаковый. Для тестов использовалась демонстрационная запись многопользовательской битвы.

В случае старенькой игры CoD: Modern Warfare в дополнение к режиму минимального качества мы использовали в том числе максимальные настройки с использованием полноэкранного сглаживания MSAA 4x. В обоих режимах новая модель гибридного процессора от AMD показала отличный результат. В простом режиме скорость ограничена значением 90 FPS, и в таком режиме протестированный прототип ноутбука не уступил околотоповому в своё время Acer 5943G.

Ну а в режиме максимального качества с мультисэмплингом скорость уже ограничена возможностями графических ядер, и тут тестовый ноутбук на Trinity отстал от топового решения не такого уж давнего времени. А главный вывод в том, что в устаревших играх A10-4600M вполне способен обеспечить играбельную частоту кадров в тяжёлых условиях максимальных настроек даже при включенном сглаживании, в то время как на других интегрированных решениях можно будет нормально поиграть разве что при средних настройках качества.

Не все игры требовательны к мощности GPU, существует и большое количество игр недавнего прошлого, которые неплохо работают даже на слабых системах. Обычно это мультиплатформенные проекты, рассчитанные в том числе и на работу на игровых консолях, аппаратная начинка которых также выпущена довольно давно и значительно отстаёт от современного железа ПК. Одной из подобных игр является Resident Evil 5:

Это ещё одна игра, которая вышла сразу и на консолях и на ПК. Resident Evil 5 хоть и мультиплатформенная игра, но она довольно требовательна к мощности системы, в том числе и GPU. Например, маломощный GPU в составе платформы AMD Zacate не может обеспечить необходимые 25-30 FPS даже при средних настройках качества, а самая слабая дискретная видеокарта от компании AMD кое-как показывает уровень 30-40 FPS.

А вот модель Radeon HD 7660G в составе топового чипа Trinity, на котором основан рассматриваемый прототип, показала весьма неплохой сравнительный результат, но только в режиме среднего качества. Рендеринг в Resident Evil 5 при низких настройках ограничен скоростью CPU и в нём ноутбук Acer Aspire 5943G, имеющий мощный четырёхъядерный Core i7, значительно обогнал других участников сравнения.

Но при средних настройках влияние мощности CPU нивелируется, и главным ограничителем частоты кадров становится мощность GPU. И тут новая платформа Trinity отыгралась, показав более 50 средних FPS и почти достав до результата мощной дискретной видеокарты Radeon HD 5850. Эта игра при средних настройках качества на A10-4600M работает довольно быстро, поэтому будет даже выставить и максимальное качество.

Street Fighter IV — это ещё одна мультиплатформенная игра на том же движке. Она относится к жанру файтингов, который отличается от большинства других тем, что для комфортного игрового процесса требует не менее 60 кадров в секунду. Но игра старая и графически несложная, поэтому во всех тестовых настройках, выбранных нами пару лет назад для тогдашних ноутбуков, такой FPS обеспечивается.

В этом случае при минимальных настройках почти все видеокарты обеспечили приемлемую производительность, кроме Zacate, а в среднем режиме комфортной смены частоты кадров не смогла обеспечить ещё и самая слабая Radeon HD 5470M. А вот гибридная модель AMD A10-4600M снова оказалась весьма быстрой, хотя и уступила системе с Mobility Radeon HD 5850 — всё-таки это дискретная видеокарта с гораздо большим потреблением энергии, пусть и устаревшая. При сотне кадров в секунду в этой игре явно можно будет повысить настройки качества на системах, основанных на Trinity APU.

Ещё одна старая мультиплатформенная игра, но более требовательная и даже имеющая поддержку DirectX 10 — Lost Planet. В этом тесте производительности новое решение AMD снова очень хорошо отработало, уступив гораздо более мощному ноутбуку от Acer не так уж много. В Lost Planet мы сравнивали все решения только при низких настройках, так как даже в них не всегда обеспечивается высокая скорость рендеринга на ноутбуках средней мощности.

В подтесте Cave производительность ограничена скоростью CPU, и поэтому старый ноутбук с четырёхъядерным CPU выигрывает в нём гораздо больше, чем в подтесте Snow, который показывает скорость графического ядра. В последнем тесте новинка от AMD лишь на 20% медленнее старого дискретного решения, и для гибридного процессора Trinity это можно считать приличным успехом. На такой системе можно будет даже выставить настройки для более высокого качества рендеринга при сохранении приемлемого FPS.

Временно закончим с мультиплатформенными играми, и перейдём к эксклюзивным играм для ПК из наиболее распространённых жанров: RTS и FPS. Первой по списку у нас идёт старенькая уже стратегия реального времени World in Conflict:

И снова мы видим ситуацию, когда в низких настройках старое решение, имеющее четырёхъядерный процессор выигрывает у нашей новинки больше, чем при средних настройках качества рендеринга. Это объясняется точно так же, как и в предыдущих тестах — в режиме средних настроек качества системы не упираются в мощность центральных процессоров, и поэтому Radeon HD 7660G показывает неплохой результат между мобильными версиями Radeon HD 5470 и HD 5850.

World in Conflict довольно сильно процессорозависима, и лишь при средних настройках тесты показывают скорость GPU. Тесты показали, что на рассматриваемом сегодня прототипе, основанном на гибридном чипе A10-4600M, вполне будет повысить игровые настройки выше средних, чтобы добиться лучшей картинки при сохранении приемлемой частоты кадров. Тем более, что для стратегии даже реального времени хватит и 30 FPS. Посмотрим, что получится в шутерах от первого лица, которые являются наиболее требовательными к мощности GPU.

STALKER: Зов Припяти — это пример довольно «тяжёлой» для графических процессоров игры, несмотря на то, что она уже далеко не нова. Максимальные настройки в ней способны поставить на колени даже мощнейшие видеокарты настольных компьютеров, что уж говорить о мобильных. Спасает то, что графический движок игры отлично масштабируется и настраивается, а режим самого низкого качества («статическое освещение») позволяет даже интегрированным видеоядрам показывать достаточную для комфортной игры частоту кадров.

В лёгком режиме скорость рендеринга снова ограничивает центральный процессор системы, поэтому прототип на Trinity довольно серьёзно уступает ноутбуку, имеющему очень мощный процессор Intel Core i7. В среднем по тяжести настроек режиме «полного динамического освещения» скорость у всех ноутбуков заметно ниже, и Radeon HD 7660G в этом режиме отстаёт от него уже не так сильно, хотя разница всё равно велика. И в случае такой тяжёлой графически игры как «Зов Припяти», на системах с новым мобильным APU не удастся серьёзно повысить графические настройки выше средних.

Игра Far Cry 2 является мультиплатформенным проектом, но она отличается продвинутой на время своего выхода графикой, значительно улучшенной именно в ПК-версии. Как мы выяснили в прошлые разы, её с трудом тянут интегрированные графические решения Intel и даже самые слабые дискретные мобильные видеокарты — они не дают играбельного FPS даже при средних настройках качества, не говоря о высоких с применением DirectX 10.

А вот мощный гибридный APU модели A10-4600M — совсем другое дело! Прототип мобильной системы на базе этого чипа, имеющий Radeon HD 7660G, показал весьма неплохую скорость даже при высоких настройках с включением DirectX 10. Подумайте только, современная встроенная графика даст комфортный FPS в этой игре при таких настройках, обеспечив более чем 40 кадров в секунду! В таких условиях скорость самых слабых решений, включая интегрированную графику от Intel (до Ivy Bridge), не обеспечит даже 25-30 FPS.

А на ноутбуке с новым решением от компании AMD можно будет даже повысить несколько настроек качества до ещё более высоких, получив более качественную картинку и вполне достаточную скорость рендеринга. Или даже включить полноэкранное сглаживание, что совсем недавно было недоступно даже на мобильных дискретных видеокартах нижнего ценового диапазона.

К сожалению, из-за сырости платформы и драйверов для неё, весьма тяжёлая для видеокарт игра Crysis Warhead не запустилась на прототипе AMD Trinity. Поэтому мы переходим сразу к ещё одной устаревшей игре из наших тестов мобильной графики — гоночному проекту DiRT 2 от компании Codemasters. Эта игра поддерживает такие возможности DirectX 11, как тесселяция и DirectCompute, и включает неплохой тест производительности. К сожалению, ASUS K52Jr и систему на Zacate в этой игре мы не тестировали, так что их результатов на диаграмме нет.

А вот гибридный процессор AMD A10-4600M справляется с задачей очень неплохо, при средних настройках обеспечивая более чем приемлемую скорость рендеринга в 45 FPS. Хотя отставание от системы с мобильным Radeon HD 5850 довольно велико — на наш взгляд, APU больше всего не хватает пропускной способности памяти, в которую упирается скорость рендеринга в этой игре.

Впрочем, для интегрированной видеокарты результат всё равно очень хороший, и даёт возможность попробовать и высокие настройки, что мы и попробуем сделать далее при тестировании в следующей части этой игры — DiRT 3.

Рассмотрим последнюю игру из устаревшего тестового набора — ещё один мультиплатформенный проект со специальной улучшенной ПК-версией — Just Cause 2. Ноутбук ASUS с Radeon HD 5470M, а также тестовая система на базе AMD Zacate в данном сравнении снова не участвовали.

Судя по показанным цифрам FPS, Just Cause 2 является одним из наиболее тяжёлых игровых тестов для не слишком мощных мобильных видеокарт. Даже при самых низких настройках очень мощная видеокарта позапрошлого поколения даёт лишь 60 FPS, а при высоком (не максимальном!) качестве еле-еле дотягивает до минимального уровня производительности, необходимого для достижения играбельности.

Но Mobility Radeon HD 5850, входящий в состав конфигурации Acer Aspire 5943G, всё же смог показать приемлемую частоту кадров при картинке высокого качества, чего не удалось сделать нашему сегодняшнему герою — чипу A10-4600M с Radeon HD 7660G. В этой игре на системах с Trinity придётся выставлять средние настройки, так как при высоких настройках качества картинки обеспечивается лишь 25 кадров в секунду, чего не хватит для нормальной игры.

Хотя по устаревшим игровым тестам уже можно сделать выводы об уровне 3D-производительности нового решения компании AMD, но это всё же довольно старые проекты, вышедшие несколько лет назад. И наше тестирование было бы неполноценным без включения в них новейших приложений. Причём уже не в низких и средних настройках, а в более сложных. Для этого мы взяли набор из нескольких современных игр, протестировав их в режимах высокого качества, а иногда и с включением эффектов DirectX 11, полноэкранного сглаживания методом MSAA и даже эффектами PhysX (в данном случае выполняемых программно, конечно же):

Итак, давайте рассмотрим игры по очереди. Игра Mafia 2 также не заработала на ноутбуке AMD Trinity из-за некоей несовместимости, а было бы интересно посмотреть, как справится с этой игрой новый APU при условия включения физических эффектов, ведь даже при их исполнении на мобильных дискретных видеокартах NVIDIA скорость порой падает ниже комфортного минимума.

Но у нас есть ещё один проект с поддержкой аппаратных физических расчётов GPU PhysX — Batman Arkham City. При высоких настройках средняя частота кадров в тесте на Trinity достигла 45 FPS, что очень даже неплохо для мобильного чипа с интегрированной графикой, а при включении экстремальных настроек качества, включая тесселяцию и другие эффекты DirectX 11, скорость упала уже до 22 FPS, что хоть и не играбельно, но является потрясающим результатом для такого чипа (у новейшей дискретной видеокарты GeForce GT 640M было лишь немногим больше).

Включение многочисленных PhysX-эффектов в этой игре сказывается на скорости ещё сильнее, так как «физику» обрабатывает центральный процессор. И FPS в этом случае просаживается до 16, что уже заметно ниже играбельности. Но это всего лишь мобильное решение с встроенным GPU и программным PhysX, так что даже такая производительность для Trinity — это выдающееся достижение.

Переходим к игре DiRT 3, вторую часть которой мы уже рассматривали чуть выше. Третья от предшественницы мало отличается технологически, зато мы проверили высокие и «ультравысокие» настройки качества. Новый мобильный APU AMD A10-4600M, имеющий видеоядро Radeon HD 7660G, очень неплохо справился с высокими настройками, обеспечив более чем 40 FPS, а вот режим Ultra новому чипу не дался — 22 FPS нельзя считать играбельной производительностью.

Похожие результаты были показаны и в проекте F1 2011, основанном на том же игровом движке. Эта игра посвящена прошлому сезону Формулы 1 и новая модель APU от компании AMD при высоких настройках способна дать возможность поиграть сравнительно комфортно, со средним FPS выше 30. А вот в «ультра»-варианте мы снова видим лишь чуть более 20 FPS, что явно неиграбельно, но не стоит забывать, что это — интегрированная графика!

Игра Hard Reset отличается неплохой графикой, но она является не слишком требовательной к мощности GPU. И наш сегодняшний герой — прототип ноутбука на базе Trinity — показал в этой игре неплохую скорость: при средних настройках более 30 FPS, при ультравысоких — около 25 FPS, что близко к играбельности.

Вторая часть игры Lost Planet отличается ещё большей нагрузкой на GPU и использует такие возможности DirectX 11, как тесселяцию и DirectCompute. Поэтому в режиме высоких настроек, включающих тесселяцию и другие требовательные эффекты, производительности AMD A10-4600M было явно недостаточно, и скорость «просела» до 12 FPS. И даже при средних настройках скорость смены кадров не превысила 25 FPS, что говорит о том, что Lost Planet 2 является одним из тяжелейших для GPU тестов 3D-производительности.

Игра Aliens vs Predator также использует новые возможности DirectX 11, такие как тесселяцию и вычислительные шейдеры при постобработке, и она весьма тяжела для GPU, хотя и не настолько, как предыдущая. При низких настройках в игре на тестовой системе с Trinity получена частота кадров выше 35 FPS, а при высоких, с включением SSAO и тесселяции, скорость рендеринга снова находится ниже предела играбельности — лишь чуть выше 20 кадров в секунду. Впрочем, тут и дискретная GeForce GT 640M набрала лишь 30 FPS, так что для интегрированного видеоядра результат отличный.

Последней современной игрой, вошедшей в наши тесты, стал популярный проект Crysis 2. Вторая часть не слишком сильно подняла планку требовательности к мощности GPU, по сравнению с первой, да и встроенный бенчмарк хоть и использует тесселяцию и продвинутые DX11-эффекты, но даже на мобильной графике показывает довольно высокие результаты. При Very high и Extreme настройках получены 22-29 FPS — и это снова отличный результат для ноутбука с гибридным процессором.

Полученные в современных играх при «тяжёлых» настройках цифры производительности впечатляют, особенно на фоне других процессоров с интегрированной графикой и дискретных видеокарт прошлых поколений. В наших тестах гибридный AMD A10-4600M показал себя весьма неплохо — уровень его производительности заметно выше, чем в предыдущем поколении и явно окажется лучше, чем будет иметь грядущее поколение мобильных Ivy Bridge от компании Intel.

Дело даже не в сравнении цифр средней частоты кадров, а в том, что мобильный гибридный чип от компании AMD, сочетающий CPU и GPU, впервые в состоянии обеспечить играбельность в режиме высоких настроек качества в большом количестве современных игр. В то время, как интегрированная графика конкурента часто не способна обеспечить минимальную играбельность даже в режиме низких настроек, не говоря уже о средних и максимальных.

А если производительности видеоядра в составе APU всё же недостаточно, то в скором времени будут предлагаться мобильные ПК, имеющие и APU и дискретную мобильную видеокарту Radeon HD 7000, которые будут способны совместно работать над рендерингом, что даст ещё большую производительность, а также улучшит применимость ноутбуков при решении различных задач.

Воспроизведение видеоданных

Кроме высокой частоты кадров в современных играх, для ноутбуков важно, чтобы аппаратное ускорение декодирования всех форматов поддерживалось графическим видеоядром, в том числе интегрированным. Хотя даже самые простые процессоры сейчас справляются с такой работой программно, но аппаратное декодирование при помощи специализированных блоков в GPU гораздо энергоэффективнее и способно увеличить время работы в автономном режиме, что немаловажно для мобильных решений.

Наши предыдущие тесты показали, что сложностей с аппаратным ускорением декодирования видеоданных нет уже ни на каких GPU, даже интегрированные решения Intel хорошо справляются с задачей, хотя некоторые проблемы у встроенных в процессоры Intel видеоядрах всё же остались.

Но нас интересует не Intel, а новый APU от компании AMD. Давайте проверим, что у A10-4600M получается с декодированием видео на практике. Для тестов мы взяли один файл формата MPEG-2 с чересстрочным Full HD, один файл формата VC-1 высокого разрешения и набор роликов наиболее распространённого формата H.264 (MPEG-4 AVC) с разным разрешением и битрейтом.

Декодирование видео AMD Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
MPEG-2 1080i 11% 8% 14% 11%
VC-1 1080p 6% 38% 5% 7%
H.264 480p 5% 5% 5% 6%
H.264 720p 5% 13% 10% 10%
H.264 1080p (20 Мбит/с) 5% 5% 5% 6%
H.264 1080p (40 Мбит/с) 6% 6% 5% 7%

С MPEG2-ускорением современные GPU давно легко справляются, кроме тех случаев, когда требуется постобработка для устранения чересстрочности (deinterlacing — деинтерлейсинг). Именно такой ролик входит в наш тестовый набор, и некоторое отставание ноутбуков, имеющих графические ядра Radeon (в т.ч. и с новым APU), в случае файла MPEG2 объясняется более качественным алгоритмом устранения чересстрочности. Впрочем, на всех системах тестовый файл проигрывался отлично, включая и нашего сегодняшнего героя — прототипа системы на Trinity от AMD.

При декодировании ролика формата VC-1 у AMD A10-4600M также всё прекрасно, чего не скажешь о ноутбуке Acer, использующем встроенное в процессор Intel Core с архитектурой Sandy Bridge видеоядро, которое не умеет аппаратно декодировать видео в формате VC-1 (по крайней мере, в плеере MPC-HC). Да и вообще, новый APU прекрасно справился со всеми видеороликами. Формат H.264 в любых его проявлениях поддался A10-4600M очень легко, GPU справляется с роликами отлично, примерно с одинаковой загрузкой CPU.

При проигрывании всех роликов DXVA-ускорение работает эффективно, и сейчас практически любое интегрированное мобильное видеоядро справляется с декодированием HD-видео даже в случае самых тяжёлых видеороликов с максимальным качеством и битрейтом. Но насколько эффективно декодируются видеоданные на Trinity APU? Давайте это проверим, измерив времени работы от батареи в разных режимах.

Время автономной работы

Перед рассмотрением возможностей прототипа ноутбука от AMD, нужно вспомнить о том, что его конфигурация включает немаленький экран и оптический привод, а литиево-полимерная батарея имеет шесть ячеек ёмкостью около 56 Вт·ч — это средний уровень. Заявленное производителем максимальное время автономной работы для ноутбуков на основе Trinity составляет более чем 11 часов, но это число указано явно для режима простоя.

Поверим компании AMD на слово, ведь режим простоя при задействовании максимального профиля энергосбережения мы не проверяли, так как просто не видим в нём никакого смысла, ведь на ноутбуке нужно работать, а не просто оставлять его пожирать батарею. А если он не нужен, то пусть отправляется в режим сна.

Первым тестовым режимом у нас считается режим активного чтения (или интернет-сёрфинга) с включенным в фоновом режиме проигрывателем аудиофайлов формата MP3, а вторым — довольно востребованный режим просмотра кинофильмов в формате H.264 с включенным DXVA-ускорением. Профиль энергосбережения в этих двух режимах был «сбалансированным» — который по умолчанию и устанавливается большинством ноутбуков.

Время работы, час:мин AMD Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
Активная работа (2D + аудио) 7:16 7:40 2:47 2:05
Воспроизведение видео H.264 4:47 5:14 2:29 1:43

Вспомним, что у модели Acer Aspire 5943G установлена батарея значительно большей ёмкости (83 Вт·ч против 56 Вт·ч у нашего сегодняшнего героя), у Acer M3 — почти такой же ёмкости, а у ноутбука ASUS — меньшей (48 Вт·ч). Хорошо видно отличие во времени выпуска ноутбуков. Даже самый ёмкий аккумулятор не помог старой топовой модели Aspire 5943G, и в режиме чтения она отработала совсем мало времени.

Прототип ноутбука на базе чипа AMD A10-4600M показал очень неплохой результат в режиме чтения более чем 7 часов, вплотную приблизившись к очень хорошему результату игрового ультрабука от Acer, который использовал гибридный процессор Intel Core i5-2467M с гораздо меньшим показателем TDP. То есть, модели платформы Trinity из низкопотребляющих, вроде A6 и A4, покажут результат ещё лучше. Технологии снижения энергопотребления AMD оказались весьма эффективными.

При просмотре аппаратно декодированного видеоролика в формате H.264 системы не смогли проработать столь же долго, но разница между решениями примерно такая же. Хотя почти все ноутбуки позволяют просмотреть двухчасовое видео при работе от батареи (кроме ASUS со слабой батареей), но только Acer Aspire Timeline Ultra M3 и прототип на AMD A10-4600M смогли обеспечить порядка 5 часов просмотра видеоролика в таких условиях.

Посмотрим, что получится в режиме максимальной игровой нагрузки. В качестве «нагрузочного» трёхмерного приложения мы ранее использовали встроенный в игру Lost Planet тест производительности, который достаточно сильно нагружает как CPU, так и GPU, и его воспроизведение закольцовано, что отлично подходит для нашей задачи. Мы проверили не только время автономной работы в производительном режиме (Performance), но и полученную при этом скорость рендеринга:

Игра Lost Planet, режим Performance AMD Trinity
(A10-4600M
HD7660G)
Acer M3
(i5-2467M
GT640M)
Acer
5943G
(i7-720QM
HD5850)
ASUS
K52Jr
(i3-350
HD5470)
Время работы, час:мин 1:46 1:35 1:11 1:12
Производительность, FPS 48,7 67,2 75,1 24,8

И вот когда у игрового ультрабука Acer в работу включилось дискретное видеоядро, мы увидели ещё одно преимущество нашего сегодняшнего героя — платформы Trinity. В этом случае модель A10-4600M обеспечивает максимальную продолжительность работы при несколько меньшей производительности, по сравнению с явно более мощным решением.

А устаревшие ноутбуки служат лучшим индикатором прогресса. Aspire 5943G даже с заметно более ёмкой батареей проработал не так уж долго, а производительность в игре Lost Planet и у топовой модели нового APU оказалась вполне достаточной, а по времени автономной работы прототип от AMD и вовсе стал победителем сравнения — отличный результат для Trinity!

Хотя даже такие экономичные решения как AMD A10-4600M, не дадут поиграть на мобильном ПК в автономном режиме даже пару часов, так что требовательные 3D-игры на ноутбуках без сетевой розетки поблизости по-прежнему долго не протянут.

Выводы

С выходом Trinity компания AMD продолжила свою «гибридную» стратегию, начатую в Llano и Zacate. Хотя огромных скачков в производительности ждать не приходилось из-за отсутствия прогресса в используемом техпроцессе, CPU и GPU части в новых APU получили приличный прирост производительности и эффективности, по сравнению с прошлым поколением. Хотя по универсальным вычислениям на CPU решение AMD может отставать от современных решений конкурента (речь о будущих мобильных Ivy Bridge), зато скорость графического ядра в Trinity явно останется самой высокой в классе.

В новой серии Trinity, AMD продолжает использовать иной подход к балансу в скорости CPU и GPU, по сравнению с Intel. И даже выход 22 нм решений конкурента, имеющих новейшее видеоядро модели HD 4000, не сможет им помочь опередить соответствующие по потреблению модели Trinity. Гибридные чипы AMD продолжат выигрывать в графических задачах, хотя конкурент подобрался уже явно ближе за счёт выпуска чипов на более совершенном техпроцессе, с которыми мы ещё сравним Trinity в будущих материалах.

Необходимо особо отметить увеличение количества и качества приложений, использующих возможности графических ядер в универсальных вычислениях. Если в момент выхода Zacate и Llano мы отмечали, что таковых приложений нет совсем, то сейчас они уже появились. Причём, речь касается не только и не столько привычных приложений по обработке видеоданных, но и архиваторов, графических пакетов и др. Хотя идеал до сих пор не достигнут, и будет интересно посмотреть на дальнейшее развитие ситуации. В любом случае, отмечаем явный прогресс решений AMD по поддержке GPGPU вычислений уже в реальных приложениях — тут они также имеют явное преимущество над конкурентом. И дальнейшее расширение применения OpenCL в программном обеспечении только усилит позиции компании.

Что касается архитектурных изменений в составе блоков Trinity, то тут мы отметим, что улучшения в ядрах Piledriver явно пошли на пользу новому APU. В случае с настольными решениями линейки AMD FX конкурировать им было очень трудно, а в Piledriver эффективность вычислений явно улучшили. И пусть AMD не смогла повысить производительность Trinity настолько, насколько смогла бы это сделать, переведя чипы на более «тонкий» техпроцесс, применение модифицированных x86-совместимых вычислительных ядер совершенно точно дало им увеличение скорости.

Перевод на более совершенный техпроцесс дал бы ещё больший рост производительности, но и в таком виде Trinity — это весьма неплохо спроектированная платформа, выжимающая все соки из имеющихся 32 нм. Кроме улучшений в CPU ядрах, которые привели к росту скорости вычислений, нужно отметить и применение более эффективной графической архитектуры VLIW4, которая позволила заметно повысить скорость в 3D задачах при схожей сложности и размере кристалла, по сравнению с Llano.

И пусть Trinity не бьёт рекордов скорости универсальных вычислений на x86-ядрах, в вышедших APU её вполне достаточно для большинства применений. Гораздо важнее экономичность и время автономной работы, и очередной сильной стороной вышедших мобильных гибридных чипов Trinity является очень неплохая энергоэффективность. Продолжительность работы в автономном режиме у протестированного прототипа оказалась очень хорошей, а в 3D-игре так и вовсе выдающейся. При этом мы протестировали не самый экономичный вариант из линейки новых APU. И можно точно сказать, что по сравнению с Llano получился явный шаг вперёд, и по энергоэффективности решения AMD будут конкурентоспособными даже по сравнению с новейшими 22 нм процессорами Intel.

В общем, в сравнении двух грандов: AMD и Intel, итог остаётся прежним. Если по CPU-производительности некоторое преимущество имеет Intel, которая пользуется в том числе и тем, что имеет свои фабрики по выпуску чипов, которые быстро переходят на более новые техпроцессы, то по мощности и функциональности графических решений преимущество у AMD — их APU имеют явно лучшие возможности в игровых приложениях. Новый гибридный чип от AMD оказался в состоянии обеспечить приемлемую производительность в большом количестве современных игр при высоких настройках качества.

Да, у Intel есть партнёрство с NVIDIA, и применение дискретной графики в дополнение к интегрированной в CPU решает часть проблем. Но в плюсах AMD не только большая скорость встроенных GPU, они ещё и умеют одновременно использовать мощности интегрированной и дискретной графики нового поколения, получая ещё большую скорость — за это отвечает технология AMD Radeon Dual Graphics.

В рамках материала нам осталось рассмотреть ценовой вопрос. И тут пока что не всё понятно. Просто потому, что реальный выход решений на розничный рынок может многое изменить — ведь стоимость конечного продукта зависит от цены множества его комплектующих, а APU хоть и является одним из важнейших, но лишь одним. Похоже, Trinity лучше всего подойдёт для таких ноутбуков, каким получился прототип, выданный нам для тестов — в его корпусе с 14-дюймовым экраном заключена мощь, достаточная для большинства задач, даже игровых. Причём, речь идёт в том числе о большей части требовательных современных игр.

При этом такой ноутбук невелик по размеру, сравнительно лёгкий и имеет приличное время автономной работы. Да и цена таких решений обещает быть не слишком высокой — ниже, чем у тех же ультрабуков, к примеру. Которые хотя и компактнее, но и менее мощные. С другой стороны стоят более мощные решения, вроде протестированного нами недавно игрового ультрабука с дискретной видеокартой NVIDIA GeForce GT 640M — они быстрее, но и дороже, да и потребляют больше энергии. Да и нам обещан выпуск гибридных систем с встроенной и дискретной графикой от AMD, в которых будут применяться продвинутые средства переключения между GPU, аналогичные NVIDIA Optimus.

Чтобы сделать окончательные выводы, нам не хватает информации о розничных ценах ноутбуков на базе Trinity и конкурирующих с ними решений от Intel. Ведь с точки зрения потенциального покупателя именно цена является важнейшей характеристикой любого товара. Мы уверены, что AMD со своими партнёрами по выпуску конечных решений смогут предложить выгодные цены на мобильные ПК на базе очень хороших чипов платформы Trinity. Ноутбуки, использующие платформу AMD A10, ожидаются в продаже по ценам порядка $700, что ниже цен на ультрабуки на базе Intel Ivy Bridge, ожидаемые примерно в то же время. И на момент выхода, новые APU обеспечат отличное сочетание возможностей и характеристик за эти деньги.





Дополнительно

ВИКТОРИНА TT

Материнские платы какого форм-фактора можно устанавливать в корпус Thermaltake Versa C22 RGB Snow Edition?

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.