Графика: быстрая, медленная и интегрированная

Часть 10: новый класс APU на примере A10-5800K и его сравнение с предшественниками


В связи с появлением новых APU (и новой настольной платформы) AMD у нас возникло непреодолимое желание повторить тестирование, аналогичное прошлогоднему, но на более современном уровне. Однако эту идею пришлось отложить — новые графические решения Intel в процессорах среднего и нижнего ценового уровня мы пока не тестировали (ограничившись только старшими моделями, драйверы обе компании не так давно обновили (а на производительности интегрированной графики это часто сказывается), да и APU новой линейки мы пока протестировали только один. В результате пришлось делать выбор между двумя решениями — сделать много тестов разных конфигураций, на что уйдет немалое количество времени, в течение которого никакой информации об А10 на наших страницах не будет, либо ограничиться экспресс-тестированием, оставаясь в рамках Lynx и Virgo. Вторая идея победила, так что сегодня у нас в статье будет только продукция AMD, и только интегрированная графика. Главная цель обзора — не всеобъемлющее исследование, а сравнение нового «класса производительности» с уже имеющимися. А более сложные вопросы мы пока склонны оставить «на потом».

Тестирование: цели и задачи, конфигурации, методика

Этот раздел сравнительно большого объема будет общим и одинаковым для всех статей: к сожалению, далеко не всем людям достаточно что-либо объяснить один раз :) Тем более, далеко не все читатели будут внимательно изучать все статьи цикла — вероятность «начать с середины» или просто ограничиться одним-двумя материалами крайне велика, в чем мы отдаем себе полный отчет. Поэтому сразу приносим извинения тем, кто против постоянного повторения одних и тех же истин. Которое, впрочем, как известно мать учения :)

Итак, во-первых и в главных следует учитывать, что в рамках данного тестирования мы не занимаемся исключительно компонентами — мы тестируем системы, из них состоящие. Отдельно процессоры тестируются в рамках статей «основной линейки». Всегда в фиксированной конфигурации — с мощной видеокартой, большим объемом ОЗУ и т. п. Есть у нас на сайте и тестирования непосредственно видеокарт в игровых приложениях, обновляемые ежемесячно. В рамках i3D-Speed все видеокарты (от простенькой бюджетки до multi-GPU) тестируются на мощной конфигурации, выбранной из расчета достаточности для графической составляющей любой мощности. Т. е. мы считаем, что с точки зрения традиционного «компонентного» тестирования этих двух линеек статей вполне достаточно.

Но вот для практического использования полученных в их рамках результатов нужно определенное связующее звено. Дело в том, что приложений, производительность которых не зависит от центрального процессора, в природе не существует. Бывают, конечно, случаи, когда она ограничивается другими компонентами, но и это очень часто для разных процессоров происходит на разном уровне. Игровые же и подобные приложения существенным образом зависят от производительности GPU, но и нагрузку на CPU дают немалую. Если задача оказывается слишком «легкой» для графики, все начинает определять только процессор. Если «тяжелой», то влияние процессора, наоборот, становится минимальным, и его даже можно иногда не учитывать. В промежутке между этими предельными случаями важны оба компонента, причем степень их важности может меняться местами. Априори неизвестным образом. Т. е. из того, что один процессор быстрее другого с использованием мощной видеокарты не следует, что соотношение сохранится, если ее заменить на бюджетную. Точнее, в каких-то режимах сохранится, в каких-то — изменится, в каких-то все просто окажутся одинаковыми. Аналогичная проблема свойственна и видеокартам — уровень «достаточности» CPU меняется в зависимости от GPU и режима его работы.

Казалось бы, достаточно просто тестировать все связки «процессор+видео». Решение очевидное и правильное в теории, но практически неосуществимое на практике, поскольку объем работы растет в геометрической прогрессии. Иными словами, 40 видеокарт на одной системе — 40 тестовых конфигураций. 40 процессоров с одной видеокартой — тоже 40 конфигураций. А если это объединить, получится 1600 тестовых конфигураций. Хотя, конечно, если всю эту работу удастся проделать, будут получены поистине бесценные результаты. Но к моменту их получения они станут уже никому не нужными, поскольку устареют (забегая вперед — даже выбранная нами «упрощенная» методика позволяет за рабочую неделю протестировать не более десятка конфигураций, так что 1600 — задача на три года при использовании одного стенда).

Но можно подойти и с другой стороны: не пытаться найти точные ответы на все вопросы, а ограничиться качественными оценками. Хотя бы для части процессоров можно попробовать «нащупать» нижний уровень производительности. Которым является интегрированная графика, благо в последнее время она превращается в неотъемлемую составляющую большинства современных процессоров. И есть младшие модели дискретных адаптеров, которые как минимум не хуже. Но в разы проще и медленнее, нежели топовые решения — на графическом рынке пока еще разброс характеристик больше, чем на процессорном. При таком выборе оборудования мы можем и существенно сократить список тестовых конфигураций и режимов. Действительно — наиболее актуальными результаты будут для покупателей бюджетных компьютеров, поскольку при цене системного блока долларов так в 1000, можно отдать  10% этой суммы за чуть более мощную видеокарту, нежели нижний уровень, а не связываться с тем же интегрированным видео. Просто — чтобы было. Так что процессоры среднего класса и выше часто тестировать со слабым видео не потребуется. Иногда, конечно, мы этим заниматься тоже будем — для того, чтобы иметь необходимые ориентиры, но лишь иногда. Кроме того, для систем такого класса не требуются тесты в каких-то выдающихся режимах, типа 2560×1600 со старшими вариациями на тему полноэкранного сглаживания :) Словом, работу можно существенным образом упростить.

Еще больше объем работы сокращает то, что 90% приложений стандартной процессорной методики от производительности видео вообще не зависит. В предыдущей серии мы использовали все программы, так что четыре ее части являются вполне достаточным доказательством данного факта. Кому все еще недостаточно — тут уж мы ничего поделать не можем :) Как бы то ни было, но GPGPU до сих пор является не более чем любопытным экспериментом, да и все работы в данном направлении показывают, что для систем со слабыми GPU он вообще особой актуальностью не отличается: мощные видеокарты на «хороших» задачах действительно способны что-то ускорить, а вот при попытке выжать что-то путное из дискретки начального уровня очень часто весь пар уходит в свисток — усложнение алгоритмов и лишние пересылки данных «съедают» весь потенциальный прирост. Из чего, впрочем, не следует делать вывод, что мы пройдем мимо какого-либо любопытного и популярного приложения, способного активно использовать ресурсы GPU. Разумеется, не пройдем и в данную экспериментальную же методику его добавим. Только вот пока основная проблема в том, что ничего подобного не попадается. Точнее, «любопытные» программы уже есть, а вот популярными они все никак по тем или иным причинам никак не становятся. То же транскодирование видео, вокруг которого было сломано немало копий, на деле мало кому требуется регулярно, да и качество работы разработанными энтузиастами программ оставляет желать много лучшего (это еще очень мягко говоря). Причем (вот она гримаса судьбы) быстрее всего выполняется при помощи специализированных аппаратных блоков, имеющихся в интегрированных GPU Intel, а вовсе не на конвеерах универсального назначения.

Таким образом, у нас остается не так уж и много программ, которые имеет смысл «гонять» на системах со слабой графикой. Фактически «стандартная» методика упрощается буквально до пяти групп, три из которых в ней являются экспериментальными. Это:

Интерактивная работа в трёхмерных пакетах
Без изменений
Математические и инженерные расчёты
Выброшены MAPLE и MATLAB, поскольку ничего на экран не выводят, а вот оставшиеся три приложения читателям интересны, судя по отзывам (понятно, что так уж сильно экономить на рабочем месте вряд ли целесообразно, но вдруг придется поработать за слабым компьютером). Фактически получается так, что по составу эти две группы в результате совпадают, но в предыдущем случае учитывается «графический» балл соответствующего теста, а в этом — «процессорный»: как показала практика тестирования, на деле оба они зависят и от процессора, и от видеокарты, что нам и требуется
Игры
Без изменений
Игры с низким разрешением и настройками качества
В рамках «основной» методики эта группа практически никак не используется и на общий балл не влияет, но сделана она как раз для систем со слабой графикой. В первую очередь, мобильных, однако не так уж они отличаются от того, что мы тестируем в этой серии
Проигрывание видео высокой чёткости
В особых комментариях не нуждается

Поскольку групп у нас не так уж много, причем все они являются достаточно специфическими, общую оценку мы ставить не будем. В первую очередь нас интересуют результаты. Которые, как водится, будут полностью совместимы с полученными на конфигурациях основной линейки тестирования, благо мы уже точно знаем, что видеокарты на прочих приложениях никак не сказываются. Так что при желании можно просто заменить соответствующий кусок в «большой» таблице, благо мы их ни в коей мере не скрываем. Однако стоит учитывать, что баллы этого тестирования с основной линейкой никак не совместимы: здесь за масштабную единицу мы берем систему с Celeron G540 и Radeon HD 6450 512 МБ GDDR3, так что для самостоятельных махинаций следует скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.

Конфигурация тестовых стендов

Процессор A4-3400 A6-3500 A6-3650 A8-3870K A10-5800K
Название ядра Llano Llano Llano Llano Trinity
Технология пр-ва 32 нм 32 нм 32 нм 32 нм 32 нм
Частота ядра (std/max), ГГц 2,7 2,1/2,4 2,6 3,0 3,8/4,2
Оперативная память 2×DDR3-1600 2×DDR3-1866 2×DDR3-1866 2×DDR3-1866 2×DDR3-1866
Видеоядро Radeon HD 6410D Radeon HD 6530D Radeon HD 6530D Radeon HD 6550D Radeon HD 7660D
Кол-во графических процессоров 160 320 320 400 384
Частота видео (std/max), МГц 600 443 443 600 800

Главными героями этой (равно как и предыдущей — посвященной CPU-части Trinity) статьи является пара топовых APU для FM1 и FM2 соответственно, т. е. A8-3870K и A10-5800K. Однако (чтоб не было скучно) мы решили добавить к ним еще один А4 и два А6 — для более полного охвата, так сказать. Но пока внимательно посмотрим на главную пару.

Как видим, графических процессоров стало меньше — 384 против 400. И это несмотря на то, что топы относятся к разным классам: в равных все еще печальнее. Так, новые А8 получат всего 256 ГП, А6 — 192 (вместо 320), а А4 — вообще 128 (вместо 160). На самом деле, ничего такого уж печального в этом нет — ранее использовалась архитектура VLIW5, где пятый блок был задействован крайне редко, а в новых процессорах применяется VLIW4. В общем, грубо говоря, новый SIMD-блок из 64 ГП на деле эквивалентен старому, где их было 80. Хотя, конечно, и это не слишком компенсирует уменьшение количества блоков — разве что новые и старые А4 в «приведенных числах» равны, так что одной из двух основных причин увеличения производительности (наряду с небольшими архитектурными улучшениями) будет увеличение тактовой частоты GPU. Если раньше речь шла о частотах 433 МГц (A4-3300 и все А6) или 600 МГц (А4-3400 и все А8), то теперь даже в А4-5300 имеем 723 МГц, А6 и А8 предлагают пользователю 760 МГц, а А10 и все 800. Причем во всех случаях речь идет о постоянных частотах — технология Turbo Core 3.0 для процессорных ядер применяется повсеместно (в Llano — лишь в части моделей), а вот для GPU ее использование ограничено мобильными APU.

Вопросами сравнения производительности с дискретными решениями, а также комбинированными конфигурациями мы сегодня заниматься не будем. Но вкратце отметим, что режим Dual Graphics почти никуда не делся — его не поддерживают только новые А4. А6/А8/А10 — без проблем, однако никаких нововведений в нем не появилось: как и ранее, для ускорения пока можно использовать максимум Radeon HD 6670. Причина банальна: на GCN пока нет достаточно «слабых» для такого применения GPU, ведь даже 512 ГП в HD 7750 — это overkill. Появились в ассортименте компании, конечно, и Radeon HD 7570/7670, однако они полностью идентичны HD 6570/6670 соответственно, т. е. это банальное переименование. Ну а Radeon HD 64хх (и «новые» 74хх, полученные тем же переименованием), как мы уже убедились в прошлом году, в паре с А6 или А8 (не говоря уже об А10) особого смысла использовать не имеет. Впрочем, в настольном сегменте Dual Graphics и ранее была не слишком-то интересной технологией, в первую очередь рассчитанной на мобильные компьютеры. Там — да: мощность лишней не бывает, пусть даже ее приходится получать при помощи multi-GPU. А в настольных компьютерах лучше уж прикупить одиночную быструю видеокарту. Или ограничиваться одним лишь интегрированным GPU. Хватит ли его или нет — мы сейчас и попробуем оценить при помощи тестов.

Осталось только упомянуть, что для всех APU нами использовался Catalyst 12.8 — последняя на момент тестирования версия.

Интерактивная работа в трёхмерных пакетах

Как мы уже не раз убеждались, у этих программ каких-то особых требований к мощности GPU нет, а вот к качеству драйверов — есть. Но если с качеством все в порядке, то тест превращается в чисто процессорный, как у нас и вышло. При этом лишь «немногопоточный», поэтому А4-3400 оказался быстрее А6-3500, ну а остальные выстроились в порядке увеличения производительности на поток.

Но еще раз заметим — сравнивать разные процессоры по результатам этой группы можно только тогда, когда видеочасть либо вообще одинаковая, либо одинаково не мешает CPU. Поскольку в последнем на данный момент тестировании Intel HD Graphics лучший результат показал Core i5-3570K с HDG 4000 и был он равен 86 баллам, а Core i7-2700K (HDG 3000) со своими 73 баллами отстает даже от AMD A4. Что, конечно, не отменяет того факта, что Core с любым дискретным Radeon HD быстрее любых APU, но заставляет задуматься :)

Математические и инженерные расчёты

Здесь влияние видеочасти еще меньше, чем в предыдущем случае, так что картина не меняется. Интересно лишь то, что в обеих группах тестов результаты A10-5800K выше, чем, во-первых, A8-3870K, а во-вторых, чем эталонная пара «Celeron G540 + Radeon HD 6450 512 МБ GDDR3».

Aliens vs. Predator

Игра крайне требовательна к графической части, так что немудрено, что два А6 с ее точки зрения одинаковы. Использовать выбранный нами режим по-прежнему нельзя ни на каком интегрированном графическом решении, зато и разница между А10 и А8 видна отчетливо — более 25%.

Примечательно, что и «легкий» режим не так уж и нетребователен, хотя с ним прекрасно справляются все «взрослые» APU AMD (да и у некоторых «детских» на это сил хватает — E-450 и E2-1800 за 30 FPS перебираются). A10-5800K все равно быстрее предшественника, пусть и в чуть меньшей степени, и вообще — переваливает за сотню кадров в в секунду, более чем вдвое обходя A4-3400 :)

Batman: Arkham Asylum GOTY Edition

До 30 кадров не дотягивает только А4, но, если А6 только-только хватает для игры, то А10-5800К уже стремится приблизиться ко «второй границе комфорта» (60 FPS). В общем, в играх на базе движка Unreal Engine 3.5 и предыдущих его версиях (а таких приложений тьмы, и тьмы, и тьмы) владельцы новых APU смогут ни в чем себе не отказывать.

Хотя понятно, что во многом это заслуга легкости самого движка — в отличие от AvP, как видим, в «легком» режиме вклад процессорной части уже очень заметен — А6-3500 весомо отстал от A6-3650, так что результаты представляют собой очень красивую лесенку :)

Crysis: Warhead x64

Великий и ужасный Crisys до сих пор не сдается интегрированной графике. Хотя новые А10 традиционно добавив 25% к результатам предшественников уже приближаются к 20 FPS (в то время, как лучшие графические решения Intel в аналогичных условиях способны только на 10,9 FPS), так что снижение разрешения и некоторых настроек вполне способно осуществить давнюю мечту многих пользователей — побегать в Crysis на HTPC :)

В качественном режиме, разумеется, поскольку если снизить настройки графики до минимума, это уже давно проблем не вызывает. Но, кстати, опять же проводя параллели с недавним тестированием LGA1155, и при таком раскладе Core i5-3570K медленнее, чем A10-5800K. А вот обгонять A8-3870K ему уже удавалось.

F1 2010

Движок обладает зачатками «искусственного интеллекта», упрощающими картинку насколько это возможно, чтобы вытянуть частоту кадров на уровень 12,5. На некоторых графических решениях, впрочем, у него это не выходит, но с Radeon HD 6410D уже проблем никаких. За исключением того, что медленновато все равно. Хотя кольцевые гонки не относятся к слишком уж динамичным видам игр, по ощущениям в них нужно хотя бы 20-25 FPS — иначе уже возникают сложности с управляемостью болида. Вот А10-5800К для игры уже более-менее достаточно, пусть и на грани, а более слабых решений в таком режиме — нет. Хотя лучше, конечно, и здесь иметь хотя бы 30 FPS, но на такой «подвиг» и некоторые дискретные видеокарты неспособны, вплоть до Radeon HD 6670 включительно.

Снижение настроек проблему решает радикально. И, кстати, сразу становится видно, что любых двух или медленных трех потоков вычисления движку F1 уже недостаточно. Но четыре ядра или два модуля с легкостью позволяют получить более 60 кадров в секунду.

Far Cry 2

Встроенный в A10-5800K Radeon HD 7660D — первое на нашей памяти интегрированное видеорешение, позволяющее в этой относительно старой игре получить в качественном режиме более 30 кадров в секунду. Старшие А8, впрочем, к «первой границе» подобрались настолько близко, насколько возможно, но ее не перешли. А у А10 даже запас есть и не такой уж маленький.

В «легком» режиме он же оказался единственным, перебравшимся и за «вторую границу», к которой предыдущие решения AMD лишь приближались. Заметим, что, благодаря высокой процессорозависимости игры, старшие Core i5 и i7 с HDG 3000 или 4000 это тоже могли сделать. Ну вот и AMD «подтянула» своих бойцов и здесь на тот же уровень. Благодаря графике в первую очередь, конечно, но для пользователя в этом большой разницы нет — главное, что А10 дешевле, чем Core i5 ;)

Metro 2033

По вполне понятным причинам, это все еще стресс-тест как для интегрированной графики, так и для младших дискретных GPU. Поэтому просто отмечаем около 20% превосходства А10 над А8 и все: для более серьезных выводов время все еще не настало.

Даже в «легком» режиме этой игры А4 — непригодны, а А6-3500 — на грани. Вот начиная со старших А6 уже можно и поиграть. Опять же — навскидку HDG 3000 и 4000 примерно равны А6 (несмотря на более мощную процессорную часть четырехъядерных Core), а прочие графические решения Intel еще медленнее.

Сводные результаты

В общем и среднем получилось 25% прироста А10 над А8 — примерно такого результата и можно было ожидать по индексу. Много это или мало? Для интегрированной графики — более чем достаточно, особенно если сравнить с решениями Intel (хотя бы бегло и навскидку — более точно это можно будет сделать после обновления тестовых результатов на более дешевых процессорах и с новыми драйверами). По сравнению с дискретными — не так уж и много. Например, Radeon HD 6570 в паре с A8-3850 набирал 283 балла, да и с другими процессорами результат аналогичный. В общем, несмотря на прирост в 25% в сравнении с Radeon HD 6550D, до результатов HD 6750 интегрированному HD 7660D не хватает примерно 15%. Ну, и еще один ориентир: те же 240 баллов набирал Radeon HD 6550D2 (т. е. Dual Graphics из HD 6550D и дискретного HD 6450) — несколько синтетический вариант, конечно, но вот теперь он достижим и при помощи одного лишь интегрированного GPU.

В «легком» режиме все легче. И прирост сравнительно с предшественниками, естественно, уменьшился. Но абсолютный результат примерно равен паре из Pentium G620 и Radeon HD 6570 — тут уже и процессор в немалой степени помог, поскольку до Core i3 с той же видеокартой остаются те же 15%, что и в случае качественных настроек. Но вот до А8-3850 с ней же — уже менее 10%.

Итого

Итак, как можно убедиться, принципиальных изменений в производительности графической части новых APU не произошло. Она быстрее некоторых дискретных решений базового уровня, но на это были способны уже и старшие Llano. А вот до идеологически близкой дискретки типа Radeon HD 6570/7570 по-прежнему «не дотягиваемся» (несмотря на то, что номер встроенного GPU уже немного выше). Но размер отставания сократился, поскольку сама по себе производительность, разумеется, подросла. Таким образом, наименование серии изменилось логичным и оправданным образом — это и правда А10, а не, к примеру, «В52» :) Хотя тем, кто искренне надеялся и верил, что графика Trinity превзойдет встроенную в Llano качественно, а не количественно, от этой логики, конечно, не легче. Однако чудеса в этой жизни случаются достаточно редко. Да и не в подобных случаях — все-таки и «старые» А8 (и, в какой-то степени, А6 и А4 тоже) предлагали пользователям больше возможностей, нежели существовавшие до их появления интегрированные графические решения, а улучшать то, что и так работает хорошо, всегда сложно. Разумеется, оставаться на месте компания не могла — как мы уже убедились в последнем на сегодняшний день семействе IGP Intel тоже удалось стабильно превзойти уровень базовых дискретных GPU и вплотную приблизиться к показателям А6 (причем заодно доведя функциональность до современного уровня — а так-то и HDG 3000 уже была не слишком медленной). Выход А10 восстановил статус-кво: процессоры Intel в части графических возможностей снова отстают на две ступени. Предыдущие APU AMD — на одну. Что в итоге (и вкупе с улучшенной процессорной частью) делает платформу Virgo более чем конкурентоспособным решением в своем сегменте рынка, но, как мы уже говорили, без радикального изменения этого самого сегмента.



Благодарим компании Corsair, Palit и «Юлмарт»
за помощь в комплектации тестовых стендов



Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.