Графика: быстрая, медленная и интегрированная

Часть 24: Intel HD Graphics третьего и четвертого поколений


Так сложилось, что с производительностью нынешнего поколения интегрированной графики Intel мы знакомились на примере старших ее модификаций или в ноутбучном исполнении, а вот последняя статья, где изучались Celeron, Pentium и Core i3 была опубликована более года назад, так что ограничивалась Sandy Bridge и Ivy Bridge. С точки зрения потенциального покупателя, разумеется, такая ситуация неправильна. Ведь интегрированное графическое ядро в топовом настольном процессоре обычно используют те, кому его характеристики не важны, так что, по большому счету, и HDG 2500 достаточно. Если недостаточно, то просто обычно приобретается дискретная видеокарта, тем более, что обладатели компьютеров на Core i7 или Core i5 легко могут позволить себе не экономить на последней. Да и в старшие модели ноутбуков производители нередко ставят дискретку по принципу «чтобы было». Пусть часто таковым оказывается GPU, сравнимый по производительности со встроенным, но отбиться от такой «заботы» не всегда представляется возможным.

А вот в бюджетном сегменте все совсем не так. Конечно, и на Pentium (не говоря уже о Core i3) можно собрать неплохой игровой компьютер. Причем если ограничиваться однопользовательским режимом, то даже не «неплохой», а хороший (в чем мы уже убедились). Однако при серьезных требованиях к производительности обычно приходится приобретать дорогие видеокарты, не экономя и прочих системах, так что тут уже можно не слишком экономить на процессоре (тем более, что, как мы уже не раз писали, на данный момент все процессоры потребительского сегмента весьма недороги). Кому же нужны самые дешевые модели? В основном тем, кому приходится экономить каждый доллар (а еще чаще — рубль или гривну), так что покупка приличной дискретной видеокарты даже не рассматривается (или рассматривается, но где-то в будущем). «Неприличную» же ныне, как не раз уже было показано, приобретать вообще смысла нет — выброшенные деньги, которые все равно не позволят получить качественное преимущество над использованием интегрированной графики. Но в этом случае характеристики последней могут начать иметь определяющее значение — просто потому, что в интерактивных приложениях (к коим относятся и игры) количественные характеристики выливаются во вполне качественные различия. Иными словами, нет большой разницы — за сколько минут в конечном итоге получится импортировать в базу или обработать большое количество изображений: конечно, 15 минут лучше 30, однако в конечном итоге работа будет выполнена (пусть и придется выпить лишнюю чашку кофе или поискать себе еще какое-нибудь занятие). В то же время 15 (и даже 20-25) и 30 кадров в секунду в игре — уже качественные отличия: во втором случае в игру можно играть с выбранными настройками, а в первом еще нет. В общем, вопрос принципиальный. Так что ответ на него интересен многим. Вот сегодня мы его и поищем.

Тестирование: цели и задачи, конфигурации, методика

Этот раздел сравнительно большого объема будет общим и одинаковым для всех статей: к сожалению, далеко не всем людям достаточно что-либо объяснить один раз :) Тем более, далеко не все читатели будут внимательно изучать все статьи цикла — вероятность «начать с середины» или просто ограничиться одним-двумя материалами крайне велика, в чем мы отдаем себе полный отчет. Поэтому сразу приносим извинения тем, кто против постоянного повторения одних и тех же истин. Которое, впрочем, как известно мать учения :)

Итак, во-первых и в главных следует учитывать, что в рамках данного тестирования мы не занимаемся исключительно компонентами — мы тестируем системы, из них состоящие. Отдельно процессоры тестируются в рамках статей «основной линейки». Всегда в фиксированной конфигурации — с мощной видеокартой, большим объемом ОЗУ и т. п. Есть у нас на сайте и тестирования непосредственно видеокарт в игровых приложениях, обновляемые ежемесячно. В рамках i3D-Speed все видеокарты (от простенькой бюджетки до multi-GPU) тестируются на мощной конфигурации, выбранной из расчета достаточности для графической составляющей любой мощности. То есть мы считаем, что с точки зрения традиционного «компонентного» тестирования этих двух линеек статей вполне достаточно.

Но вот для практического использования полученных в их рамках результатов нужно определенное связующее звено. Дело в том, что приложений, производительность которых не зависит от центрального процессора, в природе не существует. Бывают, конечно, случаи, когда она ограничивается другими компонентами, но и это очень часто для разных процессоров происходит на разном уровне. Игровые же и подобные приложения существенным образом зависят от производительности GPU, но и нагрузку на CPU дают немалую. Если задача оказывается слишком «легкой» для графики, все начинает определять только процессор. Если «тяжелой», то влияние процессора, наоборот, становится минимальным, и его даже можно иногда не учитывать. В промежутке между этими предельными случаями важны оба компонента, причем степень их важности может меняться местами. Априори неизвестным образом. То есть из того, что один процессор быстрее другого с использованием мощной видеокарты, не следует, что соотношение сохранится, если ее заменить на бюджетную. Точнее, в каких-то режимах сохранится, в каких-то — изменится, в каких-то все просто окажутся одинаковыми. Аналогичная проблема свойственна и видеокартам — уровень «достаточности» CPU меняется в зависимости от GPU и режима его работы.

Казалось бы, достаточно просто тестировать все связки «процессор+видео». Решение очевидное и правильное в теории, но практически неосуществимое на практике, поскольку объем работы растет в геометрической прогрессии. Иными словами, 40 видеокарт на одной системе — 40 тестовых конфигураций. 40 процессоров с одной видеокартой — тоже 40 конфигураций. А если это объединить, получится 1600 тестовых конфигураций. Хотя, конечно, если всю эту работу удастся проделать, будут получены поистине бесценные результаты. Но к моменту их получения они станут уже никому не нужными, поскольку устареют (забегая вперед — даже выбранная нами «упрощенная» методика позволяет за рабочую неделю протестировать не более десятка конфигураций, так что 1600 — задача на три года при использовании одного стенда).

Но можно подойти и с другой стороны: не пытаться найти точные ответы на все вопросы, а ограничиться качественными оценками. Хотя бы для части процессоров можно попробовать «нащупать» нижний уровень производительности. Которым является интегрированная графика, благо в последнее время она превращается в неотъемлемую составляющую большинства современных процессоров. И есть младшие модели дискретных адаптеров, которые как минимум не хуже. Но в разы проще и медленнее, нежели топовые решения — на графическом рынке пока еще разброс характеристик больше, чем на процессорном. При таком выборе оборудования мы можем и существенно сократить список тестовых конфигураций и режимов. Действительно — наиболее актуальными результаты будут для покупателей бюджетных компьютеров, поскольку при цене системного блока долларов так в 1000, можно отдать  10% этой суммы за чуть более мощную видеокарту, нежели нижний уровень, а не связываться с тем же интегрированным видео. Просто — чтобы было. Так что процессоры среднего класса и выше часто тестировать со слабым видео не потребуется. Иногда, конечно, мы этим заниматься тоже будем — для того, чтобы иметь необходимые ориентиры, но лишь иногда. Кроме того, для систем такого класса не требуются тесты в каких-то выдающихся режимах, типа 2560 x 1600 со старшими вариациями на тему полноэкранного сглаживания :) Словом, работу можно существенным образом упростить.

Еще больше объем работы сокращает то, что 90% приложений стандартной процессорной методики от производительности видео вообще не зависит. В предыдущей серии мы использовали все программы, так что четыре ее части являются вполне достаточным доказательством данного факта. Кому все еще недостаточно — тут уж мы ничего поделать не можем :) Как бы то ни было, но GPGPU до сих пор является не более чем любопытным экспериментом, да и все работы в данном направлении показывают, что для систем со слабыми GPU он вообще особой актуальностью не отличается: мощные видеокарты на «хороших» задачах действительно способны что-то ускорить, а вот при попытке выжать что-то путное из дискретки начального уровня очень часто весь пар уходит в свисток — усложнение алгоритмов и лишние пересылки данных «съедают» весь потенциальный прирост. Из чего, впрочем, не следует делать вывод, что мы пройдем мимо какого-либо любопытного и популярного приложения, способного активно использовать ресурсы GPU. Разумеется, не пройдем и в данную экспериментальную же методику его добавим. Только вот пока основная проблема в том, что ничего подобного не попадается. Точнее, «любопытные» программы уже есть, а вот популярными они все никак по тем или иным причинам никак не становятся. То же транскодирование видео, вокруг которого было сломано немало копий, на деле мало кому требуется регулярно, да и качество работы разработанными энтузиастами программ оставляет желать много лучшего (это еще очень мягко говоря). Причем (вот она гримаса судьбы) быстрее всего выполняется при помощи специализированных аппаратных блоков, имеющихся в интегрированных GPU Intel, а вовсе не на конвейерах универсального назначения.

Таким образом, у нас остается не так уж и много программ, которые имеет смысл «гонять» на системах со слабой графикой. Фактически «стандартная» методика упрощается буквально до пяти групп, три из которых в ней являются экспериментальными. Это:

Интерактивная работа в трехмерных пакетах
Без изменений
Математические и инженерные расчеты
Выброшены MAPLE и MATLAB, поскольку ничего на экран не выводят, а вот оставшиеся три приложения читателям интересны, судя по отзывам (понятно, что так уж сильно экономить на рабочем месте вряд ли целесообразно, но вдруг придется поработать за слабым компьютером). Фактически получается так, что по составу эти две группы в результате совпадают, но в предыдущем случае учитывается «графический» балл соответствующего теста, а в этом — «процессорный»: как показала практика тестирования, на деле оба они зависят и от процессора, и от видеокарты, что нам и требуется
Игры
Без изменений
Игры с низким разрешением и настройками качества
В рамках «основной» методики эта группа практически никак не используется и на общий балл не влияет, но сделана она как раз для систем со слабой графикой. В первую очередь, мобильных, однако не так уж они отличаются от того, что мы тестируем в этой серии
Проигрывание видео высокой четкости
В особых комментариях не нуждается

Поскольку групп у нас не так и много, причем все они являются достаточно специфическими, общую оценку мы ставить не будем. В первую очередь нас интересуют результаты. Которые, как водится, будут полностью совместимы с полученными на конфигурациях основной линейки тестирования, благо мы уже точно знаем, что видеокарты на прочих приложениях никак не сказываются. Так что при желании можно просто заменить соответствующий кусок в «большой» таблице, благо мы их ни в коей мере не скрываем. Однако стоит учитывать, что баллы этого тестирования с основной линейкой никак не совместимы: здесь за масштабную единицу мы берем систему с Celeron G540 и Radeon HD 6450 512 МБ GDDR3, так что для самостоятельных махинаций следует скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.

Конфигурация тестовых стендов

Процессор Pentium G2140 Pentium G3430 Core i3-3245 Core i3-4130 Core i3-3250 Core i3-4330
Название ядра Ivy Bridge DC Haswell DC Ivy Bridge DC Haswell DC Ivy Bridge DC Haswell DC
Кол-во ядер/потоков вычисления 2/2 2/2 2/4 2/4 2/4 2/4
Частота ядра, ГГц 3,3 3,3 3,4 3,4 3,5 3,5
Кэш L3, МиБ 3 3 3 3 3 4
Оперативная память 2×DDR3-1600
Видеоядро HDG HDG HDG 4000 HDG 4400 HDG 2500 HDG 4600
Кол-во графических процессоров 24 40 64 80 24 80
Частота видео (std/max), МГц 650/1050 350/1100 650/1050 350/1150 650/1050 350/1150
TDP, Вт 55 53 55 54 55 54

Десктопные Celeron на микроархитектуре Haswell анонсированы недавно и до наших рук еще добраться не успели, а Bay Trail — вообще отдельная история: только BGA-исполнение и TDP до 10 Вт делают эти модели как максимум конкурентами CULV-процессоров, но никак не «стандартным настольным» платформам. А вот Pentium и Core i3 разных модификаций массово доступны и для LGA1155, и для новой LGA1150. Соответственно, в нашем тестировании примут участие три пары процессоров — два Pentium и четыре Core i3. C Pentium все просто — мы взяли два процессора с равной тактовой частотой вычислительных ядер: старый G2140 и новый G3430. Обратите внимание, что графическое ядро младших моделей по прежнему называется HD Graphics, хотя это уже четвертый GPU с таким названием, причем от предыдущих двух он отличается не только архитектурно, но и число конвееров увеличилось с 6 до 10. То есть разница с Ivy Bridge будет обязательно, ну а с до сих пор встречающимися в продаже Pentium и Celeron на Sandy Bridge и сравнивать нечего — функциональность сильно разная, что мы уже отмечали чуть более года назад.

В семействе Core i3 неразберихи с названиями нет. Более того — порядка вообще стало больше — ранее компания предлагала как процессоры с ядром HDG 2500 (самым массовым в настольных Ivy Bridge), так и несколько модификаций с HDG 4000. При этом обеспечивалось равенство отпускных цен, но частота вычислительных ядер всегда была больше (при этом условии) у моделей с младшим графическим ядром. Новое же поколение разделилось на два семейства. Наследниками старых Core i3 являются модели линейки 41х0, аналогичные им по частотам и емкости кэш-памяти и укомплектованные HDG 4440. Относительно новым же товаром стали более дорогие процессоры линейки 43х0, где на борту не только старший среди «сокетных» процессоров GPU HDG 4600, но и все 4 МиБ кэш-памяти L3 задействованы: как в Core i3 первого поколения или в мобильных двухъядерных Core i7. В общем, позиционирование новых процессоров стало более простым и логичным: больше платим — больше получаем. По всем параметрам. Пересечения же по тактовой частоте с предыдущим поколением тоже есть, что и дало нам две равные по ней пары 3245-4130 и 3250-4330.

Процессор A6-6400K A8-6600K
Название ядра Richland Richland
Кол-во модулей/потоков вычисления 1/2 2/4
Частота ядра (std/max), ГГц 3,9/4,1 3,9/4,2
Кэш L3, МиБ
Оперативная память 2×DDR3-1866 2×DDR3-1866
Видеоядро Radeon HD 8470D Radeon HD 8570D
Кол-во графических процессоров 192 256
Частота видео (std/max), МГц 800 844
TDP, Вт 65 100

Четвертая пара участников тестирования — APU AMD. Более дешевые, чем процессоры Intel, но... Как уже было выяснено ранее, по графической производительности Core i7-3225 (с HDG 4000) примерно соответствовал лишь А4 линейки Trinity. Последняя же и в младшем сегменте уже заменена на Richland (вот А8 на Kaveri придется еще подождать) с небольшим увеличением производительности. У Intel прирост более весомый, однако даже топовая настольная модель компании летом не смогла достичь уровня современных А8. С тех пор драйверы обновились, что привело к некоторым любопытным эффектам, но мы все равно априори были уверены, что А8 останется недостижимым для младших процессоров Intel уровнем. Вопрос только — насколько? И как соотносится графическая производительность с более доступными А6. А вот А4 — неинтересен: как уже было сказано выше, такой уровень графической производительности уже и старым Core i3 был доступен. Пусть заметно дороже, но и производительность процессорной составляющей тоже сильно отличается, так что просто нужно выбирать — что важнее. Надеемся, что сегодняшнее тестирование позволит упростить эту задачу.

Еще один гость из другого мира — видеокарта на базе GeForce GT 630. Нечто с таким названием мы уже тестировали год назад, но именно, что с названием: старые продукты основывались на GF108, а новые используют чип GK208. Сама NVIDIA утверждает, что это новая разработка, на деле же GPU очень похож на обрезанный GK107 (ранее использовался в GT 640 и выше). Причем обрезанный программным образом — оба имеют одинаковую площадь и частично совпадающую разводку. Почему частично? Потому, что у GK208 отсутствует один канал памяти, да и шинный интерфейс это лишь PCIe x8, а не х16. Таким образом, очевидно, что при сравнимых частотах GT 630 не конкурент старым GT 640, несмотря на одинаковое количество графических процессоров. А вот сравнительно со старым же GT 630 DDR3 все должно быть не так уж и плохо: «узкая» шина памяти частично компенсируется ее более высокой тактовой частотой (1800 МГц против официальных 1600 МГц, которые в реальных продуктах часто усыхали и до 1400 МГц), а арифметические возможности чипа много выше — на уровне GT 640. Другой вопрос, нужен ли в современном компьютере такой уровень или лучше обойтись интегрированным видео? :) Зато, что немаловажно, карты на GK208 получаются компактными и сплошь снабжены пассивным охлаждением (ибо греется GPU слабо), а по цене они могут поспорить и с GT 610 / 620, отличающимися совсем уж никакой производительностью. В общем, определенная ниша у этих решений есть — хотя бы апгрейд старых компактных систем. Ну а точный уровень производительности мы определим при помощи карты от ASUS с 2 ГБ DDR3 (модификацию с 1 ГБ мы тестировать не стали ибо не за чем — разный объем в видеокартах такого уровня никак не скажется), работающей совместно с Core i3-4330 (чтоб уж точно процессор не мешал).

Интерактивная работа в трехмерных пакетах

Как мы уже писали, в драйвере версии 9.18.10.3257 программисты Intel исправили очередную порцию ошибок, что привело к любопытному эффекту: даже Pentium на Ivy Bridge (прибавив 20% к прошлогодним результатам) уже выходит на уровень любых APU AMD (за исключением, может быть, Kaveri, но эти модели только-только начинают поступать в торговые сети). Более того — это уровень младших игровых дискретных чипов NVIDIA, даже работающих в паре с более быстрым процессором. В общем, больше не стоит бояться интегрированной графики Intel. Особенно после выхода Haswell — это еще более высокий уровень производительности. Причем, как видим, установка младшей игровой дискретки (что было для таких программ практически обязательным во времена Sandy Bridge) производительность заметно снижает, т. е. этого лучше уже не делать.

Математические и инженерные расчеты

Здесь и ранее HD Graphics не слишком мешала, поскольку результаты в основном зависели от однопоточной производительности процессора, что ставило устройства Intel в выигрышное положение, а теперь ситуация только усугубилась. Но, кстати, обратите внимание — дискретная видеокарта позволяет улучшить результаты. Просто потому, что не претендует ни на кэш-память процессора, ни на тепловой пакет. Впрочем, выигрыш крайне невелик, что, в совокупности со снижением «графического» балла не позволяет изменить вывод — если и покупать дискретную видеокарту для программ профессионального назначения, то уж точно не младшую игровую.

Aliens vs. Predator

Как и следовало ожидать, HDG третьего поколения и HDG 2500 идентичны — такое мы не раз еще увидим, так что в будущем не будем подробно останавливаться на этом результате. 4400 лишь немногим быстрее, чем 4000, что простительно — одно из младших решений против некогда старшего. HDG 4600 же почти достигает производительности А6 — заметный шаг вперед ибо, как мы уже говорили, HDG 4000 хватало лишь на борьбу с А4. А разница между двумя HDG еще больше. Хотя на практике в таком режиме все разбивается о то, что даже А8-6600К (более быстрого, чем GT 630 кстати) все равно недостаточно для получения комфортной частоты кадров. Поэтому настройки придется снижать.

На минимуме, естественно, все летает. Кроме младшей графической конфигурации Ivy Bridge — даже в таком режиме ее еле хватало, чтобы перевалить за границу в 30 FPS. Так что радует, что у новой графики таких проблем хотя бы нет. И даже от дискретки уровня GT 630 уже отстает только Pentium и то немного, а устанавливать такие карты в компьютер на базе любого нового Core i3 точно дурная затея. Ну а APU впереди с большим отрывом от прочих. Результат не стал неожиданным, хотя надежды на хотя бы примерный паритет старших Core i3 с хотя бы намного более дешевыми А6. Видали мы некогда более низкие результаты даже у совсем старых А8, конечно, однако инженеры и программисты AMD тоже без дела не сидели последний год :)

Batman: Arkham Asylum GOTY Edition

Качественный (в рамках наших тестирований) режим этой игры «сдался» интегрированной графике от Intel после появления HDG 4000, а более новые GPU компании, естественно, еще быстрее. И даже Pentium не хватило самую малость, чтоб дотянуть до 30 FPS. Достижение, которое, впрочем, меркнет на фоне того, что даже старый А4-5300 или совсем уж древний А6-3500 все равно быстрее — высокую планку задала AMD, ничего не скажешь. Собственно, нет ничего удивительного и в том, что APU этой компании уже и младшую дискретку с рынка вытесняют. А у Intel, несмотря на бурный прогресс, труба пониже и дым пожиже :) Впрочем, тоже уже понятно, что и в системы на ее новых процессорах ставить решения класса GT 630 (тем более ниже) уже не имеет смысла — принципиального прироста производительности не будет.

При низком качестве картинки и старом графическом движке получается уже по большей части сравнение процессоров. С небольшими вариациями: все-таки HDG 2500 (и его родственники бюджетных семейств) слишком слабое решение, а использование дискретки меньше мешает процессорной составляющей работать в полную силу. Но в общем и целом в таком режиме можно было играть даже на Celeron G555, а прогресс со времен его появления позволяет уже так сильно себя не ограничивать.

Crysis: Warhead x64

Пример обратной ситуации — пока еще с этой игрой при выбранных настройках не может справиться никакое интегрированное графическое решение. Причем, как видим, несмотря на неуклонное увеличение производительности, ближайший год вряд ли что-то сильно изменится. Что не удивительно, поскольку даже дискретного Radeon HD 7750 DDR5 на такое хватает практически без запаса по скорости. Но если оценивать не только сами абсолютные результаты, а динамику их прироста, оценка ситуации несколько меняется. Как видим, современные Pentium уже вышли на уровень, который всего-то год назад был доступен лишь некоторым модификациям Core i3. А старшие представители последних по производительности графического ядра ныне выступают на уровне APU семейства A6 или... Дискретных видеокарт не такого уж и давнего времени, типа Radeon HD 6670 DDR3. Или же вполне современных GeForce GT 630. То есть граница между старшими (и даже уже не самыми старшими) моделями интегрированных GPU и младшими дискретными все более размывается.

Стоит снизить качество картинки до уровня игр десятилетней давности, как сразу оказывается, что хватит чего угодно, что вполне коррелирует с «житейской мудростью». Но и делает такие режимы не слишком показательными, конечно, однако как мы не раз уже говорили, выбраны они в свое время были в попытках заставить обеспечивать приемлемую производительность графику более низких классов — к примеру, интегрированную в низкопотребляющие Celeron трехлетней давности. Впрочем, кое-какую интересную информацию из них «выжать» можно и сейчас. В частности, неплохо виден прогресс драйверов Intel — чуть более года назад Pentium G2120 здесь выдавал менее 50 кадров в секунду, а с новыми драйверами G2140 стал в полтора раза быстрее. Однако и этого недостаточно для того, чтобы угнаться хотя бы за дешевыми AMD A6, а вот новые Pentium в играх с простой графикой (либо изначально простой, либо упрощенной настройками) могут уже «пободаться» и с А8. И, опять же, единственный плюс слабой дискретки — не мешает процессорной части выкладываться на полную. Хотя эффект от этого при использовании недорогих видеокарт, как видим, значительным не назовешь.

F1 2010

Хоть игре скоро будет уже четыре года, однако она по-прежнему является крепким орешком для интегрированной графики. Но немного по-иному, нежели Crysis — если там вся нагрузка ложилась именно на GPU, то тут уже важна и производительность процессора, причем желательна поддержка последним более двух потоков вычисления. В результате большинство младших решений держатся на уровне 12,5 FPS благодаря самому движку — он по-возможности пытается «не падать» ниже дополнительно упрощая картинку. Вот HDG 4000 и выше, равно как и интегрированные Radeon HD работают «честно», но все равно слишком медленно. Да и немудрено — как мы уже знаем с таким режимом справляются более-менее лишь топовые А10. А еще лучше как и ранее использовать дискретку. Желательно хотя бы Radeon HD 7730 DDR5 или выше.

В легком режиме уже даже при слабой графике видны недостатки двухпоточных процессоров. Впрочем, в очередной раз заметнее всего это проявляется при использовании процессоров AMD, а вот у Intel разница между Pentium и Core i3 невелика (причем новый Pentium может и обогнать старый i3). Поэтому минимумом стоит считать что-нибудь класса А8. Либо покупать дискретную видеокарту — специфика движков EGO (используемых во всей серии Formula One) такова, что даже снижение качества графики не делает ее бесполезной.

Far Cry 2

Far Cry 2 еще старше, так что тут уже и в качественном режиме с задачей не справляются только процессоры Intel и AMD A4/A6. В общем-то, качественное отличие Intel HD Graphics от APU или младшей дискретки — как видим, оно сохраняется до сих пор, несмотря на очень заметное увеличение производительности в новом поколении GPU.

Зато для легкого режима не хватало только Sandy Bridge, а в случае более современных устройств получаем почти тестирование производительности самих процессоров. С вполне предсказуемым результатом.

Metro 2033

Фактически еще один стресс-тест для интегрированной графики — получить от нее что-то более-менее приемлемое еще долго не получится. Зато для оценки собственно производительности GPU подходит хорошо. Впрочем, здесь почти ничего нового для нас уже нет за исключением, пожалуй, наиболее заметной разницы между двумя поколениями IGP Intel — Haswell действительно стал большим шагом вперед, позволившим компании почти догнать интегрированные Radeon. Точнее, с А4 мог уже конкурировать и HDG 4000, что, однако, на достижение не тянуло — слишком низкий уровень для относительно дорогих решений. А вот примерный паритет с А8 — уже куда ни шло. В теории, разумеется — на практике, как мы уже знаем даже дискретки за $100 слишком мало.

Собственно, и с режимом низкого качества (в этой игре не такого уж и низкого, надо заметить — минимальное поддерживаемое ей разрешение 1024 х 768 лишь недавно было часто используемым на практике) интегрированная графика справляться «научилась» не так давно. Причем не всякая — первыми границу пробили А6 на базе Llano, а переход на Trinity оказался в этом семействе даже шагом назад (ибо игра умеет полноценно задействовать многоядерные процессоры), но, в общем, их хватает. А более медленных решений — нет. Однако опять наблюдаем, что в рамках новой платформы Intel «хватает» даже Pentium, а вот большинство продуктов для предыдущей не справлялось из-за слабости массового HDG 2500. То есть фактически имеем переход количества в качество — то, что год назад «не могли» многие Core i5, сегодня «может» Pentium. Или любые Core i3, а не отдельные модели данного семейства. Что ж — тоже хорошо.

Сводные результаты

Что имеем в сухом остатке? Если вспомнить, что 100 баллов — это Radeon HD 6450 в паре с Celeron, то немало. Действительно — массовая графика для LGA1155 (а это HDG 2500 и его аналог в Celeron/Pentium или вообще слабенькие даже функционально IGP Sandy Bridge) не сумела добраться даже до данного уровня. Новые же Pentium его превосходят, т. е. встроенный в них GPU с легкостью обгоняет такие дискретные продукты, как упомянутый Radeon HD 6450 или GeForce GT 610/620. Понятно, что все они игровыми решениями могут называться только из вежливости, однако существуют и до сих пор продаются (не говоря уже о более старых видеокартах сравнимого уровня, продолжающих использоваться многими экономными пользователями компьютеров). Кроме того, позади остались и А4 для платформы FM1 — тоже базовый уровень, конечно, да еще и для устаревшей платформы двухлетней давности, однако пару лет назад мало кто верил, что Intel вообще удастся догнать AMD в обозримой перспективе: графика Sandy Bridge в любом варианте не шла ни в какое сравнение с настольными APU всех модификаций.

Core i3 на первый взгляд «подросли» слабее — HDG 4400 быстрее, чем HDG 4000 лишь на 20%, а не в полтора раза. Что легко объяснимо — если в бюджетном сегменте количество конвееров увеличилось с 6 до 10, то «этажом выше» только с 16 до 20. Однако не стоит забывать, что 4000 в предыдущем поколении являлось топовым GPU, причем применяющимся лишь в небольшой части настольных процессоров, а 4400 — нижний уровень новых настольных Core: в большинстве уже используется HDG 4600, имеющий чуть более высокую производительность. Фактически даже можно говорить о переходе количества в качество — всего-то год назад только HDG 4000 (тот самый — редкий вариант) мог обеспечить в играх частоту кадров на уровне APU AMD линейки A4, а вот сейчас уже образовался паритет и с более быстрыми А6. Естественно, на победу это никак не похоже — все-таки по цене даже А8 держатся на уровне Pentium, а Core i3 — более быстрые, но и заметно более дорогие процессоры, однако факт постепенно выравнивания позиций имеет место быть. Впрочем, выход APU на базе Kaveri вполне возможно сумеет восстановить статус-кво, однако массового распространения этих устройств (и их продвижения в нижние сегменты ассортимента AMD) придется еще подождать. А замена Trinity на Richland, как мы уже писали, являлась лишь косметическим обновлением. Совсем не похожим на переход с Ivy Bridge на Haswell.

Разумеется, «наращивание интегрированных мускулов» в продукции обоих вендоров все более и более сужает потенциальные сферы применения младших дискретных решений. Новый GT 630 оказался лишь немногим быстрее старого (узким местом является система памяти) и по-прежнему отстает от А8/А10. Да и отрыв от младших решений AMD и Intel сократился уже настолько, что приобретение дискретного видеоадаптера такого уровня вообще перестало быть оправданным мероприятием — прирост производительности не компенсирует лишних расходов и прочих недостатков подхода. В общем, единственное, на что могут претендовать видеокарты этого сегмента — модернизация старых компьютеров. Да и тут более привлекательным решением в большинстве случаев будет либо покупка более быстрой дискретки, либо просто замена платформы.

Ну а на режимы минимальных настроек можно уже постепенно переставать прекращать обращать внимание — с ними справляются уже все современные решения. Во всяком случае, настольные — суррогатным системам комфортными результатами все еще не могут похвастаться даже при упрощении графики до уровня десятилетней давности.

OpenCL

Несмотря на активные разговоры о гетерогенных вычислениях, пока сфера их применения остается очень ограниченной. Особенно если говорить о тех областях, которые применимы к интегрированной графике — использование дискретных GPU для некоторых «тяжелых» расчетов в сфере HPC началось уже несколько лет назад, однако это имеет слабое отношение к массовому рынку. А основной проблемой для последнего стало, как нам кажется, то, что OpenCL вовсе не такой уж «оупен», как декларировалось. Фактически программисты вынуждены учитывать особенности реализации спецификаций всеми тремя вендорами, т. е. работать на слишком уж низком уровне. Характерным примером незрелости технологии оказался в свое время WinZip — за победными реляциями о выходе в свет приложения хоть сколь-нибудь широкого назначения с поддержкой OpenCL, не все заметили, что речь идет о поддержке только реализации AMD, но не Intel и NVIDIA.

Что любопытно, эти особенности вылазят до сих пор даже в синтетических бенчмарках, многие из которых просто исполняют разные ветки кода на разных решениях. В частности таков и Basemark CL, который мы некоторое время назад начали использовать в рамках тестов этой линейки. К чему это приводит на практике — хорошо видно на примере нашего исследования самих программ: эта утилита явно неравнодушна к GPU от AMD. А если еще и вспомнить, что не так уж и давно процессоры Intel выполняли OCL-код только на основных ядрах, но не задействуя GPU, становится понятно, почему именно эта программа стала любимым бенчмарком AMD, использование которого рекомендовалось всем тестерам. С недавних пор, впрочем, перестали рекомендовать. Попробуем понять почему, учитывая, естественно, что Basemark CL для межплатформенного сравнения нужно использовать очень аккуратно.

На диаграмме мы собрали результаты всех протестированных в данной программе процессоров, что нарисовало крайне любопытную картину. Во-первых, как видим, HDG 2500 или «безномерной» родственник данного GPU обеспечивают производительность лишь на уровне младших мобильных решений. Понятно почему — код хорошо параллелится, так что шесть конвееров это шесть конвееров, хоть в CULV Celeron, хоть в настольном Core i3. А вот Pentium на Haswell уже намного быстрее. Впрочем, рассматривать его как серьезный OpenCL-ускоритель все равно не получается: на до A6, ни до процессоров с HDG 4000 (опять же — неважно: мобильных или настольных) он все равно никак не дотягивается. Но определенные преференции при использовании OpenCL можно получить и с его помощью — хотя бы большие, чем получит покупатель любых процессоров на ядре AMD Kabini. А вот HDG 4400 — куда более привлекательный вариант: как видим, всего лишь Core i3 нового поколения оказался равен топовому Core i7 предыдущего! Да и сравнительно с конкурирующими продуктами это не так и плохо — уровень некоторых А8. Понятно, что они дешевле, но разница в цене с младшими Core i3 все ж таки много меньше, нежели со старшими Core i7 :) А HDG 4600 это уже уровень А10. Причем несложно заметить, что большие бенефиции от внедрения OpenCL могут получить все экономные покупатели, а не только те, кто выбирает продукцию AMD: разница между i3 и i7 менее 10%. В общем, победные реляции портят только результаты Kaveri — AMD удалось в очередной раз прыгнуть выше головы. Но мало этих APU пока, в отличие от лежащих на каждом углу Core i3. К тому же, более дешевых и более производительных на классическом х86-коде, что при текущем положении дел с внедрением OpenCL крайне важно (процессор, который в большем количестве программ быстрее, а в небольшом — медленнее, выглядит привлекательнее того, который побеждает лишь в экзотическом специально подобранном окружении).

Результаты GT 630 можно особо не комментировать — как уже не раз было отмечено, не любит этот бенчмарк решения NVIDIA (причем и используется в данном случае код OpenCL 1.1, а не 1.2). С другой стороны, от повторения такой ситуации в реальных программах никто не застрахован. Ну а в данном случае, как видим, младшая дискретка легко может отстать даже от недорогой интегрированной графики. Что является дополнительным гвоздем в ее гроб :)

Итого

Если при выборе процессора высокого уровня (да еще и в предположении об использовании дискретной видеокарты) особых преимуществ Haswell над Ivy Bridge найти никому не удалось, то в бюджетном сегменте и при использовании интегрированной графики положение дел обратное: «старые» процессоры покупать нет никакого смысла. Разве что для модернизации системы на Sandy Bridge с сохранением системной платы, но тут уж лучше просто прикупить видеокарту— дешевле и эффективнее. А новая система — исключительно на LGA1150. В том, конечно, случае, если выбирать из решений Intel — как видим, отставание от APU AMD сильно сократилось, но не исчезло полностью. Таким образом, при желании сэкономить и ориентируясь в первую очередь на производительность графического ядра, хорошим  выбором по-прежнему остается платформа FM2/FM2+: тот же A8-6600K стоит дешевле любого Core i3, а A8-5600K может посостязаться по цене и с Pentium. Естественно, не стоит в данном случае забывать и о том, что эта экономия вовсе не бесплатна — процессорная часть сильно разная, что зачастую весьма актуально (во всяком случае, в данном сегменте), а в случае последующей покупки дискретной видеокарты доплата за «хороший» интегрированный GPU пропадет целиком и полностью. Кроме того, и «аппетиты» у APU AMD несколько выше, чем свойственно двухъядерным процессорам Intel. В общем, прямыми конкурентами они не являются, но, повторимся, если на первом месте производительность встроенной графики, то лучше по-прежнему обращать внимание именно на разработки AMD — новое поколение устройств от Intel отставание в этом вопросе сократило, однако далеко не до нуля, даже если отвлечься от разницы в цене.

Ну а в глобальном смысле прогресс нас, безусловно, радует. Особенно если говорить о базовом уровне производительности. Можно, конечно, в очередной раз пожурить Intel за некоторую неразбериху — ведь это уже четвертое графическое ядро с безликим названием «HD Graphics», но важнее то, что его производительность увеличилась в традиционные полтора раза. Это не делает HDG игровым решением, однако сам факт «подъема планки» уже хороший сигнал программистам. Да и выше порядка прибавилось — все-таки вплоть до Ivy Bridge включительно «основной» уровень графики Intel в настольном сегменте совпадал с «базовым»: самым массовым GPU был HDG 2500. Теперь же Core i3 отличает от Pentium не только поддержка Hyper-Threading, но и более мощная графика: как минимум HDG 4400, а уже это видеоядро лучше любого GPU Ivy Bridge. Пусть и не в полтора уже раза, но этот (и более высокий) уровень графических возможностей теперь получает каждый покупатель — за специальными моделями процессоров гоняться уже не нужно. Что, опять же, позволяет рассчитывать на более полную его утилизацию со стороны программистов.

И, разумеется, такое усиление графических возможностей младших процессоров — очередной гвоздь в гроб бюджетных дискретных видеокарт. Несмотря на то, что преимущество в производительности все еще сохраняется даже в «60-долларовом» сегменте, оно уже слишком невелико для того, чтобы покупать отдельное устройство, а не пользоваться «бесплатным» IGP. То есть практический смысл остается лишь у видеокарт ценой 100 и более долларов. Причем уже только для игрового применения — во всех остальных сферах интегрированная графика не хуже, и, главное, не хуже любая интегрированная графика, а не только считанные модели, как было два-три года назад.



Благодарим компании Corsair, «Ф-Центр» и Palit
за помощь в комплектации тестовых стендов



Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.