Графика: быстрая, медленная и интегрированная

Часть 18: Intel HD Graphics 4000 в разном окружении и влияние последнего на производительность первого


Процессоры на базе микроархитектуры Ivy Bridge появились еще год назад, так что все, кто хоть немного следит за этой темой, знают: как называется старшее видеоядро, встроенное в настольные Core i7. Правильно — Intel HD Graphics 4000. А если спуститься чуть ниже в табели о рангах где-то так до уровня Core i3, то что мы там найдем? В большинстве моделей Intel HD Graphics 2500, но вот в i3-3225 и недавно анонсированном 3245 — все тот же HDG 4000. В ноутбучных же моделях — тоже он, причем во всех поголовно (за исключением Celeron и Pentium, считающихся отдельно от категорий Core): от экстремального i7-3940XM (четыре ядра с частотой до 3,9 ГГц, TDP 55 Вт), до планшетного i3-3229Y (два ядра с частотой 1,4 ГГц, TDP 13 Вт). Но одинаковое ли это видеоядро? В случае дискретных видеокарт вопрос бы лишен смысла: таковую можно установить в компьютер с любым процессором (по крайней мере, теоретически). С интегрированным же решением все сложнее. Во-первых, даже при беглом взгляде заметна разница в максимальной частоте работы GPU, причем диапазон крайне широк — от 850 МГц (как раз i3-3229Y) до 1,35 ГГц (i7-3940XM), т. е. различается более чем в полтора раза. Во-вторых, речь идет не о каких-то фиксированных частотах — еще в первом поколении Core GPU мобильных процессоров начали использовать технологию Turbo Boost, причем она же применяется и для процессорных ядер. К чему это приводит? Частота и тех, и других меняется динамически, причем зависит как от нагрузки на CPU и GPU, так и от того, в какой теплопакет в конечном итоге нужно «уложиться». В общем, заранее все непредсказуемо, но бытует предположение, что мобильная графика, пусть и называется так же, как настольная, но работает медленнее.

Одной лишь частотой GPU разнобой в конечных системах не ограничивается. Даже на рынке дискретных видеокарт начального уровня их конечные характеристики отданы на откуп производителям, и разработчиком самого видеопроцессора никак не контролируются. Расхождение с официальными ТТХ может быть приличным, что мы недавно наблюдали: четыре(!) из пяти видеокарт Palit несколько (это мягко говоря) отличались от того, что было задумано NVIDIA. Причем несложно заметить, что основные отличия касались даже не частот чипа, а системы памяти. Однако такое вполне возможно и в случае интегрированной графики, тем более что в данном случае память редко бывает распаянной на плате. Соответственно, возможны варианты. Например, «официальная» DDR3-1600 или более медленная DDR-1333 — какие модули производитель (или пользователь) решит использовать, такие и будут. Но это, по крайней мере, как-то поддается ручной настройке, а вот если производитель решит установить всего один слот SO-DIMM (чаще всего таким «грешат» недорогие модели ультрабуков, однако не только они), получим совсем другой уровень производительности графического ядра, несмотря на то, что в характеристиках компьютера все равно будет указано «Intel HD Graphics 4000».

Можно ли протестировать все варианты и дать однозначный ответ: что каждый из них собой представляет? Можно, но сложно — количество возможных конфигураций конечно, но велико. Да и не слишком интересно этим заниматься: давно известно, что HDG 4000 даже в «лучшем виде» не является полноценным игровым решением, а вот для решения большинства прочих задач, как правило, достаточно и более старых и слабых GPU — вплоть до HD Graphics процессоров Celeron на ядре Sandy Bridge. C другой стороны, можно попробовать оценить примерный диапазон, куда должно попадать большинство решений — это уже не так сложно. Да и в процессе самых разных тестирований нами некоторый набор полезной информации накоплен. Во всяком случае, получилось так, что за последнее время с использованием одной и той же версии драйверов (что в этом случае актуально) нами было протестировано для разных целей пять различных конфигураций компьютеров, имеющих как раз искомую графическую подсистему. Таким образом, в данной статье мы просто соберем результаты вместе и попробуем оценить влияние разных факторов на производительность графического ядра Intel HD Graphics 4000.

Конфигурация тестовых стендов

Диапазон потенциально-возможных тактовых частот мы уже указали выше — от 850 МГц в процессорах Y-серии до 1350 МГц в Core i7 Extreme Mobile. Таким образом, наиболее правильным с точки зрения теории подходом было бы взять две системы: на Core i3-3229Y (ниже некуда) и Core i7-3940XM (выше не бывает) и протестировать их с разными конфигурациями памяти — как минимум, один и два канала, а как максимум еще и с разными частотами. Что на практике неосуществимо. Во-первых, найти что-нибудь на Y-процессоре все еще сложно: такие модели появились совсем недавно, так что большинство планшетов в торговых сетях комплектуются более привычными U или даже М Core. Во-вторых, в поисках большого смысла все равно нет: конструкция планшета не предполагает под собой гибкого конфигурирования системы памяти — здесь как раз можно и «нарваться» на распаянные на плате модули памяти и/или неустранимую одноканальность. В-третьих, и на верхнем крае не все гладко — топовые ноутбуки описанных выше проблем лишены, однако процессоры семейств что ХМ, что QM (где максимальная частота графики составляет 1,3 ГГц) как правило, встречаются в продаже исключительно в паре с дискретными видеокартами, которые еще и не всегда можно отключить. C другой стороны, это приводит и к тому, что крайние варианты тестировать просто не нужно — раз вероятность встречи с ними на практике нулевая или (в случае Y) все равно никаких возможностей выбора нет.

Процессор Core i3-3217U Core i5-3317U Core i7-3517U Core i7-3770S Core i7-3770K Core i5-3570S
Название ядра Ivy Bridge DC Ivy Bridge DC Ivy Bridge DC Ivy Bridge QC Ivy Bridge QC Ivy Bridge QC
Кол-во ядер/потоков вычисления 2/4 2/4 2/4 4/8 4/8 4/4
Частота ядра (std/max), ГГц 1,8 1,7/2,6 1,9/3,0 3,1/3,9 3,5/3,9 3,1/3,8
Кэш L3, МиБ 3 3 4 8 8 6
Оперативная память 2×DDR3-1333 1×DDR3-1333 2×DDR3-1600 2×DDR3-1333 2×DDR3-1600 2×DDR3-1333
Частота видео (std/max), МГц 350/1050 350/1050 350/1150 650/1150 650/1150 650/1150
TDP, Вт 17 17 17 65 77 65

А вот диапазон 1,05-1,15 ГГц, напротив, крайне интересен тем, что в него укладывается большинство возможных вариантов. Несложно заметить, что три из пяти конфигураций нами уже тестировались — сегодня просто относящиеся к видео результаты будут «развернуты». И дополнены еще двумя реализациями — в процессорах Core i7-3770S и i7-3770K. Тактовая частота видеоядра — типичные для многих Core i7 1,15 ГГц, но две разные частоты памяти. Плюс огромный разброс в плане процессорной производительности — посмотрим: как может на результаты графики повлиять она. И для сравнения мы добавили результаты одного процессора с HDG 2500, но мощной процессорной частью — вдруг окажется, что ультрамобильные решения, несмотря на топовую (формально) графику все равно существенно медленнее. При равенстве-то процессорной части такого, разумеется, не наблюдается, а вот при такой разнице — все может быть.

И немаловажным моментом является разный уровень TDP тестируемых процессоров, благо пять из шести поддерживают технологию Turbo Boost для процессорных ядер и все — для GPU. Почему это важно? Можно вспомнить, что в наших тестах энергопотребления подача нагрузки на GPU увеличивала его для Core i7-3770K на 17 Вт. Естественно, многое зависит от конкретного экземпляра процессора, тем более, что разные серии подвергаются по этому параметру отбору разной степени жесткости — там же мы видели и 20 Вт от HDG 2500 в бюджетном i5-3450. Но сам по себе порядок величины понятен и, в общем-то, не мал — двухъядерные процессоры U-серии ограничены теми же 17 Вт на весь процессор. Да и 12 Вт официальной разницы между 3770S и 3770К тоже обязаны сказаться на работе Turbo Boost при использовании процессора «целиком», а, значит, и на производительности.

Aliens vs. Predator

Как мы уже не раз писали, никакая интегрированная графика эту игру в таком режиме не вытягивает, так что получаем чистый стресс-тест видеоядра, работающего на пределе своих возможностей. Причем ограничителем этих возможностей может оказаться все, что угодно: очень показательно равенство результатов Core i3-3217U и i7-3517U — несмотря на потенциальные отличия, обе модели «уперлись» в равное TDP. Но хорошо прослеживаются два качественных эффекта — во-первых, одноканальная память даже для процессоров U-семейства смерти подобна (что это верно для топовых моделей, мы уже убеждались ранее), а во-вторых, даже в таком режиме HDG 4000 все равно быстрее, чем 2500.

В низкокачественном режиме можно уже даже попробовать и поиграть, причем на любом из испытуемых. Но по-разному: низкочастотный двухъядерный процессор с одноканальной DDR3-1333, но с HDG 4000, как оказалось, подходит для этого практически в той же степени, что и одна из старших настольных моделей с HDG 2500! Несмотря на то, что в таком режиме и процессору находится работа — недаром на первых местах два четырехъядерных Core i7. Вот между ними разница уже относительно невелика, несмотря на то, что одна модель — вообще топовая и работающая с более быстрой памятью, а вторая — энергоэффективная. 3217U и 3517U намного медленнее, хотя и в их случае некоторый запас производительности, способный позволить чуть-чуть улучшить качество картинки, есть.

Batman: Arkham Asylum GOTY Edition

Относительно старый и «легкий» графический движок «нагружает» GPU в меньшей степени, зато имеет повышенные требования к процессорной составляющей благодаря хорошей многопоточной оптимизации. В результате настольные Core i7 уже «вытягивают» качественный режим, а ультрамобильные процессоры лишь близки к этому уровню. Но очень близки, так что при небольшом снижении качества могут выйти и на «играбельный» уровень. Если, конечно, не «зажимать» систему памяти — в одноканальном режиме HDG 4000 низводится почти до уровня 2500. Но, кстати, не ниже — i5-3570S обогнал i5-3317U только за счет «полноценных» четырех ядер на более высокой тактовой частоте и вдвое большего объема кэш-памяти третьего уровня.

При минимальном качестве все превращается в соревнование процессоров. Что тут стоит отметить, так это то, что подобные настройки, как видим, до сих пор нельзя назвать совсем уж неактуальными — это для топовых процессоров с интегрированной графикой частота кадров начинает «зашкаливать» за порог достаточности, но ведь тестировать приходится не только их. На моделях для неттопов и ультрабуков же FPS высокий, однако не сказать, чтоб «избыточный».

Crysis: Warhead x64

Очередной стресс-тест, где хорошо заметна, во-первых, полная некомпетентность что систем с одноканальной памятью, что HDG 2500, а во-вторых, что процессорная составляющая даже в таких условиях все равно имеет значение, сказываясь на итоговой производительности. С другой стороны, в первую очередь, все же, GPU, а потом все остальное.

В том числе — и в потенциально пригодных для практического использования (если, конечно, кому-то составляет удовольствие любоваться на такую картинку) видеорежимах. Во всяком случае, Core i7-3517U таки сумел обогнать Core i5-3570S благодаря преимуществу в графической составляющей, несмотря на принципиально-разную процессорную.

F1 2010

Как мы уже не раз писали, одинаковая частота кадров в этой игре не значит ничего, если она равна 12,5 FPS — особенности игрового движка, пытающегося удерживать ее на таком уровне, отбрасыванием несущественного (по его мнению).

В низком качестве уже иногда можно поиграть на HDG 4000, однако, как видим, для этого нужен как минимум Core i7-3517U (в своем классе далеко не худший, мягко выражаясь, и не дешевый), причем снабженный двухканальной памятью с частотой 1600 МГц. Невыполнение любого из этих условий чревато последствиями. Превышение — изменит картину в меньшей степени, чем размер превышения :)

Far Cry 2

Быстродействия HDG 4000 по-прежнему не хватает и на эту старую игру (что давно не новость), но в меньшей степени, нежели для Crysis или AvP, конечно. Немудрено, что производительность старшего и младшего из протестированных процессоров различается в полтора раза. С другой стороны, с точки зрения житейской мудрости мы бы не удивились и большей разнице — все-таки слишком сильно различаются CPU-части. Можно даже сказать, принципиально и по всем параметрам.

А в режиме минимального качества как раз она выходит на передний план. И самым любопытным результатом является то, что Core i3-3217U даже в этом случае не смог дотянуться до порога комфортности. Т. е. эта игра почти пятилетней давности до сих пор ни в коем виде не поддается не только Atom или Brazos, но и вообще очень многим платформам повышенной экономичности. И неважно — с интегрированным ли видео или с любой дискреткой: недостаточно производительности и самой процессорной части. Так что прогресс — прогрессом, а определенный минимум системных требований обеспечивать нужно. С чем, как видим, и старшие CULV-процессоры справляются без особого запаса прочности, а младшие — не справляются вообще (интересно будет посмотреть, как с этим дела обстоят у Kabini и младших Haswell). В общем, «свеженький» планшет или бюджетный ультрабук вовсе не обязательно позволит играть даже в очень старые игры и даже «на минималке».

Metro 2033

Возвращаемся к истокам в виде первой диаграммы — понятно, что ни одного из испытуемых не достаточно для качественного режима этой игры, причем принципиально недостаточно. Но влияние ТТХ на производительность видно очень хорошо, так что мы не будем расписывать все подробно — несложно сделать все выводы и самостоятельно.

Метро 2033 появилась на полтора года позже, чем FC2, так что и минимальные требования к оборудованию у игры выше. Справедливости ради — и сам по себе режим «плинтусного»  качества имеет куда более высокое качество :) Минимум для него — Core i3-3225, т. е. чтобы хоть как-то поиграть в эту игру, нам нужен процессор с частотой выше 3 ГГц и HDG 4000, причем оба условия являются существенными. HDG 2500 игру «не вытянет» даже с такими настройками, независимо от процессора. А слабенькие модели с любой графикой с ней не справятся именно потому, что слабенькие.

О последнем советуем задуматься многим покупателям ноутбуков ;) Во-первых, в свете данных тенденций несколько странно начинают выглядеть попытки некоторых производителей комплектовать свою продукцию на CULV-процессорах дискретными видеокартами. В частности, нам встречались модели на Core i3-3217U в паре с GeForce GT 740M. Последняя видеокарта — очередной пример переименований и оптимизаций, поскольку представляет собой практически все тот же давно знакомый многим 640М, но с немного увеличенными частотами. Не бог весть что, конечно, но потенциально в пару раз быстрее, нежели тот же HDG 4000. Однако, как видим, «процессоронезависимость» игр имеет свой предел, особенно когда речь идет о более-менее современных проектах, т. е. вот для Metro 2033 уже мало низковольтных двухъядерных моделей. Таким образом, конфигурация, подобная указанной, позволит пользователю, разве что, увеличить качество картинки в старых играх, но не поиграть (хоть как-то) в новые — согласитесь, это не то достижение, ради которого есть смысл платить за дискретную графику.

Вторая проблема — из той же области: компания AMD не устает повторять что, хоть у ее APU и ниже производительность процессорной части, зато графика мощнее, чем у Intel. Как видим, всему есть пределы — в том числе, и слабой зависимости результатов от процессора. А тут еще и партнеры масла в огонь подливают, добавляя к какому-нибудь A8-4555M (которому хотя бы встроенный GPU прокормить) дискретную видеокарту на чем-нибудь типа Radeon HD 7550M/8550M. Спору нет — Dual Graphics иногда является единственным способом повысить производительность графической подсистемы, однако это актуально только тогда, когда именно ее не хватает. Как видим, в низкопотребляющем сегменте возможно не только такое.

Сводные результаты

Попробуем оценить ситуацию в общем и целом, а также посмотреть не только на игры, для чего воспользуемся диаграммами со средними результатами по группе тестов/приложений (детально с полной методикой тестирования вы можете ознакомиться в отдельной статье). Результаты на диаграммах приведены в баллах, за 100 баллов в данной статье принята производительность Core i3-3217U как самого медленного из протестированной четверки процессоров. Тем, кто интересуется более подробной информацией, опять-таки традиционно предлагается скачать таблицу в формате Microsoft Excel, в которой все результаты приведены как в преобразованном в баллы, так и в «натуральном» виде.

Итак, начнем с игр. Сразу видно, что одноканальный режим работы памяти мгновенно отбрасывает HDG 4000 на уровень 2500 и прочих подобных решений, так что для практического использования не слишком актуален. В нормальных же условиях разница результатов составляет 33%. С одной стороны — много, с другой — тут все разное. Даже TDP в 4,5 раза отличается. А вот если такой свободы не давать, и память типа DDR3-1333 одинаковую использовать, то и 15% не набирается. Что легко объяснимо — все-таки само по себе видеоядро одинаковое (с поправкой на влияние теплопакета на его реальную тактовую частоту), а с учетом его мощности, тяжелые игровые приложения являются стресс-тестом именно его в первую очередь.

Но на практике, как мы уже видели, в таковых условиях частота кадров практически повсеместно слишком низка для использования, так что более актуальными являются режимы с сниженным качеством графики. Для очень многих решений — сниженным до минимума: этот режим слишком легкий для топовых решений, но CULV-процессоры даже в нем, как видим, не всегда справляются. И вот тут-то уже зависимость результатов от процессорной части видна невооруженным глазом, так что 33% превращаются в 128% — комментарии излишни. Причем, отметим, «нормальный настольный» процессор с HDG 2500 обходит даже CULV Core i7 (3517U, конечно, младшая модель, однако и старший 3687U отличается только повышенной на 10% максимальной тактовой частотой, чего вполне может и не хватить), однако в полтора раза отстает от «нормального настольного» процессора с HDG 4000.

Если бы эта нагрузка была многопоточной, скорее всего, получили бы мы разброс результатов как в предыдущем случае, а так «всего» 1,87 раза. Но расклад внутри — иной: разницы между HDG 2500 и 4000 практически нет. Немудрено и что режим работы памяти сказывается, но слабо — более высокая тактовая частота процессора эту разницу с лихвой перекрывает.

Во времена GMA и первых версий HDG эти результаты тоже зависели от видеоядра, однако теперь, как видим, перестали. Что ж — мы учтем это при разработке следующих версий тестовых методик :)

Итого

Итак, как и следовало ожидать, мы подтвердили зависимость производительности интегрированных графических решений от процессоров, в которые они интегрированы. Впрочем, заметим, не всегда такую уж сильную. Как и следовало ожидать, когда нагрузка ложится именно на GPU, большой разброс результатов можно обнаружить лишь при сравнении процессоров с принципиально разным теплопакетом, поскольку он сказывается и на частотах графического ядра. Но подобные режимы гарантированно оказываются слишком «тяжелыми» не только для IGP, но и для младших моделей дискретных видеокарт, так что для того, чтобы поиграть на них на практике (а не просто посмотреть слайд-шоу), приходится снижать качество картинки, т. е. уменьшать нагрузку на GPU и увеличивать — на CPU. Пока последние относятся к одному классу, определяющей продолжает оставаться мощность собственно графического ядра (что мы уже наблюдали на примере настольных решений, где пара высокочастотных ядер и запас по TDP позволяли развернуться тому же HDG 4000 в полную меру своих слабых сил и в паре с отличающимися процессорами), но вот ожидать одного и того же уровня производительности от ультрабучного и настольного процессоров уже не стоит. В принципе, сложно было бы предполагать обратное, однако в точности убедиться в том, что положение дел именно таково, никогда не лишне. Любовь одинаково именовать похожие архитектурно, но разные по производительности решения началась, конечно, не с Intel, однако в большинстве случаев производители все же хоть как-то намекают на наличие разницы. Да вот и сама компания такой же практики придерживается в системе наименования процессоров — давая им непересекающиеся номера и не забывая в конце дописать буковку «М» или «U», иногда резко сказывающуюся и на номере семейства (избитый пример: подавляющее большинство настольных Core i5 относится к четырехъядерным процессорам, но все Core i5-M — лишь двухъядерные). А с графикой даже такой ясности нет: можно судить лишь по косвенным признакам — типа названия процессора, куда она встроена.

Есть ли надежды на прекращение получающегося бардака в будущем? Может быть, в отдаленном, но точно не в ближайшем поколении процессоров. То есть мы, конечно, не сомневаемся, что Iris 5100 — более производительный GPU, нежели HDG 4600. Однако позволит ли это играть на Core i7-4558U (двухъядерный SoC с TDP 15 Вт) с бо́льшим комфортом, нежели на Core i7-4700HQ, не говоря уже о старшем настольном Core i7-4770K (четырехъядерные процессоры, еще и обгоняющие 4558U по тактовой частоте и менее «зажатые» теплопакетом) — вопрос открытый. А уж полное равенство процессоров с называющимся одинаково интегрированным GPU — тем более сомнительно. Однако в точности разобраться с этими вопросами без непосредственного тестирования невозможно, а это уже тема совсем других тестирований.



Благодарим компании Corsair и Palit
за помощь в комплектации тестовых стендов



Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.