Intel 845G: Интегрированное графическое ядро и его конкуренты
«Берите пример с мужественного ковбоя, который,
когда его сбросит лошадь, снова вспрыгивает на нее,
а если она опять его сбрасывает, он опять карабкается ей
на спину, и так до тех пор, пока не отобьет себе все мозги.» Дейв Барри, «Супружество и/или секс».
Прежде чем обсуждать достоинства и недостатки графического ядра, интегрированного корпорацией Intel в чипсет 845G, следует, несомненно, определиться: какие требования мы вправе предъявлять к интегрированной графике?
Очевидно, что основная задача интегрированных решений справляться со стандартной (читай, двумерной) графикой в исполнении GDI Windows, под управлением популярных офисных приложений. Более того, разумно предположить, что экономичные ПК, построенные на основе материнских плат с интегрированными графическими решениями, будут комплектоваться соответствующими им по классу мониторами, а именно: любыми 15-дюймовыми или недорогими 17-дюймовыми моделями. Исходя из этого, разумно ограничиться сносной (без заметного падения производительности) поддержкой разрешения 1024x768 при глубине цвета 32 бита, достаточной четкостью сигнала и стандартной (соответствующей стандарту VESA) частотой кадровой развертки 85 Гц. Всех любителей большего на данный момент (до существенного падения цен на графические и профессиональные мониторы с диагональю 17 и 19 дюймов) мы будем отсылать к внешним графическим решениям на базе популярных чипов от Matrox, ATI, NVIDIA и иже с ними, удачные модели которых, даже в нижнем диапазоне цен (порядка 50 долларов), зачастую способны адекватно работать в 2D с разрешением 1280x1024@85 Гц и более.
Кроме того, заранее договоримся: в вопросах 3D-графики интегрированные решения могут не претендовать на какую-либо, кроме разумной (то есть не заставляющей ждать часами), производительность вообще. Бизнес-графика, визуализация и редкие игры после работы удовлетворятся на данный момент наличием поддержки API DirectX 7 и OpenGL 1.2 да производительностью, мало-мальски отличной от нуля. Постулируем, что на сегодняшний день такой производительностью обладают устаревшие решения уровня TNT2 и худо-бедно современные решения уровня GeForce2 MX200.
С точки зрения совместимости и беспроблемности функционирования, требования существенно возрастают: от интегрированного видео не избавиться, и наличие серьезных проблем с совместимостью с тем или иным приложением способно повлечь за собой дополнительные затраты на покупку внешнего графического решения с нуля.
Формулируя кратко всем этим требованиям встроенное в Intel 845G графическое ядро удовлетворяет. На этом, стало быть, статью можно и закончить :-).
Впрочем, у нас остался еще кое-какой материал и для тех, кому интересны не очень существенные для интегрированных решений подробности и сравнительный анализ производительности.
Участники сравнения
Вначале, как обычно, приведем список использованного оборудования для тестовых стендов и программный инструментарий.
Процессоры
Intel Pentium 4 2,2 ГГц, Socket 478
AMD Athlon XP 2100+ (1733 МГц), Socket 462
Материнские платы:
DFI NB76-EA (версия BIOS от 17/05/2002) на базе i845G
В первую очередь бросается в глаза недостаточный максимальный объем области памяти, отводимой под нужны интегрированного графического ядра 845G. Непонятно, что помешало разрешить чипсету использовать до 32 МБ памяти для непредвиденных трехмерных нужд. Ответ ничего не мешало. Реально, в BIOS задается только начальный объем памяти, отдаваемый под нужды основного буфера кадра и всяческих дополнительных (закадровых) буферов. При запуске 3D-приложений отданная графическому ядру память может динамически увеличиваться вплоть до объема в 48 МБ. Причем текстуры не будут копироваться в локальный буфер карты, как в случае внешнего графического решения, а будут адресоваться графическим ядром 845G напрямую, из области памяти текущего приложения.
Характеристики и спецификация
Теперь ТТХ в сравнении с современным да, именно современным бюджетным решением, так как сравнение с устаревшими внешними решениями оправдано только на поприще производительности, а с точки зрения возможностей мы должны четко представлять, что же мы все-таки теряем, выбирая более выгодное экономически и неприхотливое в обслуживании интегрированное графическое ядро:
Название карты
Intel 845G
GeForce 4 MX 420
Чип, ревизия, версия драйверов
Чип
845G
NV17
Ревизия
A3
Версия драйверов
6.13.01.3086
29.40
Основные параметры
Число конвейеров
1 (?)
2
Текстурных блоков на конвейер
2 (?)
2
Текстур за проход
4
2
Частота ядра, МГц
200, 266 (?)
250
Филрэйт (млн. пикселей)
200, 266 (?)
500
Филрэйт (млн. текселей)
400, 533 (?)
1000
RAMDAC, МГц
350
350*2
Параметры локальной памяти
Частота памяти, МГц
100, 133,166 (UMA)
166
Шина памяти, бит
64 (DDR)
128 SDR
Объем памяти, МБ
8
64
Скорость памяти, нс
5-8
5
Версия OpenGL
1.3
1.3
Версия DirectX
8.1
8.1
Ускорение GDI+
Да
Да
Пиксельный конвейер
Пиксельные шейдеры
Нет
Нет
Текстурных стадий
4
2
Комбинационных стадий
4
8
Multisampling
Нет
2,3,4 сэмпла
Bump mapping
DOT3
EMBM, DOT3
Число плоскостей отсечения
0
0
Вершинный конвейер
Вершинные шейдеры
Нет
1.1
Число потоков вершин
1
16
Число констант вершинного шейдера
Нет
96
Максимум матриц для блендинга
Нет
4
Индексированный блендинг
Нет
Нет
Число источников света
Нет (T&L отсутствует)
8
N-Patches
Нет
Нет
RT-Patches
Нет
Нет
Число примитивов
65536
65536
Число вершин
65536
65536
Прочие параметры
Pure Device
Да
Да
Размер спрайтов до
256
64
3D-текстуры
Нет
Нет
Карты отражения (среды)
Да (с анизотропией)
Да (с анизотропией)
Анизотропная фильтрация
Да
Да
Степень анизотропии до
2 би-/трилинейных выборки
2 би-/трилинейных выборки
Туман
FOGVERTEX FOGRANGE FOGTABLE
FOGVERTEX FOGRANGE FOGTABLE
Форматы сжатия текстур
DXTC1..5
DXTC1..5
Все на уровне, если не считать полного отсутствия какого-либо аппаратного T&L. Учитывая возможность успешной программной
эмуляции TCL и вершинных шейдеров, особенно на снабженных SSE2 процессорах семейства Pentium 4, стоит признать это решение
оправданным и даже в некотором роде модным (вспомним SiS Xabre). В свою очередь, о поддержке вывода на два монитора и полноэкранном сглаживании, в свете интегрированных решений, мы, пожалуй, даже не будем вспоминать. С другой стороны, стоит обратить внимание на отсутствие поддержки EMBM.
В наличии TDMS-трансмиттер для DVI и интерфейс для TV-Out, которые, при необходимости, мультиплексируются на выводы AGP-шины, если туда установлена специальная дочерняя интерфейсная карта. Но CRTC в графическом ядре один, и выводить, соответственно, можно только одно изображение. Отрадно отметить, что встроенное в 845G графическое ядро поддерживает GDI+, сглаживание линий, деинтерливинг и видеооверлеи, преобразование цветов, а также все распространенные методы сжатия текстур. В наличии аппаратная поддержка краевого сглаживания шрифтов. Ядро умеет параллельно и независимо выполнять 2D- и 3D-операции, что существенно ускоряет рендеринг для неполноэкранных (как правило, неигровых) 3D-приложений.
Напоследок приведем версию и список расширений OpenGL ICD:
Картина вполне симпатичная: в наличии практически все популярные возможности времен TNT2 и даже чуточку больше. Интересно,
является ли OpenGL-драйвер Intel собственной разработкой или приобретен (лицензирован) у одного из известных игроков
графического рынка? На подобные мысли наводит, например, следующее, отнюдь не обязательное ныне расширение: GL_3DFX_texture_compression_FXT1.
Тайлы, Зоны, Куски, Лоскуты, Кирпичики
А теперь самое интересное. Для увеличения эффективности работы с памятью (которая в случае UMA-архитектур особенно чувствительна
к «культуре» и интенсивности обращений) используется тайловый (!) подход к построению изображения. Intel называет это термином
Zone Rendering (зональное построение изображения), так как неудачно введенный создателями семейств PoverVR и Kyro термин «тайловая
архитектура» ранее (еще во времена Microsoft Talisman) означал нечто иное, нежели регулярное разбиение буфера кадра на одинаковые непересекающиеся зоны с раздельным последовательным построением изображения в каждой из них. Под черепицей (Tile) тогда подразумевались произвольные зоны с возможностью перекрытия. Видимо, для того чтобы избежать путаницы в терминологии, или для того чтобы не ассоциировать свое графическое ядро с не очень успешными творениями (Kyro), Intel решил использовать термин Zone Rendering. В результате чего большинство обозревателей и потребителей до сих пор не в курсе этой особенности архитектуры графического ядра, встроенного в 845G.
Итак, что же нам дает тайловая архитектура (далее будем называть ее по старой, пускай и порочной привычке) в случае интегрированного графического решения с общей памятью? Ответ множество преимуществ:
Cущественная экономия пропускной полосы памяти (доступ только к необходимым значениям текстур)
Значительная оптимизация самого характера доступа к памяти минимум переключений чтение-запись
Более низкие требования к тактовой частоте графического ядра
В свою очередь, основной проблемой тайловых архитектур является передача и сортировка треугольников. Однако в случае интегрированного решения, которому доступна вся системная память, в том числе и с хранимой в ней геометрией, эта задача может быть решена вполне успешно, особенно при наличии мощного центрального процессора. Да и узкое горло в виде AGP-шины на сей раз отсутствует у Intel встроенное в 845G графическое ядро обращается к контроллеру системной памяти напрямую, без использования какой-либо виртуальной AGP шины и моста. Это существенно снижает задержки доступа. В предельном случае графическому ядру доступна вся пропускная полоса системной памяти.
Для дальнейшей оптимизации доступа к памяти графическое ядро 845G снабжено емкими раздельными кэшами для текстур и геометрии, а также специальным индексным кэшем для ускорения привязки (сортировки) треугольников к тайлам. Как эти декларированные оптимизации сказываются на реальной производительности ядра мы увидим далее, сравнив результаты 845G с классическими интегрированными графическими ядрами.
В документации на 845G не приводится никакой официальной информации о конфигурации закрашивающих конвейеров чипа, однако следует учесть, что в случае тайловой архитектуры ситуация в этом вопросе может быть весьма неоднозначной. Например, при одних условиях чип может красить за такт N видимых точек, а при других M, и более того, это число может «плавать». С другой стороны, число значений текстур, выбираемых за такт, как правило, фиксировано даже у тайловых архитектур, и за этот параметр можно зацепиться. Забегая вперед отметим, что судя по результатам тестов (если дополнительно предположить, что графическое ядро 845G работает на синхронной с памятью частоте 266 МГц), число текстурных блоков два, а число закрашиваемых за такт точек одна. Но не забываем, что эта точка всегда видимая то есть при сравнении с классическими архитектурами необходимо умножать эту цифру на коэффициент перекрытия.
Производительность 3D, синтетические тесты
Тест на скорость заполнения:
Для сравнения здесь и далее мы будем приводить результаты GeForce2 MX400. В режиме с одной текстурой интегрированное в Intel 845G графическое ядро немного проигрывает MX400 в разрешении 800x600x16bpp и выигрывает в 1024х768х32bpp и это несмотря на меньшую пропускную полосу памяти! Сказывается отсутствие необходимости гонять во время закраски по шине значения глубины (Z). В случае с мультитекстурированием 845G на коне ко всему прочему, он способен накладывать четыре текстуры за проход, и это существенно лучше, чем две. Отметим, что даже в случае тайловой архитектуры в этом тесте рисуются все точки, а значит, в реальных приложениях мы вполне можем получить дополнительное преимущество в эффективном значении скорости закраски. Но это предположение мы проверим далее.
Теперь исследуем производительность геометрии:
Мощный центральный процессор не так уж плох в подобных задачах. На малом числе источников света он заметно проигрывает аппаратному T&L сказывается необходимость сортировки большого числа полигонов по тайлам, которую надо проделывать вне зависимости от числа источников света. Однако само освещение высокочастотный процессор рассчитывает куда как эффективнее геометрического блока GeForce2 MX, что и позволяет 845G идти практически вровень с последним при максимальном числе источников. Не будем забывать, впрочем, что в реальном приложении центральному процессору придется взять на себя и другие заботы.
Тест на производительность вывода спрайтов:
Тут MX400 вне конкуренции. Судя по всему, графическое ядро 845G от Intel не имеет специальных аппаратных средств для быстрого вывода спрайтов (отметим, что спрайты сами по себе не лучшая форма оптимизации вывода для подобной тайловой архитектуры). В результате каждый из множества спрайтов превращается в два полноценных треугольника. Затем все полученные треугольники необходимо отсортировать, и именно эта задача вызвала наибольшую заминку по ходу прохождения теста.
Производительность исполнения вершинных шейдеров:
Оба претендента не поддерживают вершинные шейдеры аппаратно, они эмулируются центральным процессором системы. Но в данном случае MX400 не требует от CPU еще и сортировки полигонов, в результате заметно вырываясь вперед.
DOT3 рельеф:
В случае 16-битного цвета MX400 выполняет эту задачу существенно быстрее, но 32-битная глубина цвета практически уравнивает шансы тайловой архитектуры 845G менее требовательной в этом вопросе к полосе пропускания памяти.
Подводя промежуточный итог по синтетическим тестам, отметим, что решение 845G от Intel демонстрирует сравнимую c MX400 или чуть меньшую производительность. Посмотрим, как будут обстоять дела с комплексными (реальными) тестовыми задачами. Судя по всему, высокая нагрузка на центральный процессор в случае тайловой архитектуры ухудшит показатели 845G.
Производительность 3D, игровые тесты
Для начала посмотрим на итоговые результаты теста 3DMark 2001 SE в режиме программного T&L (ввиду отсутствия аппаратной реализации оного у 845G):
По абсолютным цифрам решение от Intel звезд с неба в данном тесте не хватает (как раз на уровне MX200), но на фоне других интегрированных решений выглядит неплохо. Посмотрим внимательно: результат SiS 650 слабее, а у обоих чипсетов VIA, снабженных интегрированным ProSavage, значительно слабее, чем у 845G. Изо всех «интегрантов» лидером является nForce, но не будем забывать, что и стоят решения на нем зачастую ничуть не дешевле сравнимой по производительности связки 845G+MX200 или даже более производительной, с MX400. Кроме того, как ни крути, nForce существует только для Socket A, и какое-либо сравнение 845G с ним может представлять лишь академический интерес.
Для любителей подробностей приведем результаты индивидуальных тестов:
Взаимная расстановка сил сохраняется, за исключением небольшого преимущества 845G над MX200 в режимах с низкой детализацией меньшая нагрузка на центральный процессор со стороны теста позволяет развернуться тайловой архитектуре. Разумеется, более мощный центральный процессор потенциально позволит еще сильнее сократить отрыв от MX400. Более подробно расшифровку специфики каждого из тестов можно посмотреть в следующих статьях: «MadOnion 3DMark2001 и NVIDIA GeForce3 любовь с первого взгляда» и «Обзор NVIDIA GeForce4 Ti 4400 и 4600».
Теперь посмотрим, как обстоят дела с OpenGL. Говорим OpenGL подразумеваем самое массовое использование оного в качестве API для распространенных игр на базе движка Quake3:
С точки зрения ускорителей поколения GeForce2, движок Quake3 сбалансирован практически идеально. Неудивительно, что расстановка
сил не только остается той же самой, что и в суммарном результате теста 3DMark 2001, но и не меняется при разной глубине цвета.
Картина сохраняется: впереди MX400, затем nForce, затем интегрированная графика Intel 845G, затем SiS 650 и, наконец, два явных
аутсайдера на базе ядра ProSavage. Но здесь важно скорее не это, а факт вполне «играбельных» FPS при разрешении до 800x600x32bpp включительно. Что, в определенной степени, способствует развенчанию скепсиса по поводу 3D-способностей интегрированных (читай, минимальных) решений.
Теперь более современный тест в лице RtCW:
Та же картина, но 845G несколько «подсдал» по сравнению с MX200 в режиме с 32-битной глубиной цвета. Больше эффектов?
Итог достаточно мажорен: играть в популярные массовые игры в умеренных разрешениях возможно (разумеется, после работы) даже в офисе, оснащенном лишь интегрированными видеорешениями на базе 845G.
Профессиональная графика
Для профессионалов своего дела приведем результаты SPECviewperf (все-таки подобные задачи визуализации вполне могут встретиться и в офисной работе, например, у экономистов):
Интересно отметить четкое преимущество 845G в некоторых подтестах даже над MX400. Сказывается как отсутствие «бутылочного
горлышка» при передаче геометрии и атрибутов (AGP), так и достаточно качественный OpenGL-драйвер. Впрочем, не стоит забывать,
что при построении изображения этот тест использует «дедовские» методы, и в случае менее консервативных, использующих новые расширения OpenGL приложений (в том числе, неигровых) весы легко могут склониться в пользу GeForce2.
Влияние интегрированной графики на обычные приложения
Оно есть, его не может не быть. Но давайте посмотрим более конкретно.
Внимание! Не следует забывать, что значения для платформ на базе nForce и второго интегрированного чипсета VIA KM266 получены с использованием другого процессора и приводятся только для сравнения общего потенциала тестируемых платформ.
Для разминки задача по кодированию MPEG4:
Как видите, при включении интегрированной графики 845G проседает на 3%, в итоге почти сравнявшись по показателям с SiS 650. Творение VIA отстает от них на одну минуту.
Теперь серьезный тест SYSmark, вполне напоминающий интенсивную работу реального пользователя:
Как видите, взаимная расстановка сохранилась, но на сей раз различия существенно менее заметны как между чипсетами различных производителей, так и между интегрированным и неинтегрированным вариантом 845G (особенно это заметно в тесте Office Productivity здесь отличие лежит в пределах погрешности).
Напоследок тест на основе архиватора WinAce:
Теперь уже около 8% разницы между интегрированным и внешним видео на 845G, картина в целом остается прежней, но серьезно отстал чипсет SiS, который теперь вместе с обоими чипсетами VIA показывает примерно 1520-процентное отставание от «основных сил».
Подводя очередной промежуточный итог, отметим, что в подобных задачах потеря 5% производительности не самый веский повод сожалеть о существенной сумме, сэкономленной на массовой закупке офисных ПК :-).
Скорость и качество 2D
Скорость 2D как обычно опишем одним емким словом «достаточна». По крайней мере, в выбранном нами типичном
разрешении 1024x768x32bpp@85 Гц каких-либо мало-мальски заметных проблем она не создает. Качество 2D-сигнала в этом разрешении
на уровне средней GeForce3, что (внимание!) не так мало, даже для внешних 2D-карт нижнего ценового диапазона (порядка 50 долларов). Максимальное
допустимое паспортное разрешение выше, но работать с платами на базе 845G (по крайней мере, теми экземплярами, что побывали в
нашей лаборатории) в разрешении больше 1280х1024х32bpp@85 Гц не имеет никакого практического смысла изображение будет
заметно «мылить».
Заключение
Интегрированная в 845G графика успешно опережает своего прямого конкурента SiS 650, и тем более своего «не очень законного» соперника VIA P4M266.
На этом (пока) претенденты на роль массового интегрированного решения для Pentium 4 заканчиваются. Поздравим Intel с успешным ходом, призванным распространить системы на базе Pentium 4 во все, в том числе и в офисную, ниши рынка.
В свете вышесказанного интересно отметить факт (возможно, случайное стечение обстоятельств), что компания, обладающая потенциальной возможностью создать в скором времени в разы более производительное интегрированное решение для Pentium 4 (NVIDIA), лицензии на оное пока не получила. А вот слабой в этом вопросе SiS разрешение было высочайше пожаловано (впрочем, с выходом интегрированного варианта Xabre ситуация может поменяться, но судя по недавно исследованному в нашей лаборатории Xabre 400 не слишком радикально) Для полноты картины осталось подождать интегрированного решения на базе Xabre и чипсета от ATI с графическим ядром Radeon.
На данный же момент на платформе Pentium 4 Intel «царь горы». Что ж, никто и не сомневался
Системная плата Gigabyte 7VKML предоставлена компанией «ELST»
Системная плата Jetway P4MFA предоставлена компанией «ELKO»
Системная плата MSI MS6533 предоставлена компанией «Neo Group»