Планшеты на Intel Atom и Windows 8, часть 6

Новое в архитектуре Silvermont процессоров Intel Atom Z3xxx: что ждет нас в тонких, легких и недорогих планшетах на Windows 8 в 2014 году


Данный материал состоит из нескольких частей: общей части, посвященной платформе Intel Atom Z2760 и особенностям конфигурации планшетов на ее основе, тестирования трех устройств на Z2760 (Hewlett-Packard Elitepad 900, Lenovo Thinkpad Tablet 2, Hewlett-Packard Envy X2), общих выводов по поводу платформы и устройств, а также рекомендаций по выбору. В этой части мы расскажем об архитектуре и примерной производительности нового поколения Intel Atom.

Основной недостаток планшетов на Intel Atom с архитектурой Saltwell (т. е. Z2760 и аналогичных) — крайне низкая производительность, причем она портит жизнь в течение всего срока эксплуатации устройства. Впрочем, на тот момент у производителей, которые хотели бы выпустить тонкие и легкие планшеты с ОС Windows 8, просто не было выбора — либо эта платформа, либо ничего.

Сейчас Intel уделяет мобильным энергоэффективным системам гораздо больше внимания, и архитектура Silvermont для новых поколений Intel Atom выглядит очень интересно. Хотя основное направление развития — смартфоны и планшеты на платформе Google Android, планшеты на платформе Atom с ОС Windows 8 на рынке обязательно останутся. В скором времени мы представим результаты практического исследования производительности новой платформы с ОС Windows 8, а пока посмотрим на основные изменения в архитектуре, за счет которых может быть доcтигнут прирост скорости.

Напомню, что новое поколение Atom, платформа Bay Trail и архитектура Silvermont стали одной из центральных тем сентябрьского Intel Developer Forum 2013 в США.

Ну а мы начинаем знакомство.

Основные особенности и новшества Atom 3xxx (архитектура Silvermont)

Несмотря на то, что новые процессоры на архитектуре Silvermont должны относиться к линейке Atom, слово «Atom» на рынке ПК мы больше не увидим: новые процессоры на архитектуре Silvermont и с ОС Windows будут выходить под брендами Celeron (двухъядерная версия) и Pentium (четырехъядерная). Товарный знак «Atom» будет применяться только для мобильных систем под Android и планшетов с Windows и процессорами серии Z.

Таким образом, низкопроизводительные линейки Intel тоже, видимо, ждет перетряска, но сейчас не будем об этом.

Забавно отметить, что линейка Pentium докатилась уже до использования процессоров класса Atom, которые по иронии судьбы вплоть до последнего перед Silvermont поколения использовали доработанную архитектуру аж Pentium I. Вот с архитектуры и начнем.

Архитектура, техпроцесс

Новый Atom (описание на сайте Intel) производится по техпроцессу того же уровня, что и Haswell, т. е. 22 нм. Правда, по своему варианту, P1271 с транзисторами FinFET, который предназначен для однокристальных систем (SoC). Кстати, по этому же техпроцессу выпускается и Crystalwell. Более тонкий техпроцесс должен снизить уровень выделения тепла и потребления энергии новых Atom.

Судя по всему, возросшая энергоэффективность — одна из причин, позволившая уместить четыре полноценных ядра х86 в маленькой однокристальной системе, предназначенной для мобильных устройств типа планшетов.

В новом поколении сохранилась интересная особенность линейки Atom и главное отличие от всех остальных процессоров Intel: декодеры Silvermont не транслируют инструкции в µops (микрооперации), а продолжают использовать в исполнительном тракте по сути х86-инструкции без кардинальных изменений. Другими словами, если современные десктопные процессоры являются CISC-процессорами с RISC-ядром, то Silvermont, как и Saltwell, остается CISC-процессором. Эта особенность Atom возникла благодаря тому, что его архитектура ведет свою родословную от Pentium I. А так компания Intel уже очень-очень давно отказалась от чистого CISC-ядра, начиная с процессоров Penium Pro (1995) и Pentium II (1997).

Представители Intel иногда говорят, что архитектура нового процессора «разработана с нуля». Это, скорее всего, поэтическое преувеличение, но то, что она претерпела серьезнейшие изменения, — очевидно. Сравним особенности старой и новой архитектуры:

  Saltwell (z2760) Silvermont (z3770)
Техпроцесс, нм 32 22
Внеочередное исполнение (Out-of-Order Execution) есть
HyperThreading есть нет
Количество ядер/потоков, шт 2/4 4/4
Частота, ГГц 1,8 2,39 (1,45)

Главным изменением в архитектуре (помимо более тонкого техпроцесса) стало то, что Silvermont — это процессоры с внеочередным исполнением команд, в отличие от Atom предыдущего поколения (Saltwell). Благодаря этому процессор получил возможность переупорядочивать инструкции в очереди на исполнение. Это не только позволяет более равномерно загружать исполнительные устройства процессора, но и снижает зависимость производительности от программного кода, так как процессор может исполнять инструкции в произвольной последовательности. Уже только поэтому можно ждать серьезного роста производительности.

Кроме того, у Silvermont короче конвейер, поэтому при неправильном предсказании «штрафных» тактов здесь будет 10, а не 13, как у Saltwell. Это также позволяет увеличить эффективность на мегагерц частоты, но может немного снизить максимальную частоту работы.

Внеочередное исполнение инструкций требует очень большой перестройки внутренней структуры процессора, т. е. внутренняя организация блоков в Silvermont должна была претерпеть серьезные изменения по сравнению с Saltwell.

Впрочем, на этом важные усовершенствования не заканчиваются. В Silvermont вместо двух ядер с технологией Hyperthreading мы получили четыре полноценных ядра. Судя по косвенным цитатам из выступлений представителей Intel, Hyperthreading пришлось выкинуть, т. к. в маленьком кристалле для компактных мобильных устройств не удалось уместить четыре ядра с HT. Однако почему тогда не оставить старую схему 2 ядра/4 потока? Ведь раньше в Intel стремились использовать Hyperthreading везде, где можно. Тому может быть много причин: и ориентация на Android, где четыре полноценных ядра предпочтительнее двух, и маркетинг… И новая модульная архитектура. Вот она:

У Silvermont ядра процессора сгруппированы в блоки по два с общим кэшем L2, и таких блоков может быть несколько (до четырех). Вот такая интересная модульная структура, которая позволяет легко нарастить мощность процессора, добавив дополнительный блок из двух ядер.

Burst mode

Все современные модели процессоров Intel имеют динамическое управление частотами. Для процессоров Intel Atom эта технология носит название Burst mode. Суть ее примерно в том же, что и Turboboost: если нагрузка приходится лишь на несколько блоков, управление частотами может перераспределять имеющийся резерв по отводу тепла, поднимая частоту загруженных блоков, что позволит им быстрее выполнить задачу. Intel говорит о технологии «всплеска» (burst), которая позволяет повысить частоту с 1,45 ГГц до 2,4 ГГц, а помимо того, TDP может перераспределяться между центральным процессором, графикой и периферийными блоками.

Как обычно, управление ресурсами — довольно тонкий момент, и без практического исследования довольно сложно определить, что и как будет работать в реальных задачах. Скорее всего, получится как в последних поколениях Intel Core с их Turboboost: при частичной загрузке процессора частоты работы действительно будут высокими, однако при полной загрузке всех блоков, включая видео (например, в играх), когда они нужнее всего, частоты вполне могут и упасть до номинального уровня, а то и ниже.

Кстати, тут важно учитывать, что в таблице используются данные топового процессора в линейке, Z3770. Помимо него на момент написания статьи в линейке присутствует (и активно представлен на рынке) еще и Z3740, который отличается более низкими частотами работы: 1,86 ГГц (1,33 ГГц). Так что преимущесто по частотам работы над предыдущим поколением получается довольно иллюзорным.

Кэши

  Saltwell Silvermont
Кэш L1D, КБ 24 (6-way) 24 (6-way)
Кэш L1I, КБ 32 (8-way) 32 (8-way)
Кэш L2, КБ 512 (8-way) 1024 (на два ядра) (16-way)

Заметные изменения претерпел кэш L2 — он стал общим для двух ядер, попутно вдвое увеличившись по остальным параметрам. Также следует заметить и удвоение емкости TLB L2 с 64 до 128 записей. Как показывает практика, разделяемый кэш более универсален и более предпочтителен для многоядерной компоновки. К сожалению, в четырехъядерной конфигурации структура кэша L2 — 2×1024, а не 1×2048 (общий для четырех ядер). Это обусловлено модульной компоновкой нового процессора.

Буфер предвыборки

Процессоры микроархитектуры Silvermont располагают шестью буферами по 16 байт. Общий объем остался неизменным по сравнению с Saltwell, но логическая структура изменилась: в Saltwell использовались три буфера на каждый поток. Таким образом, можно четко проследить ориентацию Saltwell на многопоточность, а Silvermont — на максимальную производительность одного потока.

Декодер

В микроархитектуре Silvermont, как и в Saltwell, используются два декодера, которые выдают до двух макроинструкций в такт. Однако у Silvermont гораздо меньше ограничений на типы одновременно декодирующихся инструкций, так что новая микроархитектура более универсальна в плане исполнения программного кода и накладывает меньше требований к его написанию.

Буфер декодированных инструкций, буфер переупорядочивания, планировщик, ИУ

  Saltwell Silvermont
Буфер декодированных инструкций 2×16 32
Буфер переупорядочивания Отсутствует 32

Стоит заметить, что в Saltwell было два буфера по 16 записей (по буферу на поток HT), т. е. общий объем сохранился, но теперь буфер стал общим. В принципе, это может оказаться более выгодным и в случае использования НТ, т. к. общий динамически разделяемый буфер иногда позволяет оптимальнее использовать свой объем. В Silvermont единый буфер введен, т. к. НТ здесь больше нет, а есть отдельные полноценные ядра, т. е. ориентация идет на более эффективную работу каждого ядра

Поскольку процессоры Silvermont имеют внеочередное исполнение команд (ОоО), у них присутствует буфер переупорядочивания с 32 записями.

Исполнительные устройства

Что касается самих исполнительных устройств, то мы имеем по два исполнительных устройства на ALU и FPU, как и в прошлом поколении. Чисто теоретически, в силу отсутствия портов, Silvermont может выполнять четыре инструкции параллельно (по две на ALU и FPU). Также стоит заметить, что теперь пересылка данных между ALU и FPU совершается без «штрафов», в отличие от Saltwell. Тайминги выполнения многих команд сильно сократились.

Наборы инструкций

  Saltwell Silvermont
Набор инструкций MMX, SSE1-SSSE3 MMX, SSE1-SSE4.2
Intel 64 есть
AES-NI есть
Intel VT-x есть

Процессоры Silvermont получили поддержку наборов инструкций SSE4.1, SSE4.2 и AES-NI в дополнение к уже имевшимся у предшественника. Стоит заметить, что процессоры получили поддержку AES-NI, но не получили AVX, хотя набор инструкций AES-NI появился позже AVX (AVX-2010, AES-NI-2011). Скорее всего, это объясняется сложностями в реализации: пришлось бы увеличивать пропускную способность кэшей и буферов, а также адаптировать исполнительные устройства для выполнения 256-битных инструкций (а мобильным устройствам они не так уж и нужны)… Так что данное решение кажется вполне логичным.

Кроме того, следует обратить внимание на поддержку Intel 64 и Intel VT-x. Первая технология необходима для поддержки четырех и более гигабайт оперативной памяти. Что касается VT-x, то технологии виртуализации, скорее всего, на такой платформе и при таком уровне производительности вряд ли будут востребованы.

Графическое ядро

Графическое ядро даже не просто «претерпело кардинальные изменения» — оно здесь просто абсолютно другое.

  Saltwell (z2760) Silvermont (z3770)
Графическое ядро PowerVR SGX545 Intel HD
Частота, МГц 533 667
API DirectX10, OpenGL ES 2.0 DirectX11, OpenGL ES 3.0
Аппаратное ускорение H.264, VC-1 H.264, VC-1, MPEG-2, MVC
QSync есть

В отличие от PowerVR SGX545 стороннего производителя, в новом поколении используется интегрированное графическое ядро производства самой Intel! Архитектура графического ядра в Silvermont схожа с IvyBridge, но количество графических процессоров сократили до четырех. Для сравнения, у IvyBridge их 16 в HD4000 и 6 в самом слабом Intel HD2500.

Это дает много новых возможностей: более современные API, а также QSync, что может стать серьезным козырем для мобильных устройств. С другой стороны, не заявлена поддержка OpenCL. Судя по всему, аппаратная поддержка технологии есть, проблема с драйверами. Возможно, поддержка OpenCL будет добавлена для графики Atom позже.

Интегрированный контроллер памяти

  Saltwell (z2760) Silvermont (z3770)
Тип памяти LPDDR2 LPDDR3
Частота памяти, МГц 800 1066
Количество каналов, шт 2×32 бит 2×64 бит
Пропускная способность, ГБ/с 6,4 17,1
Максимальный объем поддерживаемой памяти, ГБ 2 4

Изменилось практически всё. И это хорошо. Более производительная подсистема памяти позволит эффективнее работать и процессору, и графическому ядру (причем даже в бо́льшей степени). Atom и так этим выгодно отличался от процессоров ARM, а теперь отрыв станет еще более заметным.

Здесь же нужно отметить, что помимо «полноценных» Atom существует еще и модификация с буквой D после номера (например, Z3770D). Она отличается тем, что контроллер памяти у нее одноканальный и поддерживает максимум 2 ГБ оперативной памяти, пусть и более высокого стандарта DDR3L-RS 1333.

Выводы

Новое поколение Intel Atom имеет существенно переработанную архитектуру Silvermont, важнейшими особенностями которой стали введение внеочередного исполнения команд и использование четырех полноценных ядер вместо двух двухпоточных (с технологией Hyperthreading) у предыдущего поколения в мейнстримовых моделях. Также можно отметить поддержку новых наборов инструкций, новый и более быстрый контроллер памяти, а главное — использование графики производства Intel, дающей много новых возможностей.

Эти нововведения позволяют ожидать от нового поколения серьезного роста производительности. Новое графическое ядро должно быть быстрее старого в 2-4 раза, плюс очень кстати поддержка QSync. Поддержка AES-NI должна дать увеличение производительности при шифровании чуть ли не на порядок. Впрочем, и в простых вычислительных задачах превосходство Atom над предыдущим поколением должно быть очень велико. Так что можно с надеждой смотреть в будущее: из решения с «минимально достаточной производительностью» (а чаще — откровенно недостаточной) платформа Intel Atom превращается в хорошую основу для полноценных мобильных систем (планшетов и тонких и легких ноутбуков) х86 с ОС Windows 8.

И о конкурентах

Несмотря на то, что новый Atom производит приятное впечатление (по крайней мере, если смотреть на технические характеристики), вряд ли его путь на рынок будет простым.

Основные конкуренты из лагеря ARM под ОС Android также существенно подтянулись, и Atom будут противостоять новые платформы Tegra 4 и Qualcomm Snapdragon 800, тоже с современной архитектурой, высокими частотами работы и мощными графическими ядрами. Причем противостоять будут на двух платформах: и на Android, и на Windows RT 8.1.

У Atom, правда, остается ниша, где их нет, — устройства с ОС Windows 8. Но в новом поколении Intel расширила и наверняка будет активно продвигать серию Y своих процессоров Core 4-го поколения (Haswell). Они обладают теми же достоинствами: низкое энергопотребление, хорошая производительность; и им тоже не нужно активное охлаждение. Один из ярких примеров — Hewlett-Packard Spectre 13 X2, «старший брат» Envy X2.

Пока непонятно, какой уровень производительности будет у решений на Core i5 Y-серии и новых Intel Atom, но производитель вряд ли допустит, чтобы эти два продукта конкурировали между собой. Другими словами, с одной стороны, Atom должен отставать от Core Y-серии, с другой — убедительно обгонять мобильных конкурентов.

Правда, тут еще важен ценовой фактор. Устройства на Intel Core серии Y наверняка будут стоить гораздо дороже из-за стоимости процессоров, поэтому, скорее всего, будут позиционироваться в качестве корпоративных устройств для работы, а не для домашних развлечений. Сейчас представители Intel намекают, что цена на планшеты с Atom будет невысокой (так всегда говорят, когда надо увеличить рыночную долю за счет конкурентов). Но пока это проявляется только для планшетов с экраном 7 и 8 дюймов, 10-дюймовые варианты даже в США предлагаются по цене в районе 500 долларов.

Пока рано делать выводы о будущей популярности планшетов с новой платформой и Windows 8. Они очень интересны для энтузиастов, которые пользуются планшетами для работы и которым поэтому необходим десктоп. Для них это действительно очень интересное решение. Но вот что касается массового пользователя… Даже предположим, что можно убрать со счетов Windows RT (хотя у меня по этому поводу есть сомнения). Для массового пользователя, которому десктоп на планшете неудобен, новый интерфейс Windows столь же чужд, как и Android или iOS, поэтому выбор будет идти на равных. А самое главное основание при устраивающей функциональности и производительности — это цена. Поэтому многое будет зависеть от ценового фактора и от того, что покупатель будет получать за свои деньги.




Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.