на главную страницуна главную страницуна главную страницу

Новости | 3D-Видео, тюнеры и LCD | iT-Среда | MacLife | Мобильные устройства | Ноутбуки | Носители информации | Платформа ПК | Приложения и утилиты | Принтеры и периферия | ProAudio | Проекторы и ТВ | Сети и серверы | Цифровой звук | Цифровое видео | Цифровое фото | Карта сайта | Поиск

Архитектурные войны (часть 1):
игровые приставки как пророки


На дворе осень, годы идут, хочется абстрагироваться и медитировать. Впрочем, просветленный читатель понимает: нет ничего более абстрактного, чем конкретные спецификации конкретных платформ. Вот почему в этой статье мы поговорим о самой любимой моей материи – будущем, адресуя ее через актуальное настоящее. Не секрет, что самые важные тенденции компьютерного мира (как и любого другого) тянутся длинными дорожками во времени, редко возникая из неоткуда или пропадая в никуда. Вот и нам надо лишь верно сориентироваться в этом парке, почувствовать, откуда и куда дует ветер, какие листья он носит, и где те заветные тропинки, которые приведут нас к выходу. Уловить движения…

Вводные рассуждения в стиле ворчливого псевдоантиглобализма

Конкретнее: в первой части этой эпической статьи, посвященной будущим архитектурам, ПК и компьютерам вообще, мы поговорим о приставках, подлежащих скорому выходу в свет. Почему? Потому что именно оттуда сейчас дует хорошо ощутимый ветер.

Неважно кто первый придумал то или иное решение, важно, кто первый воплотил его в реальную широкую эксплуатацию. Так вышло, что впервые некоторые новинки будут широко обкатаны именно там, на игровых приставках. А затем появятся и в других областях, таких как настольные ПК или серверы. Почему именно приставки? Акценты немного сместились. Если раньше всем правили физики и военные, а основные архитектурные тенденции ПК дули из хорошо понятных весей главных-фреймов и штучных суперкомпьютеров тридцатипятилетней давности, позже ветер прилетал из области дорогих рабочих станций и серверов и, соответственно, их аппаратной начинки, а сегодня случилось давно ожидаемое чудо. Ветер поменял свое направление на добрые ортогональные 90 градусов. Впереди глобальное потепление или ледниковый период?

Не космос и не военные с их расчетами ядерных взрывов теперь основной двигатель цифрового прогресса, а развлекательная индустрия и телекоммуникации. Чего стоит одно только кино и Голливуд, в сторону которого постепенно смещается и все более и более тяжелеющая индустрия компьютерных игр. В ответ и традиционные медиа идут навстречу играм, создавая трехмерных персонажей и полноформатные фильмы без живых актеров, или продавая музыку в Интернете. Государство может дать много денег на исследование и развитие технологий, но так ли эффективно оно движет прогресс в наше время как в 50-е годы? В наше время Интернета и массовых коммуникаций эффективнее собрать понемногу с каждого пользователя, зрителя и игрока. Подсаживая их на постоянную гонку технологий и новинок, заставляя обновлять свои электронные устройства все чаще и чаще. Куда идут эти деньги? В том числе и на R&D, развитие архитектур, технологий и их реализации. Исследования и разработка – вот куда текут немалые средства ведущих в своих нишах компаний. В индустрии хайтека это основной закон – хочешь быть лидером – заранее вкладывайся в R&D. Чтобы оставаться на месте, надо бежать, все быстрее и быстрее. Сколько миллиардов потрачено Sony, Intel и IBM на эту статью за последние десять лет можно только догадываться. По любому, на коммунизм и кормежку всех африканских детей хватило бы. Но тогда мы не получили бы такие замечательные, зачастую бесполезные (если честно и по большому счету рассудить), но очень интересные новые игрушки: iPod-ы, смартфоны, КПК, беспроводные сети, трехмерные ускорители и т.д.

Математически ясно, что такая гонка не может продолжаться вечно – способности людей ограничены, обучаемость тоже, рост уровня знаний и умений есть, но он вполне константен, линеен. А это значит, что новых, действительно желанных моделей использования всех этих высокотехнологичных цацек появляется все меньше и меньше, DVD, MP3, WWW, e-mail, GPRS/WiFi, SMS, цифровое фото, что еще надо в повседневной жизни большинству людей? Ну, GPS в коммуникаторе, ну, еще максимум 10 наименований. А дальше что? Мотивация покупателей падает.

Вы будете менять компьютер (телефон, плеер, фотоаппарат – нужное подчеркнуть) каждый год? Все меньше и меньше людей хотят делать это вместе с вами. В аппаратном плане им достаточно того, что они уже имеют. Ведь КОНТЕНТ все тот же, музыка, видео, письма, игры вполне стандартных жанров. Софт и модели использования все те же, реальных новинок в области интерфейсов между железом и человеком очень мало. Об этом знают и Intel и другие гранды, знают и беспокоятся. Придумывают новые приманки для покупателей, зачастую граничащие с маразмом советской армии (вспомните – о пентиуме, который ускорял интернет). Маркетинг и PR – та еще структура. Однако тенденция налицо – отток потребительских средств в сторону контента. Начинают появляться люди, которые, например, тратят на DVD диски в год заметно больше чем на свое DVD оборудование (подумал и понял: я из них, даже у нас, с чудесными кино за 100р., в год я покупаю около 80 различного типа дисков, что уже дороже моего недорогого, но весьма способного DVD плеера. А 30-40 долларов в месяц на мобильную связь… Ба, да это больше цены мобильника, даже если менять его раз в год, покупая вполне дорогие модели. ADSL – та же сумма. Вот так, незаметно, мы отдаем все больше и больше денег за контент и услуги в различных проявлениях.

Итак, сейчас интереснее купить не новый ПК или КПК (их и так достаточно), а новую игру или скажем новое интерфейсное устройство (TV-тюнер для КПК или ноутбука, GPS приемник для них же, цифровую камеру). Почему – да потому что именно они обеспечивают новый контент и новые модели его использования. А, следовательно – новые очевидные радости для нас как пользователей, которые можно увидеть и использовать (в отличие от строчки в спецификации процессора, которая отличает модель за 100 долларов от модели за 200).

Что делать производителям железа и разработчикам архитектур? Они же привыкли к этой гонке, к постоянному шаг за шагом совершенствованию платформ, с неизменным отжимом покупательских средств. Бедные ребята из Intel, Microsoft и иже? Правильно, перестроиться и кормиться из той же «контентной» Голливудской кормушки. Что они и начинают делать. Например, Apple – всегда держали нос по ветру: сколько денег принес магазин iTunes, я не знаю, но могу догадываться, что уже немало. Целая инфраструктура железа и софта – iPod и его ПО – живет бок к боку с этим сервисом, и во многом обеспечивает его востребованность. Или, например, игровые приставки, о которых мы (наконец-то! - скажет утомленный рассуждениями читатель), поговорим. Индустрия, сильно завязанная именно на игровые тайтлы и процент с их продажи. А что, это хороший повод и разработчикам железа погреться в лучах значительных денежных потоков современной развлекательной индустрии. Настолько хороший, что именно в этих приставках мы сегодня впервые видим широкое коммерческое воплощение нескольких революционных идей.

PS3 и Xbox 360 – у кого круче

Сказать сходу сложно. Архитектурно – PS3 интереснее и (в чем-то) даже на шаг впереди. В том, что касается процессоров, платформы, памяти и некоторых других аспектов, а в графике ситуация скорее обратная – впереди на шаг Xbox 360. Все бы нам нос от PS, а уши от Xbox. Абсолютно ясно одно, приставки несколько отличаются своим тактическим позиционированием.

Архитектура приставки может не быть самой производительной на момент выхода, но она просто обязана быть передовой – живет она заметно дольше игровых ПК решений, и частичному апгрейду в отличие от настольных ПК не подлежит. Интересно, что, судя по всему PS3, направлена на замену, в некоторых применениях, настольного ПК или ПК-медиацентра (в понимании MS). А вот Xbox 360, дабы не стать конкурентом другим детищам той же MS, видится своим создателям именно игровым дополнением к абстрактному цифровому дому уже снабженному настольным ПК или ПК-медиацентром. Хотя, по идее, будучи сделан несколько иначе, он мог заменить многие функции медиацентра, но это не лучший вариант для MS. Почему? Потому что, продав два ящика можно заработать больше. Медиа-ПК со специальной версией ОС XP - это один сегмент доходов, игровые приставки другой – Микрософт считает, что денег у потребителей хватит на все, а при таком сценарии фирма получит больше прибыли. Разделяй и зарабатывай. В принципе, в ближайшее время, и если не случится никаких новых великих депрессий, я бы разделил эту стратегию и прогноз (не потому что приятно подмазаться к MS, мол, я, аналитик доморощенный, а думаю так же). Потому, что ПК в доме все равно останется, игровая приставка не является идеальным хранилищем семейных данных, ей еще далеко до полноценного ПК в плане КАТАЛОГИЗАЦИИ, СОЗДАНИЯ и МОДИФИКАЦИИ контента. Другое дело, что все чаще и чаще домашний ПК будет не просто ПК, а ПК-медиацентр с тюнером, подключенный к большому экрану, так или иначе, с пультом ДУ, еще с какими интерфейсами и т.д. В новом Xbox будут функции, напрямую нацеленные на связку с таким ПК – воспроизведение контента с медиа-ПК (по сети), визуализация во время воспроизведения контента с медиа ПК напрямую, интерфейс с медиа-ПК, в котором Xbox 360 выступает в роли терминала.

При таком раскладе, скорее (к горю Intel, которая спала и видела в каждом доме еще один стационарный ПК – устройство для создания контента или игровой ПК, отдельный от медиацентра – спала и видела, но спать в таких делах надо, как известно, меньше) уменьшится число обычных домашних ПК, без медиа возможностей. Мне сдается, что их нишу частично займет Xbox 360, частично – медиацентры, а остальное вытеснят успешно марширующие на все рынки ноутбуки. Итак, при всем нашем уважении к Intel и ее желанию продать в каждый дом 4-5 процессоров, сценарий, на который ориентируется Microsoft, более вероятен. По моему скромному мнению, разумеется. Будет игровая приставка (если есть, кому на ней играть), центральный медиа-ПК – хранилище и воспроизводилище всяких фотографий, песен и фильмов, а также ноутбуки. И, что важно, процессор в этой приставке, какой бы она не была, будет не Intel. Сдаем позиции, товарищ Intel? Зато Apple теперь с нами! Но вернемся к позиционированию второй приставки нашей статьи – PS3 (Sony PlayStation 3).

На первый взгляд, тут ситуация несколько иная. Так жестко, как в случае MS, конкуренция с другими собственными продуктами Sony не грозит. Поэтому приставка нацелена выполнять и некоторые задачи медиацентра. Проигрывать DVD, будущие стандарты HD носителей, выполнять иные медиа-функции. Тому знакомо много разных интерфейсов (см. далее), поддерживаемых форматов, дополнительный HDD. Так как любой не проданный в результате покупки PS3 медиацентр с ОС от Микрософт, скорее всего, будет произведен не Sony – такая конкуренция только приветствуется. А кто кого заберет, слон или кит, и в каких странах – восточных или западных, мы с вами увидим сами, уже через три года. Лично мне кажется, что широкого распространения PS3 как медиацентра не будет, как ни крути, и эта приставка также останется зажатой в сугубо игровую нишу. Основная проблема здесь ОС (как это ни забавно звучит – проблема PS3 - Win XP, которой на этой приставке-то нет, а вот во всех основных медиа-ПК она есть). Может быть, массы заинтересует кроме игр и воспроизведение Blu-Ray DVD контента, в первое время, пока HD проигрыватели будут дороги. Помните, в свое время PS2 продавалась хорошо, в том числе и из-за возможности проигрывать DVD в то время, когда специальные проигрыватели стоили не меньше. Итак, разное позиционирование, а при здравом размышлении - одна и та же участь. Игровые (в первую очередь) приставки, остальное - как придется. Но, никак не замена полноценного медиа-центра с XP или Vista. Что и требовалось доказать – сегментация рынка позволяет (всем) отжать с него больше средств. Пусть люди купят три коробки вместо одной. ;-)

А теперь рассмотрим наши приставки подробнее.

Спецификации

 

PlayStation 3

Xbox 360

Процессор

Ассиметричная схема

1 ядро PowerPC (3.2 ГГц)
+1 VMX век торный блок для этого ядра
+2 аппаратных треда на этом ядре
+512 КБ кэш L 2 для этого ядра

8 упрощенных ядер SPE (3.2 ГГц)
(одно ядро зарезервировано и не работает, так что доступно 7)
+256 КБ адресуемой SRAM на ядро
+128 векторных регистров по 128 бит на ядро

Симметричная схема
3 ядра PowerPC (3.2 ГГц)
+1 VMX блок на каждое ядро
+2 аппаратных треда на каждое ядро (аналог HT )
+128 векторных регистров по 128 бит на каждый тред (6 наборов)

+1 Мбайт общий L2 кэш

Пиковая FP производительность

2.1 терафлопа

1 терафлоп

Графика

NVIDIA RSX (550 МГц)

аналог G70

8 вершинных процессоров
24 пиксельных процессора и TMU
16 блоков блендинга и записи

ATI GPU (500 МГц )

3 блока по 16 универсальных шейдерных процессоров
2 контрольных механизма исполняют два шейдера
4 блока по 4 TMU
10 Мбайт встроенной памяти для Z и цвета FB

Память

256 Мбайт системной памяти
XDR (3.2 ГГц)
ПСП: 25.6 ГБайт

256 Мбайт видео памяти ( RSX)
GDDR3  700*2 МГц 256 бит
ПСП : 22.4 Гбайт

512 Мегабайт общей памяти
GDDR3  700*2 МГц 256 бит
ПСП: 22.4 Гбайт

10 Мбайт встроенной в GPU памяти EDRAM
ПСП : 256 Гбайт (!)

Звук

Sound Dolby 5.1ch, DTS, LPCM
(обработка на SPE ядрах CPU)
Цифровой оптический выход

Цифровой выход,
32-бит аудио процессинг,
более 256 каналов

Вывод изображения

Поддержка HD разрешений до 1080p (!)
Два выхода HDMI
AV выход 480i, 480p, 720p, 1080i, 1080p

Все игры поддерживают 16:9,
720 p и 1080i , АА,
Видео выход стандартный или HD

Накопители

Blu-Ray DVD
Слот под опциональный отсоединяемый HDD

DVD 12х ( Dual Layer)
HDD 20Gb – отсоединяемый

Интерфейсы

USB: спереди 4, сзади 2 (USB2.0)
Memory Stick: standard/Duo, PRO
SD: standard/mini
СompactFlash: (Type I, II)
Communication: Ethernet (10BASE-T, 100BASE-TX, 1000BASE-T) x3 (in x 1 + out x 2)
Wi-Fi: IEEE 802.11 b/g
Bluetooth: Bluetooth 2.0 (EDR)

 

До 4 беспроводных игровых контроллеров
Три USB 2.0 порта
Два слота для модулей памяти (собственного типа)
Ethernet
Wi - Fi опционально: 802.11 a, b+g
Видеокамера опционально

Форматы медиа

PlayStation2 CD-ROM
CD-DA CD-DA (ROM), CD-R, CD-RW
SACD SACD Hybrid (CD layer), SACD HD
DVD PlayStation2 DVD-ROM
PLAYSTATION3 DVD-ROM DVD-Video DVD-ROM, DVD-R, DVD-RW, DVD+R, DVD+RW
Blu-ray Disc PLAYSTATION3 BD-ROM
BD-Video BD-ROM, BD-R, BD-RE

 

DVD-Video, DVD-ROM, DVD-R/RW, DVD+R/RW, CD-DA, CD-ROM, CD-R, CD-RW, WMA CD, MP3 CD, JPEG Photo CD
Возможность воспроизведения с переносных медиа - устройств, цифровых камер и Windows XP-based PCs
Возможность копировать музыку на жесткий диск
Собственные плей-листы в любой игре
Выполняет роль Media Center Extender для Windows XP Media Center Edition 2005

Итак, PS3 демонстрирует нам новаторское ассиметричное решение в области CPU (точнее их набора 1+8), использует новую скоростную память XDR от RAMBUS, поддерживает различные беспроводные интерфейсы, считывает три типа карт памяти и претендует на роль сетевого хаба. Это те самые замашки медиацентра, о которых я говорил выше. Доступны Blu-Ray диски (DVD следующего поколения, повышенной плотности записи). Зато графика – по сути, хорошо знакомое нам старое. C графической точки зрения RSX это G70, пускай и с переработанными интерфейсами и несколько иным исполнением, но архитектура та же, никаких особенных изменений нет, судя по всему, не только в возможностях, но даже в числе блоков тех или иных типов.

А Xbox 360 имеет три полностью равноправных процессора с мультитредингом. Имеет унифицированную память и передовую графическую систему с 10 мегабайтами встроенной памяти, находящуюся по своей архитектуре в 10 минутах от будущих WGF 2.0 ускорителей, которые уже вовсю разрабатываются NVIDIA и ATI для новой ОС Microsoft – Vista. Да, я говорю о R6XX и NV6X (а теперь G90, или как его там). В остальном, интерфейсная и архитектурная часть этой приставки несколько беднее, как и планируемые сценарии использования – игры и придаток к цифровому дому с медиацентром.

Подробнее.

Интересное в архитектуре PS3

Сердце этой приставки – Cell. Если быть точным, Cell это скорее прозвище, формально этот чип называется Broadband Processor, а его архитектура – BPA. Совместное детище Sony, Toshiba и IBM предназначено не только для игровых приставок, но и для иных медийных применений в будущем. Вот так он выглядит:

…снаружи. А вот что внутри:

(вверху функциональная диаграмма чипа, внизу фотография кристалла с комментариями). В наличии:

  • PPE - Мощный универсальный 64 бит процессор PowerPC, с векторным блоком VMX (FP32[4] и другие векторные операции, 128 векторных регистров по 128 бит, гибко трактуемых как 64[2], 32[4], 16[8], 8[16] или даже 128[1]. По предназначению - аналог SSEx в семействе Pentium. Сам процессор не спекулятивный, то есть не переставляет команды при исполнении, но суперскалярный – может выполнять команды вместе, если они не завязаны на общие данные и не мешают друг другу. В наличии и гипертрединг – процессор может исполнять два потока команд одновременно, что при использовании ощутимо повышает утилизацию исполнительных блоков, особенно в нашем случае отсутствия спекулятивного запуска команд. Отказ от спекулятивного исполнения позволил добиться высоких частот при низком энергопотреблении (чип Cell работает на частоте до 4.8 ГГц, хотя в PS3 частота планируется более скромная - 3.2 ГГц, видимо из соображений надежности, охлаждения и энергопотребления). PPE поддерживает все современные возможности архитектуры PowerPC 64 бит, включая MMU и виртуальную память. Кэш первого уровня 32*2 Кбайта и второго уровня 512 Кбайт. Вот так выглядит функциональная диаграмма этого процессора:

  • 8 SPE процессоров – более простых:



    и более ориентированных на потоковую обработку данных. Каждый из них имеет 256 Кбайт собственной скоростной памяти, с которой он может обменивать содержимое своих регистров и 128 регистров по 128 бит каждый (все ALU этого процессора векторные, поддерживающие разумное подмножество векторных операций более сложного VMX модуля PPE). Таким образом, в наличии 8 дополнительных векторных модулей с собственной памятью и интеллектом – все-таки каждый SPE процессор является достаточно общим (по назначению) и поддерживает такие атрибуты классических CPU как переходы, загрузка и выгрузка данных по произвольным адресам, произвольные условия и т.д. Интересно, что обмен между собственной памятью SPE и общей системной памятью может происходить по ходу его работы – для этого в каждом SPE предусмотрен собственный DMA блок. Обмен с локальной памятью происходит достаточно резво – векторные данные пересылаются за один заход, полоса пропускания подобрана таким образом, чтобы не давать ALU простаивать. Вот так выглядит схема работы SPE подробнее:

  • Все 9 процессоров связаны широкой общей когерентной шиной (то есть видят внешнюю системную память и друг друга в общем едином адресном пространстве). В наличии два интерфейса к XDR памяти и два произвольных интерфейса ввода / вывода (системная шина) для коммуникации с GPU и периферийными контроллерами. Шина ввода / вывода обеспечивает ПСП, сравнимую с системной памятью – более 20 Гбайт в секунду. Интересно, что в других применениях (судя по всему, Cell будет использоваться не только в PS3) несколько процессоров могут быть объединены в различные конфигурации:

    так и до суперкомпьютера недалеко – погоду рассчитывать или ядерные взрывы. Все нормально – игровая и медиа индустрия отдает долги – раньше военные компьютеры были прообразами для игровых приставок, теперь наоборот, приставки смогут в будущем стать прообразом для рекордных вычислительных систем научного назначения. Вот они, забавные гримасы рынка.

В действительности, для Cell можно придумать множество применений, например, серверы видео по запросу или иные медийные сервисы для большого числа клиентов одновременно. Интересно, что в PS3 один из SPE будет отключен – только 7 будут доступны. Может, это вопрос выхода годных чипов, а может и температурного режима (как и частота 3.2 вместо 4 или более ГГц). Как вариант – он может быть зарезервирован для каких-либо системных нужд.

Кроме Cell в приставке будет RSX – графический ускоритель, похожий на G70 с интерфейсом FlexIO и некоторыми другими функциями и SB – процессор ввода / вывода и контроллер всяческих интерфейсов, обеспечивающий кроме того и некоторые вопросы совместимости с PS2.

Какие выводы мы можем сделать из архитектуры этой приставки? Очень простые – решение задачи влезания на елку без уколов может быть вполне успешно проделано путем отделения котлет от картошки. Для потоковых данных, когда много надо обрабатывать похожего – потоковые процессоры попроще. Для сложных алгоритмов, когда данных мало, но их надо крутить по всякому – один процессор, но зато сложный, эффективный и традиционный. Задача программистов – грамотно разбить задачу на подзадачи, классифицировать и распределить их по соответствующим процессорам. Им поможет компилятор и соответствующие расширения библиотеки С/C++, например, векторная библиотека и компилятор для Cell позволяют компилировать один и тот же векторный код для PPE или SPE по желанию, хотя на уровне железа их векторные модули и не совместимы (SPE проще VMX).

Кстати, Intel тоже вовсю разрабатывает такие ассиметричные схемы – два тяжелых и 8 легких ядер на одном чипе и т.д. – стоит приглядеться к Cell – он лишь первая ласточка в борьбе за снижение латентности. Скоро и настольные системы от Intel будут строиться по несимметричной схеме. Кстати, почему латентности? Об этом в следующей статье, пока же лишь намекнем, что не зря каждый SPE имеет свою локальную память – именно такое решение позволяет реально эффективно обрабатывать потоковые и векторные данные в играх и схожих приложениях. Системная память одна, и большое число ядер будет слишком сильно мешать друг другу, особенно на такой частоте. Но это не все, фактически, то, что современные архитектуры пришли к многоядерным процессорам и есть следствие латентности памяти. Далее в следующей части. А пока вернемся к нашему ящику:

Интересное в архитектуре Xbox

Процессор Xbox 360 (опять оговорился - процессоры) построен по-другому. Грубо говоря, в наличии 3 PPE из Сell и мегабайт общего L2 кэша на троих:

Это описание достаточно исчерпывающее – процессоры Xbox действительно близнецы братья PPE – небольшие организационные отличия почти не меняют картину. Все тот же VMX и гипертрединг с двумя потоками, все то же исполнение двух инструкций за такт без спекуляций. Те же объемы раздельных кэшей первого уровня – 2*32 Килобайта. И даже площадь кристалла выходит сравнимая – представьте себе 3 PPE да мегабайт кэша – примерно Cell, может даже чуть-чуть больше.

Схема полностью симметрична и не требует от программистов какой-либо классификации задач по процессорам, которые будут их исполнять или иного учета конкретного ядра CPU. Пиковая эффективность несколько ниже, чем можно рассчитать для Cell, но только пиковая. Реальные приложения будут, скорее всего, сравнимы – во-первых, многое решит графика, а она у Xbox возможно даже более производительная и гибкая чем RSX, а во-вторых, – выжать 100% из Cell будет труднее, и вряд ли всем разработчикам реальных приложений удастся плодородно задействовать все доступные SPE. В итоге, при равной финальной отдаче, проблем для разработчиков Xbox создаст явно меньше – чем не критерий выбора платформы.

Итак, три процессора PowerPC на одном ядре и 1 Мбайт кэша общаются (по шине с пропускной способностью в 22 Гбайт в секунду) с GPU выполняющим одновременно и роль контроллера общей памяти. Кроме того, к нему же по PCI Express 2х подключен южный мост – контроллер всяких интерфейсов и периферии от SiS.

GPU этот без сомнений достоин внимания:

Две главных достопримечательности этого ускорителя – встроенная память и унифицированные шейдерные процессоры, выполняющие как вершинные, так и пиксельные шейдеры, в зависимости от текущей загрузки (привет, WGF 2 и Vista, и все то, о чем уже писалось в статье про графику в Longhorn, ныне Vista). Таким образом, в наличие два контрольных блока, исполняющих код двух шейдеров. Каждый из них может быть как пиксельным, так и вершинным. Контрольный блок дирижирует массивом из 16 шейдерных процессоров, причем таких массивов три, и каждый может находиться под управлением либо первого, либо второго контрольного блока (на схеме shader interp). Таким образом, все ALU чипа загружены практически все время, и вопрос баланса вершинной и пиксельной нагрузки внутри ускорителя решается автоматически! Много вершин – и процессоры больше времени проведут, обрабатывая вершины, много пикселей – закрашивая пиксели. А благодаря наличию двух контрольных блоков и переключение между шейдерами (дорогая операция) может происходить куда как эффективнее, чем ранее. Интересно, что при наличии 48 процессоров, в обработке находится 64 состояния (можно называть это нитями, но проще говорить о 64 объектах, будь-то пиксель или вершина). И такая избыточность позволяет всегда держать процессоры загруженными, даже если в части шейдеров произошел ранний выход или меньшее число команд в какой-то ветке условий. Утилизация ресурсов такого чипа близка к оптимальной, даже в случае шейдеров с условными переходами. Это – будущее графики, то, что мы увидим на ПК с приходом Vista и первых WGF 2 ускорителей. А пока – в приставке Xbox, уже в это рождество. Формально ускоритель Xbox не совместим с WGF 2 полностью, но отличия, судя по всему, минимальные и скорее формальные, чем архитектурные – на момент разработки этого GPU стандарты WGF 2 еще не были до конца определены. По любому, ATI получила шикарный полигон для обкатки будущих технологий для Vista, да еще и под бдительной опекой Microsoft – согласитесь, ситуация позитивна по самую крышку.

Встроенная память предназначена для самых критичных данных – буфера глубины и значений цвета буфера кадра. 10 Мбайт может не хватить для полного буфера во всех режимах, но тут помогает подкачка буфера в локальную память и обратно большими блоками. Отрисовка типичных сцен все равно идет не хаотично, а скорее последовательно в областях тех или иных моделей. Очень широкая и быстрая шина между чипами (ускоритель реализован с помощью двух чипов в одном корпусе):

Такая организация позволяет крайне эффективно работать с буфером кадра и делает anti-aliasing (АА) действительно практически бесплатным во всех режимах. Интересно, что второй чип, с 10 Мегабайтным буфером содержит и специальную логику – фактически блоки записи и блендинга, а также проверки глубины вынесены на него из основного чипа ускорителя. Таким образом, они получают очень широкий и быстрый доступ к данным этого буфера, делаю проверку глубины в MSAA режимах бесплатной даже с точки зрения межчиповой коммуникации. Впрочем, эта деталь уже не так важна, так как шина между чипами пропускает 256 Гбайт данных в секунду. Здорово.

Итак, Xbox дает нам много намеков на будущие графические архитектуры. Стоит задуматься и о встроенной (точнее пристроенной) к ускорителю памяти и об унифицированных шейдерных процессорах. Опять, оно все уже тут, только руку протяни, и скоро будет на нашем столе. Просто, чуть раньше чем в ПК появилось в игровой приставке. Вот откуда ветер дует…

Так кто же кого?

В итоге мы имеем сравнимый объем памяти, сравнимую ПСП и, скорее всего, сравнимую практическую производительность процессоров. Сравнимые графические возможности, надо отметить несколько более эффективно и красиво реализованные у ATI. Кто победит? Конечно же, интерфейс, дизайн, цена и доступные игры. Архитектуры не настолько разные по силе, чтобы это что-то решало. И даже некоторые неудобства программирования PS3 не повлияют на ход лодки – будет сделано всё, чтобы их нивелировать, да и решения о выпуске игры на ту или иную платформу принимают, как правило, не программисты… Выиграет Sony и Microsoft, и NVIDIA и ATI, и IBM (даже дважды). И даже SiS и Rambus получат свой кусочек пирога. Потому, что все они получат часть средств от заинтересованных потребителей, в том числе и средств идущих на новый игровой контент. После чего компании окупят R&D, и даже останется на бутерброды с икрой, если все пойдет хорошо. Обкатают на широких массах новые идеи и технологии. И продолжат эту карусель спроса и предложения, разработки и убеждения. Купи, купи новое ;-)



Александр Медведев (unclesam@ixbt.com)
Опубликовано — 3 октября 2005 г.
 
Игровые приставки как пророки

Архитектурные войны (часть 1):
игровые приставки как пророки

На дворе осень, годы идут, хочется абстрагироваться и медитировать. Впрочем, просветленный читатель понимает: нет ничего более абстрактного, чем конкретные спецификации конкретных платформ. Вот почему в этой статье мы поговорим о самой любимой моей материи – будущем, адресуя ее через актуальное настоящее. Не секрет, что самые важные тенденции компьютерного мира (как и любого другого) тянутся длинными дорожками во времени, редко возникая из неоткуда или пропадая в никуда. Вот и нам надо лишь верно сориентироваться в этом парке, почувствовать, откуда и куда дует ветер, какие листья он носит, и где те заветные тропинки, которые приведут нас к выходу. Уловить движения…

Вводные рассуждения в стиле ворчливого псевдоантиглобализма

Конкретнее: в первой части этой эпической статьи, посвященной будущим архитектурам, ПК и компьютерам вообще, мы поговорим о приставках, подлежащих скорому выходу в свет. Почему? Потому что именно оттуда сейчас дует хорошо ощутимый ветер.

Неважно кто первый придумал то или иное решение, важно, кто первый воплотил его в реальную широкую эксплуатацию. Так вышло, что впервые некоторые новинки будут широко обкатаны именно там, на игровых приставках. А затем появятся и в других областях, таких как настольные ПК или серверы. Почему именно приставки? Акценты немного сместились. Если раньше всем правили физики и военные, а основные архитектурные тенденции ПК дули из хорошо понятных весей главных-фреймов и штучных суперкомпьютеров тридцатипятилетней давности, позже ветер прилетал из области дорогих рабочих станций и серверов и, соответственно, их аппаратной начинки, а сегодня случилось давно ожидаемое чудо. Ветер поменял свое направление на добрые ортогональные 90 градусов. Впереди глобальное потепление или ледниковый период?

Не космос и не военные с их расчетами ядерных взрывов теперь основной двигатель цифрового прогресса, а развлекательная индустрия и телекоммуникации. Чего стоит одно только кино и Голливуд, в сторону которого постепенно смещается и все более и более тяжелеющая индустрия компьютерных игр. В ответ и традиционные медиа идут навстречу играм, создавая трехмерных персонажей и полноформатные фильмы без живых актеров, или продавая музыку в Интернете. Государство может дать много денег на исследование и развитие технологий, но так ли эффективно оно движет прогресс в наше время как в 50-е годы? В наше время Интернета и массовых коммуникаций эффективнее собрать понемногу с каждого пользователя, зрителя и игрока. Подсаживая их на постоянную гонку технологий и новинок, заставляя обновлять свои электронные устройства все чаще и чаще. Куда идут эти деньги? В том числе и на R&D, развитие архитектур, технологий и их реализации. Исследования и разработка – вот куда текут немалые средства ведущих в своих нишах компаний. В индустрии хайтека это основной закон – хочешь быть лидером – заранее вкладывайся в R&D. Чтобы оставаться на месте, надо бежать, все быстрее и быстрее. Сколько миллиардов потрачено Sony, Intel и IBM на эту статью за последние десять лет можно только догадываться. По любому, на коммунизм и кормежку всех африканских детей хватило бы. Но тогда мы не получили бы такие замечательные, зачастую бесполезные (если честно и по большому счету рассудить), но очень интересные новые игрушки: iPod-ы, смартфоны, КПК, беспроводные сети, трехмерные ускорители и т.д.

Математически ясно, что такая гонка не может продолжаться вечно – способности людей ограничены, обучаемость тоже, рост уровня знаний и умений есть, но он вполне константен, линеен. А это значит, что новых, действительно желанных моделей использования всех этих высокотехнологичных цацек появляется все меньше и меньше, DVD, MP3, WWW, e-mail, GPRS/WiFi, SMS, цифровое фото, что еще надо в повседневной жизни большинству людей? Ну, GPS в коммуникаторе, ну, еще максимум 10 наименований. А дальше что? Мотивация покупателей падает.

Вы будете менять компьютер (телефон, плеер, фотоаппарат – нужное подчеркнуть) каждый год? Все меньше и меньше людей хотят делать это вместе с вами. В аппаратном плане им достаточно того, что они уже имеют. Ведь КОНТЕНТ все тот же, музыка, видео, письма, игры вполне стандартных жанров. Софт и модели использования все те же, реальных новинок в области интерфейсов между железом и человеком очень мало. Об этом знают и Intel и другие гранды, знают и беспокоятся. Придумывают новые приманки для покупателей, зачастую граничащие с маразмом советской армии (вспомните – о пентиуме, который ускорял интернет). Маркетинг и PR – та еще структура. Однако тенденция налицо – отток потребительских средств в сторону контента. Начинают появляться люди, которые, например, тратят на DVD диски в год заметно больше чем на свое DVD оборудование (подумал и понял: я из них, даже у нас, с чудесными кино за 100р., в год я покупаю около 80 различного типа дисков, что уже дороже моего недорогого, но весьма способного DVD плеера. А 30-40 долларов в месяц на мобильную связь… Ба, да это больше цены мобильника, даже если менять его раз в год, покупая вполне дорогие модели. ADSL – та же сумма. Вот так, незаметно, мы отдаем все больше и больше денег за контент и услуги в различных проявлениях.

Итак, сейчас интереснее купить не новый ПК или КПК (их и так достаточно), а новую игру или скажем новое интерфейсное устройство (TV-тюнер для КПК или ноутбука, GPS приемник для них же, цифровую камеру). Почему – да потому что именно они обеспечивают новый контент и новые модели его использования. А, следовательно – новые очевидные радости для нас как пользователей, которые можно увидеть и использовать (в отличие от строчки в спецификации процессора, которая отличает модель за 100 долларов от модели за 200).

Что делать производителям железа и разработчикам архитектур? Они же привыкли к этой гонке, к постоянному шаг за шагом совершенствованию платформ, с неизменным отжимом покупательских средств. Бедные ребята из Intel, Microsoft и иже? Правильно, перестроиться и кормиться из той же «контентной» Голливудской кормушки. Что они и начинают делать. Например, Apple – всегда держали нос по ветру: сколько денег принес магазин iTunes, я не знаю, но могу догадываться, что уже немало. Целая инфраструктура железа и софта – iPod и его ПО – живет бок к боку с этим сервисом, и во многом обеспечивает его востребованность. Или, например, игровые приставки, о которых мы (наконец-то! - скажет утомленный рассуждениями читатель), поговорим. Индустрия, сильно завязанная именно на игровые тайтлы и процент с их продажи. А что, это хороший повод и разработчикам железа погреться в лучах значительных денежных потоков современной развлекательной индустрии. Настолько хороший, что именно в этих приставках мы сегодня впервые видим широкое коммерческое воплощение нескольких революционных идей.

PS3 и Xbox 360 – у кого круче

Сказать сходу сложно. Архитектурно – PS3 интереснее и (в чем-то) даже на шаг впереди. В том, что касается процессоров, платформы, памяти и некоторых других аспектов, а в графике ситуация скорее обратная – впереди на шаг Xbox 360. Все бы нам нос от PS, а уши от Xbox. Абсолютно ясно одно, приставки несколько отличаются своим тактическим позиционированием.

Архитектура приставки может не быть самой производительной на момент выхода, но она просто обязана быть передовой – живет она заметно дольше игровых ПК решений, и частичному апгрейду в отличие от настольных ПК не подлежит. Интересно, что, судя по всему PS3, направлена на замену, в некоторых применениях, настольного ПК или ПК-медиацентра (в понимании MS). А вот Xbox 360, дабы не стать конкурентом другим детищам той же MS, видится своим создателям именно игровым дополнением к абстрактному цифровому дому уже снабженному настольным ПК или ПК-медиацентром. Хотя, по идее, будучи сделан несколько иначе, он мог заменить многие функции медиацентра, но это не лучший вариант для MS. Почему? Потому что, продав два ящика можно заработать больше. Медиа-ПК со специальной версией ОС XP - это один сегмент доходов, игровые приставки другой – Микрософт считает, что денег у потребителей хватит на все, а при таком сценарии фирма получит больше прибыли. Разделяй и зарабатывай. В принципе, в ближайшее время, и если не случится никаких новых великих депрессий, я бы разделил эту стратегию и прогноз (не потому что приятно подмазаться к MS, мол, я, аналитик доморощенный, а думаю так же). Потому, что ПК в доме все равно останется, игровая приставка не является идеальным хранилищем семейных данных, ей еще далеко до полноценного ПК в плане КАТАЛОГИЗАЦИИ, СОЗДАНИЯ и МОДИФИКАЦИИ контента. Другое дело, что все чаще и чаще домашний ПК будет не просто ПК, а ПК-медиацентр с тюнером, подключенный к большому экрану, так или иначе, с пультом ДУ, еще с какими интерфейсами и т.д. В новом Xbox будут функции, напрямую нацеленные на связку с таким ПК – воспроизведение контента с медиа-ПК (по сети), визуализация во время воспроизведения контента с медиа ПК напрямую, интерфейс с медиа-ПК, в котором Xbox 360 выступает в роли терминала.

При таком раскладе, скорее (к горю Intel, которая спала и видела в каждом доме еще один стационарный ПК – устройство для создания контента или игровой ПК, отдельный от медиацентра – спала и видела, но спать в таких делах надо, как известно, меньше) уменьшится число обычных домашних ПК, без медиа возможностей. Мне сдается, что их нишу частично займет Xbox 360, частично – медиацентры, а остальное вытеснят успешно марширующие на все рынки ноутбуки. Итак, при всем нашем уважении к Intel и ее желанию продать в каждый дом 4-5 процессоров, сценарий, на который ориентируется Microsoft, более вероятен. По моему скромному мнению, разумеется. Будет игровая приставка (если есть, кому на ней играть), центральный медиа-ПК – хранилище и воспроизводилище всяких фотографий, песен и фильмов, а также ноутбуки. И, что важно, процессор в этой приставке, какой бы она не была, будет не Intel. Сдаем позиции, товарищ Intel? Зато Apple теперь с нами! Но вернемся к позиционированию второй приставки нашей статьи – PS3 (Sony PlayStation 3).

На первый взгляд, тут ситуация несколько иная. Так жестко, как в случае MS, конкуренция с другими собственными продуктами Sony не грозит. Поэтому приставка нацелена выполнять и некоторые задачи медиацентра. Проигрывать DVD, будущие стандарты HD носителей, выполнять иные медиа-функции. Тому знакомо много разных интерфейсов (см. далее), поддерживаемых форматов, дополнительный HDD. Так как любой не проданный в результате покупки PS3 медиацентр с ОС от Микрософт, скорее всего, будет произведен не Sony – такая конкуренция только приветствуется. А кто кого заберет, слон или кит, и в каких странах – восточных или западных, мы с вами увидим сами, уже через три года. Лично мне кажется, что широкого распространения PS3 как медиацентра не будет, как ни крути, и эта приставка также останется зажатой в сугубо игровую нишу. Основная проблема здесь ОС (как это ни забавно звучит – проблема PS3 - Win XP, которой на этой приставке-то нет, а вот во всех основных медиа-ПК она есть). Может быть, массы заинтересует кроме игр и воспроизведение Blu-Ray DVD контента, в первое время, пока HD проигрыватели будут дороги. Помните, в свое время PS2 продавалась хорошо, в том числе и из-за возможности проигрывать DVD в то время, когда специальные проигрыватели стоили не меньше. Итак, разное позиционирование, а при здравом размышлении - одна и та же участь. Игровые (в первую очередь) приставки, остальное - как придется. Но, никак не замена полноценного медиа-центра с XP или Vista. Что и требовалось доказать – сегментация рынка позволяет (всем) отжать с него больше средств. Пусть люди купят три коробки вместо одной. ;-)

А теперь рассмотрим наши приставки подробнее.

Спецификации

 

PlayStation 3

Xbox 360

Процессор

Ассиметричная схема

1 ядро PowerPC (3.2 ГГц)
+1 VMX век торный блок для этого ядра
+2 аппаратных треда на этом ядре
+512 КБ кэш L 2 для этого ядра

8 упрощенных ядер SPE (3.2 ГГц)
(одно ядро зарезервировано и не работает, так что доступно 7)
+256 КБ адресуемой SRAM на ядро
+128 векторных регистров по 128 бит на ядро

Симметричная схема
3 ядра PowerPC (3.2 ГГц)
+1 VMX блок на каждое ядро
+2 аппаратных треда на каждое ядро (аналог HT )
+128 векторных регистров по 128 бит на каждый тред (6 наборов)

+1 Мбайт общий L2 кэш

Пиковая FP производительность

2.1 терафлопа

1 терафлоп

Графика

NVIDIA RSX (550 МГц)

аналог G70

8 вершинных процессоров
24 пиксельных процессора и TMU
16 блоков блендинга и записи

ATI GPU (500 МГц )

3 блока по 16 универсальных шейдерных процессоров
2 контрольных механизма исполняют два шейдера
4 блока по 4 TMU
10 Мбайт встроенной памяти для Z и цвета FB

Память

256 Мбайт системной памяти
XDR (3.2 ГГц)
ПСП: 25.6 ГБайт

256 Мбайт видео памяти ( RSX)
GDDR3  700*2 МГц 256 бит
ПСП : 22.4 Гбайт

512 Мегабайт общей памяти
GDDR3  700*2 МГц 256 бит
ПСП: 22.4 Гбайт

10 Мбайт встроенной в GPU памяти EDRAM
ПСП : 256 Гбайт (!)

Звук

Sound Dolby 5.1ch, DTS, LPCM
(обработка на SPE ядрах CPU)
Цифровой оптический выход

Цифровой выход,
32-бит аудио процессинг,
более 256 каналов

Вывод изображения

Поддержка HD разрешений до 1080p (!)
Два выхода HDMI
AV выход 480i, 480p, 720p, 1080i, 1080p

Все игры поддерживают 16:9,
720 p и 1080i , АА,
Видео выход стандартный или HD

Накопители

Blu-Ray DVD
Слот под опциональный отсоединяемый HDD

DVD 12х ( Dual Layer)
HDD 20Gb – отсоединяемый

Интерфейсы

USB: спереди 4, сзади 2 (USB2.0)
Memory Stick: standard/Duo, PRO
SD: standard/mini
СompactFlash: (Type I, II)
Communication: Ethernet (10BASE-T, 100BASE-TX, 1000BASE-T) x3 (in x 1 + out x 2)
Wi-Fi: IEEE 802.11 b/g
Bluetooth: Bluetooth 2.0 (EDR)

 

До 4 беспроводных игровых контроллеров
Три USB 2.0 порта
Два слота для модулей памяти (собственного типа)
Ethernet
Wi - Fi опционально: 802.11 a, b+g
Видеокамера опционально

Форматы медиа

PlayStation2 CD-ROM
CD-DA CD-DA (ROM), CD-R, CD-RW
SACD SACD Hybrid (CD layer), SACD HD
DVD PlayStation2 DVD-ROM
PLAYSTATION3 DVD-ROM DVD-Video DVD-ROM, DVD-R, DVD-RW, DVD+R, DVD+RW
Blu-ray Disc PLAYSTATION3 BD-ROM
BD-Video BD-ROM, BD-R, BD-RE

 

DVD-Video, DVD-ROM, DVD-R/RW, DVD+R/RW, CD-DA, CD-ROM, CD-R, CD-RW, WMA CD, MP3 CD, JPEG Photo CD
Возможность воспроизведения с переносных медиа - устройств, цифровых камер и Windows XP-based PCs
Возможность копировать музыку на жесткий диск
Собственные плей-листы в любой игре
Выполняет роль Media Center Extender для Windows XP Media Center Edition 2005

Итак, PS3 демонстрирует нам новаторское ассиметричное решение в области CPU (точнее их набора 1+8), использует новую скоростную память XDR от RAMBUS, поддерживает различные беспроводные интерфейсы, считывает три типа карт памяти и претендует на роль сетевого хаба. Это те самые замашки медиацентра, о которых я говорил выше. Доступны Blu-Ray диски (DVD следующего поколения, повышенной плотности записи). Зато графика – по сути, хорошо знакомое нам старое. C графической точки зрения RSX это G70, пускай и с переработанными интерфейсами и несколько иным исполнением, но архитектура та же, никаких особенных изменений нет, судя по всему, не только в возможностях, но даже в числе блоков тех или иных типов.

А Xbox 360 имеет три полностью равноправных процессора с мультитредингом. Имеет унифицированную память и передовую графическую систему с 10 мегабайтами встроенной памяти, находящуюся по своей архитектуре в 10 минутах от будущих WGF 2.0 ускорителей, которые уже вовсю разрабатываются NVIDIA и ATI для новой ОС Microsoft – Vista. Да, я говорю о R6XX и NV6X (а теперь G90, или как его там). В остальном, интерфейсная и архитектурная часть этой приставки несколько беднее, как и планируемые сценарии использования – игры и придаток к цифровому дому с медиацентром.

Подробнее.

Интересное в архитектуре PS3

Сердце этой приставки – Cell. Если быть точным, Cell это скорее прозвище, формально этот чип называется Broadband Processor, а его архитектура – BPA. Совместное детище Sony, Toshiba и IBM предназначено не только для игровых приставок, но и для иных медийных применений в будущем. Вот так он выглядит:

…снаружи. А вот что внутри:

(вверху функциональная диаграмма чипа, внизу фотография кристалла с комментариями). В наличии:

  • PPE - Мощный универсальный 64 бит процессор PowerPC, с векторным блоком VMX (FP32[4] и другие векторные операции, 128 векторных регистров по 128 бит, гибко трактуемых как 64[2], 32[4], 16[8], 8[16] или даже 128[1]. По предназначению - аналог SSEx в семействе Pentium. Сам процессор не спекулятивный, то есть не переставляет команды при исполнении, но суперскалярный – может выполнять команды вместе, если они не завязаны на общие данные и не мешают друг другу. В наличии и гипертрединг – процессор может исполнять два потока команд одновременно, что при использовании ощутимо повышает утилизацию исполнительных блоков, особенно в нашем случае отсутствия спекулятивного запуска команд. Отказ от спекулятивного исполнения позволил добиться высоких частот при низком энергопотреблении (чип Cell работает на частоте до 4.8 ГГц, хотя в PS3 частота планируется более скромная - 3.2 ГГц, видимо из соображений надежности, охлаждения и энергопотребления). PPE поддерживает все современные возможности архитектуры PowerPC 64 бит, включая MMU и виртуальную память. Кэш первого уровня 32*2 Кбайта и второго уровня 512 Кбайт. Вот так выглядит функциональная диаграмма этого процессора:

  • 8 SPE процессоров – более простых:



    и более ориентированных на потоковую обработку данных. Каждый из них имеет 256 Кбайт собственной скоростной памяти, с которой он может обменивать содержимое своих регистров и 128 регистров по 128 бит каждый (все ALU этого процессора векторные, поддерживающие разумное подмножество векторных операций более сложного VMX модуля PPE). Таким образом, в наличии 8 дополнительных векторных модулей с собственной памятью и интеллектом – все-таки каждый SPE процессор является достаточно общим (по назначению) и поддерживает такие атрибуты классических CPU как переходы, загрузка и выгрузка данных по произвольным адресам, произвольные условия и т.д. Интересно, что обмен между собственной памятью SPE и общей системной памятью может происходить по ходу его работы – для этого в каждом SPE предусмотрен собственный DMA блок. Обмен с локальной памятью происходит достаточно резво – векторные данные пересылаются за один заход, полоса пропускания подобрана таким образом, чтобы не давать ALU простаивать. Вот так выглядит схема работы SPE подробнее:

  • Все 9 процессоров связаны широкой общей когерентной шиной (то есть видят внешнюю системную память и друг друга в общем едином адресном пространстве). В наличии два интерфейса к XDR памяти и два произвольных интерфейса ввода / вывода (системная шина) для коммуникации с GPU и периферийными контроллерами. Шина ввода / вывода обеспечивает ПСП, сравнимую с системной памятью – более 20 Гбайт в секунду. Интересно, что в других применениях (судя по всему, Cell будет использоваться не только в PS3) несколько процессоров могут быть объединены в различные конфигурации:

    так и до суперкомпьютера недалеко – погоду рассчитывать или ядерные взрывы. Все нормально – игровая и медиа индустрия отдает долги – раньше военные компьютеры были прообразами для игровых приставок, теперь наоборот, приставки смогут в будущем стать прообразом для рекордных вычислительных систем научного назначения. Вот они, забавные гримасы рынка.

В действительности, для Cell можно придумать множество применений, например, серверы видео по запросу или иные медийные сервисы для большого числа клиентов одновременно. Интересно, что в PS3 один из SPE будет отключен – только 7 будут доступны. Может, это вопрос выхода годных чипов, а может и температурного режима (как и частота 3.2 вместо 4 или более ГГц). Как вариант – он может быть зарезервирован для каких-либо системных нужд.

Кроме Cell в приставке будет RSX – графический ускоритель, похожий на G70 с интерфейсом FlexIO и некоторыми другими функциями и SB – процессор ввода / вывода и контроллер всяческих интерфейсов, обеспечивающий кроме того и некоторые вопросы совместимости с PS2.

Какие выводы мы можем сделать из архитектуры этой приставки? Очень простые – решение задачи влезания на елку без уколов может быть вполне успешно проделано путем отделения котлет от картошки. Для потоковых данных, когда много надо обрабатывать похожего – потоковые процессоры попроще. Для сложных алгоритмов, когда данных мало, но их надо крутить по всякому – один процессор, но зато сложный, эффективный и традиционный. Задача программистов – грамотно разбить задачу на подзадачи, классифицировать и распределить их по соответствующим процессорам. Им поможет компилятор и соответствующие расширения библиотеки С/C++, например, векторная библиотека и компилятор для Cell позволяют компилировать один и тот же векторный код для PPE или SPE по желанию, хотя на уровне железа их векторные модули и не совместимы (SPE проще VMX).

Кстати, Intel тоже вовсю разрабатывает такие ассиметричные схемы – два тяжелых и 8 легких ядер на одном чипе и т.д. – стоит приглядеться к Cell – он лишь первая ласточка в борьбе за снижение латентности. Скоро и настольные системы от Intel будут строиться по несимметричной схеме. Кстати, почему латентности? Об этом в следующей статье, пока же лишь намекнем, что не зря каждый SPE имеет свою локальную память – именно такое решение позволяет реально эффективно обрабатывать потоковые и векторные данные в играх и схожих приложениях. Системная память одна, и большое число ядер будет слишком сильно мешать друг другу, особенно на такой частоте. Но это не все, фактически, то, что современные архитектуры пришли к многоядерным процессорам и есть следствие латентности памяти. Далее в следующей части. А пока вернемся к нашему ящику:

Интересное в архитектуре Xbox

Процессор Xbox 360 (опять оговорился - процессоры) построен по-другому. Грубо говоря, в наличии 3 PPE из Сell и мегабайт общего L2 кэша на троих:

Это описание достаточно исчерпывающее – процессоры Xbox действительно близнецы братья PPE – небольшие организационные отличия почти не меняют картину. Все тот же VMX и гипертрединг с двумя потоками, все то же исполнение двух инструкций за такт без спекуляций. Те же объемы раздельных кэшей первого уровня – 2*32 Килобайта. И даже площадь кристалла выходит сравнимая – представьте себе 3 PPE да мегабайт кэша – примерно Cell, может даже чуть-чуть больше.

Схема полностью симметрична и не требует от программистов какой-либо классификации задач по процессорам, которые будут их исполнять или иного учета конкретного ядра CPU. Пиковая эффективность несколько ниже, чем можно рассчитать для Cell, но только пиковая. Реальные приложения будут, скорее всего, сравнимы – во-первых, многое решит графика, а она у Xbox возможно даже более производительная и гибкая чем RSX, а во-вторых, – выжать 100% из Cell будет труднее, и вряд ли всем разработчикам реальных приложений удастся плодородно задействовать все доступные SPE. В итоге, при равной финальной отдаче, проблем для разработчиков Xbox создаст явно меньше – чем не критерий выбора платформы.

Итак, три процессора PowerPC на одном ядре и 1 Мбайт кэша общаются (по шине с пропускной способностью в 22 Гбайт в секунду) с GPU выполняющим одновременно и роль контроллера общей памяти. Кроме того, к нему же по PCI Express 2х подключен южный мост – контроллер всяких интерфейсов и периферии от SiS.

GPU этот без сомнений достоин внимания:

Две главных достопримечательности этого ускорителя – встроенная память и унифицированные шейдерные процессоры, выполняющие как вершинные, так и пиксельные шейдеры, в зависимости от текущей загрузки (привет, WGF 2 и Vista, и все то, о чем уже писалось в статье про графику в Longhorn, ныне Vista). Таким образом, в наличие два контрольных блока, исполняющих код двух шейдеров. Каждый из них может быть как пиксельным, так и вершинным. Контрольный блок дирижирует массивом из 16 шейдерных процессоров, причем таких массивов три, и каждый может находиться под управлением либо первого, либо второго контрольного блока (на схеме shader interp). Таким образом, все ALU чипа загружены практически все время, и вопрос баланса вершинной и пиксельной нагрузки внутри ускорителя решается автоматически! Много вершин – и процессоры больше времени проведут, обрабатывая вершины, много пикселей – закрашивая пиксели. А благодаря наличию двух контрольных блоков и переключение между шейдерами (дорогая операция) может происходить куда как эффективнее, чем ранее. Интересно, что при наличии 48 процессоров, в обработке находится 64 состояния (можно называть это нитями, но проще говорить о 64 объектах, будь-то пиксель или вершина). И такая избыточность позволяет всегда держать процессоры загруженными, даже если в части шейдеров произошел ранний выход или меньшее число команд в какой-то ветке условий. Утилизация ресурсов такого чипа близка к оптимальной, даже в случае шейдеров с условными переходами. Это – будущее графики, то, что мы увидим на ПК с приходом Vista и первых WGF 2 ускорителей. А пока – в приставке Xbox, уже в это рождество. Формально ускоритель Xbox не совместим с WGF 2 полностью, но отличия, судя по всему, минимальные и скорее формальные, чем архитектурные – на момент разработки этого GPU стандарты WGF 2 еще не были до конца определены. По любому, ATI получила шикарный полигон для обкатки будущих технологий для Vista, да еще и под бдительной опекой Microsoft – согласитесь, ситуация позитивна по самую крышку.

Встроенная память предназначена для самых критичных данных – буфера глубины и значений цвета буфера кадра. 10 Мбайт может не хватить для полного буфера во всех режимах, но тут помогает подкачка буфера в локальную память и обратно большими блоками. Отрисовка типичных сцен все равно идет не хаотично, а скорее последовательно в областях тех или иных моделей. Очень широкая и быстрая шина между чипами (ускоритель реализован с помощью двух чипов в одном корпусе):

Такая организация позволяет крайне эффективно работать с буфером кадра и делает anti-aliasing (АА) действительно практически бесплатным во всех режимах. Интересно, что второй чип, с 10 Мегабайтным буфером содержит и специальную логику – фактически блоки записи и блендинга, а также проверки глубины вынесены на него из основного чипа ускорителя. Таким образом, они получают очень широкий и быстрый доступ к данным этого буфера, делаю проверку глубины в MSAA режимах бесплатной даже с точки зрения межчиповой коммуникации. Впрочем, эта деталь уже не так важна, так как шина между чипами пропускает 256 Гбайт данных в секунду. Здорово.

Итак, Xbox дает нам много намеков на будущие графические архитектуры. Стоит задуматься и о встроенной (точнее пристроенной) к ускорителю памяти и об унифицированных шейдерных процессорах. Опять, оно все уже тут, только руку протяни, и скоро будет на нашем столе. Просто, чуть раньше чем в ПК появилось в игровой приставке. Вот откуда ветер дует…

Так кто же кого?

В итоге мы имеем сравнимый объем памяти, сравнимую ПСП и, скорее всего, сравнимую практическую производительность процессоров. Сравнимые графические возможности, надо отметить несколько более эффективно и красиво реализованные у ATI. Кто победит? Конечно же, интерфейс, дизайн, цена и доступные игры. Архитектуры не настолько разные по силе, чтобы это что-то решало. И даже некоторые неудобства программирования PS3 не повлияют на ход лодки – будет сделано всё, чтобы их нивелировать, да и решения о выпуске игры на ту или иную платформу принимают, как правило, не программисты… Выиграет Sony и Microsoft, и NVIDIA и ATI, и IBM (даже дважды). И даже SiS и Rambus получат свой кусочек пирога. Потому, что все они получат часть средств от заинтересованных потребителей, в том числе и средств идущих на новый игровой контент. После чего компании окупят R&D, и даже останется на бутерброды с икрой, если все пойдет хорошо. Обкатают на широких массах новые идеи и технологии. И продолжат эту карусель спроса и предложения, разработки и убеждения. Купи, купи новое ;-)



Александр Медведев (unclesam@ixbt.com)
Опубликовано — 3 октября 2005 г.
 
 
Комментарии?  Поправки?  Дополнения? degust@ixbt.com
 
Комментарии?  Поправки?  Дополнения? degust@ixbt.com


на главную страницуна главную страницуна главную страницу

Новости | 3D-Видео, тюнеры и LCD | iT-Среда | MacLife | Мобильные устройства | Ноутбуки | Носители информации | Платформа ПК | Приложения и утилиты | Принтеры и периферия | ProAudio | Проекторы и ТВ | Сети и серверы | Цифровой звук | Цифровое видео | Цифровое фото | Карта сайта | Поиск

Copyright © by iXBT.com, 1997—2012. Produced by iXBT.com