R520 и другие, предварительные размышления


Не секрет, что в сети появилось множество досрочных данных относительно будущих продуктов ATI на базе нового чипа R520 и его урезанных экономичных версий (RV5XX). Постараемся суммировать доступную информацию, выделить наиболее вероятные (с точки зрения логики) сценарии и параметры и проанализировать возникшие перспективы. Вперед.

Судя по всему, будут анонсированы следующие решения:

Линейка чипов

  R520 RV530 RV515
Технология, нм 90 нм 90 нм ?
Частота ядра, МГц. 450-600 500-600 450-550
Частота памяти, МГц (450-700)*2 (400-700)*2 (400-500)*2
Шина памяти, бит. 256 128 (64) 128 (64, 32) +HM
Типы памяти DDR, GDDR3 DDR, GDDR3 DDR, GDDR3
Пиксельных процессоров 16 12 4
TMU 16 12 4
Шейдерная модель 3.0 3.0 3.0
Возможности Два HDCP DVI выхода,
HDMI (только R520) DVI,
HDTV- Out с внешним интерфейсным чипом,
аппаратный H.264 декодер

Нет сомнений, что главная черта новых продуктов — поддержка шейдерной модели 3.0. И это, товарищи, правильно. Наконец-то!

R520 содержит значительно (сделаем ударение на этом слове) переработанные пиксельные процессоры. По крайней мере, по сравнению с предыдущей архитектурой R4XX, обремененной рудиментарными фазами, наследием темной переходной эпохи первых шейдеров и DX8. Такая архитектура сильно отличалась от более гибких NV3X-4X (изначально спроектированных с оглядкой на более-менее произвольные, по структуре и длине, шейдеры и динамическое исполнение ветвлений). В итоге конвейеры стали более гибкими, приобрели возможность исполнять переходы и другие радости третьей шейдерной модели. Как следствие — перед нами более сложные, по отношению к предыдущим поколениям, пиксельные процессоры, причем как с точки зрения числа транзисторов и занимаемой на кристалле площади, так и по алгоритму действия. Но став более гибкими и более сложными, стали ли они более быстрыми? Совершенно не обязательно. Такие серьезные изменения коснулись пиксельных процессоров ATI впервые со времен R3XX. Схема, примененная в R3XX и R4XX, была проще, чем у NVIDIA и, по сути, имея слабую сторону — отсутствие поддержки SM3, имела и сильную — высокую эффективность работы при малой сложности, особенно, на простых операциях. Утрачена ли эта эффективность теперь, с приобретением гибкости? Скорее всего, шило компенсирует в данном вопросе мыло, и мы получим конвейеры более гибкие, и, благодаря различным ухищрениям и новшествам, сравнимые по скорости со старыми (на одинаковой частоте). Может быть, и несколько более быстрые, но, явно не в разы и даже не на 50% — цифры порядка 10-20% пикового преимущества на один конвейер при равной частоте выглядят более логичными.

Забавно, но, с одной стороны, архитектура ATI стала ближе к NVIDIA, а с другой, в силу своего исходного отличия, сделала шаг в сторону от того, что мы видели ранее в R3XX-4XX и NV3X-4X. Этот шаг — шаг в будущее, в лице Xenos (действительно революционной архитектуры графического ускорителя для консоли MS Xbox 360) и будущих архитектур графических процессоров новой ОС Microsoft (ранее известной как Longhorn). Сам по себе он не так велик, как в случае с Xenos, но принципиален, и более подробно мы коснемся этого вопроса в будущей, посвященной новым архитектурам и их жизни в игровых приставках, статье. А пока, отметим наличие и единство в R520 некой диалектической противоположности тенденций (хорошая фраза) ;-)

Итак, с точки зрения производительности, следует ожидать пиксельных конвейеров, несколько (но не фатально) более производительных на единицу частоты, чем в случае R4XX, а, следовательно, столь же успешно сравнимых с конвейерами G70. Но не забываем, что в G70 их 24, а не 16. Для 16 конвейерных чипов, это не даст ATI никакого преимущества, а скорее наоборот, может вызвать определенные проблемы. Смотрите сами: налицо не столь успешные значения частот ядра, как задумывалось на этапе проектирования. Кто знает, сколько будет реально доступных карт на 600 МГц, в то время, как карты на базе G70 уже заполонили собою прилавки, и над рынком витает потенциальный выход усиленной версии G70 (некой 7800 Ultra), на основе все того же, как известно, хорошо поддающегося разгону чипа (да еще, скорее всего, вкупе с более быстрой памятью). Как не крути — риск остаться в проигрыше в гонке за абсолютное лидерство в престижном сегменте самых-самых. Всё покажут тесты, однако уже сейчас можно прогнозировать достаточно близкие результаты без какого-либо подавляющего преимущества со стороны ATI. Арифметика проста: 24*430=10320, а 16*600=9600. Даже если предположить, что у ATI будет 20% преимущество по частоте — 720 МГц*16=11520 — оно не выглядит подавляющим превосходством, и это теоретический максимум на шейдерах, а так, все будет зависеть от конкретных приложений, соответственно, и единого мнения у тестеров не будет. Никакие чудо-драйверы тут не возможны, схожая степень оптимизации шейдеров диктуется самой архитектурой SM3 и DX9 и от драйверов, конечно, зависит многое, но скорее в вопросе не проиграть, чем выиграть у NVIDIA. Учитывая, сколько времени ATI боролась с наладкой выпуска R520, можно предположить, что драйверы не только уже готовы, но и отлажены-оптимизированы, не по одному разу. Ведь первые тестовые чипы появились очень давно.

На частоте в 600 МГц возможен паритет, а может даже и небольшой проигрыш. Но будут ли реально доступны карты на 600 МГц или более? 550*16=8800. Даже +20%=10560 — в лучшем теоретическом случае по скорости закраски будет паритет, реально — во многих приложениях даже небольшое отставание. А теперь представьте себе, что NVIDIA выпускает G70 на 500 МГц (или чуть меньше) и с более быстрой памятью? Так то.

Подведем итог: более скоростная шина памяти и более шустрые вычислительно пиксельные конвейеры R520 будут компенсироваться меньшим числом пиксельных процессоров. Впрочем, принижать значение локальной памяти не стоит — она может творить чудеса при грамотном использовании. Другое дело, что и NVIDIA не дремлет — более быстрая память доступна и может быть установлена, разгонный потенциал G70 хорошо известен. В итоге, наиболее вероятной ситуацией в этом сегменте рынка будет паритет скорости (или около того), и все будет решать цена, предпочтения и набор дополнительных возможностей. Возможности — сравнимы. Цена — может быть сравнима (особенно если начнется конкуренция). А вот доступность: тут у NVIDIA, согласитесь, есть заметная фора.

Однако, как известно, в финансовом плане многое решает широкий средний сектор (нижний уровень в последнее время все больше и больше остается за интегрированными в чипсеты решениями), на который и нацелены два других чипа — RV530 и RV515. Здесь картина для ATI более радужная, особенно в случае RV530 — 12 конвейеров и хорошая частота ядра — до 700 МГц, частота, которой так не хватает более сложному R520. Есть версия, что этот чип скорее является обрезанным вариантом R580, чем R520 — отсюда и большие частоты, и некоторые другие возможности. Что-то подсказывает, что следует надеяться и на заметно более высокий выход годных чипов, чем в случае старшего брата. Все это по технологии 90 нм, то есть потенциально производство более выгодно, особенно по мере наращивания массового выпуска. С другой стороны, не секрет что по мере утончения норм, все чаще и чаще сказываются капризы новых технологических процессов, делая их преимущества совершенно не очевидными, даже в среднем ценовом секторе, то есть после длительной фазы отладки и при больших объемах выпуска. Именно каприз, сильное отличие желаемых параметров R520 от того, что в итоге выходит с конвейера, привел к скромной частоте ядра (в среднем 500-550 МГц, 600 МГЦ у самой производительной и, скорее всего, малодоступной версии) и существенным задержкам запуска этих чипов в массовое производство. Помните, как в свое время NVIDIA долго и мучительно осваивала новый процесс для NV3X?

Чип RV515 — самый недорогой, в нем только один квад, что существенно упрощает некоторые аспекты. Если он будет производиться по технологии 90 нм (пока нам не известны планы ATI на этот счет), он может стать очень недорогим чипом, при этом, обладая поддержкой всех характерных особенностей линейки, включая и третьи шейдеры. Большой спектр возможных частот, ширины шины памяти и поддерживаемых типов памяти, позволит гибко ориентироваться и реагировать на потребности рынка и конкурентную ситуацию. Запланирован и HyperMemory (HM) режим, в том числе, при желании вендора, и с предельно узкой шиной памяти — 32 бита. Для этого чипа все решит только цена.

Несмотря на бытовавшие слухи о 24-х и даже 32-х конвейерных версиях R520, мы склонны считать, что если таковые (пробные) чипы и были разведены и произведены, а не только смоделированы (что, при таком сценарии, стоило ATI немалых дополнительных денег), они себя не оправдали. Выход годных или пиковые частоты этих монстров вынудили компанию остаться на базовом, 16 конвейерном варианте для R520. Судя по всему, никаких дополнительных конвейеров на кристалле, который пойдет в производство нет, и если таковые и случатся, то только в оптимизированной версии R580, которая в данный момент разрабатывается и для которой вероятно приберегут суффикс XT PE (см. таблицу с картами далее) или новую циферку, например, RADEON X1900.

Линейка карт

RADEON Чип (конвейеров) Частота ядра / памяти, МГц Объём памяти, Мбайт (бит) Цена, $
X1800 XT R520 (16) 600 / 700 512 (256) GDDR3 599
X1800 XL R520 (16 ) 550 / 625 512 (256) GDDR3 499
X1800 PRO R520 (16 ) 500 / 500 256 (256) GDDR3 449
X1800 LE R520 (1 2) 450 / 450 256 (256) GDDR3 349
X1600 XT RV530 (12) 600 / 700 128-512 (128)
DDR1/2/GDDR3
Зависит от памяти
X1600 PRO RV530 (12) 500 / 400 128-256 ( 128/64)
DDR1/2/GDDR3
Зависит от памяти
X1300 PRO RV515 (4) 550 / 500 128-256 (128) Зависит от памяти
X1300 LE RV515 (4) 450 / 400 128-256 (128/64) Зависит от памяти
X1300 LE HM RV515 (4) 450 / 500 32-128 (64) Зависит от памяти

Серия X1800: XT, судя по всему, будет картой для прессы, по крайней мере, в первые месяцы. Энтузиасты получат XL (если все пойдет хорошо), основной картой станет как всегда PRO, а частично бракованные чипы с одним заблокированным квадом пойдут на LE версию, более-менее доступную для нормального, не проводящего все свое время только в играх, покупателя. Кстати, верхние решения изрядно греются и занимают два слота (система охлаждения).

Серия X1600 выглядит наиболее привлекательной в плане конкуренции с продуктами NVIDIA – 12 конвейеров, шейдеры 3.0, передовая технология. Производительность, бывшая топовой для предыдущего поколения, но за разумные деньги и с достаточно скромным энергопотреблением в рамках одного занимаемого слота. При этом частота 700 МГЦ старшей модели позволяет надеяться и на хороший разгонный потенциал моделей дешевле. Обе планируемые версии пока что с 12 конвейерами – это говорит о высоком прогнозируемом выходе годных чипов. В средней серии будет предлагаться достаточно широкое поле для произвола вендоров – могут быть установлены разные типы и объемы памяти, в том числе, будут и карты с урезанной вдвое шириной шины памяти (64 бита) и старой и недорогой DDR памятью, в том числе и на низких частотах. Если себестоимость чипа будет разумна – это приведет к появлению хорошо сбалансированных и очень конкурентоспособных недорогих карт, призванных вытеснить решения предыдущих поколений и задать жару сериям 6600 и 6800 от NVIDIA.

Серия X1300 – недорогие карты на базе RV515. Очень небольшое потребление, все возможности и, надеемся, скромная цена при богатом выборе различных вариантов от независимых производителей. Таким образом, ATI закрывает всю линейку дискретных продуктов и переводит ее на новый виток архитектур, с поддержкой SM3. Осталось выпустить соответствующий чипсет с интегрированным решением, и он, несомненно, уже находится в разработке.

Разумеется, настоящее кто-есть-кто, для всей линейки покажут как обычно три параметра: скорость, доступность и цена. Ждать осталось недолго.

О прочих возможностях и интерфейсах

Новые ускорители поддерживают HDCP формат на оба DVI интерфейса, а старшие модели на базе R520 способны выводить на DVI разъемы и HDMI (High Definition Media Interface, интерфейс для вывода изображения и звука на цифровые кинотеатры и другие аудио-видео воспроизводящие устройства нового поколения. Пока не известно будет эта возможность доступна для всех карт на базе R520 или только для линейки All-In-Wonder. Разумеется, рано или поздно (скорее не сразу) будет выпущена и CrossFire (CF, так и хотелось сказать SLI) версия X1800, а все обычные карты X1800 изначально совместимы с ней, и могут работать в подчиненном режиме. Кроме того, у всех карт с внешним TV-Out чипом будет поддержка аналогового компонентного HDTV-Out.

О перспективах

Самое интересное – R580. Когда, и сколько конвейеров, вот вопрос. Очевидно, что он будет основываться на той же архитектуре что и R520, но, возможно, с большим числом конвейеров (24 или даже 32). Не секрет, что реально новая архитектура, подобная Xenus (R500) из xbox 360 по построению, с унифицированными процессорами, и к тому же, полностью соответствующая WGF 2.0, будет реализована лишь в R600 и следующей архитектуре NVIDIA (то, что раньше называлось NV50), и оба этих чипа мы увидим еще не скоро, в 2006 году. Пока же нас ждёт суровая конкуренция в среднем секторе, и попытки перетянуть на себя одеяло формального лидерства в верхних эшелонах, за счет выпуска оптимизированных версий, возможно, с большим числом конвейеров, более высокочастотных карт и ревизий и т.д.

Это все в будущем. А пока никакого лидерства R520 не предвидится, никакой революции не будет и самый насущный вопрос, все тот же: какова будет реальная цена и доступность старших карт ATI. Увидим ли мы 600 МГц R520 на полках сразу после анонса?





Дополнительно

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.