AMD Radeon HD 6870 и HD 6850:

теоретические сведения о новых решениях для среднего ценового сектора

Сегодня мы познакомимся с новыми продуктами компании AMD, предназначенными для среднего ценового диапазона — AMD Radeon HD 6870 и HD 6850. В отличие от серии Radeon HD 5800, эти видеокарты позиционируются несколько ниже — у них цена будет меньше, а вот производительность почти такая же. Ну и функциональность, соответственно, ничем в худшую сторону не отличается.

В этот раз обзор будет разделён по времени на две части — в день анонса (сегодня) выходит только эта теоретическая часть общего материала, а все практические исследования, включая и синтетические и игровые тесты, выйдут у нас несколько позже.

Лирическое вступление

Общеизвестно, что осень, наряду с весной, — это традиционное время появления новых или обновления «старых» графических архитектур. К сожалению, освоение техпроцессов, более совершенных, чем 40 нм, у тайваньской фабрики TSMC в очередной раз заметно затянулось (32 нм отменили, и остаётся только ждать 28 нм), и производители видеочипов вынуждены продолжать пользоваться «устаревшим» 40-нанометровым техпроцессом, приведение которого в приличное состояние также заняло продолжительное время и проходило не совсем гладко.

Вот и компании AMD, вероятно планировавшей выпуск обновления своей архитектуры сразу на более тонком техпроцессе, пришлось выпускать чипы на всё том же 40-нанометровом. Перед анонсом решений обновленной архитектуры компания AMD собрала журналистов в североамериканском городе Лос-Анджелесе, который порадовал российских журналистов своим теплом во время выпадения первых твёрдых осадков в столице нашей Родины. Кстати, если вы суровы, как челябинские мужики, и вам не интересны лирические и прочие вступления, то лучше переходите сразу к серьёзному разделу материала.

Ну а лирикам мы сначала немного расскажем о поездке в США. Хотя в рамках данного материала можно лишь вкратце написать о том, что мы увидели, ведь описание всей поездки получится слишком длинным. Учитывая долгий перелёт, AMD дала журналистам передохнуть перед «глубоким погружением» (Deep Dive) в технические детали, что оказалось совершенно правильным решением.

В вечер прилёта наших времени и сил оставалось разве что на ужин и небольшую прогулку вокруг отеля (Hayatt Regency Century Plaza — очень хороший!). Район рядом с местом проживания называется Century и это некий бизнес-центр с кучей банков в округе. Но были рядом и другие предприятия, например, одна из студий телевизионной компании Fox, известной по сериалам House MD и многим другим.

Первый полный день поездки с самого начала был исключительно развлекательным — компания AMD повезла нас на экскурсию в Universal Studios и одноимённый парк развлечений, где мы были VIP-гостями, гордо отличающимися бейджиками с соответствующей надписью, которые давали некие привилегии, в т. ч. и небольшую скидку на различные сувениры в многочисленных местных лавках.

Парк Universal удивил своими размерами — как небольшой городок. Мало того, что сама часть парка возле входа выполнена в виде декораций многочисленных кинофильмов, так ещё и развлекательных аттракционов на свежем воздухе и в помещениях там довольно много и занимают они значительные площади. Развлечения населения там весьма разнообразны, и это дело явно поставлено на широкую ногу.

Рассказ о студиях Universal и о соответствующем парке вполне потянет на отдельный материал, уж слишком много всего мы там увидели: и сами студии, и склады со всякой утварью, которая используется в качестве декораций, и кучу аттракционов: King Kong 360 3D, The Simpsons Ride, Terminator 2 3D…

А после парка вместе с парой российских коллег мы отправились на бульвар Голливуд и прошлись немного по местам голливудской славы — Walk of Fame — тем самым звёздочкам на тротуаре. Их там очень много — и это главное впечатление.

Кстати, в тот день была премьера фильма Jackass в 3D (фильм, выросший из реалити-шоу «Чудаки»), и перед всемирно известным кинотеатром Grauman's Chinese Theater были расстелены красные дорожки, по которым должны были ходить местные знаменитости. Народа, решившего поглазеть на них, собралось вокруг очень много, ну а мы, во-первых, мало кого знали, а во-вторых — решили лучше посмотреть Беверли Хиллс и знаменитую надпись Hollywood, которую обещал нам экскурсионный тур на открытом микроавтобусе.

Экскурсовод, а по совместительству и водитель, действительно подробно рассказал про Беверли Хиллс и многих его обитателей, показав дома различных знаменитостей, которые часто скрывались за высокими зелёными оградами. Он утверждает, что на одной из следующих трёх фотографий запечатлён дом Киану Ривза, попробуйте догадаться какой.

Угадать довольно легко, но если вам нужна подсказка, то вот она — что выбрал бы главный герой The Matrix? В общем, поколесили мы по домам известных личностей (а живут они довольно скромно, по сравнению со многими российскими господами, надо сказать), а вот до надписи Hollywood на склоне холма на экскурсионной машине мы так и не доехали. Хотя и увидели её после того, как водитель сказал, как проще всего это сделать:

Это вид почти с бульвара Голливуд, из торгового центра поблизости. В общем, повпечатлявшись пару минут, мы поехали обратно. Поймав такси, даже не особенно удивились тому, что водитель оказался бывшим соотечественником, переехавшим сюда много лет назад из Узбекистана. Говорит, что тут таких много. Охотно верим.

Впереди был самый важный день — технические сессии AMD, рассказывающие о новых продуктах и их особенностях. Что интересно, мероприятие проходило в здании бывшей фондовой биржи Лос-Анджелеса, расположенной где-то в даунтауне. Ныне постройка служит развлекательным целям, превратившись в ночной клуб (Exchange LA, на фото ниже видны барные стойки).

Перед прессой выступали многочисленные представители компании AMD и их партнёры, в течение почти всего дня рассказывавшие о новых аппаратных и программных решениях. Обо всём этом читайте далее, в «серьёзном» разделе статьи, а здесь я приведу лишь пару фотографий с мероприятия.

После окончания всех сессий в клубе прошла прощальная вечеринка, для представителей российской прессы продолжившаяся на балконе одного из номеров нашего отеля. К сожалению, наш вылет был ранним утром и времени на Лос-Анджелес уже совсем не оставалось. А ведь до побережья океана в этот раз я так и не добрался…

Серьёзная часть

Давайте сначала поговорим немного о положении AMD на рынке в целом. Стратегия компании в последние годы очень проста, и самое главное в ней то, что они единственные, кто выпускает полноценные платформы в комплекте: и настольные, и мобильные. Так, за проходящий 2010 год ими было выпущено четыре новые платформы, на которых основаны десятки решений от производителей настольных ПК и ноутбуков.

Вторая важная для компании ниша — дискретные GPU для ПК. И тут успехи AMD в последнее время велики, как никогда: благодаря быстрому освоению техпроцесса 40 нм и при помощи целой линейки отличных решений для DirectX 11, выпущенных первыми в отрасли, по доле рынка дискретных видеочипов AMD не просто догнала, но и обогнала своего основного конкурента — компанию Nvidia. Не говоря уже о рынке DX11-совместимых решений, на котором они просто доминируют, что вполне логично, учитывая полугодовое опережение конкурента по времени.

Естественно, что при наличии сильных платформ и дискретных видеочипов важной целью и задачей является выпуск гибридных решений AMD Fusion. Некоторые из них уже были продемонстрированы на выставках вроде Computex, а другие готовятся к выпуску и уже существуют в виде семплов. Как, к примеру, вот эта системная плата с Llano, которую показали журналистам при анонсе линейки Radeon HD 6800.

Лишь компания AMD может теоретически претендовать на все эти рынки, так как Intel пока что выпускает только интегрированные графические решения, а Nvidia — исключительно дискретные. Так что AMD старается ухватить весь пирог. Понятно, что возможности эти лишь потенциальные, но тем не менее — именно у AMD они наиболее широки. К слову, прогноз по продажам графических решений в 2011 году составляет 500—600 миллионов устройств.

Но Fusion APU — это всё же несколько иной рынок, нежели Radeon, а мы сегодня рассматриваем именно дискретную графику. И семейство под внутренним кодовым названием «Northern Islands» призвано усилить позиции AMD на этом рынке. Косвенная связь новых решений с Fusion есть в том, что через несколько лет мощь нынешней дискретной графики будет доступна и в гибридных APU.

Ну а слоган анонсированных сегодня AMD Radeon HD 6870 и HD 6850 — «Today, the best just got better», что в вольном переводе с маркетингового английского означает: «Всё то же самое, но немного лучше».

И действительно, «Barts» (а это кодовое наименование чипа, лежащего в основе линейки HD 6800) не особенно сильно отличается от решений предыдущей линейки на чипе «Cypress». Так произошло во многом потому, что переводить производство с 40 нм на более «тонкий» техпроцесс в ранее предполагаемые сроки не получилось. 32 нм был отменён, а 28 нм нужно ждать ещё какое-то время.

Поэтому AMD не смогла выпустить полностью новую архитектуру и модифицировала существующую, ведь 40 нм постепенно улучшается, и хотя на этом техпроцессе нельзя сделать мощные GPU новой архитектуры, но уже выпущенную можно значительно усилить. Однако «Barts» — это не топовое решение, а замена для серии AMD Radeon HD 5800, оптимизированная для снижения энергопотребления и по себестоимости.

Главной целью выпуска линейки HD 6800 стало достижение лучших показателей производительности на ватт и площадь чипа. Другими словами, AMD продолжает проводить давно известную политику главенства энергетической эффективности и себестоимости производства GPU.

Реальных технических изменений в чипе немного, хотя он действительно был улучшен. Основные изменения в Barts, по отношению к Cypress: более эффективная обработка геометрии и тесселяция, оптимизированная архитектура с улучшенной эффективностью, повышенное качество изображения (сглаживание и анизотропная фильтрация более высокого качества), модифицированная технология AMD Eyefinity. И всё это должно достаться покупателям дешевле HD 5800.

Давайте разберёмся, почему получилось так, что серия 6800 не лучше и не быстрее серии 5800, как это делалось ранее? Во-первых, как мы уже написали выше, AMD пришлось менять планы из-за длинного промежутка между 40 нм и более тонким техпроцессом и выпускать промежуточную линейку чипов. Во-вторых, они решили немного поменять свою линейку, прикрыв «дыру» между топовыми решениями и средним уровнем, которая есть у них сейчас (ведь линейка HD 5700 заметно медленнее, чем HD 5800).

Поэтому серия HD 5800 как бы разделилась на две: Barts и Cayman (о последней мы поговорим чуть позже в этом году, она станет топовой одночиповой серией). Линейка HD 5700 остаётся на рынке в неизменном виде, HD 6800 немного спускается вниз по скорости (она медленнее, чем HD 5800 в целом), а на смену HD 5800 в верхней части приходят решения HD 6900 на чипе «Cayman» (на слайде есть ещё и двухчиповый «Antilles», но это дело ещё чуть более позднего времени, да и не особенно массовый продукт).

А вот как это выглядит по наименованиям конкретных решений. Получается, что к концу года линейка AMD будет состоять из решений разной архитектуры, так как HD 5700 остаются без изменений (получат ли они переименование в HD 6700 — это вопрос), а в HD 6900 вполне вероятны некоторые архитектурные изменения, по сравнению с 5800 и 6800. Интересна и модель под индексом HD 6990 — судя по всему, это двухчиповая карта на двух Cayman (или Barts?).

Так как наш сегодняшний чип «Barts» во многом повторяет архитектуру «Cypress», которую мы подробно рассматривали в предыдущих материалах, то будет полезно ознакомиться с подробной информацией о предыдущих архитектурах компании по следующим статьям на нашем сайте:

А мы переходим к подробным характеристикам анонсированных сегодня видеоплат серии Radeon HD 6800, основанных на новом чипе с кодовым названием «Barts».

Графические ускорители серии Radeon HD 6800

Кодовое имя чипа «Barts»
Технология 40 нм
1,7 млрд. транзисторов (более чем на четверть меньше, чем у «Cypress»)
Унифицированная архитектура с массивом общих процессоров для потоковой обработки многочисленных видов данных: вершин, пикселей и др.
Аппаратная поддержка DirectX 11, в том числе и новой шейдерной модели — Shader Model 5.0
256-битная шина памяти: четыре контроллера шириной по 64 бита с поддержкой памяти GDDR5
Частота ядра до 900 МГц
14 SIMD-ядер, включающих 1120 скалярных ALU для расчётов с плавающей точкой (целочисленные и плавающие форматы, поддержка точности FP32 в рамках стандарта IEEE 754)
14 укрупненных текстурных блоков, с поддержкой форматов FP16 и FP32
56 блоков текстурной адресации и столько же блоков билинейной фильтрации, с возможностью фильтрации FP16-текстур на полной скорости и поддержкой трилинейной и анизотропной фильтрации для всех текстурных форматов
32 блока ROP с поддержкой режимов антиалиасинга с возможностью программируемой выборки более чем 16 семплов на пиксель, в том числе при FP16- или FP32-формате буфера кадра. Пиковая производительность до 32 отсчетов за такт (в т. ч. для буферов формата FP16), а в режиме без цвета (Z only) — 128 отсчета за такт
Запись результатов до восьми буферов кадра одновременно (MRT)
Интегрированная поддержка RAMDAC, шести портов Single Link или трёх портов Dual Link DVI, а также HDMI 1.4a и DisplayPort 1.2

Спецификации карты Radeon HD 6870

Частота ядра 900 МГц
Количество универсальных процессоров 1120
Количество текстурных блоков — 56, блоков блендинга — 32
Эффективная частота памяти 4200 МГц (4×1050 МГц)
Тип памяти GDDR5
Объем памяти 1024 мегабайта
Пропускная способность памяти 134,4 гигабайт в сек.
Теоретическая максимальная скорость закраски 28,8 гигапикселей в сек.
Теоретическая скорость выборки текстур 50,4 гигатекселей в сек.
Поддержка CrossFireX
Шина PCI Express 2.1
Разъёмы: DVI Dual Link, DVI Single Link, HDMI 1.4a, два mini DisplayPort 1.2
Энергопотребление от 19 до 151 Вт (два 6-штырьковых разъёма питания)
Двухслотовый дизайн
Рекомендованная для рынка США цена $239

Спецификации карты Radeon HD 6850

Частота ядра 775 МГц
Количество универсальных процессоров 960
Количество текстурных блоков — 48, блоков блендинга — 32
Эффективная частота памяти 4000 МГц (4×1000 МГц)
Тип памяти GDDR5
Объем памяти 1024 мегабайта
Пропускная способность памяти 128,0 гигабайт в сек.
Теоретическая максимальная скорость закраски 24,8 гигапикселей в сек.
Теоретическая скорость выборки текстур 37,2 гигатекселей в сек.
Поддержка CrossFireX
Шина PCI Express 2.1
Разъёмы: DVI Dual Link, DVI Single Link, HDMI 1.4a, два mini DisplayPort 1.2
Энергопотребление от 19 до 127 Вт (один 6-штырьковый разъём питания)
Двухслотовый дизайн
Рекомендованная для рынка США цена $179

Применение всё того же самого 40-нанометрового техпроцесса, но уже в отработанном виде позволило компании AMD выпустить решения среднего уровня, примерно соответствующие по производительности предыдущим топовым. Сложность чипов снизилась на четверть, равно как и площадь ядра, а вот многие характеристики, влияющие на производительность, остались почти на том же уровне, во многом из-за повышенных тактовых частот. Естественно, что новый чип стал ещё более эффективен энергетически.

Принцип наименования моделей изменился, о причинах такого решения мы писали выше. По сравнению с предыдущей серией поменялась и первая, и вторая цифры. Radeon HD 6870 и HD 6850 предназначены для смены HD 5870 и HD 5850, хотя они должны быть чуть медленнее их попарно. Зато в будущем планируется выпуск топовых карт серии HD 6900.

Два варианта серии, как обычно для видеокарт AMD, отличаются тактовыми частотами видеочипа и памяти, а также у младшей модели отключена и часть исполнительных блоков. На обе видеокарты серии устанавливают память типа GDDR5, одинакового объёма — 1 гигабайт. Это оптимальный объём памяти на сегодняшний день, от большего объёма на решениях среднего уровня никакой пользы просто не будет.

А ещё младшее решение отличается дизайном платы, и референсные кулеры у них разные. Обе видеокарты имеют двухслотовую систему охлаждения, закрытую привычным пластмассовым кожухом по всей длине карты. А вот энергопотребление младшей карты ниже, что позволило обойтись в её случае лишь одним 6-штырьковым разъёмом питания.

Архитектура «Barts»

Обновленную архитектуру Cypress мы рассматривали в соответствующей базовой статье. Как вы помните, особенных изменений в нём не было, это в основном развитие идей предыдущих поколений, хотя небольшие модификации затронули практически все блоки чипа. А отличия чипа Barts от Cypress вообще в основном количественные, хотя и не только.

Итак, какие изменения принесла переработанная архитектура в Barts? В основном, увеличенную производительность на каждый Ватт и миллиметр площади, то есть улучшенную эффективность. Хотя AMD называет Barts «вторым поколением DirectX 11», изменений в архитектуре практически нет, они почти исключительно количественные — просто иное количество исполнительных блоков и другой баланс между производительностью и потреблением с себестоимостью.

Да, некоторые оптимизации привели к повышению скорости обработки геометрии и тесселяции — больного места решений AMD, по сравнению с конкурирующими. Но эти улучшения не изменили скорость тесселяции в разы, а лишь в полтора-два раза в лучшем случае.

Нам кажется более интересным улучшение качества полноэкранного сглаживания и текстурной фильтрации, хотя они скорее программные, а не аппаратные. Также любопытна поддержка декодирования DivX и Blu-ray 3D-видео, да и улучшения в AMD Eyefinity и поддержке новых стандартов HDMI 1.4a и DisplayPort 1.2 весьма логичны и своевременны.

Хотя это в основном изменения, связанные не с ядром GPU, а с прочими блоками, которые не относятся к 3D-части чипа, которая наиболее интересна для нас сейчас. Итак, давайте рассмотрим блок-схему нового чипа.

Смотрим, что изменилось. По сути, это только блоки в составе Graphics Engine и общее количество блоков SIMD. Блок тесселяции ныне улучшен (это седьмое поколение, см. далее), растеризаторов стало два (или вдвое увеличен темп обработки примитивов, что также вполне вероятно), а количество блоков SIMD снизилось с 18—20 (у Cypress) до 12—14 штук (у Barts), в зависимости от модели.

Ровно настолько же уменьшилось и общее количество процессоров потоковой обработки, теперь их максимум 1120 штук, в отличие от 1600 у Cypress. Всё остальное осталось прежним, и 256-битная шина памяти с поддержкой GDDR5 видеопамяти, и блоки ROP, и остальное.

Благодаря более высоким тактовым частотам, производительность Radeon HD 6870 оказывается выше, чем у HD 5850 (внимание — ниже, чем у HD 5870 даже теоретически!), при меньшей площади GPU. Но это сравнение по цене, а если сравнивать чипы Barts и Cypress на одной частоте, то анонсированное сегодня решение будет в основном медленнее.

Тесселяция и обработка геометрии

Известно, что относительно слабым местом ранних решений AMD была тесселяция, появляющаяся в DX11-приложениях. И вполне логично, что в Barts частично исправили именно это. Блок тесселяции в данном GPU объявлен уже седьмым поколением тесселятора ATI/AMD (см. слайд ниже). Первый появился ещё в древнем ATI Radeon 8500, второй в консоли Xbox 360 от Microsoft, а далее пошли серии видеокарт AMD. Вероятно, 8-е поколение мы увидим уже в серии HD 6900…

Честно говоря, нам не совсем понятно такое большое количество поколений тесселяторов, особенно если большинство их изменений ограничивались введением совместимости с версиями DirectX и уж тем более исключительно небольшими приростами производительности. А можно вспомнить и решения конкурента, первое же поколение тесселяторов которого превосходит по производительности все существующие семь (а то и восемь) поколений тесселяторов AMD. Так есть ли смысл гордиться этой цифрой?

Впрочем, важнее то, что по данным синтетических тестов компании AMD, скорость тесселяции в HD 6870, по сравнению с HD 5870, увеличилась в полтора-два раза (конечно, мы это проверим в практическом исследовании). Причём, новый чип эффективнее всего справляется со средними уровнями тесселяции, а при высоких скорость почти не выросла. Но это не будет проблемой, так как в играх такие уровни не используются и не будут нужны в ближайшее время. Вот пример увеличения сложности геометрии при разных степенях разбиения:

Это уже камешек в огород конкурента. Действительно, вряд ли кому нужны треугольники размером в один пиксель, а при слишком большой детализации эффективность загрузки других блоков (растеризаторов, к примеру) значительно снижается, да и в целом такая работа недостаточно эффективно выполняется на нынешних GPU. В недостатках высокой степени тесселяции: лишняя работа по шейдингу (overshading), большое количество краёв полигонов, нуждающихся в обработке при мультисемплинге и т. д. В общем, такой подход вызывает лишь растрату ресурсов, на взгляд представителей AMD.

В идеале нужно добиваться наиболее эффективных оттесселированных моделей, чтобы размер каждого треугольника был около 16 пикселей на полигон. Это весьма выгодно для попиксельной обработки, которая ведётся именно такими блоками. Таким образом достигается идеальный баланс между качеством рендеринга и производительностью.

Именно для достижения этой цели служат такие методы, как адаптивная тесселяция, когда высокие уровни разбиения используются для объектов на первом плане и отдельных поверхностей, требующих высокой детализации, а для дальних объектов применяются меньшие уровни тесселяции, что улучшает производительность и почти не сказывается на качестве итоговой картинки.

Улучшения в качестве рендеринга

Как известно, предыдущие чипы AMD сделали правильный шаг в направлении достижения наиболее качественной картинки — в них появилась поддержка нового алгоритма анизотропной фильтрации, текстурные мип-уровни при которой расположены по идеальным окружностям. Также можно отметить возможность включения сглаживания методом суперсемплинга, который заметно улучшает общее качество рендеринга.

Что радует, в серии HD 6800 продолжили вносить изменения, направленные на улучшение качества картинки. С одной стороны, почти все уже забыли об этом, так как качество у решений и AMD и Nvidia схожее и в целом уже весьма неплохое, но с другой — возможности для улучшения всегда есть. В данном случае компания AMD решила ввести новый режим сглаживания, улучшить качество текстурной фильтрации и (наконец-то!) дать возможности по отключению оптимизаций Catalyst AI.

Новый метод сглаживания — это известный по некоторым мультиплатформенным играм Morphological Anti-Aliasing (MAA). Это не совсем привычный нам метод сглаживания, а скорее фильтр постобработки, применяемый к финальной картинке при помощи вычислительного шейдера. Данный метод сглаживает все пиксели сцены, а не только края полигонов и полупрозрачных текстур как MSAA, хотя в недостатках у него — излишняя замыленность, как видно по картинке.

При этом MAA быстрее суперсемплинга, так как обрабатывает только нужные участки, на которых шейдером найдены резкие цветовые переходы. Производительность и суть алгоритма схожа с методом edge-detect CFAA в драйверах AMD, но сглаживание применяется ко всем резким граням. Что весьма немаловажно, обещается, что метод форсирования MAA из AMD Catalyst Control Center совместим со всеми приложениями DirectX 9/10/11.

Но этот новый метод сглаживания — это полностью программное нововведение. А что инженеры AMD изменили в алгоритмах текстурной фильтрации? По их словам, алгоритм анизотропной фильтрации был переработан для улучшенной обработки «шумных» текстур, в частности — получения более плавных переходов между мип-уровнями текстур при анизотропной фильтрации. При этом обещается отсутствие потерь в производительности и отсутствие зависимости качества фильтрации от угла наклона поверхности, как и было ранее. На скриншоте слева — HD 5800, а справа — HD 6800.

Что не менее важно, так это новый пользовательский интерфейс в AMD Catalyst Control Center, позволяющий изменять качество текстурной фильтрации и даже полностью отключать все оптимизации. Для этого в настройки драйверов внедрили новый ползунок Catalyst AI:

Как видите, Texture Filtering Quality может иметь три значения, и отдельно отключаются оптимизации текстурных форматов (когда один текстурный формат подменяется в драйвере другим, чуть менее качественным, но более быстрым), к которым имели некоторые претензии конкуренты AMD.

Улучшения в технологиях вывода изображения

Полезно отметить поддержку DisplayPort 1.2 новыми решениями AMD, которая включена в улучшенную мультимониторную технологию AMD Eyefinity Multi-Display Technology. Её отличие в возможности вывода сразу нескольких каналов по одному разъёму DisplayPort, что позволит подключить большее количество мониторов к одной видеокарте.

Для подключения нескольких мониторов при помощи одного разъёма будет необходим специальный хаб или соединение мониторов типа «daisy chain». DisplayPort 1.2 обеспечивает поддержку большего количества мониторов, высоких разрешений и частот обновления, в том числе для стереомониторов следующего поколения. К слову, на все мониторы при этом могут выводиться изображения разного разрешения и частоты обновления.

На новых видеокартах AMD установлен порт HDMI версии 1.4a, пригодный для вывода стереокартинки. Для этого используется специальный стандарт передачи стереокадров, поддерживаемый новыми 3D-телевизорами, поэтому никаких проблем с выводом стерео на них не будет (читайте отдельный раздел о поддержке стереорендеринга компанией AMD ниже по тексту).

Немаловажным фактором качества вывода картинки является качественная цветокоррекция при выводе изображения на мониторы с расширенным цветовым охватом. И у серии AMD Radeon HD 6800 есть соответствующий аппаратный движок для этой задачи.

Но мультимониторные технологии и вообще технологии вывода изображения имеют не очень много смысла без соответствующей поддержки. И тут всё в порядке, мониторов с разъемами DisplayPort на рынке уже более трёх десятков, а игр, специально оптимизированных и подготовленных для мультимониторного вывода, — под полсотню (а сотни других игр просто совместимы с технологией Eyefinity). Также в последнее время появились недорогие адаптеры DP to Single-Link DVI, позволяющие подключить несколько недорогих мониторов к одной видеокарте.

В драйверах улучшений не меньше, ко всему, что уже есть в настройках (деление устройств на группы, продвинутый конфигуратор, цветокоррекция для каждого устройства отдельно, компенсация рамок дисплея, поддержка CrossFireX и др.), скоро добавятся новые режимы, такие как группа мониторов 5×1 в портретном режиме, автоматический вывод HydraGrid и т. п.

Технология AMD HD3D

Видя успешное продвижение стереовидения на рынке, AMD не могла остаться в стороне, не выступив с очередной открытой инициативой. Теперь она относится к стереорендерингу. Инициатива была анонсирована на GDC 2010, суть её в сотрудничестве производителей программного и аппаратного обеспечения, предоставлении широкого выбора решений, снижении их стоимости и повышения гибкости.

Инициативу поддержало большое количество компаний. Так, программное обеспечение по конвертации в Stereo 3D выпускается компаниями DDD и iZ3D, проигрыванием 3D-видео занимаются компании Cyberlink, Arcsoft, Roxio и Corel. За аппаратную часть отвечают производители дисплеев: LG, Samsung, CMI и Viewsonic, а производство очков и передатчиков остаётся за компаниями Bit Cauldron, XpanD и RealD.

Собственно, ничего нового инициатива Stereo 3D не предлагает, это всё те же стереомониторы и стереоочки, стереоигры и поддержка Blu-ray 3D, ПО для конвертации контента в стереоформат и т. п. Свою задачу компания AMD видит в предоставлении возможностей технологии AMD HD3D для игр в стереорежиме. Для этого видеодрайверами обеспечивается поддержка четырёхбуферного рендеринга в приложениях DirectX 9, DirectX 10 и DirectX 11, а при помощи партнёров из компаний DDD и iZ3D уже поддерживается более 400 игр в стереоформате.

Так, TriDef 3D Experience от DDD позволяет просматривать в стереоформате фотографии и видео, TriDef Ignition автоматически «конвертирует» порядка четырёх сотен DirectX 9, 10 и 11 игр в стереоформат, а TriDef Media Player делает то же самое с видеоданными с DVD и с видео высокого разрешения. Причем заявлено, что первые стереорешения, основанные на AMD Radeon HD были показаны (где и кому — вопрос отдельный) еще год назад, в октябре 2009-го. Такое решение совместимо со всеми стандартами вывода стереокартинки, всеми типами стереоочков и «безочковых» технологий.

Кстати, об очках. На мероприятии AMD для журналистов выступал Colin Baden, CEO компании Oakley, всемирно известной своей спортивной оптикой и солнцезащитными очками. Он рассказал о модели стереоочков Oakley HDO-3D. Естественно, не обошлось без похвальбы, эти очки были названы «первыми оптически корректными стереоочками на Земле», якобы снижающими эффекты засветки и двоения картинки, заметные во многих случаях, в т. ч. и при использовании очков из комплекта 3D Vision. Было бы интересно сравнить эти варианты вживую, ну а пока остаётся верить (или не верить) на слово.

К слову, компания AMD скоро планирует запустить на сайте портал, посвящённый технологии стереовывода HD3D, помогающий пользователям получить информацию о программных и аппаратных решениях для игр, просмотра фото и видео в стереоформате. При должном старании и средствах может получиться неплохо.

Блок обработки видео Unified Video Decoder 3

Решения Radeon давно славятся своими возможностями по декодированию и обработке видеоданных. Ещё со времён ATI именно у них в этой сфере были одни из лучших решений. Впоследствии и компания AMD продолжила эти традиции. В UVD3 появилась не только поддержка декодирования новых форматов, но и более качественная постобработка видеоданных.

Новые возможности постобработки привели к дальнейшему усилению позиций в известном тесте HQV 2.0. При максимально возможном счёте в 210 баллов, новая видеокарта AMD Radeon HD 6870 набирает 198 баллов, а лучшая из конкурирующих — лишь 138 баллов. Впрочем, это тест самой компании AMD, и к таким результатам всегда нужно относиться осторожно. Не потому что обман, но зачастую лукавство.

Весьма интересной новинкой нам кажется появление поддержки декодирования формата DivX/XviD (читай, MPEG-4). Но не только этот формат получил улучшения, теперь и MPEG-2 декодируется на GPU полностью, да и поддержка кодеков с двумя потоками (Blu-ray 3D) у AMD появилась.

И всё же интереснее то, что свежевышедшие видеокарты компании AMD, благодаря включению в GPU последней модификации блока UVD третьего поколения, умеют ускорять проигрывание видеороликов формата MPEG-4. Это важно не только и не столько из-за самой по себе сниженной загрузки CPU при декодировании, но поможет продлить время автономной работы ноутбуков и нетбуков, снизит шум от вентиляторов домашних кинотеатров на основе ПК (HTPC) и позволит проигрывать файлы MPEG-4 высокого разрешения на бюджетных ПК.

На мероприятии для журналистов была показана демонстрация одновременного декодирования на CPU и GPU. Как видите, при полностью программном декодировании CPU загружен работой более чем на 20%, а при перекладывании работы на GPU производства AMD, центральный процессор системы практически перестаёт выполнять какую-то значимую работу, ибо она становится в 10 раз меньше. Понятно, что всё это делалось и ранее, но не для DivX/XviD-формата.

Игры с поддержкой DirectX 11

Ну какой обзор современной видеокарты обходится без рассказа о новых играх с поддержкой свежих графических API? Вот и в этот раз AMD рассказала о нескольких приложениях с поддержкой DirectX 11. Но сначала расскажем о статистике от AMD по таким играм. Во-первых, они продали уже более 25 миллионов DX11-совместимых видеокарт, что само по себе уже довольно много.

Во-вторых, в результате грамотной совместной работы с Microsoft и игровыми разработчиками за прошедшее время было выпущено 15 игр и три игровых движка, обладающих поддержкой последней версии этого API. А в следующем году нам обещают еще пять DX11-игр, к разработке которых AMD приложила свою руку так или иначе. Список и правда довольно впечатляющий, и в AMD неплохо поработали.

Одной из совсем свежих игр является симулятор гонок «Формула-1» от Codemasters — F1 2010. Не будем отнимать хлеб у авторов Gametech.ru и рассказывать о самой игре, приведём лишь возможности DirectX 11, применённые в F1 2010. Во-первых, в DX11-версии применяются буферы большей точности — формат с 16-бит на цвет, по сравнению с 10-битным в DX9-версии. В результате качество рендеринга несколько выше и цвет получается более глубокий.

Возможности Shader Model 5.0 в игре применяются для значительно более качественной фильтрации теней и имитации погодных условий, а DirectCompute используется в постобработке для ускорения алгоритма размытия по Гауссу. Эта задача выполняется в вычислительном шейдере вдвое быстрее, чем в пиксельном, что позволяет использовать обработку в полном разрешении, а также получать высококачественный эффект HDR bloom.

Ещё одной известной игрой последнего времени с применением возможностей DirectX 11, является Civilization V. Работа над продвинутой DX11-версией началась ещё за год до выхода самого DirectX 11 API. И разработчики заявляют, что это не было традиционным портом DX9/DX10 на DX11, а скорее наоборот. DX10-версии вообще не существовало, они сразу же начали работать с прототипом DX11. И это сказалось на движке — он отлично оптимизирован для многопоточной обработки и использует соответствующие возможности DX11.

Но не только ускорением на многопроцессорных системах отличается этот игровой движок. Civilization V использует такие возможности последней версии API, как тесселяция и вычислительные шейдеры. Разработчики даже впервые использовали новые возможности, доступные исключительно на DX11-решениях — некое специфическое текстурное сжатие.

Так, в игре есть 18 мировых лидеров (см. скриншот выше), и каждая из таких сцен содержит по 200 мегабайт текстурных данных. В Fireaxis разработали новый алгоритм сжатия, который позволил вместить все эти текстуры (18×200=3,6 ГБ) в менее чем 150 мегабайт, при этом некоторые текстуры были сжаты в десятки раз. Но самое важное в алгоритме то, что распаковка текстур происходит исключительно на GPU, и мощности CPU при этом не используются, и по шине передаётся намного меньше данных, и в видеопамяти они занимают меньше места.

Третьей игрой, про которую мы хотим написать, является последняя часть сериала Medal of Honor. К сожалению, DX11-рендер в игре есть только для многопользовательской её части, а в игре для одного игрока таких возможностей нет. Тем не менее, DICE оптимизировали мультиплеер для DX11, игрой используются возможности этой версии графического API для многопоточного рендеринга и значительного улучшения производительности, а вычислительные шейдеры применяются для рендеринга более качественных мягких теней.

Последней игрой, достойной упоминания, является Deus Ex: Human Revolution. Долгожданное продолжение многими любимой игры (в основном первой части) не только оптимизировано для мультимониторного рендеринга в очень высоких разрешениях и для стереорендеринга на ПК, но и отличается поддержкой некоторых DX11-особенностей, таких как тесселяция, улучшенные алгоритмы SSAO и имитации глубины резкости (Depth of Field). И без оптимизаций производительности не обошлось. Надеюсь, нам понравится то, что мы увидим в начале следующего года.

Остальные три игры, описанные выше в этом разделе статьи, уже вышли в продажу и их можно приобрести, дабы воочию убедиться в наличии или отсутствии заявленного применения возможностей DirectX. При условии возможности проведения удобных автоматизированных тестов производительности, мы рассмотрим вопрос об включении этих игр в свой тестовый набор.

Неграфические вычисления

В этом смысле в Barts аппаратных изменений нет, зато они есть в программной части. AMD предпочитает называть вычисления на GPU параллельной обработкой (Parallel Processing). И естественно, что ими поддерживаются исключительно индустриальные стандарты — открытый OpenCL и закрытый, но не менее индустриальный DirectCompute из DirectX 11.

OpenCL привлекает AMD как открытый и мультиплатформенный API для так называемых гетерогенных архитектур, что очень неплохо подходит для всё того же AMD Fusion. Именно при помощи OpenCL можно раскрыть вычислительные возможности как CPU, так и GPU. Понятное дело, что AMD была первой компанией, которая представила OpenCL для CPU и GPU одновременно. А в целом OpenCL поддерживается такими крупными компаниями, как Apple, IBM, Intel, Nvidia, Sony и др.

У DirectCompute другие преимущества: распространение в составе DirectX компанией Microsoft и очень простой метод внедрения вычислений на GPU в уже существующие DirectX приложения, и особенно 3D-игры.

Изменения в параллельных вычислениях AMD произошли скорее с названиями, чем с аппаратной частью. На смену марке ATI Stream пришла технология AMD Accelerated Parallel Processing (APP). На мой взгляд — длинновато, хотя и лучше описывает то, что технология означает, и вполне соответствует повсеместному отказу от марки ATI. В компании решили сделать изменения в марке именно сейчас, при анонсе нового поколения графических карт и выпуске новой линейки, что абсолютно логично.

Теперь пакет SDK называется AMD APP SDK v2.2 (бывший ATI Stream SDK) и он включает полноценную платформу разработки на OpenCL для GPU и многоядерных x86 CPU, также поддерживается и AMD Fusion. На веб-сайте компании теперь есть раздел OpenCL Zone, названием подозрительно напоминающий CUDA Zone, где разработчики могут найти свежую информацию по OpenCL, учебные материалы по работе с OpenCL, утилиты для разработчиков и различные библиотеки, а также любые другие материалы по теме.

В качестве примера компании-разработчика на OpenCL, работающего в сотрудничестве с AMD, можно назвать компанию Viewdle (видимо, намеренно созвучно с одной немаленькой успешной компанией), которая занимается задачами распознавания лиц для различных приложений, используя в т. ч. и ускорение расчётов на GPU. Задача весьма востребованная, как в сфере не очень серьёзной (всякие социальные сети и службы знакомств, к примеру), так и в системах безопасности.

Так вот разработчики из Viewdle утверждают, что сотрудничество с AMD и использование OpenCL помогло увеличить эффективность и производительность их приложений, а стандарт OpenCL значительно облегчил многоплатформенную разработку. Что же, остаётся порадоваться за любое применение GPU в вычислительных задачах, которое будет особенно важно при широком распространении гибридных систем, основанных на Fusion APU и аналогах.

Краткие выводы

Подводя итоги теоретического обзора новых видеокарт серии Radeon HD 6800, можно сказать, что компания AMD в очередной раз выбрала исключительно верное с прагматичной точки зрения решение, слегка изменив архитектуру и сделав так, чтобы новые решения были ещё более эффективны энергетически и с точки зрения производительности в определённом ценовом диапазоне, раз уж более тонкие техпроцессы пока недоступны.

Пусть серия HD 6800 мало чем отличается от HD 5800 аппаратно, без некоторых улучшений «железа» всё же не обошлось, причём именно там, где нужно — в задачах тесселяции. Да и в целом видеокарты для покупателей теперь стали значительно привлекательнее именно за счёт сниженной цены и почти той же производительности, что и предыдущие топовые решения.

Пару слов обязательно нужно сказать и про конкурентов. Объективный вердикт будет выставлен в выводах практического тестирования, а сейчас мы можем лишь предположить, что HD 6870 и HD 6850 должны стать довольно успешными на рынке, хотя повторить успех предыдущих поколений будет трудно, так как у них нет преимущества в поддержке более новой версии DirectX, какое было у серии HD 5000.

Конкурировать новой линейке придётся с многочисленными решениями на основе Nvidia Geforce GTX 460, которых вышло уже довольно много, в том числе разогнанных и с разным объёмом видеопамяти. И хотя AMD сравнивает свои новые решения с обычными вариантами GTX 460, эти модели на чипах Nvidia продаются уже заметно дешевле $200, и равняться при корректном сравнении придётся скорее на специальные версии GTX 460, обладающие значительно повышенными тактовыми частотами.

Ну а напоследок, продолжая тему конкуренции, приведём один из слайдов презентации AMD, справедливость которого мы скоро проверим в материале, посвящённом практическому исследованию производительности AMD Radeon HD 6870 и HD 6850. В нём мы узнаем, как производительность новых решений на основе чипа Barts соотносится со скоростью предыдущих решений компании AMD, а также конкурирующих видеокарт Nvidia. А там, глядишь, и конкурент ещё чем-нибудь ответит. «Эту песню не задушишь, не убьешь… » (с)