Та же конфета, но в новой обертке, и, кажется, вкуснее… ATI RADEON X1950 XTX (R580+)


Часть 1: Теория и архитектура

Итак, очередное прибавление в номере названия продукта от ATI. И опять на «50». Был RADEON X1900, стал X1950. Впрочем, старые модели не уничтожаются, а просто уходят вниз по цене. В дальнейшем X1900 XTX просто пропадет.

Уже можно догадываться, что такое изменение в названии продукта несет крайне незначительные нововведения, однако в целом - это знаменательное событие. Во-первых, введение GDDR4 памяти на рынок, во-вторых, наконец-то изменена система охлаждения, которая уже не так шумит при сильной нагрузке на видеокарту, да и нагрев снизился. Но обо всем по порядку.

Перед нами небольшая модификация чипа R580, в этот раз изменений в чипе очень мало, существенных нововведений нет вообще. Основное и единственное значительное отличие состоит в модификации контроллера памяти, исправлении неких ошибок по работе с новым типом памяти GDDR4. Теперь обновленный контроллер памяти в R580+ поддерживает сразу три типа памяти: DDR2, GDDR3 и GDDR4. Также, по словам ATI, в R580+ были сделаны и другие мелкие изменения: увеличен размер некоторых кэшей, HyperZ теперь работает в разрешениях вплоть до 2560х1600. Все остальное осталось прежним: количество транзисторов, число пиксельных, текстурных и вершинных процессоров, используемый техпроцесс. Некоторое время назад многими источниками предполагалось, что в производстве R580+ будет использоваться 80 нм техпроцесс, что позволит снизить себестоимость чипа, уменьшить его энергопотребление и, возможно, увеличить частоту чипа в новых продуктах. Но ожиданиям не суждено было сбыться, вероятно, на техпроцесс 80 нм перейдут уже чипы нового поколения (R600) и чипы из других ценовых секторов, выходящих между R580+ и следующим поколением.

Так как R580+ является почти полной копией чипа R580, который, в свою очередь, был модифицированным R520 и также не имел больших нововведений, мы настоятельно рекомендуем прочитать соответствующие обзоры: RADEON X1800 (R520) и RADEON X1900 (R580). А в этой статье внимание уделено, прежде всего, небольшим отличиям между R580+ и R580.

Официальные спецификации RADEON X1950

  • Кодовое имя чипа R580+
  • Технологический процесс 90 нм
  • 384 миллиона транзисторов
  • Корпус flip-chip (перевернутый чип без металлической крышки)
  • 256-битный интерфейс памяти
  • Поддержка до 1 гигабайта DDR2, GDDR3 или GDDR4 памяти
  • Шинный интерфейс PCI-Express x16
  • 48 пиксельных процессоров
  • 16 текстурных блоков
  • 8 вершинных процессоров
  • Вычисление, блендинг и запись до 16 полных (цвет, глубина, буфер шаблонов) пикселей за такт
  • Точность вычислений для вершин и пикселей — FP32
  • Поддержка SM 3.0 (шейдерной модели версии 3.0), включая динамические ветвления в пиксельных и вершинных процессорах. Единственное ограничение — отсутствие выборки текстур из вершинных процессоров
  • Эффективная реализация переходов и динамических ветвлений в пиксельных процессорах
  • Поддерживается рендеринг в буфер кадра формата FP16, включая операции блендинга и мультисэмплинг, а также введен новый целочисленный тип данных RGBA (10:10:10:2) для буфера кадра, пригодный для более качественного рендеринга без использования FP16
  • Поддержка текстур в формате FP16, в том числе текстурного сжатия для FP16 текстур, включая технологию 3Dc+. Аппаратная фильтрация при выборке FP16 текстур не поддерживается
  • Технология выборки четырех соседних значений из текстуры вместо одного за такт, в случае отсутствия фильтрации (ускоряет фильтрацию, запрограммированную в пиксельном шейдере, например, для формата FP16)
  • Качественный алгоритм анизотропной фильтрации, пользователю доступен выбор между более быстрой и более качественной реализацией, улучшенная трилинейная фильтрация
  • Поддержка «двустороннего» буфера шаблонов
  • MRT рендеринг (Multiple Render Targets — рендеринг в несколько буферов)
  • Контроллер памяти с 512-битной внутренней кольцевой шиной, два разнонаправленных кольца по 256 бит, 4 канала памяти, программируемый арбитраж
  • Эффективное кэширование и более эффективная реализация HyperZ (по заявлению ATI, в очередной раз были увеличены внутричиповые буферы HyperZ, по сравнению с R580)
  • Два RAMDAC 400 МГц
  • Два DVI Dual Link интерфейса с поддержкой HDCP и HDMI
  • TV-Out и TV-In интерфейс, HDTV-Out
  • Последнее поколение аппаратного видеопроцессора, выполняющего задачи компрессии, декомпрессии и постобработки видеоданных, с поддержкой аппаратного ускорения декодирования H.264 — наиболее прогрессивного видеоформата
  • 2D ускоритель с поддержкой всех функций GDI+
  • Поддержка технологии ATI CrossFire

Спецификации референсной карты RADEON X1950 XTX

  • Частота ядра 650 МГц
  • Эффективная частота памяти 2.0 ГГц (2*1000 МГц)
  • Тип памяти GDDR4, 0.91 нс (штатная частота до 2*1100 МГц)
  • Объем памяти 512 мегабайт
  • Пропускная способность памяти 64.0 гигабайта в секунду
  • Теоретическая скорость закраски 10.4 гигапикселя в секунду
  • Теоретическая скорость выборки текстур 10.4 гигатекселя в секунду
  • Два DVI-I разъема (Dual Link, поддерживается вывод в разрешениях до 2560х1600)
  • Шина PCI-Express 16х
  • TV-Out, HDTV-Out, поддержка HDCP
  • Потребляет более 100 Вт энергии, примерно столько же, сколько и RADEON X1900 XTX

Спецификации референсной карты RADEON X1950 CrossFire Edition

  • Частота ядра 650 МГц
  • Эффективная частота памяти 2.0 ГГц (2*1000 МГц)
  • Тип памяти GDDR4, 0.91 нс (штатная частота до 2*1100 МГц)
  • Объем памяти 512 мегабайт
  • Пропускная способность памяти 64.0 гигабайта в секунду
  • Теоретическая скорость закраски 10.4 гигапикселя в секунду
  • Теоретическая скорость выборки текстур 10.4 гигатекселя в секунду
  • Один DVI-I разъем (Dual Link, поддерживается вывод в разрешениях до 2560х1600)
  • Шина PCI-Express 16х
  • Разъем CrossFire
  • Потребляет более 100 Вт энергии, примерно столько же, сколько и RADEON X1900 XTX

Как мы видим, спецификации R580+ и RADEON X1950 XTX почти полностью повторяют данные R580 и RADEON X1900 XTX, соответственно. Единственным отличием от предыдущей топовой модели ATI является использование GDDR4 памяти. Тактовая частота чипа осталась прежней, для RADEON X1950 XTX сохранили частоту RADEON X1900 XTX — 650 МГц, а частота локальной видеопамяти изменилась, теперь она равна 1000(2000) МГц, что еще недавно казалось недостижимым значением. Понятно, что столь высокая рабочая частота стала возможной именно благодаря применению нового типа памяти. Референсная видеокарта RADEON X1950 XTX использует микросхемы памяти GDDR4 со временем доступа 0.9 нс, что соответствует частоте работы 1100(2200) МГц, это даже чуть выше рабочей частоты в рассматриваемой модели.

GDDR4 (Graphics Double Data Rate, версия 4) — это новое поколение «графической» памяти, специально разработанной для применения в 3D видеокартах, работающее почти в два раза быстрее, чем GDDR3. Основными отличиями GDDR4 от GDDR3, существенными для пользователей, являются повышенные рабочие частоты (а значит, и пропускная способность) и сниженное энергопотребление. Технически, память GDDR4 не сильно отличается от GDDR3, это ее дальнейшее развитие, что значительно упрощает адаптацию существующих чипов и разработку будущих продуктов с поддержкой нового типа памяти. Первыми видеокартами с чипами GDDR4 на борту стали RADEON X1950 XTX, а у компании NVIDIA продукты на базе этого типа памяти планируются несколько позднее. Скорее всего, это будут видеокарты уже на базе NVIDIA G80.

Новый тип памяти разрабатывался компаниями Samsung и Hynix в сотрудничестве с ATI, которая руководила разработкой в рамках JEDEC. Сегодня чипы GDDR4 уже выпускаются указанными двумя компаниями, но только Samsung начала ее промышленное производство. Память не так давно стала поставляться в больших объемах производителям видеокарт, в массовое производство с июня этого года запущены модули со скоростями до 1.2(2.4) ГГц, также компания заявляла об успешной разработке чипов с рабочими частотами вплоть до (1.6)3.2 ГГц, что в два раза больше, чем у самых скоростных чипов GDDR3. В данный момент, компания Samsung выпускает три типа чипов памяти GDDR4: со временем доступа 0.71, 0.83 и 0.91 нс, с рабочими частотами от 1100(2200) до 1400(2800) МГц. Остается надеяться, что имеющие место проблемы с доступностью новой памяти GDDR4, которая выпускается пока в ограниченных объемах, со временем исчезнут.

Преимущества новых модулей памяти перед GDDR3 не только в скорости — энергопотребление модулей, по разным оценкам, примерно на 30-40% ниже, чем у GDDR3. Более низкое энергопотребление GDDR4 позволяет снизить требования к питанию и охлаждению или увеличить энергопотребление видеочипа, оставив неизменным потребление видеокарты в целом. Снижение потребления может быть достигнуто за счет более низкого номинального напряжения VDD для GDDR4 — 1.5 В, что позволяет говорить об экономии энергии по сравнению с GDDR3. Однако в ранних чипах, устанавливаемых на карты RADEON X1950, используется напряжение 1.8 В, то есть то же самое, что и для GDDR3. А для самых мощных решений может использоваться напряжение 1.9 В. Именно из-за этого X1950 XTX сейчас потребляет не меньше, чем X1900 XTX, несмотря на то, что потенциально GDDR4 менее требовательна к питанию, чем предыдущая версия «графической» памяти.

Повышение рабочей частоты памяти выразилось в улучшении показателя ее пропускной способности, для RADEON X1950 XTX ПСП равна 64 Гб/с, что больше, чем у любой другой одночиповой видеокарты, вышедшей ранее. Для сравнения, у NVIDIA GeForce 7800 GTX значение ПСП равно 51.2 Гб/с, у GeForce 7800 GTX 512Mb — 54.4 Гб/с, причем, на последней устанавливалась самая быстрая GDDR3 память. GDDR4 память, установленная на видеокарте RADEON X1950 XTX, имеет почти 30% преимущество по пропускной способности перед прошлым топом компании ATI, это позволяет новому решению иметь до 15% преимущества перед X1900 XTX в условиях большой нагрузки на видеопамять, таких, как высокие разрешения с включенным антиалиасингом. Что мы обязательно проверим в практической части статьи.

Отличий у CrossFire версии платы по сравнению с обычной в этот раз меньше, теперь частота чипа и памяти у этих версий равная, а единственная разница заключается в том, что вместо двух DVI разъемов и TV-out на ней устанавливается один DVI и специальный CrossFire разъем. Любопытно и то, что рекомендуемые цены на эти две модели также не отличаются, обе видеокарты предполагается продавать за $449.

В следующей части обзора на примере синтетических тестов мы посмотрим, насколько сильно сказывается увеличение пропускной способности памяти, сравним RADEON X1900 XTX и RADEON X1950 XTX на их стандартных частотах, что покажет нам изменение производительности в разных режимах именно из-за увеличенной частоты памяти. Особое внимание мы уделим сравнению RADEON X1900 XTX на стандартных частотах и RADEON X1950 XTX на частотах X1900 XTX, то есть, с пониженной до 775(1550) МГц частотой видеопамяти. Это сравнение позволит нам уверенно утверждать об отсутствии глобальных изменений в чипе, а также узнать, какую производительность обеспечивает GDDR4 по сравнению с GDDR3 на одинаковых частотах. Ведь вполне возможно, что из-за увеличившихся задержек GDDR4 памяти, RADEON X1950 XTX может даже отставать от своего предшественника в некоторых случаях. Мы обязательно проверим это и в синтетических, и в игровых тестах.

Архитектура R580+

Еще раз рекомендуем прочитать теоретическую часть обзора чипа R520, так как в этой статье мы не рассматриваем архитектуру так же подробно, как это сделано там. Здесь мы лишь вкратце повторим особенности новых чипов ATI, рассмотрим диаграмму из материалов компании:

Диаграмма взята из статьи о R580, который отличается от R520 числом пиксельных процессоров, при том же числе текстурных процессоров (четыре квада, то есть 16 текстур за такт). R580+ же не отличается от него ничем, по большому счету. Чип содержит восемь вершинных процессоров (на схеме обозначены как Vertex Shader Processors), соответствующих требованиям SM 3.0, кроме поддержки выборки из текстур, и построенных по стандартной для ATI схеме: ALU каждого вершинного процессора может исполнять две разные операции одновременно, над тремя компонентами вектора и четвертой компонентой или скаляром.

Архитектура пиксельной части отличается от применяемой основным конкурентом тем, что текстурные модули вынесены за общий конвейер. Здесь нет общего длинного конвейера, по которому «крутятся» квады, текстурная часть существует отдельно — блоки генерации текстурных координат и доступа к текстурам и сами TMU, а отдельно — пиксельные процессоры, выполняющие арифметические операции, и наборы регистров с данными. Специальный Ultra Threading Dispatch Processor управляет исполнением — в обработке одновременно находится 512 квадов, каждый из которых может быть на разных стадиях исполнения шейдера. Вместе с каждым квадом хранится его текущее состояние, команда шейдера, значения ранее проверенных условий. Процессор постоянно проверяет наличие свободных ресурсов: текстурных и пиксельных блоков и направляет стоящие на очереди квады в освободившиеся устройства. Если квад не прошел проверку на условие и не должен обрабатываться той или иной частью шейдера, он пропустит ненужные команды, и не будет занимать работой текстурный или пиксельный блок. Если квад ждет данных из текстурного блока — он пропустит вперед другие квады, которые загрузят пиксельные вычислительные блоки.


Та же конфета, но в новой обертке, и, кажется, вкуснее… ATI RADEON X1950 XTX (R580+) — Часть 2: Особенности видеокарты и синтетические тесты





Дополнительно

iXBT BRAND 2016

«iXBT Brand 2016» — Выбор читателей в номинации «Процессоры (CPU)»:
Подробнее с условиями участия в розыгрыше можно ознакомиться здесь. Текущие результаты опроса доступны тут.

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.