Основой 3D-карт AMD Radeon RX Vega 64 Liquid Cooled Edition, RX Vega 64 и RX Vega 56 стала графическая архитектура нового поколения

1174

Продолжая рассказ о 3D-картах AMD Radeon RX Vega 64 Liquid Cooled Edition, RX Vega 64 и RX Vega 56, необходимо остановиться на графическом процессоре, который служит их основой.

Он построен на новой архитектуре Vega, состоит из 12,5 млрд транзисторов и изготавливается по 14-нанометровой технологии FinFET LPP. Процессор рассчитан на работу на тактовой частоте до 1,7 ГГц и включает около 45 МБ памяти SRAM, а для внутренних соединений в нем используется шина Infinity Fabric.

Основой 3D-карт AMD Radeon RX Vega 64 Liquid Cooled Edition, RX Vega 64 и RX Vega 56 стала графическая архитектура нового поколения

В процессоре есть четыре движка асинхронного исполнения команд, четыре модифицированных геометрических движка и шестьдесят четыре вычислительных блока Compute Unit (CU) нового поколения. По словам AMD, они серьёзно переделаны по сравнению с предыдущими архитектурами. В составе этих CU находится 4096 потоковых процессоров, 256 текстурных блоков и 64 блока ROP.

При проектировании GPU инженеры AMD воспользовались опытом разработки архитектуры Zen, в частности, укоротили и оптимизировали все линии данных на критических участках, что позволило уменьшить задержки на 8%, размер кристалла — на 18%, а энергопотребление — почти вдвое.

Из других изменений отметим удвоенный до 4 МБ объем кэш-памяти второго уровня, который теперь могут использовать блоки ROP, что важно для техник, использующих рендеринг в текстуры. Также чип отличается использованием скоростной памяти HBM второго поколения с поддержкой ECC, важной для профессиональных применений, отличающейся большей плотностью (до 8 раз больший объём памяти на стек) и пропускной способностью. HBM2 имеет шину 2048 бит и работает на частоте, близкой к 1 ГГц, что даёт пропускную способность 484 ГБ/с.

В AMD считают, что память HBM нужно рассматривать как кэш для данных, которые находятся на медленных носителях. По сути, HBM2 в Vega используется как кэш-память последнего уровня для системной памяти и накопителей данных. Архитектура виртуальной памяти основана на страницах разного размера, неактивные из которых перемещаются в более медленное хранилище, освобождая кэш для активных страниц памяти. При этом не требуется сложного управления памятью, и хранить все данные в быстрой локальной памяти (кэше) не обязательно. Такой подход позволяет использовать виртуально бесконечный объём ресурсов из многих миллионов треугольников и сотен гигабайт текстурных данных.

Вычислительные блоки Compute Unit теперь поддерживают двойной темп для операций над данными с точностью FP16, совместимый с IEEE. По замерам AMD использование FP16 или смешанной точности по сравнению с точностью FP32 даёт в тесте 3DMark Sierra при постобработке около 20-25% преимущества без видимых потерь в качестве. И это уже можно использовать в существующих графических API.

Кроме этого, в Vega добавили 40 новых инструкций: комбинированных операций для повышения количества исполняемых операций за такт, для использования при майнинге криптовалют, для обработки видеоданных и адресации памяти. А из графических изменений отметим самую полную поддержку DirectX Feature Level 12_1, которая превосходит не только GPU AMD прошлого поколения, но и лучшие графические процессоры NVIDIA — Pascal.

При проектировании Vega инженеры AMD воспользовались опытом разработки архитектуры Zen

В частности, появилась поддержка Raster Ordered Views, Conservative Rasterization уровня Tier 3 и Tiled Resources уровня Tier 3, что лучше, чем у GPU конкурента. Дополнительный уровень Conservative Rasterization позволяет использовать эти возможности в алгоритмах эффективного отбрасывания невидимой геометрии.

Вообще, AMD давно ратует за изменение существующего геометрического конвейера и введения новых типов шейдеров Primitive Shaders — новой аппаратной стадии конвейера, которая позволит отбрасывать невидимые примитивы очень рано, повышая общую эффективность.

Например, хотя Vega сама по себе вдвое быстрее Fiji по обработке геометрии, предлагаемое изменение конвейера позволяет повысить скорость ещё втрое. Увы, пока что это невозможно использовать в рамках текущих API, но компания сотрудничает с ведущими разработчиками для того, чтобы заинтересовать их.

Никуда не делось эффективное использование асинхронных вычислений, которое является преимуществом решений AMD. Применение этой возможности в DX12-версии игры The Division дало прирост в 13%, а специфические оптимизации основного процесса рендеринга DOOM на PS4, перенесённые на ПК, дали и вовсе 43% прироста в скорости. Были улучшены тайловые оптимизации в Draw Stream Binning Rasterizer, дающие в среднем приросты порядка 10-15% (иногда и больше) в разном программном обеспечении (не только играх), улучшены и геометрические движки для нагрузок с большим количеством геометрии.

Обо всём этом и многом другом мы расскажем подробнее в обзоре видеокарты Radeon RX Vega.

31 июля 2017 Г.

11:45

Ctrl
ПредыдущаяСледующая

Все новости за сегодня

Samsung откроет шоурум в футуристическом торговом центре Лондона: Samsung займёт верхний этаж ТЦ Coal Drops Yard своим демонстрационным центром22

Qualcomm и Mercedes-AMG Petronas Motorsport расширили стратегическое сотрудничество: Они будут вместе разрабатывать высокоскоростную связь и беспроводное питание для гоночных машин1

Razer оценила web-камеру Kiyo и микрофон Seiren X в 100 долларов за каждую новинку: Razer представила web-камеру Kiyo и микрофон Seiren 2

FAA предлагает запретить провоз камер и других электронных устройств в багаже: Международная организация гражданской авиации (ICAO) планирует обсудить предложение FAA в ближайшее время21

Смартфон Huawei Mate 10 Pro в рейтинге DxOMark обошёл Samsung Galaxy Note 8 и Apple iPhone 8 Plus: Смартфон Huawei Mate 10 Pro в рейтинге DxOMark заработал 97 баллов42

Amazon и eBay обвинили в попустительстве мошенничеству с НДС: По оценке налогового департамента, только в прошлом и позапрошлом году недополучено 1-1,5 млрд фунтов стерлингов9

Еще одна версия Xiaomi Mi Notebook Air 13 по характеристикам оказалась хуже предыдущей : 43

Камера Detu F4 Plus снимает сферические панорамы с разрешением 8К: Камера F4 Plus позиционируется как профессиональное решение и стоит $25994

Смартфон HTC U11 Plus получит степень защиты IP68, Edge Sense и Boom Sound, но не будет представлен 2 ноября : ЖК-дисплей устройства будет иметь диагональ 6 дюймов при разрешении WQHD+ и плотности пикселей 538dpi10

Samsung Artik s — защищенные беспроводные вычислительные модули для IoT: Платформа Samsung Artik IoT будет полностью интегрирована с платформой SmartThings Cloud

Уже выпущенные телевизоры LG получат поддержку звука в формате Dolby TrueHD: Прошивка будет выпущена до конца месяца10

Опубликованы новые изображения смартфона Meizu X2, который оснащен дополнительным круглым дисплеем: Meizu X2 должен выйти в линейке Blue Charm и относиться к среднему ценовому сегменту11

Платформа для оперативной доставки и распределения финансовой информации nxFeed FPB2 построена на FPGA Xilinx Virtex UltraScale+: Платформа nxFeed FPB2 превосходит решения предыдущего поколения по производительности на 30%

Dodocool предлагает кабель для зарядки iPhone и iPad в форме брелока для ключей: 7

В базе TENAA замечен загадочный смартфон HTC с дактилоскопическим датчиком на задней панели: Основой HTC 2Q4D200 служит SoC с восьмиядерным процессором

В семействе АС Google Home появится модель Quartz с экраном: Напомним, дисплеями оснащены такие умные АС, как Amazon Echo и Echo Spot1

Умная акустическая система 808 Audio XL-V обеспечивает доступ к голосовому помощнику Amazon Alexa : Умная акустическая система 808 Audio XL-V стоит $130

По статистике Chrome, доля защищенного трафика на платформе Android за год выросла с 42% до 64%: Переход на HTTPS продолжается4

Опубликованы изображения 3D-карт Asus GeForce GTX 1070 Ti Turbo и ROG Strix GTX 1070 Ti Gaming: Сведений о частотах компонентов 3D-карт Asus GeForce GTX 1070 Ti Turbo и ROG Strix GTX 1070 Ti Gaming пока нет

997
1318

iXBT TV

  • Обзор беззеркальной фотокамеры Fujifilm X-A3 формата APS-C со сменными объективами

  • Обзор беззеркальной фотокамеры Fujifilm X-A10 формата APS-C со сменными объективами

  • Планшеты для подводного чтения, дешевый безрамочный смартфон и автономная VR-гарнитура

  • Обзор 3D-принтера Funtastique Evo: дешевая, но вполне функциональная DIY-модель

  • Обзор робота-пылесоса Polaris PVCR 0920WV Rufer с функцией влажной протирки полов

  • Новинки Google на любой вкус: Pixel 2, Pixel 2 XL, Pixelbook, Clip, Home Mini и Max

  • Обзор водонепроницаемого бинокля Canon 10x42L IS WP с оптическим стабилизатором

  • Обзор компактного вертикального пылесоса Kitfort КТ-525

  • Обзор 15-дюймового игрового ноутбука MSI GE63VR 7RF Raider 4K с 4K-экраном

  • Ракета вместо самолета, умные AC Amazon, робот-мяч

  • Обзор парогенератора MIE Stiro Pro для глажки, отпаривания и уборки дома

  • Обзор изогнутого 37,5-дюймового IPS-монитора Acer XR382CQK с соотношением сторон 21:9

1212

Календарь

июль
Пн
Вт
Ср
Чт
Пт
Сб
Вс

Рекомендуем почитать