GeForce RTX 3090 покажется игрушкой. Nvidia опубликовала документ, где описывается таинственный GPU-N нового поколения

Но это смоделированный GPU

Согласно многочисленным утечкам и слухам, видеокарты Nvidia нового поколения выйдут в конце следующего года. Несмотря на это, в Сети появились первые технические подробности о топовом GPU поколения Hopper, но в достаточно специфическом виде. 

GeForce RTX 3090 покажется игрушкой. Nvidia опубликовала документ, где описывается таинственный GPU-N нового поколения

Графический процессор, о котором пойдёт речь, в документах фигурирует, как GPU-N. Нюанс в том, что документ этот является научной работой специалистов Nvidia, а тот самый GPU-N там фигурирует как смоделированный и спрогнозированный GPU следующего поколения, параметры которого сформированы путём линейной экстраполяции параметров с GPU V100 на GA100. При этом в документе чётко сказано, что его авторы не пытались спроектировать точную конфигурацию будущего графического процессора, а продемонстрировали влияние ожидаемых скоростей масштабирования на пропускную способность вычислений и памяти. 

Предположительно, мы говорим о части GPU GH100, который придёт на смену GA100 и будет ориентирован на специализированные ускорители, а не игровые видеокарты. Ранняя информация о том, что GPU Hopper будут двухчиповыми, в данном случае не подтверждается и не опровергается, но моделировали авторы одночиповый GPU. То есть, вероятно, почти всё, что указано ниже, можно умножать на два. 

GeForce RTX 3090 покажется игрушкой. Nvidia опубликовала документ, где описывается таинственный GPU-N нового поколения

Итак, как указано, GPU-N содержит 134 блока SM и 8576 ядер CUDA. Это всего на четверть больше, чем у GA100. Моделирование происходило при условии работы трёх тестовых GPU на частоте 1,4 ГГц. Также новому графическому процессору приписали 60 МБ кеш-памяти второго уровня и 100 ГБ памяти HBM2e с пропускной способностью почти 2,7 ТБ/с с возможностью масштабирования до 6,3 ТБ/с.  

В итоге моделирование показало, что производительность с одинарной точностью (FP32) составит 24,2 TFLOPS и 779 TFLOPS с половинной точностью (FP16). Это соответственно на 24% и 350% больше, чем у GA100. Для сравнения: у уже представленного ускорителя AMD Instinct MI250X показатели соответственно равны 95,7 и 383 TFLOPS. 

Также интересным моментом в документе является описание архитектуры COPA (Composable On-PAckage). В данном случае речь скорее о концепции, но это не важно. Идея COPA заключается в разделении GPU на отдельные составляющие в виде отдельных чипов с последующим созданием итогового GPU под конкретные нужды того или иного сегмента. К примеру, таким образом можно выделить кеш-память в отдельный кристалл и при необходимости увеличить её объём относительно обычного в 32 раза. Напомним, технология AMD 3D V-Cache реализует именно такую идею.  

Но пока можно лишь гадать, увидим ли мы в ближайшие годы GPU, созданные в рамках концепции COPA.  

15 декабря 2021 в 11:34

Автор:

| Источник: WCCF Tech, ACM DL

Все новости за сегодня

Календарь

декабрь
Пн
Вт
Ср
Чт
Пт
Сб
Вс