Новые подробности об архитектуре графического процессора GT300

1174

Помимо фотографий графического ускорителя NVIDIA Tesla, во время официального анонса графического процессора GT300 была показана новая информация касательно архитектуры с кодовым названием Fermi. На слайдах продемонстрированы общие характеристики новинки, организация потоковых мультипроцессоров и их структура, результаты производительности в вычислениях чисел с плавающей запятой и другое.

Как и сообщалось ранее, графический процессор нового поколения GT300 содержит три миллиарда транзисторов, имеет 512 шейдерных ядер и обеспечивает производительность в вычислениях с двойной точностью, в восемь раз превышающую производительность чипа GT200.

Потоковые мультипроцессоры расположены вокруг общей кэш-памяти второго уровня. На слайде каждый такой мультипроцессор представляет собой вертикальный прямоугольник, который содержит оранжевую часть (планировщик и организатор), зелёную часть (исполнительные модули) и голубые части (файлы регистров и кэш-память первого уровня).

На следующем слайде показана внутренняя структура мультипроцессора. Каждый из 16 мультипроцессоров имеет 32 шейдерных ядра, что в сумме даёт 512 так называемых CUDA-ядер.

Что касается памяти, новый GPU оснащён шестью 64-разрядными контроллерами памяти GDDR5, что даёт 384-битную шину памяти и поддержку до 6 ГБ памяти GDDR5. Fermi является первой архитектурой, поддерживающей код коррекции ошибок (ECC) для данных, хранящихся в памяти. Технология NVIDIA Parallel DataCache значительно ускоряет математические вычисления и выполнение других функций.

На слайде показано сравнение производительности в вычислениях чисел с плавающей запятой двойной точности между видеокартой Tesla C1060 и новой моделью на архитектуре Fermi. В тесте с 20480 объектами новинка показывает результат 18,16 кадров в секунду, производя за секунду 7,61 млрд итераций. Её предшественница способна лишь на 3,52 кадра в секунду, выполняя за секунду 1,47 млрд итераций.

Решения на архитектуре Fermi называют первыми в мире вычислительными GPU. Благодаря набору инструкций Parallel Thread eXecution второго поколения (PTX 2.0), в них реализована аппаратная поддержка таких средств программирования, как C, C++, Fortran и множество других функций (таких как унифицированное адресное пространство, OpenCL и DirectCompute).

Основной задачей Fermi считают перенос вычислений больших массивов данных на GPU, оставив в ответственности центрального процессора обработку множества различных инструкций.

К сожалению, на конференции GPU Technology Conference не были упомянуты даты выхода продуктов на архитектуре Fermi. Ожидается, что в ближайшие месяцы компания NVIDIA закончит работу над чипом GT300, и на его основе появятся продукты серий GeForce, Quadro и Tesla.

В заключение, приводим сравнительную таблицу характеристик чипа GT300 и его предшественников:

GPU G80 GT200 GT300
Транзисторов 681 млн 1,4 млрд 3,0 млрд
Потоковых процессоров 128 240 512
Вычислений*
двойной точности
30 FMA/такт 256 FMA/такт
Вычислений*
одинарной точности
128 MAD/такт 240 MAD/такт 512 FMA/такт
Warp-планировщиков** 1 1 2
Спец. функциональных
модулей (SFU)**
2 2 4
Разделяемой памяти** 16 КБ 16 КБ до 48 КБ
Кэш-памяти L1** до 48 КБ
Кэш-памяти L2** 768 КБ
Поддержка ECC памяти +
Конкурентных ядер до 16
Ширина адреса 32 бита 32 бита 64 бита

* вычислений чисел с плавающей запятой
** на потоковый мультипроцессор

Источник: HardwareZone

2 октября 2009 Г.

09:00

Ctrl
ПредыдущаяСледующая

Все новости за сегодня

Введена в строй крупнейшая ветряная электростанция Amazon: Электростанция насчитывает более 100 турбин3

Гарнитура смешанной реальности Samsung HMD Odyssey не выйдет на рынок Европы: В США Samsung HMD Odyssey в комплекте с двумя контроллерами будет предлагаться по цене 499 долларов

Игровой монитор Benq Zowie XL2536 поддерживает технологию DyAc: В мониторе Benq Zowie XL2536 используется жидкокристаллическая панель разрешением Full HD

Испытания блогера JerryRigEverything показали, что смартфон Google Pixel 2 имеет ряд особенностей: Смартфон Google Pixel 2 лучше не гнуть

LG Innotek вошла в состав международной ассоциации CharIN: LG Innotek начала производство комплектующих для автомобильного рынка еще в 2005 году

Xiaomi предлагает умный дверной замок за $256: Дактилоскопический датчик распознает отпечатки пальцев людей в возрасте от 7 до 70 лет с вероятностью ошибки 0,0005%8

Мини-ПК MSI Cubi 3 Silent будут оснащены пассивной системой охлаждения и CPU Intel Kaby Lake: MSI готовит мини-ПК Cubi 3 Silent3

Владельцы Samsung Galaxy S8 и Note8 смогут работать с Linux: В настоящий момент Linux on Galaxy проходит стадию тестирования13

Шасси Streacom BC1 Mini предназначено для малогабаритных систем : Шасси из алюминия весит 805 г1

Система для самоуправляемых автомобилей, создаваемая Apple, представляет собой отдельный блок: Блок, создаваемый в рамках проекта Project Titan, размещается на крыше машины5

В Южной Корее создана первая в мире система для липосакции, в которой хирургу помогает искусственный интеллект: Система M.A.I.L создана в сотрудничестве с Microsoft 1

Представлен планшет Chuwi SurBook Mini: Устройство может работать под управлением операционных систем Windows 10 и Ubuntu

General Motors первой начнёт испытания беспилотных машин в Нью-Йорке: В следующем году на улицах Нью-Йорка появятся прототипы беспилотных машин1

Портативные акустические системы Ultimate Ears Blast и Megablast не боятся воды и поддерживают Amazon Alexa: Ultimate Ears Blast и Megablast оцениваются в 230 и 300 долларов соответственно 2

997
1318

iXBT TV

  • Обзор беззеркальной фотокамеры Fujifilm X-A10 формата APS-C со сменными объективами

  • Планшеты для подводного чтения, дешевый безрамочный смартфон и автономная VR-гарнитура

  • Обзор 3D-принтера Funtastique Evo: дешевая, но вполне функциональная DIY-модель

  • Обзор робота-пылесоса Polaris PVCR 0920WV Rufer с функцией влажной протирки полов

  • Новинки Google на любой вкус: Pixel 2, Pixel 2 XL, Pixelbook, Clip, Home Mini и Max

  • Обзор водонепроницаемого бинокля Canon 10x42L IS WP с оптическим стабилизатором

  • Обзор компактного вертикального пылесоса Kitfort КТ-525

  • Обзор 15-дюймового игрового ноутбука MSI GE63VR 7RF Raider 4K с 4K-экраном

  • Ракета вместо самолета, умные AC Amazon, робот-мяч

  • Обзор парогенератора MIE Stiro Pro для глажки, отпаривания и уборки дома

  • Обзор изогнутого 37,5-дюймового IPS-монитора Acer XR382CQK с соотношением сторон 21:9

  • Обзор робота-полотера Everybot RS500

1212

Календарь

октябрь
Пн
Вт
Ср
Чт
Пт
Сб
Вс

Рекомендуем почитать