Компания NVIDIA, сразу же вслед за видеокартами серии GeForce GTX 200 и продуктом AMD с вычислительной мощностью 1 TFLOPS (FireStream 9250), представила ещё одну пару производительных решений на базе нового GPU GT200— GPGPU-ускоритель расчётов Tesla C1060, именуемый производителем как «вычислительный процессор» — Tesla C1060 Computing Processor и «вычислительную систему» — blade-плату Tesla S1070 Computing System.
NVIDIA Tesla C1060, как говорит производитель, плата, способная превратить рядовой ПК в высокопроизводительную систему (High Performance Computing, HPC), которая сможет обойти по скорости небольшой компьютерный кластер. Это энергоэффективное решение даст профессионалам мощный инструмент прямо на их рабочем месте и позволит существенно ускорить ресурсоёмкие расчёты.
Tesla C1060 основана на многоядерном процессоре Tesla с массивным параллелизмом, поддерживающим программную модель CUDA C, упрощающую программирование под многоядерные системы.
Характеристики Tesla C1060:
- Число GPU: 1 (1,4 млрд.транзисторов)
- 240 потоковых процессоров
- Поддержка технологии NVIDIA CUDA второго поколения
- FPU-вычисления: IEEE 754 — с одинарной и двойной точностью
- Шина PCI Express x16 Generation 2
- Интерфейс памяти: 512-бит
- Пропускная способность памяти: 102 ГБ/с
- Частота потоковых процессоров: 1300 МГц
- Частота памяти: 800 МГц
- Объем GDDR3-памяти: 4096 МБ
- Питание: 2 х 6-контактных разъема или 6+8-контактные разъемы
- Энергопотребление: 225 Вт /160 Вт (пиковое/номинальное)
- Размеры: 26,46 х 11,03 см, двухслотовая плата
NVIDIA Tesla C1070 представляет собой ещё более мощную вычислительную систему благодаря плотной упаковке сразу 960 потоковых процессоров в одну систему.
Характеристики Tesla C1070:
- Число GPU: 4
- 960 потоковых процессоров
- Поддержка технологии NVIDIA CUDA второго поколения
- FPU-вычисления: IEEE 754 — с одинарной и двойной точностью
- Системный интерфейс: PCIe x16 или x8
- Интерфейс памяти: 4 x 512-бит
- Пропускная способность памяти: 408 ГБ/с
- Частота потоковых процессоров: 1500 МГц
- Объем GDDR3-памяти: 16 ГБ
- Энергопотребление: 700 Вт
- Типоразмер: 1U
Производительность C1060 округлена NVIDIA до 1 TFLOPS, 1U-система, соответственно, производит до 4 TFLOPS. Более точное значение производительности одного GT200 — 933 GFLOPS. Скорость же FireStream 9250 называется некоторыми источниками равной 1,2 TFLOPS, поскольку 4 таких решения обеспечивают производительность равную около 5 TFLOPS.
Тем не менее, плата Tesla C1060 оценивается дороже решения AMD — её цена $1699, а blade-система 1U, Tesla C1070, получила цену в $7995.
Источник: NVIDIA