Новое поколение NVIDIA Maximus на базе архитектуры Kepler


7 августа 2012 на SIGGRAPH 2012 было представлено второе поколение платформы для рабочих станций NVIDIA Maximus, теперь на архитектуре Kepler. Этот материал написан по итогам пресс-брифинга с американской штаб-квартирой NVIDIA и официальной премьеры нового поколения Maximus на SIGGRAPH 2012, откуда велась прямая онлайн видео-трансляция всех проходящих мероприятий. Спешим успокоить читателей: сайт iXBT.com пока ещё не превратился в рупор корпоративного маркетинга, поэтому в данном материале не было использовано ни одно предложение из пресс-релиза. Все мысли автора предлагаются как дополнение к официальным материалам.

Итак, сразу скажем, что цифра 2 официально с Maximus second generation не используется, также как Quadro и Tesla на Kepler не меняются. Но их можно будет различить по букве K в маркировке карт, например, Quadro K5000, Tesla K20.

Напомним, первое поколение Maximus было представлено в ноябре 2011 года и базировалось на графической плате Quadro + одной или нескольких вычислительных платах Tesla (читайте наш разговор с Nvidia в статье iXBT.com: NVIDIA Quadro и Maximus). В первую очередь, NVIDIA Maximus предназначен для профессионального применения. Наибольшая отдача была зафиксирована в наиболее ресурсоёмких задачах, там где есть что считать, и время расчётов измеряется в часах: научные расчеты, моделирование и трассировка лучей в графике. Во втором поколении Maximus принципиальных изменений не произошло. Это по прежнему связка из графической и вычислительной плат, вероятно поэтому название осталось без изменений. Однако теперь технология или платформа Maximus продвигается более активно и более цельно. Если предыдущее поколение виделось в системе как две разные карты, с дублированием функции и даже необходимостью ручного управления (с чем мы столкнулись во время нашего первого практического знакомства), то сейчас на уровне драйверов неразбериха полностью преодолена даже в первом поколении. Второе поколение — это и вовсе не просто две карты, а единое законченное решение. Более того, благодаря системе сертификации можно будет спокойно покупать готовую рабочую станцию c Maximus и сразу начинать работать, безо всякой дополнительной настройки. О выходе рабочих станций с новым Maximus уже заявили HP, Dell, Lenovo и Fujitsu, плюс отечественные и зарубежные системные интеграторы и многочисленные партнеры Nvidia.

Период становления на ноги Maximus пройден. Из перспективного эксперимента Maximus превращается ни много ни мало в персональный вычислительный центр внутри обычной рабочей станции. В то, что раньше называлось supercomputer, а сейчас high performance computing. Принципиальное и качественное отличие Maximus от вычислительного центра — поддержка привычными прикладными приложениями, которые используют инженеры и дизайнеры, а не только самописный софт и ручная параллелизация задач, что могут себе позволить лишь программисты и ученые. Ничто, впрочем, не мешает любым разработчикам изучить API и использовать Maximus в своих собственных программах.

И ещё раз вернёмся к важному вопросу: в чём отличие Maximus от профессионального графического ускорителя Quadro? В эффективности решения задач, требующих значительных вычислений и одновременно с этим высококачественной визуализации результата. Если графический ускоритель нагрузить и 3D визуализацией, и расчётами, как это происходило до появления Maximus, то непременно скажется нехватка вычислительных ресурсов GPU, пропускной способности различных шин и нехватки объема памяти из-за конфликта интересов вычислительного и графического API (в типичном случае CUDA и OpenGL). Именно для решения этой проблемы и была выдвинута инициатива Maximus, где разделение на две карты повышает производительность от десятков процентов до нескольких раз, в зависимости от типа и масштаба выполняемой задачи. Более того, плата-вычислитель Tesla, созданная только для вычислений, с архитектурой Kepler раскрывается в полной мере. Помимо увеличившейся чистой скорости вычислений в GFlops, соотношение производительность на Ватт стало выше втрое. А, как известно, именно энергоэффективность — это единственное препятствие, которое сдерживает массовое распространение высокопроизводительных вычислений. Мегаваттная мощность и необходимость отвода огромного количества тепла — это отличительная черта всех суперкомпьютеров. В дополнение к этому, у больших вычислительных кластеров на базе CPU зачастую есть ограничения программной части специализированным ПО, которое призвано раскрыть уникальную архитектуру наиболее полно. Maximus дает перенос вычислений на уровень рабочих станций и ускорение расчётов на порядок. А это уже существенно меняет процесс работы с рабочей станцией, ведь вместо ожидания можно сделать больше полезной работы, например, увеличить количество создаваемых финальных вариантов. Конечно, Maximus никак не избежать адаптации под прикладное ПО на уровне драйверов, а прикладному ПО, 3D редакторам и прочим программам, необходимо также умение использования всех особенностей железа, если мы говорим о максимальной отдаче, а не просто о десятках процентов прироста скорости, которые автоматически получаются в существующих версиях. Ранний («бумажный») анонс Maximus как раз способствует активизации партнёров NVIDIA и дорелизной подготовки всего ПО, чтобы конечный потребитель не получил сырой продукт в момент старта продаж. Именно для этого введена программа сертификации ISV (партнёров, поставщиков ПО) и ведётся взаимная адаптация драйверов и прикладного ПО. Поддерживаемыми операционными системами Maximus объявлены Windows и Linux.

В настоящий момент существуют только мобильные Quadro Kepler, десктопные пока есть лишь в инженерных образцах, серийные изделия выйдут в октябре 2012. Tesla Kepler появится ещё позже, в декабре 2012. В анонсе делается упор на Quadro K5000 и Tesla K20. Однако со временем обновленная линейка моделей Kepler получит расширение как вверх, так и вниз. Это связано в первую очередь с тем, что в отдельных задачах мощность Quadro K5000 зачастую будет являться избыточной, а затраты неоправданно высокими. Мощный ускоритель Quadro K5000 является прямой заменой Quadro 5000, при той же самой цене (для рынка США $2249 MSRP).

Главные особенности NVIDIA Quadro K5000

  • количество текстур 1 миллион прямо в памяти видеокарты (Bindless Textures), что ранее было недоступно и требовало участия CPU
  • новое сглаживание FXAA, на смену MSAA (подробнее в статье iXBT.com о NVIDIA GK104)
  • новое сглаживание TXAA учитывает время (буква T от temporal), результат приближен к сглаживанию в кинематографическом рендеринге
  • увеличенный до 4 ГБ объем кадрового буфера
  • аппаратное кодирование в H.264, включая профили high и stereo
  • интерфейс PCIe-3 вдвое быстрее PCIe-2
  • Поддержка 4 мониторов на каждой карте K5000
  • Display Port 1.2 с максимальным разрешением 3840×2160

Главные особенности NVIDIA Tesla K20

  • втрое большая производительность на Ватт (SMX)
  • средства управления параллелизмом графический ядер (Dynamic Parallelism)
  • правильное взаимодействие с многоядерными CPU (Hyper-Q GPU)

В интернете размещены две живые демонстрации работы Kepler. В обоих случаях указывается, что это именно Maximus Kepler. В первом ролике V-Ray работает впечатляюще быстро, но явно не в максимальном качестве. Надо сказать, что рендеринг можно настраивать и получить гораздо более убедительный результат, немного пожертвовав «магией реального времени». Здесь же явно была цель показать именно скорость и работоспособность технологии уже сейчас. Делать какие-то выводы об окончательной производительности преждевременно, пока не будет финальных продуктов и релизных версий драйверов.

Interactive 3D rendering with Autodesk Maya, Chaos Group V-Ray RT 2.0 and NVIDIA Maximus

 

Computational Fluid Dynamics (CFD) with RTT DeltaGen, FluidDyna, and NVIDIA Maximus

 

Дополнительная информация находится на официальном сайте NVIDIA.




Дополнительно

ВИКТОРИНА TT

Материнские платы какого форм-фактора можно устанавливать в корпус Thermaltake Versa C22 RGB Snow Edition?

Нашли ошибку на сайте? Выделите текст и нажмите Shift+Enter

Код для блога бета

Выделите HTML-код в поле, скопируйте его в буфер и вставьте в свой блог.