NVIDIA CUDA 5 еще больше упрощает программирование на GPU

ПредыдущаяСледующая
NVIDIA Logo

NVIDIA представила NVIDIA CUDA 5, новую версию самой распространенной в мире платформы параллельных вычислений и модели программирования для ускорения решения научных и инженерных задач на GPU. Новую версию можно бесплатно загрузить на сайте NVIDIA Developer Zone.

Платформу CUDA загрузили уже свыше 1.5 миллиона раз, при этом она поддерживает более 180 ведущих инженерных, научных и коммерческих приложений. Сегодня CUDA – это самый простой способ для разработчиков обеспечить ускорение приложений на графических процессорах.

Новые возможности CUDA 5 еще больше ускоряют и упрощают разработку GPU-ускоряемых приложений. Среди них – поддержка динамического параллелизма, библиотек, вызываемых напрямую из кода на GPU, GPUDirect для RDMA (дистанционный доступ к памяти напрямую) и интегрированной среды разработки NVIDIA Nsight Eclipse Edition (IDE).

NVIDIA CUDA

Новые возможности CUDA 5

CUDA 5 позволяет разработчикам полностью использовать потенциал графических процессоров NVIDIA, включая модели на базе архитектуры NVIDIA Kepler, и создает самую быструю, эффективную и мощную вычислительную платформу из ныне существующих. Основные возможности:

  • Динамический параллелизм– новые алгоритмы GPU-ускорения

    Потоки GPU могут динамически рождать новые потоки, позволяя GPU адаптироваться к новым данным. Сводя к минимуму пересылку данных в CPU и обратно, динамический параллелизм значительно упрощает параллельное программирование. Это также позволяет применять GPU-ускорение к более широкому спектру распространенных алгоритмов, например, используемых в адаптивном измельчении сетки и вычислительной гидродинамике.

  • Вызываемые из кода на GPU библиотеки – развитие экосистемы разработчиков приложений

    Новая библиотека CUDA BLAS позволяет разработчикам применять динамический параллелизм для их собственных библиотек, вызываемых напрямую из кода на GPU. Они могут создавать дополнительные API, которые позволят другим разработчикам расширять функциональность своих ядер и выполнять обратные запросы к GPU для изменения функциональности сторонних библиотек, вызываемых GPU. Такая поддержка связывания объектов обеспечивает эффективный и знакомый процесс создания больших приложений под GPU путем компилирования многочисленных исходных файлов CUDA в отдельные объектные файлы и их объединения в большие приложения и библиотеки.

  • Поддержка GPUDirect для RDMA – сокращение узких мест системной памяти

    GPUDirect обеспечивает прямую связь между GPU и другими устройствами PCI-E и поддерживает прямой доступ к памяти между сетевыми картами и GPU. Это сильно уменьшает задержки MPISendRecv между узлами GPU в кластере и повышает общую скорость работы приложения.

  • NVIDIA Nsight Eclipse Edition – быстрое и простое генерирование кода CUDA

    Эта функция позволяет программистам создавать, отлаживать и профилировать приложения под GPU в знакомой среде на базе Eclipse на платформе Linux и Mac OS X. Встроенный редактор CUDA и примеры кода ускоряют генерирование кода CUDA, а автоматический рефакторинг кода позволяет легко портировать циклы CPU на ядра CUDA. Встроенная профессиональная система анализа проводит автоматический анализ работы и дает пошаговые инструкции для устранения узких мест в работе кода, а подсветка синтаксиса позволяет легко отличать код GPU от кода CPU.

Новый онлайн центр CUDA для разработчиков

Чтобы лучше раскрыть потенциал CUDA для разработчиков, NVIDIA запустила бесплатный онлайн ресурсный центр для программистов CUDA по этому адресу. На сайте доступна новейшая информация по платформе и модели программирования CUDA, а также открыт доступ ко всей документации и технологиям CUDA, включая инструменты, примеры кода, библиотеки, API и руководство по настройке и программированию.

Разработчики параллельных приложений приглашаются вступить в программу CUDA Registered Developer Program и получать бесплатный ранний доступ к новым версиям программ, инструментам и ресурсам. Подробнее смотрите тут.

16 октября 2012 Г.

08:00

Ctrl
ПредыдущаяСледующая
194
194

Все новости за сегодня

Apple возглавила рейтинг самых почитаемых компаний Fortune: Второй год подряд следом за Apple идет Amazon5

Низкий спрос на ноутбуки вынуждает производителей металлических корпусов обратить внимание на электромобили: Помимо корпусов электродвигателей производители осваивают выпуск корпусов для различной электроники, применяемой в электромобилях

В 2017 году чаще всего клонировали смартфоны Samsung : Apple заняла вторую позицию с результатом 7,72%3

«Доллар 2.0» — Наталья Касперская назвала Bitcoin разработкой ЦРУ: Некоторые аналитики считают, что уже в этом году курс Bitcoin может достигнуть 100 000 долларов37

Представлены 3D-камеры Intel RealSense D415 и D435: RealSense D415 и D435 доступны для предзаказа по цене 150 и 180 долларов соответственно2

iOS 11 серьёзно отстаёт от предшествующей версии по темпам распространения : iOS 11 заняла 65% рынка совместимых устройств 40

Защищенный смартфон Aermoo M2 получил сдвоенные камеры PureView Carl Zeiss: В основной сдвоенной камере используются датчики изображения разрешением 16 и 13 Мп3

Суммарный годовой доход магазина Apple AppStore в нынешнем году сравняется с мировыми кассовыми сборами кинотеатров: AppStore скоро достигнет отметки в 40 млрд долларов дохода9

В семействе Coffee Lake появится три процессора Pentium Gold и пара CPU Celeron: Появились данные о новых CPU Intel48

iXBT TV

  • Apple отключит замедление iPhone, 10 лет MacBook Air, дрон спас человека

  • Обзор автомобиля Mercedes-Benz E 220 d 4Matic All-Terrain Luxury: полноприводный внедорожный универсал

  • Обзор складной гладильной системы MIE Maxima: утюг, отпариватель для одежды и гладильная доска

  • Обзор недорогого Full HD DLP-проектора BenQ W1050 для домашнего кинотеатра

  • Процессор Intel с графикой AMD, экраны любой формы и размера

  • Критическая уязвимость Intel, разбор Apple iMac Pro, Dell XPS 13 стал тоньше

  • Обзор компактной беспроводной колонки JBL Playlist с поддержкой Chromecast

  • Обзор игрового IPS-монитора LG 34UM69G с соотношением сторон 21:9

  • Обзор блока питания Aerocool P7-750W Platinum с гибридной системой охлаждения

  • Apple специально замедляет старые iPhone, VR-революция, крошечный телефон

  • Обзор широкоугольного объектива Canon EF 35 mm F1.4L II USM

  • Обзор робота-пылесоса Kitfort KT-516 со сменными уборочными блоками

Календарь

октябрь
Пн
Вт
Ср
Чт
Пт
Сб
Вс