Конференция Nvidia GTC 2018: платформы для высокопроизводительных вычислений

Введение

Вот уже почти с десяток лет каждой весной в калифорнийском городе Сан-Хосе проходит ежегодная конференция компании Nvidia. В этом году GPU Technology Conference 2018 посетили больше 8500 участников со всего мира, из них более 300 — представители прессы и аналитики. Экспозиции выставки содержат полторы сотни выставочных стендов, а в рамках конференции проводилось более 600 часов разнообразных выступлений на тему применения решений Nvidia в различных сферах.

В 2018 году конференция празднует свое девятилетие, и за прошедшее время она стала одним из наиболее заметных событий в индустрии, связанной с различными сферами, в которых применяются высокопроизводительные вычисления, вроде искусственного интеллекта, реалистичной графики и автопилотируемых автомобилей.

Наши читатели в курсе, что компания Nvidia вот уже несколько лет занимается далеко не только традиционным для них рынком игровых и профессиональных графических процессоров, они постоянно пробуют выходить и на другие рынки, открывая новые ниши. К примеру, в сфере процессоров для высокопроизводительных вычислений дела компании продвигаются очень неплохо, и этот рынок оказывает все большее влияние в том числе и на финансовые показатели компании. Ну а решения для самоуправляемых автомобилей хоть пока и не получили должного распространения, но лишь по той причине, что до массового выпуска таких машин просто еще никто из производителей не дошел.

Тема графических применений продукции Nvidia на конференции GTC давно перестала быть главной, хотя немалую часть выставки и даже выступления главы компании и в этом году занимала трассировка лучей в реальном времени, но все же основной темой для Nvidia на GTC сейчас является применение ее решений в системах искусственного интеллекта и глубокого обучения, в частности. Технологии калифорнийской компании шагнули далеко за рамки ускорения рендеринга и обработки визуальных данных, и главной для них сейчас именно является вычислительная платформа для ускорения глубокого обучения. Об этом говорят и выставленные на входе самоуправляемые автомобили.

В прошлогоднем материале с GTC 2017 мы подробно писали о том, почему это важно именно сейчас. Вычислительные возможности серверов, компьютеров и смартфонов становятся все более впечатляющими, но это лишь теоретические возможности. Нужно научиться использовать их, сделав компьютеры умнее, чтобы они лучше распознавали голос и смысл, понимали обычную человеческую речь, точно определяли и распознавали образы, и делали многое другое. На GTC 2018 компания Nvidia, в лице ее бессменного президента Дженсена Хуанга, в очередной раз представила целую серию важных анонсов, увеличивающих возможности вычислительных платформ компании.

Nvidia каждый год улучшает производительность и функциональность своих решений, предназначенных для глубокого обучения, открывая все новые возможности по применению платформ, которые должны привести к изменениям в различных сферах: медицине, транспорте, науке и других. За прошедший почти десяток лет произошло два существенных изменения в политике Nvidia. Если раньше они были компанией, выпускающей в основном графические процессоры, пусть в том числе и для профессиональных задач, то затем они перешли к вычислительным решениям, анонсировав программно-аппаратную платформу CUDA, а позже стали компанией, которая занимается еще более высоким уровнем — искусственным интеллектом и полноценной платформой для автопилотирования.

Важно, что указанные нами рынки куда больше застоявшегося рынка игровых GPU, и потенциал для роста на них просто огромен. Можно взять автомобили, большинство которых в будущем должны стать автопилотируемыми, или другие решения с применением искусственного интеллекта — во всех них нужны вычислительные решения, максимально производительные и энергоэффективные. Посмотрев на финансовые отчеты Nvidia на протяжении нескольких лет, можно отметить несколько трендов, на которые мы указывали еще в прошлых годах. В сфере автомобильных решений есть не слишком большой, но все же прирост, а вот продажи решений для высокопроизводительных вычислений (серверов, дата-центров и других аналогичных применений) растут постоянно и уже выросли в несколько раз. Вполне понятно, что Nvidia вкладывает максимум ресурсов именно в эти сферы.

Искусственный интеллект уже сейчас в некоторых областях способен выполнять многие задачи точнее и быстрее человека, а дальше будет больше. В ближайшие годы должен продолжиться взрывной рост применения искусственного интеллекта во многих сферах. В медицине должен произойти рывок в повышении эффективности и точности диагностики с применением систем обработки данных, использующих искусственный интеллект. В установке правильных диагнозов и в процессе лечения системы ИИ должны серьезно облегчить и улучшить труд врачей. Добавим к медицине многочисленных роботов, автопилоты и многое другое, и получим новый дивный мир. Конечно же, переход этот будет плавным, но мы должны увидеть множество изменений еще при нашей жизни.

Почему все вообще происходит именно сейчас? Дело в том, что раньше содержать нейронные сети достаточных размеров было слишком дорого или даже невозможно, но вычислительные мощности современных систем растут, и немалый вклад в это внесла в том числе и Nvidia со своими вычислительными процессорами с весьма эффективными для этих задач блоками. Поэтому сейчас глубокое обучение и нейронные сети для решения своих задач может позволить себе уже куда больший круг компаний, даже небольших. Взрывной рост вычислительных возможностей дал возможность применения нейросетей во все большем количестве сфер и применений. А ведь сложность задач, которые ставят перед собой исследователи, постоянно растет, и каждый год требуется в несколько раз больше производительности.

Эксперты прогнозируют рост как внедрения технологий с использованием искусственного интеллекта, так и прибыли от продажи таких решений. Конечно, далеко не только продукты Nvidia будут применяться в высокопроизводительных системах, многие крупные компании выпустили собственные решения для ускорения задач глубокого обучения, но практика показывает, что у Nvidia сейчас весьма сильные позиции на этом рынке, и они даже еще не раскрыли весь свой потенциал. Компания занялась этой темой одной из первых, у них есть не просто отличный набор аппаратного обеспечения, но и полноценные платформы и продукты, готовые к применению и весьма эффективные в задачах с применением искусственного интеллекта.

А конференция GTC интересна тем, что это сейчас главное мероприятие для компании Nvidia и именно на нем делаются основные анонсы компании, связанные с рынком высокопроизводительных вычислений и искусственного интеллекта. К примеру, на прошлогодней выставке GTC 2017 были представлены: новая архитектура Volta и ускоритель Tesla V100 на его основе, линейка суперкомпьютерных систем Nvidia DGX, платформа для автомобилей Drive PX Xavier, применение возможностей искусственного интеллекта при трассировке лучей, институт глубокого обучения, платформа для умных городов Metropolis, имитатор роботов Isaac и референсные платформы для роботов. Все это довольно важно для индустрии, было хорошо ей воспринято и широко используется. А чем же порадовала GTC 2018? Сейчас расскажем.

Новости высокопроизводительных вычислений и глубокого обучения

Ученые, занимающиеся вычислениями, связанными с медициной, изучением климата, геологией и многим другим, предъявляют все более высокие требования к вычислительной мощности серверов, ведь расчеты в их задачах занимают по несколько дней даже на самых мощных серверах из ныне существующих. Им очень помогает не прекращающийся рост вычислительной мощи GPU, которые во многих задачах, поддающихся распараллеливанию, оказываются гораздо эффективнее систем на основе универсальных CPU, рост производительности которых несколько замедлился в последние годы. Неудивительно, что количество разработчиков ПО, использующих графические процессоры, за 5 лет увеличилось в 10 раз, а производительность самых быстрых 50 суперкомпьютеров в мире, использующих GPU, выросла в 15 раз.

Если говорить о временном отрезке в пять лет, то в 2013 году Nvidia предложила рынку сервер на основе графических процессоров архитектуры Fermi, которые для своего времени были весьма неплохими и получили поддержку со стороны разработчиков ПО, а выход на рынок вычислительных процессоров на основе архитектуры Volta сопровождается как очередным ростом производительности, так и расширением поддержки со стороны разработчиков.

Применений для Volta придумано и разработано уже куда больше, а если сравнивать серверы на основе GPU с традиционными системами на основе CPU, то давайте приведем любимый фокус главы Nvidia, который любит сопоставлять их по энергоэффективности, стоимости и занимаемому в серверных помещениях физическому месту.

В частности, сравнимую производительность обеспечивают: сервер из 600 двухпроцессорных систем на основе CPU, потребляющий 360 кВт, и 40 систем с четырьмя Volta каждая, потребляющих совместно лишь 48 кВт. Получается, что схожие возможности и производительность в задачах, где GPU может заменить CPU, можно получить за 20% цены серверов на основе CPU, при в разы лучшей энергоэффективности и лишь при 1/7 от занимаемого CPU-серверными стойками места.

Так как GPU хороши в массовых вычислениях, то особенно высок спрос на их вычислительные мощности со стороны разработчиков, занимающихся системами искусственного интеллекта: нейросетями и т. д. Для них Nvidia предлагает полноценную ИИ-платформу, состоящую из вычислительных процессоров Tesla V100, готовых систем DGX-1 и DGX Station на основе этих GPU, имеющих разный уровень производительности, менее дорогих решений Titan V, обладающих поддержкой TensorRT и облачных платформ известных компаний.

Одним из самых интересных «аппаратных» анонсов на GTC 2018 стало объявление нового вычислительного решения Tesla V100, использующего удвоенный до 32 ГБ объем начиповой HBM2-памяти, который актуален в большом количестве требовательных к объему и скорости памяти задач глубокого обучения. Удвоенный объем памяти позволит тренировать большие по размеру модели нейросетей и получать преимущество в задачах, которые были ограничены ранее памятью объемом в 16 ГБ.

Новое вычислительное решение Tesla V100 32GB доступно сразу со дня анонса, а такие известные производители как Cray, Hewlett Packard Enterprise, IBM, Lenovo, Supermicro и Tyan начнут распространять системы на основе Tesla V100 32GB во втором квартале текущего года. Сервис Oracle Cloud Infrastructure также уже анонсировал планы по предложению своим клиентам возможностей новой Tesla V100 32 ГБ в облаке во второй половине года.

Но даже четырех топовых GPU в системе DGX-1 для некоторых применений оказалось мало, исследователи не отказались бы и от более мощных систем, так как «лишнюю» производительность им всегда есть куда потратить. Именно для них Nvidia анонсировала мощнейшую систему на основе графических процессоров Volta — DGX-2, в которой объединены возможности сразу 16 процессоров Tesla V100 с 32 ГБ памяти каждый.

Совместно с новой технологией межчиповых соединений NVSwitch, соединяющей до 16 ускорителей Tesla V100 в единое устройство с производительностью подсистемы памяти в 2,4 терабайта/с, возможности таких систем и вовсе будут казаться почти безграничными. NVSwitch расширяет возможности NVLink и предлагает в 5 раз большую пропускную способность по сравнению с лучшими из свитчей PCI Express и позволяет создавать системы с большим количеством соединенных друг с другом GPU в них.

Для того, чтобы объединить 16 графических процессоров, потребовалось создание специального чипа NVSwitch, который и обеспечивает подключение GPU друг к другу. Всего для объединения 16 GPU требуется 12 таких чипов. Кристалл NVSwitch достаточно сложен, он содержит 18 высокопроизводительных линий связи NVLink, состоит из 2 млрд. транзисторов и производится по техпроцессу 12 нм на тайваньской фабрике TSMC.

Нейросети становятся все более сложными и требуют обработки в разы больших объемов данных с каждым годом. Также появились некоторые новые техники, требующие большего количества GPU, соединенных друг с другом для обмена данными и синхронизации. Такие операции требуют передачи большого объема данных и высокой пропускной способности. Объединение мощи 16 GPU быстрой связью с пропускной способностью в 2,4 ТБ/с позволяет добиться в разы большей производительности.

Использование DGX-2 позволяет обойти ограничения по сложности и размерам модели, имеющиеся у традиционных вычислительных архитектур, убирает предыдущие ограничения по скорости передачи данных между чипами, и позволяет использовать наборы данных большего размера при все более ресурсоемких нагрузках, включающих параллельную тренировку нейросетей. ИИ-суперкомпьютер DGX-2, состоящий из 16 самых производительных вычислительных процессоров с ускорением ИИ, дает возможность тренировки вчетверо более крупных моделей при многократном ускорении, по сравнению с аналогичными системами, существующими сегодня.

Каждый из NVSwitch содержит 18 портов NVLink (50 ГБ/с на порт), на базовой плате их шесть штук вместе с восемью GPU Tesla V100, и две такие базовые платы могут объединяться в одно целое. Каждый из восьми GPU на одной плате соединен с каждым из шести NVSwitch одиночным NVLink каналом, а восемь портов каждого чипа NVSwitch используются для обмена данными с другой базовой платой. Соответственно, каждый из восьми GPU на плате с другими процессорами «общается» на скорости в 300 ГБ/с.

DGX-2 — наиболее производительное готовое решение на основе Tesla V100 и NVSwitch, предназначенное для задач глубокого обучения. Это первый одиночный сервер с вычислительной производительностью до двух петафлопс, заменяющий 300 обычных серверов, занимающих 15 стоек в дата-центрах при в 60 раз меньшем размере и в 18 раз большей энергоэффективности. Выглядит он как сравнительно небольшой ящик:

В целом получается система с 81 920 вычислительными ядрами, 512 ГБ быстрой HBM2-памяти с общей пропускной способностью в 14,4 ТБ/с и высочайшей производительностью в задачах, связанных с нейросетями — 2000 терафлопс для операций на тензорных ядрах. Скорость обмена данными между процессорами составляет 300 ГБ/с. Вот так выглядит DGX-2 в разобранном состоянии:

Хорошо видны 16 блоков с графическими процессорами и 12 блоков с NVSwitch. Остается добавить, что DGX-2 отличается энергопотреблением в 10 кВт и весит этот шкаф под 160 кг. По сравнению с системой DGX-1 на основе 16-гигабайтных версий V100, в некоторых задачах, где нужен большой объем памяти, переход на DGX-2 обеспечивает прирост скорости до 10 раз.

С ценой получилось довольно забавно — сначала Дженсен Хуанг показал публике слайд с ценой в 1,5 млн долларов, и когда все охнули, он быстренько поменял слайд уже на правильный, с перечеркнутой «ошибочной» ценой и указанной настоящей — 399 тысяч долларов, что уже куда приятнее полутора миллионов.

Публика не осталась без сравнения с традиционными серверами на основе CPU и в этот раз. Nvidia сравнивает DGX-2 с кластером из 300 двухпроцессорных серверов, стоящих 3 миллиона долларов и имеющих энергопотребление в 180 кВт. Неудивительно, что DGX-2 со значительно лучшей энергоэффективностью и в разы меньшей ценой имеет преимущество. Правда, это сравнение справедливо только для конкретных задач глубокого обучения, а не для всех подряд. Но такая мощь позволит тратить в несколько раз меньше времени и денег на обучение нейросетей, что бывает критично.

Поставки готовых DGX-2 систем ожидаются в третьем квартале этого года. Но и DGX-1 никуда не пропадет, вся линейка высокопроизводительных систем на основе GPU продолжает существовать. Более того, все «старые» системы получат новые ревизии с апгрейдом до 32-гигабайтных V100 и будут поставляться уже в обновленном виде.

DGX-2 — это первая система, использующая NVSwitch и позволяющая 16 процессорам системы использовать общую память. На такой системе разработчики могут тренировать нейросети на более сложных и больших массивах данных, используя более комплексные модели глубокого обучения. В результате новая система DGX-2 в некоторых задачах может быть в несколько раз быстрее DGX-1 на основе все той же архитектуры Volta, представленной в сентябре. Новинка включается в линейку продуктов DGX и становится на вершину этой серии вычислительных систем Nvidia.

Самое важное в DGX-2 то, что это — самое производительное готовое решение для ускорения задач, связанных с использованием возможностей искусственного интеллекта. Эта система упрощает масштабирование ИИ-задач построением самых крупных вычислительных кластеров для задач глубокого обучения, также с богатейшими возможностями для визуализации результатов. Использование готовой системы позволяет тратить меньше времени на решение задач по обеспечению работоспособности аппаратной и программной инфраструктуры, и решать задачи, напрямую связанные с искусственным интеллектом. Платформа Nvidia обеспечивает высокую надежность, а кроме этого, работоспособность DGX-2 поддерживается компанией Nvidia, имеющей богатый опыт по построению, разворачиванию и поддержке подобных систем.

Интересно, что такую систему клиенты не просили у компании, а ее задумали в Nvidia самостоятельно, чтобы создать новый сегмент рынка. На данный момент этот сегмент совсем небольшой, но разработка DGX-2 на основе NVSwitch — это помощь тем исследователям, кто заинтересован в разработке новых алгоритмов и приложений будущего. Вероятно, в Nvidia надеются на появление различных приложений на основе нейросетей, которые будут востребованы массами и потребуют больших вычислительных мощностей, которую Nvidia и предоставит в конечных продуктах.

Для задач глубокого обучения с применением нейросетей довольно важен и анонс по программной части — с апреля 2018 года решения Nvidia получили поддержку TensorRT 4, ONNX и WinML. А для того, чтобы получить возможность удобного использования нескольких объединенных систем, Nvidia объявила поддержку открытого ПО для автоматизации развертывания и масштабирования Kubernetes.

Оно позволяет использовать несколько физических или виртуальных вычислительных систем для одновременного выполнения одной задачи с балансировкой загрузки и автоматическим управлением кластером. На GTC было показано применение сразу восьми систем на основе процессоров Tesla V100 для определения нейросетью видов цветов на изображениях. Объединение вычислительных возможностей GPU с помощью Kubernetes позволило ускорить эту задачу в разы.

Вообще, платформа Nvidia AI Inference уже получила широчайшую поддержку в индустрии, самые известные компании используют эти решения в своих нейросетях для различных задач: здравоохранение, умные города, роботы, автопилоты, производство, распознавание изображений и речи и т. д.

И это совсем неудивительно, учитывая ускорение определения нейросетями в разы, десятки раз и сотни, по сравнению с универсальными процессорами. Все перечисленные компании используют решения Nvidia и это еще далеко не полный их список. Похоже, по крайней мере в ближайшем будущем Nvidia в сфере «ускорителей искусственного интеллекта» ждет вполне закономерный успех.

Трассировка лучей в реальном времени

Мы уже рассказывали об анонсе технологии трассировки лучей в реальном времени, исполняемой на графических процессорах Nvidia и получившей название RTX. Фактически, технологию анонсировали еще на игровой конференции Game Developers Conference, которая прошла неделей раньше GTC, но тогда говорили в основном про игровые ее применения в рамках нового графического API компании Microsoft — DXR. Но ведь эту технологию также можно использовать и в приложениях на основе Vulkan и Nvidia OptiX.

Многие разработчики с энтузиазмом восприняли новую технологию и сразу же выпустили несколько демонстрационных программ, показывающих возможности гибридного рендеринга, использующего растеризацию и трассировку лучей: физически точные отражения и преломления, а также тени не только от точечных источников света, реалистичное глобальное освещение и затенение, учитывающие особенности распространения света в природе.

Одной из самых впечатляющих оказалась демонстрация на тему популярного киносериала Star Wars, созданная на основе движка Unreal Engine, и исполняющаяся на четырех ускорителях Volta, имеющихся в составе DGX Station (мы попросили включить режим wireframe, чтобы убедиться в том, что нам показывают именно рендеринг в реальном времени):

Возможности трассировки лучей в реальном времени открывают множество новых алгоритмов, выдающих фотореалистичный результат, и в целом являются одним из важнейших шагов в компьютерной графике за последние годы. Это относится далеко не только к игровым приложениям, но и многим сферам профессиональной графики.

Именно для таких применений компания Nvidia и анонсировала на конференции GTC 2018 новое решение для профессиональной среды — Quadro GV100 GPU с поддержкой технологии Nvidia RTX, обеспечивающей трассировку лучей в реальном времени для разработчиков и дизайнеров.

Многие профессионалы в сфере развлечений и медиа нуждаются в точном расчете освещения, затенения и прозрачности. А еще лучше, чтобы это делалось как можно быстрее и ближе к реальному времени. Сочетание возможностей технологии RTX с мощнейшим аппаратным решением Quadro GV100 делает вычислительно интенсивные задачи трассировки лучей для профессиональных приложений возможными в реальном времени — как программируемые пиксельные шейдеры несколько лет назад. И оптимизация трассировки лучей RTX под архитектуру Volta помогла добиться ускорения сложного рендеринга до 10 раз, по сравнению с лучшими из многоядерных центральных процессоров.

Это важно потому, что профессиональные графические решения Nvidia Quadro применяются при создании сотен игровых проектов и видеороликов к ним, в теле- и киноиндустрии, а также других сферах развлечений, и при создании дизайна различных товаров и в архитектурных задачах. И все эти специалисты по графике, дизайнеры и архитекторы теперь смогут создавать еще более сложные и интерактивные сцены в фотореалистичном качестве с использованием рендеринга в реальном времени или близком к этому.

Новая Quadro GV100 использует обновленный чип архитектуры Volta, имеющий уже 32 ГБ локальной памяти стандарта HBM2 с коррекцией ошибок ECC, шириной шины в 4096 бит и пропускной способностью в 870 ГБ/с. GPU содержит 5120 вычислительных ядер и 640 тензорных ядер, что обеспечивает производительность в 14,8/7,4 терафлопс при одинарной/двойной точности вычислений. А для быстрой работы системы шумоподавления OptiX AI, встроенной в Nvidia RTX, обеспечивается скорость вычислений в 118,5 терафлопс, что в десятки, а то и сотню раз выше, чем у любого CPU. Максимальное потребление энергии при этом составляет 250 Вт.

Удобно, что можно объединить две Quadro GV100 при помощи интерфейса Nvidia NVLink второго поколения, обеспечивающего работу пары процессоров в виде одного устройства. Тогда в объединенной системе будет 10240 вычислительных ядер, обеспечивающих 236 терафлопс специализированных операций глубокого обучения. Мосты NVLink для соединения двух плат Quadro продаются отдельно и они позволяют объединить мощь пары GV100 для увеличения производительности и объема локальной видеопамяти — при поддержке этой технологии со стороны приложения, видеоподсистема на основе двух GV100 будет иметь 64 ГБ общей видеопамяти. Естественно, ПСП ко второй половине памяти будет несколько ниже — но благодаря NVLink второго поколения обеспечивается вполне приличная скорость передачи до 200 ГБ/с.

Новая плата Quadro предлагает четыре разъема DisplayPort 1.4 с поддержкой передачи звука и HDCP 2.2, поддержку стереовывода, поддержку технологий GPUDirect, NVLink (для соединения пары Quadro в единую систему) и Quadro Sync II. К карте можно одновременно подключить четыре дисплея с разрешением 4096×2160 пикселей и частотой обновления до 120 Гц или четыре дисплея с разрешением 5120×2880 пикселей и частотой 60 Гц или два дисплея с разрешением 7680×4320 при 60 Гц.

Из других достоинств Quadro GV100 выделим широкую поддержку различных API — разработчики могут воспользоваться возможностями трассировки лучей RTX через интерфейс Nvidia OptiX, новый API для трассировки лучей Microsoft DirectX Raytracing, а в будущем и еще один новый API Vulkan (расширения для поддержки RTX пока находятся в разработке). Реалистичное освещение, отражения, преломления и тени, рассчитываемые при помощи трассировки лучей, использующей шумопонижение с использованием искусственного интеллекта из OptiX, обеспечивает высокую производительность при фотореалистичной картинке, а также отличную масштабируемость при поддержке 64 ГБ памяти, необходимых для рендеринга самых сложных сцен.

В своем ключевом выступлении Дженсен Хуанг снова не обошелся без излюбленного сравнения серверов на GPU с системами на CPU — в этот раз в задаче трассировки лучей. Традиционную ферму с 280 двухпроцессорными серверами в 14 стойках и потреблением в 168 кВт по производительности в этой специализированной задаче он приравнял к паре стоек из 14 серверов с четырехпроцессорными GPU-системами, потребляющих всего 24 кВт. То есть, в графических задачах, где вместо CPU применимы GPU, можно получить ту же скорость при 1/7 энергопотреблении и 1/7 занимаемого серверами физического места. А главное — всего лишь при 20% от стоимости аналогичной CPU-системы.

Хотя сама по себе технология Nvidia RTX была анонсирована на игровой конференции GDC, на GTC компания анонсировала ее поддержку в более чем двух десятках приложений профессиональной графики, которые используют миллионы пользователей серьезного ПО. Неудивительно, что у Nvidia уже есть куча партнеров по применению RTX в игровых движках, профессиональных приложениях, утилитах и т. п. И особенно довольны таким сотрудничеством компании, работающие с графикой для киноиндустрии, ведь они могут получить прирост скорости в несколько раз, пусть даже и не в финальном рендеринге. Среди компаний и их продуктов можно выделить Autodesk, Blender, V-Ray, Octane Render, Renderman и другие.

Доступность нового профессионального решения Quadro GV100 объявлена прямо со дня анонса — приобрести новинку можно на сайте компании, а в течение месяца эта модель появилась и у известных производителей рабочих станций, включая Dell EMC, HP, Lenovo и Fujitsu, а также авторизованных дистрибьюторов: PNY Technologies для Северной Америки и Европы, ELSA/Ryoyo для Японии и Leadtek для Азии. Рекомендованная цена решения составляет $9000.

Почему Nvidia заговорила о трассировке лучей для профессиональных и для игровых применений именно сейчас, ведь до реального времени еще далековато — если целиться на качественную картинку, то даже для игрового применения (на примере демки Star Wars) нужно несколько самых мощных видеокарт. Все дело в том, что решения архитектуры Volta не только аппаратно оптимизированы в том числе для задач трассировки лучей, но и могут выполнять очень быстрые алгоритмы шумоподавления, использующие искусственный интеллект и очень быстро выполняющиеся именно на тензорных ядрах, впервые появившихся в GV100.

Удаление шума при помощи алгоритма с применением искусственного интеллекта позволяет гораздо быстрее получить картинку приемлемого качества — хорошо натренированная нейросеть «дорисовывает» недостающие (еще не рассчитанные при помощи трассировки лучей) значения пикселей довольно точно, и человеческий глаз с трудом найдет в изображении изъяны. Даже в 10 раз меньшее количество трассировок лучей при использовании AI Denoiser делает картинку очень близкой к совершенству.

На выставочном стенде компании Nvidia был показан в том числе и пример с рендерингом при помощи бета-версии рендерера V-Ray, использующего новые возможности Volta по ускорению трассировки лучей — сцена из трейлера Destiny 2 предоставлена компаниями Activision и Bungie. И автор материала лично убедился в том, что отрисовка на GPU с использованием шумоподавления при помощи ИИ делает картинку довольно качественной буквально за пару-тройку секунд, тогда как CPU за это время отрисовывает лишь очень малую часть пикселей. И это стало доступным для всех желающих вместе с Quadro GV100.

Обучение автопилотов в виртуальном мире

Известно, что компания Nvidia давно занимается разработкой решений, предназначенных для автопилотируемых транспортных средств, и даже является одним из лидеров в этой сфере, если рассматривать независимые компании, предлагающие свои разработки всем заинтересованным сторонам. Естественно, что на GTC 2018 не могли обойти вниманием тему автопилотирования, ведь в не таком уж далеком будущем практически все движущиеся по дорогам (а еще наверняка и в воздухе и на воде) средства обретут возможность самостоятельного управления при помощи искусственного интеллекта: личные автомобили, роботакси, грузовики, автобусы, тракторы и многое другое. Очень много информации на эту тему мы дали в отчете с европейской GTC 2017, прошедшей в Мюнхене.

Компания Nvidia играет значимую роль в глобальном развитии автопилотов, предоставляя заинтересованным разработчикам полноценную платформу Drive, которая способна собирать и обрабатывать необходимые данные, тренировать нейросети, проводить симуляции и, собственно, управлять транспортным средством. Платформа для автопилотирования в процессе работы занимается решением множества задач, включая определение объектов, расстояния до них, скорость и направление их движения, нахождение свободного места и прокладывание маршрута, создание карты объектов по данным с камер, лидаров и других датчиков, учет погодных условий и многих других.

Все эти задачи требуют обработки просто огромного количества тестовых данных, и автопилот учится на их основе: чем больше — тем лучше будет его качество. Получение четких и верных исходных данных для нейросетей жизненно необходимо, ведь они основаны не на четком следовании программе, а действуют на основе изученных ранее данных. Как было метко сказано Дженсеном на конференции: «Данные — это новые исходные коды», и это действительно так. Чем больше у исследователя качественных данных для обучения, тем «умнее» будет искусственный интеллект, обученный на их основе.

Поначалу Drive Xavier будет единственным решением с высшим уровнем безопасности ASIL D (Automotive Safety Integrity Level D), определяющим параметры серьезности риска, вероятности воздействия и управляемости. Но Nvidia также уже представила и решение для автопилотов будущего, которое получило кодовое наименование Orin.

Если Xavier — это уменьшенный в размерах аналог Drive PX 2, то Orin — это аналог Pegasus по уровню производительности и возможностей, но на основе лишь двух чипов, в отличие от четырех в Pegasus (два графических процессора Volta и два мобильных процессора Xavier). Главное, что Orin будет иметь ту же вычислительную архитектуру, что и предыдущее решение, что позволит очень легко и просто перенести на него все уже существующие разработки. И в этом — сила Nvidia, ведь они постепенно развивают свои продукты, не меняя общего подхода.

К слову, чипы Xavier содержат девять миллиардов транзисторов, на их основе можно создавать роботакси с высшим пятым уровнем автономности. Поставляются пока что инженерные образцы этих чипов, а массовое производство должно начаться лишь в следующем году. Еще более новый Orin будет компактнее и экономичнее, позволит получить еще большую производительность, но когда он станет доступным для заказчиков — пока что неизвестно.

Естественно, раз конференция проходила после не самого приятного случая с автопилотируемым автомобилем компании Uber, насмерть сбившим переходящую дорогу в темное время суток пожилую женщину с велосипедом, не обошлось без затрагивания этой темы. Еще до того, как Дженсена спросили об этом случае журналисты, он сам решил пояснить, что хотя Nvidia и предоставляет Uber оборудование для автопилота, эта компания не использует программное обеспечение Nvidia для работы автопилота, у них собственные разработки. А уж аппаратные средства никак не могут быть виноваты в случившемся, и скорее всего, их просто неверно настроили.

И хотя многие компании временно перестали тестировать автопилотируемые автомобили на дорогах общего пользования после первого смертельного случая с пешеходом (хотя сколько их ежедневно погибает от рук живых водителей?), никто не остановил разработки полностью, продолжая улучшать ПО на основе других методов.

Анонсированное компанией Nvidia на GTC 2018 решение, входящее в платформу Drive, как раз отлично подходит для того, чтобы проводить тестирование даже без выезда автомобилей на дороги. В рамках своего ключевого выступления, Дженсен Хуанг представил систему симуляции Drive Sim и Constellation, предназначенную для безопасной тренировки автопилотов в виртуальной реальности, позволяющей проехать много миллионов «почти настоящих» километров без каких-либо физических происшествий и печальных последствий для жизни и здоровья людей.

Drive Sim и Constellation — это облачная система для обучения и тестирования автономных автомобилей с использованием виртуального пространства с фотореалистичной графикой, имеющая ту же архитектуру, что и другие составляющие платформы Drive. Система симуляции состоит из двух серверов: один из них запускает программное обеспечение Drive Sim для имитации работы сенсоров самоуправляемого автомобиля, таких как камеры, лидары и радары, а второй содержит мощный ИИ-компьютер Drive Pegasus, содержащий полный стек автопилотируемого ПО, которое обрабатывает имитируемые данные так, как будто они поступают от реальных сенсоров реального автомобиля, движущегося по настоящей дороге.

Разработка автопилотов требует тестирования и проверки на протяжении многих километров для того, чтобы достичь требуемой безопасности и точности, и применение виртуальной реальности в Drive Constellation позволяет улучшить работу алгоритмов автопилотирования с помощью большего количества тренировочных заездов с различными сценариями и условиями на дороге, в том числе крайне редкими — и все это возможно осуществить за меньшее время, по сравнению с таким же тестированием на реальных автодорогах. Конечно же, без испытаний на дорогах все равно не обойтись, но самая опасная первая часть обучения, когда ИИ еще далеко не идеален, пройдет в безопасной виртуальной среде.

Сервер симуляции работает на основе графических процессоров Nvidia, каждый из которых генерирует поток имитируемых данных для сенсоров, который скармливается бортовому автопилоту на основе Drive Pegasus для дальнейшей обработки. А управляющие команды от Drive Pegasus отправляются обратно в симулятор для обеспечения обратной связи — такие циклы обмена данными происходят 30 раз в секунду.

Программное обеспечение Drive Sim генерирует фотореалистичную картинку при воссоздании тестового виртуального окружения и может имитировать различные погодные эффекты, вроде снежной бури или ливня, а также другие эффекты: ослепляющий солнечный свет, ограниченный обзор в ночное время суток и т. д. Также может отличаться дорожное покрытие и ситуация на дороге. Для проверки корректности работы автопилотов можно создавать практически любые ситуации и сценарии, имитировать редкие и/или сложные условия, в том числе погодные, генерировать какие-то специфические сценарии, а главное — натренировать искусственный интеллект на основе виртуального «проезда» миллионов километров без какой-либо опасности для окружающих. 10 000 систем Constellation позволят проехать 3 миллиарда миль за год и качественно натренировать искусственный интеллект.

Система симуляции дорожной обстановки Drive Sim и Constellation будет доступна для партнеров компании Nvidia уже в третьем квартале текущего года. А партнеров у них уже много, это и такие гранды автомобильной индустрии, как Mercedes-Benz, Toyota, Audi, Volvo и Scania, так и небольшие, но подающие большие надежды многочисленные стартапы.

Новые решения компании Nvidia интегрируют возможности платформы Drive Pegasus, симуляции Drive Sim для тестирования и проверки способностей автопилотов и позволяют собрать данные, натренировать искусственный интеллект в гибридном режиме, как на основе реальных трасс, так и в виртуальной реальности, и использовать все эти возможности в самоуправляемых автомобилях будущего. Платформа Nvidia Drive отличается от аналогичных предложений тем, что это полноценная программно-аппаратная платформа, максимально компактная и энергоэффективная, да еще и постоянно развивающаяся.

Из другого интересного контента, относящегося к автомобильной теме, выделим показанный во время ключевого выступления Дженсена пример использования виртуальной реальности для удаленного управления автомобилем Ford, который был оснащен датчиками и дистанционным управлением. Оператор же в шлеме виртуальной реальности HTC Vive Pro сидел в виртуальном Lexus где-то далеко от реального автомобиля (виртуально — сколь угодно далеко, лишь бы задержки связи не были слишком большими) и действовал удаленными органами управления автомобиля: рулем и педалями.

«Виртуальный водитель» видел изображение с камер и управлял автомобилем, в зависимости от увиденного. В принципе, объезжать препятствия и парковаться таким образом можно, но демонстрация Nvidia подобной возможности была скорее нужна для большей зрелищности. Единственный вариант, когда она реально может понадобиться в будущем — выход из строя автопилота и управление удаленным оператором для возвращения автомобиля на базу. Хотя можно найти и еще пару применений, наверное.

Суперкомпьютер для визуализации в медицине

Одной из важнейших сфер применения высокопроизводительных систем на основе графических процессоров Volta является медицинская отрасль. Еще много лет назад на предыдущих конференциях Nvidia GTC мы познакомились с подобными применениями, число которых продолжает увеличиваться. И для того, чтобы еще больше облегчить задачи исследователей, связанные с медициной, в Nvidia решили выпустить специализированную вычислительную платформу Project Clara, лучше всего проявляющую себя в медицинских расчетах и визуализации полученных результатов.

В мире используется много различных систем для медицинской диагностики и визуализации, и медицинские снимки и изображения разного рода помогают определять заболевания еще на ранней стадии. Увы, но несмотря на то, что эти аппараты спасают жизни и здоровье людей, рынок этот очень инертный — замена старого оборудования новым происходит очень медленно и далеко не каждый год старые аппараты заменяются новыми.

А вот совершенствование технологий диагностики привело к тому, что параллельные вычисления принесли некоторое развитие и в этой области. Еще с десяток лет назад исследователи обнаружили, что графические процессоры Nvidia обладают хорошо подходящей аппаратной и программной архитектурой для работы с медицинскими изображениями, помогая улучшить качество получаемых изображений и получить возможность их генерации в реальном времени. Быстрое развитие глубокого обучения позволило внедрить алгоритмы искусственного интеллекта во множество подобных медицинских приложений.

На конференции GTC 2018 компания Nvidia представила суперкомпьютер Project Clara, который предназначен для обработки различных медицинских изображений и который позволяет изменить существующие возможности уже сейчас. Основанная на возможностях GPU, платформа поддерживает все важные технологии компании: CUDA, CUDNN, TensorRT, RTX и позволяет обрабатывать и визуализировать различные данные, помогающие в медицинских применениях. К примеру, итеративная реконструкция в КТ и получение сигнала на базе предыдущих значений в МРТ, снижают необходимость в облучении до 10 раз, сокращая время на получение МРТ-снимка.

В качестве еще одного из подобных примеров можно привести обработку изображения человеческого плода в утробе матери, которое ранее можно было посмотреть лишь в двухмерном черно-белом виде. Но новые решения с применением алгоритмов искусственного интеллекта дают совершенно иные возможности по анализу изображений. При помощи специализированной обработки на решениях Nvidia стал возможен просмотр трехмерной модели, по которой проще производить необходимую диагностику.

Еще одним применением является анализ не слишком качественной двухмерной картинки, полученной при помощи обычного ультразвукового сканирования внутренних органов, в частности сердца. Применение искусственного интеллекта позволяет восстановить объемное изображение сердечного желудочка из обычной 2D-картинки и вычислить характеристики, требуемые врачам для диагностики. В представленном на GTC алгоритме V-Net применяется объемная сегментация для автоматического измерения объема крови, проходящего через сердце — и все это получено из двухмерного черно-белого УЗИ-изображения.

На картинке показано анимированное 3D-изображение (открывается по клику) левого желудочка сердца, которое разделено на сегменты с помощью V-Net — сверточной 3D-нейросети, работающей на базе GPU Tesla V100. Лет пятнадцать назад для решения таких задач был нужен суперкомпьютер стоимостью в несколько миллионов долларов, а сейчас его может заменить система из нескольких Tesla V100. И это только пара самых очевидных применений расчетных задач и визуализации, связанных с медициной.

У компании Nvidia уже есть многолетний опыт работы в области медицинской визуализации, и высокопроизводительные вычисления на GPU только начали менять процесс получения и анализа медицинских снимков. Прелесть Project Clara в том, что этот суперкомпьютер позволяет запускать множество вычислительных инструментов одновременно, применяя виртуальные графические процессоры Nvidia для обеспечения доступа сразу нескольким пользователям. Эффективно масштабировать и распределить вычисления по GPU поможет упомянутый ранее балансировщик нагрузки Kubernetes.

Nvidia обеспечила ученых полноценной платформой для задач обработки и визуализации результатов ультразвукового сканирования, магнитно-резонансной, позитронно-эмиссионной и компьютерной томографии, маммографии, рентгеновского анализа и многих других. Неудивительно, что большое количество партнеров заинтересовались таким применением вычислительных систем на основе GPU.

С компанией сотрудничают десятки компаний из сферы здравоохранения, также как и научно-исследовательские учреждения в области медицины. Так, приложение AutoMap, созданное центром MGH Martinos, помогает сократить время получения МРТ и улучшить качество изображений, V-Net автоматически измеряет анатомию и оценивает функциональность (пример был приведен выше), а качественный рендеринг Эллиота Фишмана из Университета Джона Хопкинса повышает качество изображений, сокращая время диагностики для рентгенологов и увеличивая эффективность лечения.

Из других примеров — компания Subtle Medical, работающая над десятками приложений по визуализации в области медицины, которая выиграла более 250 миллионов долларов в рамках программы поддержки стартапов Nvidia Inception. Специалисты говорят, что подобные новые технологии улучшат сферу здравоохранения в целом, а виртуализированный медицинский суперкомпьютер способен кардинально изменить многие возможности специалистов в этой области, совершив важный прорыв в медицине.

Экспонаты с выставки: автомобили и роботы

Выставочный зал GTC каждый год удивляет чем-то интересным и необычным, так получилось и в этот раз — любопытных демонстраций тут было показано немало. Начнем с автомобильной части, как самой обширной. В отличие от мюнхенской GTC Europe 2017, в Калифорнии не показывали автоэкспонаты в движении. Впрочем, они тут уже стали обыденными, так как в процессе тестирования колесят по штату десятками, если не сотнями.

Из выставленных в зале автомобилей сразу выделяется роботизированный гоночный автомобиль серии Roborace, о котором мы писали в наших прошлогодних репортажах. На его разработку потребовалось лишь два года, и теперь Robocar существует в реальности, приводится в движение четырьмя электромоторами и разгоняется до 300 км/ч. Чтобы движение болида было полностью автономным, он содержит 15 различных сенсоров и датчиков, которые управляются при помощи платформы Nvidia Drive.

Рядом с робоболидом расположилась внешне обычная Toyota, но внутренности у нее интересные — в Toyota Research Institute совместно с компаниями Nvidia, Luminar и Velodyne разработали платформу для автопилотирования Platform 3.0, которая включает множество различных датчиков для обеспечения управления их автопилота следующего поколения.

Естественно, не обошлось и без собственных автомобилей Nvidia — BB8, которые проходят тестирование на обычных дорогах (оно было приостановлено по уже упомянутой выше причине) в Калифорнии, Нью-Джерси, Германии и Японии — эти автомобили собирали данные и улучшали качество фирменной платформы автопилотирования Drive.

В отличие от большинства представленных автомобилей, в собственную разработку компании разрешали сесть внутрь. Кроме обычных демонстраций определения и отслеживания объектов, определения расстояний до них и т. п., в этот раз было показано отслеживание самого водителя — система способна постоянно следить за его работоспособностью в целях безопасности, пока еще автопилоты не полностью автономны.

Очень возможно, что подобная система бы не позволила тому самому водителю автомобиля Uber, который сбил женщину, постоянно отвлекаться от наблюдения за дорогой. К слову, представитель одной из компаний, также занимающихся тестированием автопилотов на улицах, сказал нам, что в их компании таких вольностей не допускают — наблюдатель обязан следить за дорогой постоянно, иначе его отстранят от заездов.

Одним из самых футуристичных (как минимум — на вид) автомобилей выставки стал Einride T-Pod — прототип автономного грузовичка на электрической тяге, который призван заменить большие грузовики. Грузовичок управляется удаленно, имеет батарею емкостью в 200 кВт·ч и может проехать до 200 км на одной зарядке.

Другие автомобили выглядели обыденно — кажется, что это обычный Lexus RX400h, но разработка AutonomouStuff предлагает настраиваемую автопилотируемую платформу для дальнейшей разработки с использованием продвинутых алгоритмов самостоятельного управления. Жалко, что сейчас нельзя просто взять и протестировать все эти автопилоты, ведь методика тестирования у нас в голове уже практически готова.

Еще один абсолютно обычный с виду экспонат — Mercedes-Benz A-класса, представленный на выставке CES в начале года. И это — действительно всего лишь обычный Мерседес, просто новая разработка компании использует информационно-развлекательную систему на основе решений Nvidia, которая применяет искусственный интеллект для распознавания голоса, а также имеет продвинутые возможности для отрисовки двухмерных изображений и 3D-анимации.

Просим прощения за плохое качество фотографии, экспонат имел необычно большую популярность, внутри всегда кто-то сидел и пробиться за руль было довольно сложно. В любом случае, очень хорошо, когда ранние разработки попадают в уже реальный автомобиль, который можно купить даже у нас в стране.

Ну и последним из автомобильных экспонатов отметим самый впечатляющий — грузовик Peterbilt с начинкой компании TuSimple, показывающей на выставке свою разработку с четвертым уровнем автономности (SAE Level 4). Выглядит грузовик замечательно и дополнительно греет сердце тем старичкам, которые не хотят принимать футуристичный вид автомобилей вроде Einride T-Pod.

Естественно, что не только возможности легковых автомобилей и грузовиков могут быть каким-то образом улучшены при помощи решений Nvidia. На выставке был даже небольшой экскаватор Komatsu, в котором используются возможности компактного решения Jetson для распознавания и анализа объектов на строительной площадке. Говорят, что это нужно для большей безопасности (видимо, чтобы не зацепить ковшом или гусеницей строителей) и повышения эффективности работы.

Там же был расположен еще один экспонат на ту же тему — использование Nvidia Jetson помогает в управлении тяжелой строительной техникой и при анализе эффективности ее использования. Как смутно видно на экране, система анализирует как минимум активность строительной техники и время ее эффективной работы и простоя.

Как время автопилотов наступит неминуемо, так и дело роботизации не минует многочисленные сферы, такие как доставка товаров, логистика и склады, сельское хозяйство, промышленное производство и сфера розничных продаж. Роботизация способна увеличить эффективность всех этих сфер деятельности, и многие из примеров были показаны на выставке GTC 2018.

Компания Nvidia в прошлом году анонсировала симулятор для тренировки роботов Isaac, предназначенный для эффективного обучения умных машин в виртуальной среде, имитирующей условия реального мира, использующей фотореалистичную графику и продвинутую физическую симуляцию, а также референсные платформы для роботов. В этом году проект также упоминался в рамках ключевого выступления, так как он уже доступен для использования заинтересованными лицами на сайте компании.

На GTC 2018 было показано несколько роботов различного назначения, а иногда и без него просто для демонстрации возможностей разработанных систем. Как вот этот робот, который только и делал, что открывал и закрывал многочисленные ящики стола. При этом на расположенном рядом экране отрисовывалась 3D-модель стола с учетом реального положения всех ящиков.

Был тут и робот самой Nvidia, который они обучали и тестировали в собственных офисных помещениях — представляете, у него даже есть собственный бейдж. Ну и большой красный kill switch. Этот робот был сконструирован специалистами компании чисто для демонстрации возможностей их платформы, а заодно и понимания того, с какими проблемами могут столкнуться независимые разработчики, практической цели у него нет, возить товары он не может — а зря, можно было бы посылать его за кофе!

А вот роботов на складах можно начинать использовать уже сейчас, это и складские роботы и роботы-консультанты в розничных магазинах. Мы уже писали о том, что вторые даже могут заменить людей при решении простых задач по поиску товаров в магазинах и способны проконсультировать по возможностям товаров, используя искусственный интеллект и общаясь с покупателями привычным образом — голосом.

На стендах было показано несколько образцов роботов-кладовщиков, которые чаще всего используют все ту же популярную систему Nvidia Jetson для того, чтобы возможности ИИ помогали находить необходимый товар на складе. Другие умеют укладывать коробки разного размера и веса на транспортировочную ленту. А еще одни — умеют работать в среде вместе с людьми, определяя их и корректируя свои действия так, чтобы не помешать им.

Есть и целые небольшие складские автомобильчики, использующие платформу Jetson. К примеру, автономное решение JD.com использует эту платформу для нахождения и перемещения товаров на складе. Жалко, что нельзя было увидеть его в действии.

Совсем не только самоуправляемые автомобили и роботы различного назначения были представлены на выставке конференции. К примеру, достаточно интересным нам показался демо-стенд самой компании, где было представлено почти все, что показано на ключевом выступлении, а также и многое другое. Впрочем, эта часть была менее зрелищной, так как экспонаты заменялись экранами.

В частности, была показана мощная система на основе DGX Station из четырех Tesla V100, которая при помощи искусственного интеллекта и TensorRT способна автоматически сама определять важные моменты в спортивных матчах — режиссеры и монтажеры скажут таким системам просто огромное спасибо.

Или помните рассказ о применении возможностей медицинского суперкомпьютера Clara? Одной из уже открытых его способностей является обработка двухмерного УЗИ-изображения и 3D-реконструкция с определением характеристик внутреннего органа (сердца, в частности). На представленной фотографии можно рассмотреть модель органа и определенные параметры, которые облегчают диагностику медикам.

На стенде профессиональной графики показывали не только возможности по аппаратному ускорению обработки панорамного VR-видео в разрешении 8K×8K на ноутбуке с внешним графическим решением на основе Quadro, но и аппаратное ускорение трассировки лучей в пакете трехмерной графике при использовании рендерера V-Ray — как мы уже писали ранее, он действительно работает гораздо быстрее CPU-варианта и ничуть не хуже его по качеству.

Ну и из последнего в выставочном зале отметим очередные применения Nvidia Jetson в системах искусственного интеллекта для умных городов — анализ видеоизображения, определение лиц, отслеживание передвижения объектов и многое другое. Как бы кто ни хотел иного, в будущем следить за нами всеми станут еще тщательнее, чем сейчас. Уже сегодня во многих городах работают или внедряются подобные системы, в том числе и у нас.

Кроме того, возможности умных городов простираются намного дальше банального видеонаблюдения, пусть и с высокой степенью автоматизации и больших возможностях. Об этом мы уже писали в своих предыдущих материалах по теме.

Новая штаб-квартира Endeavor в работе

В прошлогодней отчетной статье мы подробно написали о новом здании Nvidia, построенном рядом с несколькими старыми. На тот момент здание хоть и уже обрело общий вид, но все еще было в стадии строительства и отделки. И вот теперь оно уже несколько месяцев используется, может еще не в полную силу, но довольно активно (пусть вас не смущает малое количество людей в здании, большинство из них в это время были в конференц-зале в Сан-Хосе, мы же сделали наоборот — посетили офис компании).

Внешне здание выглядит довольно впечатляюще — стекло с рублеными на полигоны (геометрические примитивы с тремя вершинами — треугольники) формами приличного размера. На фото показан пешеходный путь по дороге от старых зданий. Но мы, что вполне естественно для США, приехали на автомобиле, и поэтому первое впечатление на нас оказала подземная парковка.

Даже просто вход из-под земли в здание выглядит несколько футуристично, прям как в фантастических фильмах — подсветка, стекло и бетон рисуют впечатляющую картину. Ну а при входе внутрь первое же, на что обращаешь внимание — мощный поток солнечного света через специальный проем, оставленный посередине здания.

Естественно, солнце светит только днем, но система освещения в здании проработана так, что она эффективно сочетает естественное и искусственное освещение, поддерживая необходимый комфорт — все очень светлое и чистое. Также внутри просто очень много пространства, а система кондиционирования и вентиляции настроена так, что воздух в здании свежий и приятный. Вместе с большим пространством и приятным освещением это дает довольно важное ощущение комфорта.

Что естественно — в офисе налажена строгая контрольно-пропускная система с различными уровнями доступа и зайти туда, куда тебе нельзя, просто не получится. Интересно, что в Nvidia тестировали разные системы распознавания лиц, чтобы в будущем обойтись без бейджей вообще, но пока что их точность и другие характеристики не устроили специалистов и было решено пойти проверенным путем. Возможно, в будущем эти турникеты вообще заменят камеры и будет создаваться иллюзия того, что ничего ни от кого не закрыто.

А пока что всем нужны бейджи, и посетителей здания встречает стильно оформленная приемная — reception. Тут можно как подождать встречающего сотрудника компании на диванчике, так и заполнить все свои данные на терминале, чтобы их сразу же распечатали и пропустили гостей (но только при сопровождении сотрудника компании — а вдруг вы шпион конкурентов?)

Пространство внутри разделено на зоны с различным назначением: рабочие открытые пространства, зоны отдыха и питания, переговорные комнаты и т. п. Есть и собственный магазин, конечно же — вход в него предваряет этакая семья Nvidia в фирменной одежде компании, толерантная и выверенная: мама с папой разного цвета «кожи». Правда, ребенок то у них явный мальчик, судя по одежде. Лучше бы еще и девочку поставили — от греха подальше. Вдруг у кого-нибудь возникнут глупые вопросы.

В магазине, помимо фирменной одежды, рюкзаков, сувениров и прочей атрибутики с маркировкой Nvidia, есть и товары собственного изготовления: видеокарты, медиаконсоли и даже платформы для разработчиков Jetson TX1 и TX2.

Больше всего интересно, что цены на те же видеокарты тут указаны ниже рекомендованных! Как видно на снимке, топовый Titan V стоит не $2999, а $2699. Да и ценники всех остальных видеокарт ниже тех, что рекомендованы для розницы в США. Хорошо быть сотрудником Nvidia! Правда, больше пары штук в руки не дадут все равно. Но что мешает зайти завтра и послезавтра?

Переходим к другим, не менее интересным зонам. Во-первых, рабочие зоны тут даже не сразу увидишь — все они запрятаны подальше от общих зон, что правильно — мало кому хочется, чтобы ему мешали работать толпы коллег, постоянно ходящие туда-сюда. К примеру, возле большого окна можно просто отдохнуть или поесть за столиком или попить кофе, разместившись на диванчике, а рабочие столы размещены наверху за ширмами — никто никому не помешает.

Вот еще один вид с явным разделением зон: сверху люди работают, а внизу — обедают и отдыхают. Также эта «лестница» играет роль рядов для сидения перед большим экраном, который разворачивается при работе проектора для каких-то внутренних мероприятий — эта открытая зона является также и очень большим конференц-залом.

Для любителей поесть без лишних глаз есть тут и небольшие закрытые помещения. А вот те же столики рядом с кафе и лестница с рядами сидений с другого угла:

Мы были в здании не в самое удачное время с точки зрения обеда и опробовать местную кухню не удалось, но по опыту посещения старых зданий компании можно сказать уверенно — с едой тут все очень хорошо. А уж напитков вообще можно пить сколько душе угодно. Но только безалкогольные. Хотя и выпить что-то покрепче тут тоже можно — если дело ближе к вечеру, ведь днем нужно работать.

В самом сердце здания расположен бар Shannon’s с весьма приятной обстановкой и удобными столами и барными стойками, выпиленными из цельного ствола толстого калифорнийского дерева. Атмосфера в баре должна быть замечательной, так и представляется некое собрание, посвященное выпуску какого-то удачного продукта, подкрепленное соответствующим празднованием. Мы же, как я говорил, были в здании в максимально неудачное время, и ни поесть ни выпить не смогли. Что же, попробуем вернуться сюда еще раз — и повод придумаем.

А если кто не пьет, так здоровеньким помрет для спокойного тихого отдыха также есть отдельные зоны, вроде показанной на следующем снимке — тут можно насладиться тишиной и спокойствием, разместившись в удобных креслах.

Осталось рассказать разве что о переговорных комнатах и конференц-залах. Традиционно для Nvidia, последние обязательно имеют собственные имена на определенную тематику. В новом здании они посвящены различным темам вроде компьютеров и искусственного интеллекта, из самых интересных выделим одно замеченное название, которое будет понятно может не всем, но многим:

К слову, комнаты для встреч тут очень удобные и шикарно обставленные: дерево, кожа — материалы и конструкция мебели просто отличные. И так как все еще очень новое, то выглядит это скорее как выставочный зал в мебельном магазине.

Есть и маленькие переговорные комнатки, их тут больше всего — на два человека, на одного, с телефоном, с компьютером, со столом и без него. В общем, выбор богатый. Но даже при относительной пустоте офиса во время нашего посещения, множество таких комнат было занято.

Кстати, рабочие столы тут имеют надежную конструкцию и очень удобные — можно изменять высоту как угодно: от самой низкой при сидячем положении и до положения для работы стоя, что может быть полезно для того, чтобы не просиживать мягкое место — все регулируется и приводится в движение при помощи электромотора.

В целом, новое здание Nvidia нам понравилось и в прошлый раз, и уж тем более сейчас — особенно тем, что оно открытое и очень светлое. На наш взгляд, очень хорошо, что работникам не мешают коллеги из кафе и комнат отдыха, их не стесняет пространство над головой и по краям, а через окна сверху поступает много солнечного света — все это позитивно скажется на эффективности работы.

Возможно, новое здание пока что выглядит пожалуй даже слишком стерильно, но это и понятно — оно еще очень свежее и не совсем обжитое, плюс за порядком тут следят очень хорошо. Да и работниками оно пока еще заселено не полностью, судя по всему. Но потенциал у здания огромный, все необходимое для эффективной работы и отдыха тут есть, и я бы с удовольствием попробовал там поработать (шутка, мы же независимое издание, ну!)

И напоследок — вид на новое здание Nvidia из самолета, снятое уже когда автор материала вылетал из Сан-Хосе. Здание точно имеет свой стиль, выгодно отличаясь от сотни почти одинаковых коробок. А скоро рядом появится еще одно, у Nvidia уже есть планы на его строительство. Да и старые здания вроде пока никуда не денутся, работников на все хватает. Тем более, что не все из них готовы перебираться в открытое пространство open space, некоторые сотрудники очень любят свои старые закрытые кабинеты...

Еще чуть дальше по направлению взгляда на приличном отдалении можно увидеть другое новое здание — Apple Park в Купертино. Пожалуй, эти два здания являются сейчас самыми заметными в этой части Кремниевой долины при виде сверху, хоть сравнивать их напрямую и нельзя. Если Apple является крупнейшей технологической компанией мира, для которой такой выпендреж — дело обычное, то Nvidia — скорее быстрорастущая компания с большим потенциалом, особенно в высокопроизводительных вычислениях, связанных с искусственным интеллектом. И этот потенциал потихоньку раскрывается, что сказывается в том числе и на появлении необходимости в больших зданиях.

Выводы

Пожалуй, самым необычным на GTC этого года стало отсутствие «архитектурных» анонсов. Если в предыдущие годы Nvidia в лице Дженсена старалась представить свои планы на будущее по вычислительным архитектурам, иногда анонсируя их, а иногда рассказывая хотя бы о названии и основных идеях GPU будущего, в этот раз решили обойтись без таких подробностей вовсе. Хотя какие-то планы на анонсы, вероятно, изначально все же были. Причинами их отмены может быть то, что для новой вычислительной архитектуры еще довольно рано, а игровые GPU на серьезной конференции по вычислениям анонсировать как-то... неправильно. Ждем как минимум E3 2018?

Впрочем, Nvidia давно уже переросла роль просто разработчика графических чипов. Теперь это лишь одна из сфер их деятельности, и это понятно, ведь даже один рынок электроники для автопилотов куда больше рынка игровых видеокарт. А если добавить сюда рынок серверов и медицинской техники, то игровые GPU можно и вовсе отбросить, получается? Да нет, конечно, игроки уже в изрядной степени оплатили прогресс вычислительных решений Nvidia, и дальше продолжат — этот рынок для компании остается очень важным и никуда от них не уйдет. Но это не значит, что нужно на нем зацикливаться.

Как сказал на ключевом выступлении Дженсен Хуанг, Nvidia — это уже не просто компания, проектирующая чипы, но компания, разрабатывающая вычислительные архитектуры и программное обеспечение. То есть, приоритетом для компании становятся платформы и системы, а не просто чипы: Drive для автомобилей, Clara для медицины, Isaac для роботов и т. д. А графические процессоры — это лишь малая часть из того, что сейчас делает компания, и отсутствие архитектурных анонсов не должно никого настораживать. Во-первых, запаса уже существующих GPU и по производительности и по возможностям вполне достаточно на сегодня, а во-вторых — новые вычислительные архитектуры и не должны выпускаться слишком часто.

По остальным анонсам могло показаться, что Nvidia просто реализует идеи, показанные ранее или очевидные, но их объявления в этот раз также скорее связаны с другим уровнем — специалисты компании уделяют больше внимания готовым системам на основе своих чипов и целым кластерам из них. Это должно помочь им и дальше отвоевывать влияние на сложном рынке высокопроизводительных вычислений. Многие разработчики уже сейчас используют решения компании, а не специализированные аналоги конкурентов, так как при разработке систем искусственного интеллекта сейчас выгоднее использовать именно графические процессоры, но ослаблять хватку Nvidia нельзя, конкуренты могут перехватить инициативу в любой момент.

Преимущество решений Nvidia в том, что их решения стали уже вполне универсальными: они изначально умеют очень эффективно обрабатывать видеоданные и графику, позднее обзавелись специальными блоками для быстрых тензорных вычислений, критически важных для задач глубокого обучения, и постепенно улучшают свои возможности по выполнению задач, не слишком хорошо поддающихся распараллеливанию — в качестве одного из таких примеров можно привести однокристальную систему Xavier, предназначенную для автомобилей и сочетающую максимальное разнообразие исполнительных блоков, что и делает его универсальным процессором.

Хотя громких «низкоуровневых» анонсов на GTC 2018 и не случилось, менее интересной конференция от этого не стала, количество и значимость анонсов были не менее существенными, чем в прошлом году. Тем более, что главной для компании становится уже скорее не вычислительная архитектура, а предлагаемые компанией продукты и платформы для различных сфер деятельности, связанных с качественной графикой, искусственным интеллектом и высокопроизводительными вычислениями. А может быть в Nvidia решили оставить какие-то объявления и на другие конференции GTC, которые в течение года пройдут в других местах планеты: Тайвань, Япония, Европа, Израиль, Вашингтон. Это тоже вполне вероятно, а то в прошлом году они во многом повторяли калифорнийскую часть.

В любом случае, разрабатывать программное и аппаратное обеспечение на основе нынешних и для будущих продуктов, платформ и вычислительных систем компании Nvidia можно уже сейчас, так как архитектурно все они обратно совместимы и для разработки уже есть практически все необходимое. А будущие архитектуры, чипы, платформы и готовые продукты компании по их выходу просто позволят получить дополнительное преимущество по скорости вычислений и гибкости и для уже существующих приложений в том числе.

Но все же нельзя забывать и о важных анонсах этого года: и так мощный ускоритель Tesla V100 теперь стал еще более привлекательным, обзаведясь вдвое большим объемом памяти, что может быть и не столь сложно с технической точки зрения (в теории, ничто особо не мешало сделать вариант V100 с 32 ГБ сразу же), но это довольно важно для многих алгоритмов и задач, требующих обработки больших объемов данных. Про новую модель суперкомпьютера DGX-2 и речи нет, по сути она открыла совершенно новый сегмент рынка, и в некоторых задачах значительно облегчит работу исследователей и еще сильнее привлечет их к использованию именно решений Nvidia.

Также нельзя не отметить и анонсы серьезной графики с возможностью трассировки лучей в реальном времени на новой профессиональной видеокарте Quadro GV100, которая имеет возможность объединения мощностей с еще одной видеокартой, объявление платформы для обучения и тестирования автопилотов в виртуальной реальности Drive Sim и Constellation, анонс имени автомобильного сердца будущего Orin, выход специализированной вычислительной платформы Project Clara для медицинских задах по визуализации, другие анонсы, связанные с высокопроизводительными вычислениями и глубоким обучением: поддержка Kubernetes и TensorRT 4, а также многое другое, что не вошло в наш материал.

Мы уже писали, что Nvidia стала одним из главных игроков на рынке решений, связанных с использованием и развитием искусственного интеллекта, решения компании используют многие компании по всему миру, и их популярность только увеличивается. В прошлом году мы говорили о том, что это будет сказываться и на финансовых результатах компании, и тренд на увеличение дохода Nvidia от сектора высокопроизводительных вычислений продолжился, подтвердив наши мысли. Нет никаких предпосылок к тому, что этот рост прекратится, ведь примеров применения систем, платформ и чипов Nvidia на конференции GTC в очередной раз представлено очень много, и это еще далеко не все — распространение систем искусственного интеллекта и глубокого обучения находится в начале своего пути и взрывной рост мы еще увидим в будущем. И у калифорнийской компании, когда-то известной всего лишь как производитель игровых видеочипов, есть все шансы стать одной из самых преуспевающих в этом деле.

Новые технологии и продукты Nvidia помогают развитию индустрии не только визуальных, но и множества других видов вычислений, и особенно важно — исследованиям в сфере искусственного интеллекта, который бурно развивается. Выросшая почти до предельных для Сан-Хосе размеров, конференция объединила тысячи участников, жадно поглощающих важные анонсы из уст Дженсена и показывающих самые необычные применения GPU и других продуктов компании. GTC постоянно привлекает максимум внимания от исследователей в этих сферах, хотя и проводится уже в нескольких местах по всему миру, как бы разделившись тематически (в Мюнхене в 2017 было больше про автопилотирование, в Азии — о роботизации), но это разделение весьма условное.

Подтвердив наши прошлогодние прогнозы, калифорнийская часть GTC в этом году снова выросла в масштабах, хотя ей уже и слегка мешают чисто физические пределы конференц-центра, расположенного в центре Кремниевой долины. Будем надеяться, что поток новинок не иссякнет и постараемся рассказывать вам о них и всех анонсах компании каждый год. Ознакомиться с дополнительной информацией, списком участников и докладов, а также главным выступлением Дженсена Хуанга, представленным на конференции Nvidia GTC 2018, можно на специализированном сайте компании.

23 апреля 2018 Г.