Nvidia DGX Суперкомпьютеры

Продукт
Разработчики: Nvidia (Нвидиа)
Дата премьеры системы: 2016/04/05
Дата последнего релиза: 2018/03/28
Технологии: Суперкомпьютер

Содержание

2018: Nvidia DGX-2

В конце марта 2018 года компания Nvidia представила суперкомпьютер DGX-2, обладающий производительностью около двух петафлопс, и предназначенный для задач глубокого обучения. По утверждению компании, одиночный сервер DGX-2 способен заменить 300 обычных серверов, занимающих 15 стоек в дата-центрах при в 60 раз меньшем размере и в 18 раз большей энергоэффективности.[1]

В основе суперкомпьютера лежат 16 видеоускорителей Tesla V100, сочетающих в себе графический процессор Nvidia GV100 на архитектуре Volta и 32 ГБ памяти HBM2.

Для связи графических ускорителей используется интерфейс NVSwitch, позволяющий «общаться» двум GPU на скорости до 300 Гбит/с. Данная шина вместе с NVLink 2 позволяет объединить все 16 Tesla V100 в один гигантский видеоускоритель с почти 82 тысячами ядер CUDA, более чем десятью тысячами ядер Tensor и 512 ГБ памяти HBM2 с предельной пропускной способностью в 14,4 Тбайт/с.

Nvidia DGX-2
Nvidia DGX-2

Остальные спецификации суперкомпьютера Nvidia DGX-2 включают два процессора Intel Xeon Platinum (конкретные модели не называются), до 1,5 Тбайт оперативной памяти DDR4, а также NVMe-накопители суммарным объёмом от 30 до 60 Тбайт. Кроме того, на борту присутствует интерфейс InfiniBand наряду со 100-гигабитным Ethernet. Энергопотребление устройства в нагрузке составляет 10 кВт.

Суперкомпьютер Nvidia DGX-2 был оценён производителем в $400 тыс., поставки начнутся в третьем квартале.[2]

2016: Nvidia DGX-1

5 апреля 2016 года компания NVIDIA сообщила о создании DGX-1 с целью поддержки разработок в сфере искусственного интеллекта.

NVIDIA DGX-1 – система, разработанная специально для задач глубокого обучения. Она оснащена необходимым аппаратным обеспечением, программным обеспечением для глубокого обучения и инструментами разработки для быстрого разворачивания системы. В ее основе графические процессоры, которые обеспечивают скорость обработки данных, сравнимую с 250 серверами x86 архитектуры.

NVIDIA DGX-1, (2016)
NVIDIA DGX-1, (2016)

Использование GPU-ускоренных вычислений обеспечивает исследователям в области данных создание умных машин, способных учиться, видеть и воспринимать мир как человек. Система обладает значительной вычислительной мощью, позволяя запускать приложения искусственного интеллекта. Она сокращает время исследователей на обучение больших и сложных глубоких нейронных сетей.

Нейронные сети позволяют создавать новые типы приложений, работающих с колоссальными объемами информации и, соответственно, требующих более высокого уровня вычислительной производительности.

«
Искусственный интеллект – это самый масштабный технологический прорыв нашего времени. Совершенно очевидно, он изменит все отрасли промышленности, все компании, да и весь уклад человеческой жизни. Искусственный интеллект породит новые рынки, от которых получат пользу все. Сегодня исследователи в области данных и искусственного интеллекта тратят слишком много времени на создание «домашних» высокопроизводительных вычислительных систем. Система DGX-1 проста в установке и преследует только одну цель: раскрыть потенциал сверхчеловеческих способностей и направить его на решение проблем, ранее считавшихся неразрешимыми.

Дженсен Хуанг (Jen-Hsun Huang), генеральный директор и соучредитель NVIDIA
»

В набор ПО DGX-1 входят:

  • NVIDIA Deep Learning GPU Training System (DIGITS), интерактивная система для создания глубоких нейронных сетей (DNN),
  • NVIDIA CUDA Deep Neural Network (cuDNN) версии 5, GPU-ускоряемая библиотека примитивов для создания DNN.

В составе системы оптимизированные версии нескольких широко используемых фреймворков глубокого обучения— Caffe, Theano и Torch. DGX-1 предоставляет доступ к облачным инструментам управления, обновлениям ПО и банку приложений-контейнеров.

Характеристики

  • Пиковая производительность до 170 терафлопс вычислений половинной точности (FP16)
  • Восемь GPU-ускорителей Tesla P100, с 16 ГБ памяти на борту каждого GPU
  • NVLink Hybrid Cube Mesh
  • 7ТБ SSD DL Cache
  • Dual 10GbE, Quad InfiniBand 100Gb
  • 3U – 3200 Вт

Суперкомпьютер NVIDIA DGX-1 – это первая в мире система, разработанная специально для задач глубокого обучения и ускоренного анализа данных в области искусственного интеллекта. Суперкомпьютер позволяет обрабатывать и анализировать информацию в 100 раз быстрее по сравнению с традиционными вычислительными системами, что приводит к значительной экономии на формировании и обслуживании ИТ-инфраструктуры.

Система построена на ускорителях Tesla P100, высокоскоростное соединение между которыми обеспечивает интерфейс NVIDIA NVLink, способный увеличить скорость обмена данными между GPU до 12 раз по сравнению с шиной PCI-E. Комплекс программного обеспечения системы выключает NVIDIA DIGITS GPU Training System, NVIDIA Deep Learning SDK (CuDNN, NCCL), NVIDIA Dockerдля быстрого создания и обучения глубоких нейронных сетей (DNN). Помимо этого, система включает оптимизированные версии широко используемых фреймворков глубокого обучения — Caffe, Theano, Torch и не только. NVIDIA DGX-1 также имеет доступ к облачной системе управления, необходимой для создания и развертывания контейнеров, системных обновлений и доступа в хранилище приложений.

Примечания



ПРОЕКТЫ (3) ИНТЕГРАТОРЫ (2) РЕШЕНИЕ НА БАЗЕ (2)
СМ. ТАКЖЕ (13)


Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2016 год
2017 год
2018 год
Текущий год

  IBM (3, 6)
  Т-Платформы (T-Platforms) (3, 3)
  HPC HUB (1, 2)
  Bull (Atos IT Solutions And Services) (1, 2)
  Другие (0, 0)

  Cray (1, 2)
  РСК Технологии (1, 2)
  Nvidia (Нвидиа) (1, 1)
  Bull (Atos IT Solutions And Services) (1, 1)
  Другие (0, 0)

  Bull (Atos IT Solutions And Services) (1, 1)
  Atos SE (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения

За всю историю
2016 год
2017 год
2018 год
Текущий год

  Atos Quantum Learning Machine - 1 (1, 0)
  Atos Bull sequana - 1 (1, 0)
  Другие 0