Nvidia H100 GPU

Продукт
Разработчики: Nvidia (Нвидиа)
Дата премьеры системы: 2022/03/25
Отрасли: Электротехника и микроэлектроника
Технологии: Процессоры

Основные статьи:

2022: Анонс кремниевой архитектуры Hopper и созданной на её основе GPU H100

25 марта 2022 года компания NVidia анонсировала целый ряд технологий, ориентированных на использование в сфере искусственного интеллекта. В первую очередь, это кремниевая архитектура Hopper, созданный на её основе GPU H100 и «суперпроцессор» Grace CPU.

Nvidia H100 GPU

По информации компании, архитектура и суперпроцессор названы в честь контр-адмирала ВМФ США Грейс Хоппер (Grace Hopper), создательницы первого в истории компилятора компьютерного языка программирования и одного из первых высокоуровневых языков программирования COBOL.

Архитектура Hopper и GPU H100 призваны оптимизировать процесс обучения машинных моделей. Шина NVLink четвёртого поколения позволяет соединять до 256 GPU H100, обеспечивая девятикратный прирост пропускной способности, по сравнению с предыдущими поколениями.

Сам по себе процессор H100 содержит 80 млрд транзисторов. При этом он поддерживает PCIe Gen5 и HBM3; благодаря этому пропускная способность памяти достигает 3 терабайт в секунду. В Nvidia утверждают, что H100 в три-шесть раз превосходит процессор предыдущего поколения A100 в вычислениях с плавающей запятой в зависимости от разрядности.

В зависимости от форм-фактора характеристики GPU будут несколько отличаться. Так, у старшей версии имеется 15 872 ядра CUDA.

Технические характеристики

Памяти у обеих версий по 80 ГБ, причём это HBM3 с пропускной способностью 2 либо 3 ТБ/с. TDP старшей версии составляет 700 Вт, тогда как у модификации с PCIe 5.0 показатель вдвое меньше.

Производительность версии SXM5 достигает 30 TFLOPS (FP64), 60 TFLOPS (FP32), а у версии PCIe 5.0 показатели соответственно равны 24 и 48 TFLOPS. Также стоит отметить интерфейс NVLink, который в том же порядке обеспечивает скорость передачи данных в 900 либо 600 ГБ/с.

Что касается Grace CPU, то это фактически два процессора, соединённых шиной NVLink-C2C. Grace предназначен для использования в «гипермасштабных высокопроизводительных вычислениях и сфере ИИ» в комплекте с H100 или самостоятельно. Процессор насчитывает 144 ядер Arm, а его пропускная способность составляет 1 терабайт в секунду[1].

Архитектура Hopper приносит на рынок и тензорные ядра четвёртого поколения, которые в девять раз быстрее предыдущего поколения в ряде задач машинного обучения. Отдельно в Nvidia отметили набор инструкций DPX, который поможет разработчикам писать код для ускорения алгоритмов динамического программирования в различных отраслях, ускоряя рабочие процессы для диагностики заболеваний, квантового моделирования, анализа графов и оптимизации маршрутизации.

Системы на основе решений Hopper будут доступны партнёрам Nvidia в третьем квартале[2].

Примечания



СМ. ТАКЖЕ (2)


Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2019 год
2020 год
2021 год
Текущий год

  МЦСТ (7, 16)
  Микрон (Mikron) (1, 8)
  Oracle (1, 7)
  Nvidia (Нвидиа) (14, 6)
  Intel (33, 4)
  Другие (155, 15)

  МЦСТ (3, 3)
  Микрон (Mikron) (1, 3)
  Nvidia (Нвидиа) (1, 2)
  Intel (1, 2)
  Другие (0, 0)

  МЦСТ (1, 2)
  Oracle (1, 1)
  Nokia Corporation (1, 1)
  Микрон (Mikron) (1, 1)
  Другие (0, 0)

  Байкал Электроникс (Baikal Electronics) (2, 3)
  Микрон (Mikron) (1, 2)
  Intel (1, 1)
  МЦСТ (1, 1)
  Huawei (1, 1)
  Другие (1, 1)

Данные не найдены

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2019 год
2020 год
2021 год
Текущий год
Данные не найдены