Fujitsu Graphics Processing Unit (GPU)

Продукт
Разработчики: Fujitsu
Дата премьеры системы: 2016/08/18
Технологии: Процессоры

Fujitsu Graphics Processing Unit (GPU) - программная технология, объединяющая несколько графических процессоров для получения преимуществ высокоскоростного глубинного обучения.

18 августа 2016 года Fujitsu объявила о разработке программной технологии, которая объединяет несколько графических процессоров (GPU, Graphics Processing Unit) для получения преимуществ высокоскоростного глубинного обучения.

Глубинное обучение – технология, демонстрирующая более высокий уровень точности распознавания по сравнению с предыдущими разработками. Для обеспечения высокой точности распознавания требуется постоянный анализ больших массивов данных. Для этого использовались графические процессоры, которые лучше подходят для высокоскоростных операций по сравнению с обычными центральными процессорами (CPU).

Отличия между технологиями, (2016)
Отличия между технологиями, (2016)


Как правило, для ускорения глубинного обучения требуется несколько компьютеров с мощными GPU, объединенных в сеть и работающих параллельно. Недостаток этой методики - при объединении более 10 вычислительных машин возрастает время обмена данными между компьютерами и специалистам труднее добиться эффекта параллелизма.

Fujitsu переработала технологию параллелизации, которая обеспечивает эффективный и быстрый обмен данными между компьютерами. Технологию протестировали в рамках платформы глубинного обучения Caffe. В рамках теста, измеряющего время обучения с помощью AlexNet 1 и сети компьютеров с 64 GPU, разработка продемонстрировала скорость обучения, которая в 27 раз выше, чем при работе одного компьютера с одним GPU. По сравнению с результатами без использования технологии, скорость обучения выросла на 46% для сети с 16 GPU и на 71% для 64 GPU.

Действие паралеллизма, (2016)
Действие паралеллизма, (2016)

С помощью технологии, задачи машинного обучения, для выполнения которых раньше требовался один месяц, могут выполняться примерно за день в параллельном режиме работы 64 GPU.

В рамках разработки и внедрения технологии, Fujitsu удалось увеличить скорость обработки данных при глубинном обучении:


Технология установки очередности обмена данными

Эта технология автоматически контролирует приоритет обмена данными для того, чтобы данные, необходимые для начала следующей сессии обучения, обменивались между несколькими компьютерами заблаговременно. В существующих технологиях обработка задач по обмену данными первого уровня, которые нужны для начала следующего процесса обучения, выполняется последней, что увеличивает задержку. В представленной технологии, за счет выполнения обработки задач по обмену данными первого уровня во время обработки задач по обмену данными второго уровня, время ожидания сокращается.

Технология обработки оптимизирующая рабочие операции в соответствии с размером данных

Для обработки данных, при которой результаты операций передаются всем компьютерам, и изначальный объем данных небольшой, каждый компьютер обменивается данными и затем выполняет такую же операцию, что позволяет устранить время, необходимое для передачи и получения результатов. Когда объем данных большой, обработка распределяется, и результаты обработки передаются другим компьютерам для последующих операций. За счет автоматического выбора оптимального метода на основе размера данных эта технология увеличивает общую скорость работы.

Посредством созданной технологии можно сократить время исследований и разработок в области глубинного обучения, включая разработку уникальных моделей нейронной сети для автоматизированного управления роботами, автомобилями и пр. Кроме того, преимущества разработки можно использовать в сфере финансов и здравоохранения, включая задачи по классификации патологий и прогнозирование биржевых курсов. Fujitsu планирует уже в 2016 году начать извлекать коммерческую выгоду из разработки в рамках проекта искусственного интеллекта Human Centric AI Zinrai.



Подрядчики-лидеры по количеству проектов

За всю историю
2016 год
2017 год
2018 год

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2016 год
2017 год
2018 год

  МЦСТ (15, 6)
  Oracle (8, 6)
  Микрон (Mikron) (2, 3)
  ИНЭУМ им. И.С. Брука (1, 3)
  AMD (8, 2)
  Другие (125, 5)

  ИНЭУМ им. И.С. Брука (1, 2)
  Другие (0, 0)

  Intel (1, 1)
  Байкал Электроникс (Baikal Electronics) (1, 1)
  Другие (0, 0)

  МЦСТ (2, 2)
  Nvidia (Нвидиа) (2, 2)
  AMD (1, 2)
  Байкал Электроникс (Baikal Electronics) (1, 1)
  Oracle (1, 1)
  Другие (0, 0)

Распределение базовых систем по количеству проектов, включая партнерские решения

За всю историю
2016 год
2017 год
2018 год

  Эльбрус 4.4 - 2 (2, 0)
  Другие 0

  Intel Xeon Scalable - 1 (1, 0)
  Baikal-Т1 - 1 (1, 0)
  Другие 0

  AMD EPYC (ранее Opteron) - 2 (2, 0)
  Nvidia Jetson - 1 (1, 0)
  Nvidia Quadro - 1 (1, 0)
  Oracle SPARC - 1 (1, 0)
  Baikal-Т1 - 1 (1, 0)
  Другие 2