Megatron

Продукт
Название базовой системы (платформы): Искусственный интеллект (ИИ, Artificial intelligence, AI)
Разработчики: Nvidia (Нвидиа), Microsoft
Дата премьеры системы: 2021/10/15
Технологии: Речевые технологии

Содержание

Основные статьи:

Megatron — инструмент с открытым исходным кодом команды исследователей Nvidia, на базе которого изучается обучение языковых моделей в любом масштабе.

2021

Выпуск фреймворка Nvidia NeMo Megatron

На конференции GTC в ноябре 2021 года Nvidia представила Nemo Megatron – фреймворк для обучения больших языковых моделей, содержащих триллионы параметров. NeMo Megatron построен на базе Megatron – проекта с открытым исходным кодом команды исследователей NVIDIA, изучающей эффективное обучение языковых моделей в любом масштабе. Фреймворк автоматизирует сложность обучения LLM с помощью библиотек обработки данных, которые собирают, обрабатывают, систематизируют и очищают данные.

Nemo Megatron оптимизирован для масштабирования в инфраструктуре ускоренных вычислений Nvidia DGX SuperPOD.Субъекты КИИ, операторы ПДн и все-все-все: кому закон предписывает внедрять SIEM

На базе этого же проекта была представлена Megatron 530B – кастомизируемая большая языковая модель, которую можно обучать для новых предметных областей и новых языков.

Полный список анонсов ноябрьской GTC 2021 доступен здесь.

Создание модели генерации естественного языка при участии Microsoft

15 октября 2021 года Microsoft и Nvidia объединили свои усилия для создания модели генерации естественного языка Megatron-Turing Natural Language Generation, которая содержит 530 миллиардов параметров.

Тенденция изменения размеров современных NLP-моделей с течением времени

MT-NLG имеет в 3 раза больше параметров по сравнению с существующей крупнейшей моделью такого типа и демонстрирует высокую точность в широком наборе задач естественного языка, таких как:

  • Предсказание завершения текста по смыслу;
  • Понимание прочитанного;
  • Генерация логических выводов;
  • Создание заключений на естественном языке;
  • Различение смысла слов с несколькими значениями.

Обучение столь мощной модели стало возможным благодаря многочисленным инновациям. Например, NVIDIA и Microsoft объединили современную инфраструктуру обучения на основе GPU с программным стеком распределенного обучения. Были созданы базы данных естественного языка, включающие сотни миллиардов единиц контента, а также разработаны методы обучения для повышения эффективности и стабильности оптимизации.



СМ. ТАКЖЕ (1)


Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (41)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (29)
  SteadyControl (19)
  Сбербанк (18)
  Другие (265)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Другие (28)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Проф ИТ (Prof IT) Ростов-на-Дону (3)
  Другие (39)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (8)
  Сбербанк (6)
  ОБИТ (3)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  Другие (31)

  Сбербанк (3)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (2)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1)
  ОБИТ (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 50)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (6, 42)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (13, 32)
  Сбербанк (24, 27)
  SteadyControl (1, 24)
  Другие (512, 308)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl (1, 7)
  SteadyControl HoReCa (1, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 6)
  Другие (18, 29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl (1, 5)
  SteadyControl HoReCa (1, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  Другие (29, 47)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 8)
  Сбербанк (2, 8)
  СалютДевайсы (ранее SberDevices) (2, 8)
  Яндекс (Yandex) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4, 4)
  Другие (25, 32)

  СалютДевайсы (ранее SberDevices) (2, 4)
  Сбербанк (2, 4)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (1, 2)
  Т-Банк (1, 1)
  TargetAI (Таргет плюс) (1, 1)
  Другие (5, 5)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  SteadyControl Система контроля и управления персоналом - 24
  МТТ VoiceBox - 24
  BSS Digital2Speech - 21
  Сбер: GigaChat (ГигаЧат) - 20
  EXpress Защищенный корпоративный мессенджер - 16
  Другие 283

  МТТ VoiceBox - 9
  SteadyControl Система контроля и управления персоналом - 7
  EXpress Защищенный корпоративный мессенджер - 6
  BSS Digital2Speech - 5
  SmartLogger II - 4
  Другие 22

  EXpress Защищенный корпоративный мессенджер - 5
  SteadyControl Система контроля и управления персоналом - 5
  BSS Digital2Speech - 4
  Robovoice Пользовательская no-code платформа для разработки ИИ-ботов - 3
  Napoleon IT отзывы - 3
  Другие 38

  Сбер: GigaChat (ГигаЧат) - 7
  МТС Exolve Виртуальная АТС - 6
  YandexGPT - 4
  EXpress Защищенный корпоративный мессенджер - 3
  Naumen Erudite - 3
  Другие 29

  Сбер: GigaChat (ГигаЧат) - 3
  Lad: GPTZator - 2
  LazyDoc Программный комплекс для заполнения и анализа медицинской документации - 1
  Just AI Agent Platform для разработки и управления AI-агентами - 1
  МТС Exolve Голосовой робот - 1
  Другие 4