Google Parrotron

Продукт
Разработчики: Google
Дата премьеры системы: июль 2019 г
Отрасли: Интернет-сервисы
Технологии: Речевые технологии

2019: Анонс

В середине июля 2019 года Google анонсировала программное обеспечение, которое помогает людям с нарушениями речи полноценно общаться. Инструмент получил название Parrotron.

Он использует глубокую нейронную сеть, обученную преобразовывать нетипичную речь в свободную и понятную. Технология конвертирует голос в текст и обратно, не прибегая к распознаванию движения губ и другим визуальным сигналам.

Google представила ПО для свободного общения людей с нарушениями речи

Google подключила к нейросети аудиоматериалы суммарной продолжительностью 30 тыс. часов, которые содержат миллионы анонимных фрагментов разговоров. По словам разработчиков, Parrotron значительно уменьшает количество ошибок при распознании речи для глухих — вероятность ошибки снизили с 89% до 25%. В Google не намерены останавливаться на достигнутом и обещают дорабатывать технологию.

Как пишет издание VentureBeat, к июлю 2019 года миллионы людей по всему миру имеют нарушения речи. В США такие отклонения замечены у 7,5 млн человек, примерно 5% американских первоклассников испытывают проблемы с высотой, громкостью и качеством звукопроизношения. Многообразие отклонений осложняет разработчикам ИИ-систем понимание вопроса и создание систем распознавания и синтеза речи. Им приходится приспосабливать свои технологии к отклонениям, по которым доступны небольшие наборы данных для обучения.

«
Parrotron облегчает пользователям с нетипичной речью возможность общаться с другими людьми и быть понятыми ими и речевыми интерфейсами. Для этого используют комплексный метод преобразования речи, который с большей вероятностью воспроизводит предполагаемую речь пользователя… А поскольку Parrotron не сильно настроен на воспроизведение слов из предопределенного словарного набора, входные данные для модели могут содержать совершенно новые слова, иностранные слова, имена и даже бессмысленные слова, — сообщили работающие в Google исследователь Фади Биадси (Fadi Biadsy) и инженер-программист Рон Вайс (Ron Weiss).[1]
»

Примечания



Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (48)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (41)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (29)
  SteadyControl (19)
  Сбербанк (18)
  Другие (265)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (9)
  Группа компаний ЦРТ (Центр речевых технологий) (8)
  SteadyControl (6)
  Unlimited Production (Анлимитед Продакшен, eXpress) (4)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
  Другие (28)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (6)
  SteadyControl (5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (5)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (4)
  Robovoice (Робовойс) (3)
  Другие (39)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (8)
  Сбербанк (6)
  Voice Systems Robotics (VSR, VS Robotics) (3)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (3)
  ОБИТ (3)
  Другие (31)

  Сбербанк (3)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (2)
  ТелеМедХаб (1)
  Just AI (1)
  TargetAI (Таргет плюс) (1)
  Другие (4)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Группа компаний ЦРТ (Центр речевых технологий) (18, 50)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (6, 42)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (13, 32)
  Сбербанк (24, 27)
  SteadyControl HoReCa (1, 24)
  Другие (512, 308)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
  Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
  SteadyControl HoReCa (1, 7)
  SteadyControl (1, 7)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 6)
  Другие (18, 29)

  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
  Сбербанк (3, 5)
  SteadyControl HoReCa (1, 5)
  Unlimited Production (Анлимитед Продакшен, eXpress) (1, 5)
  SteadyControl (1, 5)
  Другие (29, 47)

  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 8)
  Сбербанк (2, 8)
  СалютДевайсы (ранее SberDevices) (2, 8)
  Яндекс (Yandex) (2, 5)
  Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4, 4)
  Другие (25, 32)

  Сбербанк (2, 4)
  СалютДевайсы (ранее SberDevices) (2, 4)
  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (1, 2)
  TargetAI (Таргет плюс) (1, 1)
  МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 1)
  Другие (5, 5)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  МТТ VoiceBox - 24
  SteadyControl Система контроля и управления персоналом - 24
  BSS Digital2Speech - 21
  Сбер: GigaChat (ГигаЧат) - 20
  EXpress Защищенный корпоративный мессенджер - 16
  Другие 283

  МТТ VoiceBox - 9
  SteadyControl Система контроля и управления персоналом - 7
  EXpress Защищенный корпоративный мессенджер - 6
  BSS Digital2Speech - 5
  SmartLogger II - 4
  Другие 22

  SteadyControl Система контроля и управления персоналом - 5
  EXpress Защищенный корпоративный мессенджер - 5
  BSS Digital2Speech - 4
  Сбер: GigaChat (ГигаЧат) - 3
  Prof IT: Vocamate AI - 3
  Другие 38

  Сбер: GigaChat (ГигаЧат) - 7
  МТС Exolve Виртуальная АТС - 6
  YandexGPT - 4
  Naumen Erudite - 3
  VS Robotics: VS Робот-оператор - 3
  Другие 29

  Сбер: GigaChat (ГигаЧат) - 3
  Lad: GPTZator - 2
  Сбер SaluteSpeech (SmartSpeech) - 1
  Targetai Платформа-конструктор для создания, тестирования и мониторинга LLM-агентов - 1
  Т-Банк Сервис речевой аналитики для бизнеса (ране Тинькофф) - 1
  Другие 4