Название базовой системы (платформы): | Yandex SpeechKit Cloud |
Разработчики: | Яндекс.Облако |
Дата премьеры системы: | июнь 2022 г. |
Отрасли: | Информационные технологии |
Технологии: | Речевые технологии |
Основные статьи:
- Нейросети (нейронные сети)
- Распознавание речи (технологии, рынок)
- Речевые технологии: на пути от распознавания к пониманию
2022: Запуск нейросети
В конце июня 2022 года компания Yandex.Cloud запустил распознающую 10 иностранных языков нейросеть, с помощью которой можно создавать голосовых помощников и роботов для колл-центров с большими потоками клиентов.
В частности, созданная на облачной платформе Yandex Cloud нейросеть знает английский, французский, датский, финский, турецкий и другие языки. Она может распознать речь на любую тему — короткие и длинные фразы, имена, адреса, даты и числа.
Система способна распознавать язык автоматически в одном потоке: нейросеть может в любой момент переключаться между языками. При этом есть возможность давать ей «подсказки», чтобы улучшить качество распознавания.
Мультиязычная модель работает на базе архитектуры Transformer. «Трансформеры» обрабатывают входные слова параллельно и независимо друг от друга, благодаря чему быстро обучаются. Чтобы при переходе на другой язык текст получался связным и грамматически правильным, нейросеть обучали на десятках терабайтов данных из профессиональных датасетов и массивах данных из сервисов и приложений «Яндекса».Рынок ИТ-услуг в России: оценки, тренды, крупнейшие участники. Обзор и рейтинг TAdviser
Нейросеть работает в сервисе синтеза и распознавания речи Yandex SpeechKit. К концу июня 2022 года сервис используют более 1000 клиентов, в том числе X5 Retail Group и « Додо пицца». Новое мультиязычное распознавание доступно для проектов пользователей Yandex SpeechKit и настраивается стандартными средствами в API.
Мы стремимся к тому, чтобы диалоговые сценарии для разработки голосовых помощников вроде Алисы, автоматизации работы с клиентами, проведения опросов и контроля качества были доступны каждому бизнесу. Для внедрения любой фичи в речевые технологии требуются большие массивы данных, высококвалифицированные специалисты и сотни часов обучения, – отметил руководитель разработки Yandex SpeechKit Василий Ершов. [1] |
Примечания
Подрядчики-лидеры по количеству проектов
Группа компаний ЦРТ (Центр речевых технологий) (43)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (27)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (24)
Naumen (Наумен консалтинг) (14)
Voice Systems Robotics (VSR, VS Robotics) (9)
Другие (147)
Группа компаний ЦРТ (Центр речевых технологий) (5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (4)
Voice Systems Robotics (VSR, VS Robotics) (2)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2)
3iTech (ранее 3i Technologies) (2)
Другие (15)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (7)
Naumen (Наумен консалтинг) (3)
Voice Systems Robotics (VSR, VS Robotics) (3)
Мегапьютер Интелидженс (Megaputer Intelligence) (2)
Другие (11)
Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров
Группа компаний ЦРТ (Центр речевых технологий) (16, 46)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (3, 28)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (11, 25)
Яндекс (Yandex) (9, 14)
Avaya (4, 13)
Другие (300, 144)
Группа компаний ЦРТ (Центр речевых технологий) (2, 5)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (1, 5)
SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
Neuro.net (Нейро) (1, 2)
3iTech (ранее 3i Technologies) (1, 2)
Другие (7, 9)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (2, 12)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 7)
Voice Systems Robotics (VSR, VS Robotics) (1, 3)
Naumen (Наумен консалтинг) (1, 3)
Voximplant (Фастком) (2, 2)
Другие (9, 11)
МТС Exolve (Межрегиональный ТранзитТелеком, МТТ) (1, 9)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 8)
Группа компаний ЦРТ (Центр речевых технологий) (4, 7)
Unlimited Production (Анлимитед Продакшен) (1, 6)
Naumen (Наумен консалтинг) (2, 4)
Другие (12, 13)
SberDevices (СалютДевайсы, ранее СберДевайсы) (2, 2)
Banks Soft Systems, BSS (Бэнкс Софт Системс, БСС) (2, 2)
Яндекс (Yandex) (1, 1)
Napoleon IT (Наполеон Айти) (1, 1)
Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
Другие (6, 6)
Распределение систем по количеству проектов, не включая партнерские решения
МТТ VoiceBox - 24
BSS Digital2Speech - 19
Voice2Med Система распознавания речи в медицине - 14
SmartLogger II - 12
Naumen Erudite - 12
Другие 159
BSS Digital2Speech - 5
Voice2Med Система распознавания речи в медицине - 4
Neuro.net Голосовой робот - 2
3i TouchPoint Analytics - 2
Naumen Erudite - 2
Другие 9
МТТ VoiceBox - 11
BSS Digital2Speech - 6
Naumen Erudite - 3
VS Robotics: VS Робот-оператор - 3
PolyAnalyst Платформа визуальной разработки сценариев анализа данных и текстов - 2
Другие 12
МТТ VoiceBox - 9
BSS Digital2Speech - 7
EXpress Защищенный корпоративный мессенджер - 6
SmartLogger II - 4
Naumen Erudite - 3
Другие 17