ORBL Биометрическая система распознавания лиц и речи

Продукт
Разработчики: ORBL (ОРБЛ)
Дата премьеры системы: 2020/02/13
Отрасли: ЖКХ, сервисные и бытовые услуги,  Недвижимость,  Торговля,  Фармацевтика, медицина, здравоохранение
Технологии: ИБ - Биометрическая идентификация,  Речевые технологии,  Системы видеоаналитики

2020: Запуск системы распознавания речи в коммерческую эксплуатацию

13 февраля 2020 года компания ORBL запустила в коммерческую эксплуатацию b2b-продукт – систему распознавания речи высокой точности. Это дескриптор голоса, с помощью которого можно переводить в текст спонтанную потоковую речь.

Какие данные можно получить с помощью программы распознавания речи:

  • эмоциональный окрас речи (восемь эмоций – по спектру от гнева до радости);
  • демографические характеристики говорящего (пол и возраст);
  • полноценную стенограмму аудиоданных для дальнейшей аналитики.

ORBL запустила в коммерческую эксплуатацию систему распознавания речи высокой точности
«
«К запуску представленной функции ORBL подтолкнул запрос со стороны существующих клиентов, которые уже пользуются видеоаналитикой. Дело в том, что в совокупности оба решения – распознавание лиц и распознавание речи - дают некую синергию, которая выражается в полноте данных для принятия управленческих решений. С технической точки зрения функция распознавание речи не несёт дополнительных нагрузок на аппаратуру, оба процесса реализовываются на одном устройстве в рамках общей архитектуры. Распознавание сразу и лица, и голоса помогают общему решению работать оптимально, а бизнесу - получать бенефиты от единой архитектуры»,

отметил Антон Рудов, генеральный директор и основатель ORBL
»

Прежде чем запустить продукт в коммерческую эксплуатацию, ORBL провели несколько пилотов с банками, медучреждениями. Со слов разработчика, положительная обратная связь от заказчиков говорит о том, что технология может быть использована в самых разных отраслях:

  • Ритейл и сфера услуг. Это прежде всего компании, которые захотели фиксировать работу своих сотрудников в офисах и отделах продаж (магазинах) не только на видео, но и с помощью аудио. В ритейле распознавание голоса нужно для того, чтобы понимать, как происходило общение с покупателями, например, на кассе. В сфере услуг (например, салоны красоты и дилерские центры) решение помогает контролировать работу консультантов. Речь сотрудников записывается в личные микрофоны и затем преобразовывается в текст, который система анализирует на соответствие скриптам. Это очень помогает также при разборе конфликтных ситуаций с клиентами.
  • Колл-центры тоже могут контролировать сотрудников на предмет того, насколько точно они следуют скриптам в ходе разговора с клиентами. Особенно это актуально для служб поддержки банков.
  • Маркетинговые службы могут анализировать настроение клиентов, а также испытываемые в момент беседы эмоции, после чего выводить средние показатели удовлетворенности.
  • Медицинская сфера. Например, при проведении вскрытия патологоанатомы могут заносить данные в информационную систему, «заполняя» голосом нужные поля.
  • Системы аутентификации. Голос человека неповторим и его невозможно подделать. В контроле доступа по голосу заинтересованы, например, различные helpdesk системы. Голосовая биометрия для доступа к учётной записи по телефону не только распознает голос и сверяет его с образцом в базе, но и умеет отличать «живого» собеседника от записанной заранее речи. Для этого используется «капча» - робот просит собеседника просят повторить спонтанно выбранную фразу.

Технические характеристики:

  • Программа может обрабатывать аудиоданные, полученные через различные устройства – например, диктофон или телефон. Конечное качество распознавания зависит от исходного качества данных. Минимальный результат – это «захват» ключевых слов, а при достаточном качестве записи заказчик получает готовую стенограмму.
  • Точность распознавания при записи на диктофон достигает 95-96% при спонтанной речи, то есть когда человек не диктует или не старается специально четко проговаривать слова). Это позволяет получить готовый текст с минимальным количеством опечаток и ошибок, которые можно легко исправить в ручном режиме.
  • Телефонный канал обеспечивает чуть меньшую точность – 80%. Это связано с тем, что его частота дискретизации составляет 8 кГц, тогда как при записи на диктофон – 44 кГц. Однако словарь распознавания для конкретной тематики дает прибавку точности еще в 10%. Например, для агентства недвижимости такой словарь может включать названия жилых комплексов или жаргонные обозначения типов планировок квартир.

Если говорить про точность распознавания речи в системах контроля доступа, то результат обработки голоса выражается в процентах соответствия - насколько точно он совпадает с эталонной записью в базе биометрии.Гид по российским системам PAM (Privileged Access Management) 89.1 т

Отличия от аналогичных систем, отмеченные разработчиком:

  • Это стековое решение - распознавание лица и речи в одной архитектуре. Одновременно с высокой точностью распознавания голоса, система обеспечивает распознавание лиц с точностью 99.99997% с поворотом головы до 65 градусов, минимальной освещенности в 60 лк, со скоростью 0.3-0.4 секунды.
  • Горизонтальное масштабирование, обеспечивающее минимальное TCO для клиента.
  • Работает не только из облака, но и локально (в основном на рынке облачные решения). ORBL не использует публичные облака, что в значительной мере, по мнению разработчика, снижает риски утечки данных. Обработка данных происходит или на сервере ORBL, или на серверах заказчиков.
  • В отличие от других локальных решений, для продукта ORBL нужно меньше аппаратных ресурсов - за счёт того, что обработка данных (как видео, так и аудио) производится на видеокартах средних по мощности компьютеров. Это даёт экономию ресурсов.

Пока технические возможности системы по преобразованию речи в текст ограничены существующими запросами. Например, она не настроена на правильную расстановку знаков препинания, так как в основном используется для стандартизированного заполнения полей, а не создания литературного текста. В планах разработчика на 2020 год также есть создание интонационного распознавания речи, благодаря которому знаки препинания будут расставляться автоматически в процессе транскриптизации речи. С этой задачей вполне может справиться алгоритм машинного обучения, который проанализирует массив аудиоданных (например, аудиокниг) и выявит закономерности между интонациями говорящего и знаками препинания в тексте. Также в планах - усовершенствование функции текстовой аналитики. С её помощью заказчики смогут анализировать текстовые каналы связи с аудиторией (e-mail, чаты, форум) на предмет упоминания определённых тем и ключевых словосочетаний. Эта функция полезна и для обучения чат-ботов - чтобы они могли легко считывать опечатки и ошибки в сообщениях от клиентов, считают в ORBL. Кроме того, в компании работают над синтезом речи для создания на основе этой функции полноценных голосовых ботов, которые смогут, например, консультировать клиентов по телефону.



Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Биолинк Солюшенс (BioLink Solutions) (134)
  Прософт Биометрикс (ProSoft Biometrics) (74)
  Индид, Indeed (ранее Indeed ID) (47)
  VisionLabs (ВижнЛабс) (38)
  Группа компаний ЦРТ (Центр речевых технологий) (32)
  Другие (496)

  Сбербанк (7)
  Индид, Indeed (ранее Indeed ID) (7)
  Сканпорт АйДи (Scanport) (6)
  VisionLabs (ВижнЛабс) (4)
  ОКТРОН (3)
  Другие (15)

  Сбербанк (8)
  Сканпорт АйДи (Scanport) (3)
  Индид, Indeed (ранее Indeed ID) (2)
  Банк ВТБ (1)
  ВидеоМатрикс (Videomatrix) (1)
  Другие (12)

  ОКТРОН (5)
  Центр биометрических технологий (ЦБТ) (4)
  Viant (Виант) (4)
  Сканпорт АйДи (Scanport) (3)
  VisionLabs (ВижнЛабс) (3)
  Другие (19)

  АйТи Бастион (1)
  Уральский центр систем безопасности (УЦСБ) (1)
  Другие (1)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Биолинк Солюшенс (BioLink Solutions) (9, 140)
  Прософт Биометрикс (ProSoft Biometrics) (18, 84)
  VisionLabs (ВижнЛабс) (26, 53)
  Индид, Indeed (ранее Indeed ID) (1, 47)
  Группа компаний ЦРТ (Центр речевых технологий) (14, 41)
  Другие (374, 337)

  Сбербанк (3, 8)
  Индид, Indeed (ранее Indeed ID) (1, 7)
  VisionLabs (ВижнЛабс) (3, 6)
  Shenzhen Chainway Information Technology (1, 6)
  АйТи Бастион (1, 3)
  Другие (6, 6)

  Сбербанк (1, 8)
  Shenzhen Chainway Information Technology (1, 3)
  Индид, Indeed (ранее Indeed ID) (1, 2)
  Voca-Tech (Вока-Тек) (1, 1)
  ВидеоМатрикс (Videomatrix) (1, 1)
  Другие (5, 5)

  Shenzhen Chainway Information Technology (1, 8)
  РТК Софт Лабс (2, 3)
  Ростелеком (2, 3)
  Группа компаний ЦРТ (Центр речевых технологий) (2, 2)
  VisionLabs (ВижнЛабс) (1, 2)
  Другие (9, 10)

  АйТи Бастион (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  BioLink BioTime - 123
  Indeed Access Manager (Indeed AM) - 47
  BioLink FingerPass - 45
  Biosmart Studio - 36
  VisionLabs Luna - 27
  Другие 459

  Indeed Access Manager (Indeed AM) - 7
  Shenzhen Chainway C-серия RFID-считывателей - 6
  Сбербанк: Система оплаты по улыбке - 5
  АйТи Бастион: СКДПУ НТ Система контроля действий поставщиков ИТ-услуг - 3
  Сбер и VisionLabs: Мобильная биометрическая система контроля доступа на базе ИИ - 2
  Другие 9

  Сбербанк: Система оплаты по улыбке - 8
  Shenzhen Chainway C-серия RFID-считывателей - 3
  Indeed Access Manager (Indeed AM) - 2
  ЦРТ: Визирь - 1
  VisionLabs Luna - 1
  Другие 4

  Shenzhen Chainway C-серия RFID-считывателей - 8
  VisionLabs Luna - 2
  Indeed Access Manager (Indeed AM) - 2
  Единая биометрическая система (ЕБС) - 2
  Hikvision СКУД - 1
  Другие 7

  АйТи Бастион: СКДПУ НТ Система контроля действий поставщиков ИТ-услуг - 1
  Другие 0

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  VizorLabs (Визорлабс) (44)
  ВидеоМатрикс (Videomatrix) (43)
  Вокорд (Vocord) (39)
  VisionLabs (ВижнЛабс) (29)
  SteadyControl (19)
  Другие (432)

  VizorLabs (Визорлабс) (13)
  SteadyControl (6)
  VisionLabs (ВижнЛабс) (3)
  Транс-Телематика (3)
  Урбантех (3)
  Другие (36)

  ВидеоМатрикс (Videomatrix) (10)
  SteadyControl (5)
  Сбер Бизнес Софт (4)
  Nord Clan (Норд Клан) (3)
  VizorLabs (Визорлабс) (3)
  Другие (31)

  Интеллектуальные технические системы НПО (НПО ИТС) (5)
  Северсталь-Инфоком (3)
  NtechLab (Нтех Лаб) (3)
  VisionLabs (ВижнЛабс) (2)
  Городские технологии (2)
  Другие (40)

  Северсталь-Инфоком (1)
  Айтеко (Ай-Теко, iTeco) (1)
  Городские технологии (1)
  Лаборатория измерительных систем (1)
  РИР (Росатом Инфраструктурные решения) (1)
  Другие (1)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Вокорд (Vocord) (9, 45)
  ВидеоМатрикс (Videomatrix) (20, 44)
  VizorLabs (Визорлабс) (9, 43)
  VisionLabs (ВижнЛабс) (13, 36)
  PTV Group (2, 25)
  Другие (400, 269)

  VizorLabs (Визорлабс) (4, 13)
  SteadyControl (1, 7)
  SteadyControl HoReCa (1, 7)
  Технологии безопасности дорожного движения (ТБДД) (1, 3)
  ВидеоМатрикс (Videomatrix) (2, 2)
  Другие (15, 19)

  ВидеоМатрикс (Videomatrix) (4, 10)
  SteadyControl HoReCa (1, 5)
  SteadyControl (1, 5)
  Nord Clan (Норд Клан) (1, 3)
  VisionLabs (ВижнЛабс) (2, 2)
  Другие (12, 14)

  Интеллектуальные технические системы НПО (НПО ИТС) (1, 4)
  NtechLab (Нтех Лаб) (1, 3)
  Softlogic (Софтлоджик Рус) (1, 3)
  VisionLabs (ВижнЛабс) (1, 2)
  Nord Clan (Норд Клан) (1, 2)
  Другие (15, 15)

  Городские технологии (1, 1)
  ВидеоМатрикс (Videomatrix) (1, 1)
  РИР (Росатом Инфраструктурные решения) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  VisionLabs Luna - 27
  Визорлабс Контроль ОТ и ПБ (VizorLabs Health & Safety) - 26
  PTV Visum - 25
  SteadyControl Система контроля и управления персоналом - 24
  ЦРТ: Визирь - 16
  Другие 318

  Визорлабс Контроль ОТ и ПБ (VizorLabs Health & Safety) - 9
  SteadyControl Система контроля и управления персоналом - 7
  ТБДД: Азимут Комплексы фотовидеофиксации - 3
  Vizorlabs Платформенное решение видеоаналитики - 2
  Softlogic: SC-iMVS-RM3 Автокомплекс нейросетевого наблюдения для контроля объектов дорожной инфраструктуры - 2
  Другие 20

  SteadyControl Система контроля и управления персоналом - 5
  Vmx SILA: TP - 5
  Vmx SILA: LSI - 3
  Nord Clan: ML Sense - 3
  PTV Visum - 2
  Другие 14

  НПО ИТС: Паук Трафик - 4
  Softlogic: SC-iMVS-RM3 Автокомплекс нейросетевого наблюдения для контроля объектов дорожной инфраструктуры - 3
  NtechLab FindFace Multi - 3
  VisionLabs Luna - 2
  Nord Clan: ML Sense - 2
  Другие 14

  Городские технологии: Умные парковки - 1
  Vmx Dequs: PIS - 1
  Русатом Интеллектуальная транспортная система - 1
  Другие 0