Платформа текстовой аналитики на основе интеллектуальных систем сбора и обработки текстов

Продукт
Разработчики: ФИЦ ИУ РАН - Информатика и управление Федеральный исследовательский центр РАН, Центр компетенций НТИ на базе МГУ, Технологии системного анализа
Дата премьеры системы: 2020/04/14
Технологии: Big Data,  Data Mining

2020: Разработка решения для интеллектуального анализа больших массивов текстов

В Центре компетенций НТИ на базе МГУ по направлению «Технологии хранения и анализа больших данных» совместно с Институтом проблем искусственного интеллекта ФИЦ «Информатика и управление» РАН и ООО «Технологии системного анализа» разработана платформа текстовой аналитики на основе интеллектуальных систем сбора и обработки текстов на русском и английском языках. Проект является первым в мире промышленным решением, обладающим возможностями кросс-языковой аналитики. Об этом 14 апреля 2020 года сообщил РВК.

Разработанное решение может анализировать и обрабатывать любой тип информации, представленной в текстовом виде на русском, английском, белорусском, казахском и татарском и языках. Преимуществом проекта является возможность кросс-языковой аналитики текстов: не требуется повторный поиск одних и тех же сведений, представленных в документах на разных языках и описанных терминами из разных языков. Внедрение решения существенно упростит работу специалистов, работающих с анализом больших объемов текстов, и значительно повысит эффективность патентного и исследовательского поиска.

Решение позволяет проводить анализ больших объемов научно-технической информации, анализ социальных сетей на предмет выявления материалов нежелательной тематики, девиантного поведения, анализ психологического состояния пользователей и социальной напряженности слоев общества. Кроме того, решение может выполнять задачи по извлечению информации, анализу медицинских документов, технической информации по закупкам для перевода больших полуструктурированных массивов текстов в форму структурированной информации.

В дальнейшем потребителями разработки могут стать аналитические центры, научные и научно-образовательные организации, предприятия, оказывающие услуги защиты интеллектуальной собственности, государственные корпорации. Также потенциальными потребителями могут стать нормативно-правовые справочные системы и консалтинговые бюро.

«
Симбиоз нескольких научных подходов, предложенный президентом Российской академии социальных наук, доктором философских наук, профессором Г.В. Осиповым, позволяет описывать тематику документов через словосочетания и анализировать смысл, отдельных высказываний в форме неоднородных семантических сетей. В совокупности с современными методами компьютерной лингвистики, дистрибутивной семантики и машинного обучения созданное решение позволяет достигать большей точности и полноты в задачах текстовой аналитики,
комментирует разработку руководитель проекта Илья Соченков, научный сотрудник Центра компетенций НТИ на базе МГУ по большим данным
»

Решение на апрель 2020 года уже прошло стадию пилотных внедрений в таких организациях, как: ИНФРА-М, НЦР Руконт, НТИМИ, Дирекция научно-технических программ, Минобрнауки РФ, что позволило собрать базу технологических запросов заказчиков в области текстовой аналитики.

Стоимость разработки и внедрения готового решения варьируется от 5 до 25 млн рублей в каждом конкретном случае в зависимости от потребности заказчика в услугах по интеграции, кастомизации и глубокой настройке программного обеспечения.



Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (128)
  БизнесАвтоматика НПЦ (123)
  Инфосистемы Джет (13)
  Сбербанк (12)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (11)
  Другие (777)

  БизнесАвтоматика НПЦ (4)
  Napoleon IT (Наполеон Айти) (2)
  PIX Robotics (Пикс Роботикс) (2)
  Инфосистемы Джет (2)
  Sitronics KT, Ситроникс КТ (ранее Кронштадт Технологии) (2)
  Другие (60)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  SL Soft (СЛ Софт) (3)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (2)
  Синимекс (Cinimex) (2)
  Другие (67)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (4)
  Loginom Company (Аналитические технологии) (3)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Другие (94)

  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (2)
  Napoleon IT (Наполеон Айти) (1)
  Группа компаний ЦРТ (Центр речевых технологий) (1)
  Институт искусственного интеллекта (ИИИ) МФТИ (1)
  Лаборатория измерительных систем (1)
  Другие (16)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Loginom Company (Аналитические технологии) (2, 240)
  БизнесАвтоматика НПЦ (2, 122)
  Полиматика (Polymatica) (4, 15)
  SL Soft (СЛ Софт) (4, 15)
  Oracle (12, 14)
  Другие (423, 213)

  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (3, 3)
  Sitronics KT, Ситроникс КТ (ранее Кронштадт Технологии) (2, 2)
  SL Soft (СЛ Софт) (1, 2)
  Полиматика (Polymatica) (1, 2)
  Другие (17, 20)

  БизнесАвтоматика НПЦ (1, 5)
  Полиматика (Polymatica) (3, 4)
  SL Soft (СЛ Софт) (3, 4)
  Rubbles (Раблз) (1, 2)
  Retail Rocket (Ритейл Рокет) (1, 2)
  Другие (16, 16)

  БизнесАвтоматика НПЦ (1, 7)
  Loginom Company (Аналитические технологии) (1, 4)
  Ростелеком (1, 1)
  1С Про Консалтинг (1, 1)
  Яндекс.Облако (Yandex Cloud) (1, 1)
  Другие (13, 13)

  Lad, Лад Ай Ти (ранее ГК Лад, Лад-Проект) (1, 2)
  CleverDATA (Клевер Дата) (1, 1)
  Группа компаний ЦРТ (Центр речевых технологий) (1, 1)
  НКЦ ОТИС Лаборатория исследований и разработок (IPChain Lab) (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Deductor - 226
  Visary BI Платформа бизнес-аналитики - 122
  Loginom - 14
  Polymatica Analytics Аналитическая платформа - 13
  IBM SPSS Decision Management - 10
  Другие 197

  Visary BI Платформа бизнес-аналитики - 4
  Polymatica Analytics Аналитическая платформа - 2
  ЦРТ: Speech Analytics Lab - 2
  PIX Process Management (PIX Процессы) - 2
  CM.Expert Data Mining платформа - 2
  Другие 16

  Visary BI Платформа бизнес-аналитики - 5
  Rubbles Customer Insight - 2
  Retail Rocket: Smart Placement Ads - 2
  Polymatica Analytics Аналитическая платформа - 2
  СберТаргет - 1
  Другие 10

  Visary BI Платформа бизнес-аналитики - 7
  Loginom - 4
  Ростелеком: Цифровая платформа для мониторинга отрасли гостеприимства - 1
  К2 НейроТех: ПАК-AI - 1
  Celsus (Цельс) Нейросеть для анализа медицинских изображений - 1
  Другие 12

  Lad: GPTZator - 2
  IPChain Lab: SonicScout Pro - 1
  CleverData CDP - 1
  ЦРТ: SpeechXplore ИИ-решение для исследования и развития коммуникаций с клиентами - 1
  Другие 0

Подрядчики-лидеры по количеству проектов

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (123)
  Большая Тройка (46)
  Сбербанк (16)
  Умная Логистика (14)
  Доверенная среда (13)
  Другие (625)

  БизнесАвтоматика НПЦ (4)
  РИР (Росатом Инфраструктурные решения) (3)
  Яндекс.Облако (Yandex Cloud) (2)
  CM.Expert (АвтоЭксперт) (2)
  Департамент информационных технологий Москвы (ДИТ) (2)
  Другие (62)

  БизнесАвтоматика НПЦ (6)
  Сбер Бизнес Софт (3)
  Retail Rocket (Ритейл Рокет) (2)
  Arenadata (Аренадата Софтвер) (2)
  Университет Иннополис (2)
  Другие (75)

  БизнесАвтоматика НПЦ (7)
  GlowByte, ГлоуБайт (ранее Glowbyte Consulting, ГлоуБайт Консалтинг) (6)
  Цифровые технологии и платформы (ЦТиП) (3)
  Ростелеком (3)
  Arenadata (Аренадата Софтвер) (2)
  Другие (93)

  CleverDATA (Клевер Дата) (1)
  Napoleon IT (Наполеон Айти) (1)
  Институт искусственного интеллекта (ИИИ) МФТИ (1)
  Лаборатория измерительных систем (1)
  НКЦ ОТИС Лаборатория исследований и разработок (IPChain Lab) (1)
  Другие (15)

Распределение вендоров по количеству проектов внедрений (систем, проектов) с учётом партнёров

За всю историю
2023 год
2024 год
2025 год
Текущий год

  БизнесАвтоматика НПЦ (3, 122)
  Большая Тройка (2, 46)
  Умная Логистика (2, 14)
  Триафлай (1, 14)
  Цифра (2, 12)
  Другие (326, 172)

  РИР (Росатом Инфраструктурные решения) (3, 4)
  БизнесАвтоматика НПЦ (1, 4)
  Сбербанк (2, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  CM.Expert (АвтоЭксперт) (1, 2)
  Другие (18, 20)

  БизнесАвтоматика НПЦ (1, 5)
  Сбербанк (3, 3)
  DataCatalog (ДатаКаталог) (1, 3)
  Luxms (1, 3)
  Ростелеком (1, 2)
  Другие (19, 22)

  БизнесАвтоматика НПЦ (1, 7)
  РИР (Росатом Инфраструктурные решения) (2, 2)
  Data Sapience (Дата Сапиенс) (1, 2)
  Цифра (1, 2)
  DataCatalog (ДатаКаталог) (1, 2)
  Другие (11, 12)

  НКЦ ОТИС Лаборатория исследований и разработок (IPChain Lab) (1, 1)
  CleverDATA (Клевер Дата) (1, 1)
  Триафлай (1, 1)
  Другие (0, 0)

Распределение систем по количеству проектов, не включая партнерские решения

За всю историю
2023 год
2024 год
2025 год
Текущий год

  Visary BI Платформа бизнес-аналитики - 122
  Большая Тройка: АИС Редактор территориальных схем - 39
  Триафлай BI-платформа - 14
  ZIIoT Платформа для работы с промышленными данными - 12
  Luxms BI - 11
  Другие 165

  Visary BI Платформа бизнес-аналитики - 4
  Росатом Цифровое теплоснабжение - 2
  Arenadata Catalog - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Prime Finance: ФинОфис - 2
  Другие 19

  Visary BI Платформа бизнес-аналитики - 5
  Luxms BI - 3
  Arenadata Catalog - 3
  RT.Datalake Решение для хранения и обработки данных любых объемов - 2
  Retail Rocket: Smart Placement Ads - 2
  Другие 16

  Visary BI Платформа бизнес-аналитики - 7
  Luxms BI - 2
  Arenadata Catalog - 2
  Data Ocean Nova Платформа данных - 2
  ZIIoT Платформа для работы с промышленными данными - 2
  Другие 11

  CleverData CDP - 1
  Триафлай BI-платформа - 1
  IPChain Lab: SonicScout Pro - 1
  Другие 0