Проект

Росстат вооружается Big Data для переписи населения и повышения качества статистики

Заказчики: Федеральная служба государственной статистики (Росстат)

Москва; Государственные и социальные структуры



Дата проекта: 2019/09

Росстат приступает к разработке концепции использования больших данных, рассказал глава ведомства Павел Малков 29 сентября 2019 года на площадке финала конкурса «Цифровой прорыв». В ней будут определены направления, где и как Росстат будет применять эти технологии. По словам Малкова, завершить разработку концепции планируется в середине 2020 года.

Для разработки концепции предстоит выбор подрядчика, причем делать выбор Росстат планирует не в рамках 44-ФЗ, а по линии проекта развития системы государственной статистики, финансируемого Всемирным банком.

Как пояснил TAdviser замруководителя Росстата Сергей Егоренко, проект развития системы государственной статистики с Всемирным банком был запущен еще более 10 лет назад и находится в завершающей стадии. В рамках этого проекта была поставлена цель модернизации и информационно-вычислительной инфраструктуры Росстата, и методологической базы.

В планах ведомства, например, использование Big Data при всероссийской переписи населения в 2020 году. В ней Росстат рассчитывает задействовать данные, полученные не только напрямую от граждан, но и из других источников, к примеру, информационных систем других ведомств, а также данные операторов мобильной связи.

Глава Росстата Павел Малков рассказал о масштабных планах ведомства по использованию технологий Big Data (фото - TAdviser)
Глава Росстата Павел Малков рассказал о масштабных планах ведомства по использованию технологий Big Data (фото - TAdviser)


Другое направление, где Росстат рассматривает применение больших данных - расчет индекса потребительских цен, говорит Малков. Здесь можно было бы использовать различные данные по линии ФНС. Например, информацию с контрольно-кассовой техники. По словам главы Росстата, ведомство уже экспериментирует с данными ФНС.

«
Мы надеемся, что через какое-то время нам удастся перейти от метода прямого наблюдения, который используется сейчас для расчета индекса цен, к расчету на основе данных из административных источников информации. Но это не быстрый процесс. Сначала нам предстоит научиться работать с огромными объемами неструктурированных данных, научиться их разбирать. Уже есть первые результаты. Также предстоит определить источники данных по каждой из 500 позиций потребительских товаров, работ, услуг, научиться их рассчитывать, сопоставлять, - пояснил Павел Малков. - Думаю, это горизонт 2-3 лет.
»

Другие направления, где Росстат планирует задействовать Big Data - это статистика по туризму и миграции.

По словам Павла Малкова, Росстат с ФНС уже разрабатывает «дорожную карту», куда совместно двигаться по использованию Big Data. Здесь тоже предстоит большая работа, поскольку пока ни системы ФНС не приспособлены к предоставлению необходимых Росстату данных, ни системы Росстата не готовы получать их и работать с ними. Кроме того, нет методологии и нормативной базы для работы с такими данными, добавил Малков.

Также Росстат уже начал сотрудничать в области получения данных с Банком России, Министерством энергетики, ПФР, за счет чего уже существенно повысили качество ряда расчетов. Помимо этого, по данным главы Росстата, ведомство начало переговоры с крупными ритейлерами, чтобы использовать и их данные.