2017/01/10 14:24:47

Большие данные (Big Data) в России

Российский рынок Big Data находится на начальной стадии развития. Основными потребителями таких технологий являются банки, телеком-операторы и крупные ритейлеры. Главными проблемами развития направления больших данных являются нехватка квалифицированных кадров и отсутствие достаточного опыта российских внедрений.

Обзор BI и Big Data

Содержание

2016

Состояние российского рынка Big Data

Российский рынок Big Data находится на начальной стадии развития и под этим термином часто понимаются традиционные BI-подходы. Основными потребителями технологий больших данных, так же, как и основными носителями больших объемов данных, являются компании в банковском секторе, телекоме и торговле. Для них анализ больших объемов данных, связанных с анализом платежеспособности клиентов, потребительским поведением и рыночной конъюнктурой является важнейшим инструментом для поддержания конкурентного преимущества.

В последние годы во всех компаниях из большой тройки мобильных операторов появились подразделения, специализирующиеся на работе с большими данными, причем они являются не просто информационными подразделениями для развития клиентских профайлов, они являются бизнес-единицами, которые призваны генерировать дополнительную прибыль.

« Именно в телекоме начали переводить большой контур систем на Hadoop. Большие массивы данных из биллинг-систем, CRM и других источников складываются в Hadoop, агрегируются и уже над этой информацией надстраивают BI, позволяющий понимать, где в данный момент находится абонент и каковы его потребности, чтобы предложить лучший сервис, сделать для каждого конкретного клиента наиболее привлекательной предложение, - рассказывает Андрей Байбутов, директор по развитию бизнеса департамента BI ГК «Корус Консалтинг». »

Ритейл тоже находится в числе первопроходцев рынка Big Data. Все больше компаний из этого сегмента создают отдельные подразделения по работе с данными, чтобы как можно глубже погружаться в строки чеков за 2+ лет и находить новые скрытые взаимосвязи, добавляет Байбутов.

Иван Вахмянин, генеральный директор компании Visiology, полагает, что первая шумиха уже прошла, и сейчас происходит накопление реального опыта, как у заказчиков, так и у исполнителей.

« Мы ожидаем в ближайшее время появления интересных кейсов, причем не только в «традиционных» для Big Data отраслях, таких как финансы, телеком и ритейл, но и в промышленности, логистике, строительстве и здравоохранении, - добавляет Вахмянин. »

Павел Адылин, исполнительный директор компании Artezio (группа компаний ЛАНИТ), считает, что потенциальным заказчиком Big Data проектов в России в ближайшее время должны выступить также и компании госсектора, т.к. они обладают огромными накопленными объемами данных, пригодными для анализа.

Константин Черноусов, заместитель генерального директора Vesolv, приводит пример реализованного проекта в госсекторе: «Например, Федеральная Налоговая Служба завершила первый проект с использованием Big Data по отслеживанию цепочки плательщиков НДС и пресечению мошенничеств по уводу НДС».

Что касается решений, предлагаемых разработчиками, то это либо международные коммерческие продукты от Oracle, SAP и подобных, либо решения на базе open source технологий. Отечественного софта для обработки большого объема данных практически нет, добавляет Черноусов.

Андрей Нугманов, партнер AT Consulting, директор блока BI, считает, что в секторе «нового BI» – анализа больших данных, процессинга событий и принятия решений в реальном времени – стек СПО активно теснит продукты традиционных вендоров. Оно развивается в свете обновленного видения функциональных требований к BI и технологически во многом догнало проприетарный стек.

« Открытый код, транспарентность развития, правовая чистота и доступность, гарантированная и не замкнутая на одного вендора поддержка, толерантность к оборудованию, высочайшая популярность СПО, в первую очередь среди молодых и перспективных специалистов, – все это становится причинами активного вытеснения и вымывания «старого» проприетарного стека из традиционных ниш, - уверен Нугманов. »

Вендоры пытаются если не оседлать волну, то хотя бы не быть погребенными ею. Кто-то открывает код и переходит на СПО-модель бизнеса, пытаясь возродить интерес у публики, а значит и у лидеров мнений в среде покупателей, к своим традиционным продуктам. Другие активно интегрируются с крупными поставщиками сервисов по поддержке стека Hadoop, стараясь снизить стоимость владения своими традиционными продуктами за счет использования открытых возможностей Big Data и достичь синергетических эффектов гибридного решения.

« Клиент не всегда готов сразу платить за лицензии вендору и пытается самостоятельно протестировать технологию, понять степень ее применимости и набрать необходимую экспертизу для дальнейшей эксплуатации. Выбор СПО позволяет обеспечить быстрое внедрение интересующей функциональности без лицензионных платежей и – благодаря отсутствию закупочных процедур – в минимальные сроки. Каких-то серьезных препятствий в развитии данных технологий у клиентов мы не видим. И экспертиза присутствует на рынке, и как минимум есть внятный бизнес-кейс, обеспечивающий сокращение операционных затрат на хранение значительных объемов информации, - говорит Нугманов. »

С точки зрения технологий, в AT Consulting наблюдают, что на первый план выходят решения использующие In-Memory Data Grid (IMDG).

« Hadoop позволяет собрать разнородную информацию и хранить. Теперь пришло время следующего шага – проводить сложные аналитические расчеты в онлайн-режиме. Классические MPP-платформы уже не могут обеспечить быстрой реакции по причине наличия операций чтения и записи на диски и специфики операционной среды. Также важен и вопрос стоимости таких технологий, - рассказывает партнер AT Consulting. - Мы видим, что для серьезных аналитических задач все чаще применяются in-memory решения. Они обеспечивают возможность высокопроизводительного параллельного выполнения запросов на сильно нагруженных аналитических системах для обслуживания тысяч пользователей в режиме высокой доступности. »

Роман Баранов, руководитель направления бизнес-аналитики и хранилищ данных компании «Крок», отмечает важность понимания того, что сам термин Big Data с каждым годом становится все более размытым. Перечень технологий, которые можно отнести к этому понятию, становится все больше. Они уже являются обыденной реальностью большинства современных компаний. Кроме того, произнося «большие данные» многие уже давно имеют в виду не только сбор и хранение данных, но и аналитику, и интернет вещей, и многое другое.

Тренды российского и мирового рынка Big Data

Основная тенденция российского рынка Big Data — проникновение технологий больших данных в те области, в которых раньше их было сложно представить.

Если ранее огромное число сегментов, например, производство, не так активно уделяло внимание технологиям работы с большими данными, то сейчас возможность собрать информацию со всех датчиков и другого оборудования завода дает гигантские возможности.

« Это позволит существенно оптимизировать работу на самом производстве, а также повысить эффективность планирования и конвертировать полученную информацию в деньги, которые теряются при отклонении от плана или не дозарабатываются с точки зрения утерянной прибыли, - говорит Андрей Байбутов, директор по развитию бизнеса департамента BI ГК «Корус Консалтинг». »

По мнению Константина Черноусова, заместителя генерального директора Vesolv, общий тренд заключается в том, что все хотят использовать Big Data, поскольку анализ больших данных повышает эффективность и конкурентоспособность компании. И одним из движимых фактов является, как ни странно, появляющиеся опасения от того, что конкурент начал извлекать выгоду, используя новую технологию.

Если говорить о мировых трендах, то в первую очередь можно говорить о тренде переноса инфраструктуры Big Data в облако, считает Иван Вахмянин, генеральный директор компании Visiology.

« Это имеет смысл для многих компаний, так как серверные мощности для Big Data стоят очень дорого, а нужны не всегда на постоянной основе. Например, мы в Visiology большинство своих Big Data экспериментов проводим в облаке Amazon. Кроме того, облачные Big Data продукты часто сильно облегчают работу инженеров – порог входа большинства Big Data программных продуктов в плане развертывания очень высокий, а в облаке можно сразу получить уже сконфигурированный кластер, - рассказывает Вахмянин. »

Второй тренд, по его словам, - это потоковая (streaming) аналитика, которая позволяет анализировать поступающие данные в реальном масштабе времени. Эта возможность особенно важна для приложений, построенных поверх данных, собираемых с датчиков (IoT, IIoT).

Павел Адылин из Artezio, добавляет, что для мирового рынка характерно разделение направления Big Data, которое у нас пока понимают в общем виде, на множество самостоятельных направлений, решающих более узкие специфические задачи.

Например, по его данным, можно выделить: программно-аппаратные средства обеспечения хранения больших данных, средства параллельной обработки данных, средства фильтрации данных и построения моделей, средства визуализации данных и их взаимосвязи, средства работы с изображениями, машинное обучение, интеллектуальные интерфейсы, автоматизация умственного труда.

С таким разделением также связано появление готовых отраслевых решений для малого и среднего бизнеса, работающих как автономные приложения, так и по моделям SaaS или BDaS (Big Data as Service).

Барьеры российского рынка Big Data

Нехватка специалистов

Одна из главных проблем рынка Big Data в России - трудности с поиском квалифицированных специалистов.

По мнению Ивана Вахмянина из Visiology, дефицит таких кадров наблюдается не только потому, что они должны обладать довольно сложным набором навыков и компетенций, но и потому что сегодня мало кто понимает, как их готовить, оценивать и правильно организовывать их работу.

Константин Черноусов, заместитель генерального директора Vesolv, рассказывает, что сейчас постепенно входит в обиход такая профессия как Data Scientist. Она довольно редкая, но спрос на нее уже колоссальный: на одно резюме такого специалиста приходится порядка 50 запросов на работу.

« В России таких специалистов, которые расскажут руководству о возможностях анализа с использованием Big Data, посчитают бюджет и реализуют проект, мало, и увеличить их количество быстро не получится, поскольку отсутствуют не просто курсы, а даже материалы на русском языке, - отмечает Черноусов. »

Андрей Тиунов, генеральный директор компании «БиАй Партнер» (ГК «Ай-Теко»), уточняет, что Data Scientist - это эксперты со стороны компании-заказчика, которые понимают тенденции своего рынка, отлично знают бизнес, находят возможности для его роста и умеют использовать потенциал данных, которыми владеют, для решения тех или иных задач. Именно они обладают ключевыми компетенциями по решениям Big Data, говорит Тиунов.

Андрей Байбутов, директор по развитию бизнеса департамента BI ГК «Корус Консалтинг», также считает, что хороших специалистов в области Big Data на рынке критически мало.

« Если вы сейчас выйдете на рынок ресурсов в поиске хорошего специалиста с опытом работы с Big Data, machine learning, IoT и т.д., вряд ли сходу сможете найти человека с опытом от двух до пяти лет работы, да ещё и с необходимым продуктовым портфелем. Поэтому многие компании стараются взращивать собственных специалистов под данные задачи, - поясняет эксперт. »

Любовь Ведешина, руководитель практики бизнес-аналитики компании «Интерпроком», видит проблему в том, что в России пока не сформировалось экспертное сообщество аналитиков в области больших данных, не появились компетентный заказчик и компетентный исполнитель.

« На стороне потенциальных заказчиков мы видим нехватку специалистов, которые одинаково хорошо разбирались бы как в отраслевой специфике, так и в подходах, инструментах и методах обработки больших данных. На стороне исполнительней уже появились эксперты в области больших данных мирового уровня, некоторые даже находятся в мировом топе. Но их единицы, - подчеркивает Ведешина. »

Профессия аналитика в области больших данных пока еще не стала массовой. В вузах нет соответствующих программ подготовки, опять же потому что пока мало компетентных преподавателей. Корпорации отчасти компенсируют нехватку специалистов, предлагая собственные программы обучения. Например, ШАД (Школа анализа данных) от «Яндекса» и платные курсы в «Билайне».

« Однако этих курсов недостаточно, должно пройти еще какое-то время, чтобы число квалифицированных аналитиков больших данных изменило бы качество спроса и предложения на рынке Big Data, - полагает Любовь Ведешина. »

Павел Адылин, исполнительный директор Artezio, добавляет, что в силу недостатка специалистов в области Big Data в России чаще всего не разделяются профессии Data Scientist, Data Analyst и Data Engineer. Если первый из них является создателем новых технологий извлечения информации из данных, алгоритмов машинного обучения, искусственного интеллекта, то последний является разработчиком комплексов программного или программно-аппаратного обеспечения для решения конкретных задач больших данных. Для подготовки этих различных специалистов уже сейчас требуется внедрять различные методологические подходы, уверен Адылин.

Нехватка опыта внедрений

Основным сдерживающим фактором в развитии рынка Big Data в России ряд экспертов называют небольшое количество российских кейсов, на которые могли бы опираться как заказчики, так и интеграторы. В результате чего, Big Data проекты оказываются рискованными.

« Часто приходится слышать от клиентов – «гарантируйте нам, что внедрение Big Data аналитики принесет нам экономию N рублей», но таких гарантий дать невозможно, как минимум, до проведения эксплоративного анализа накопленных данных и построения и верификации первых моделей, что само по себе требует вложения ресурсов», - отмечает Иван Вахмянин, генеральный директор компании Visiology. »

Об этом же говорит и Любовь Ведешина, руководитель практики бизнес-аналитики компании «Интерпроком». По её мнению, потенциальные потребители не понимают, какую выгоду для их компании и отрасли несут технологии применения больших данных. Заказчики сомневаются, что их инвестиции в технологии обработки и анализа больших данных окупятся.

Аналогичного мнения придерживается и Константин Черноусов из Vesolv. По его словам, сдерживает развитие российского рынка отсутствие знаний о возможных выгодах от использования Big Data.

Представитель «Корус Консалтинг» Андрей Байбутов также ссылается на опыт внедрений, как на барьер рынка:

« Я знаю только о единицах, максимум — паре десятков внедрений. Большая часть проектов с большими данными делается зачастую на продуктах с открытым исходным кодом, опыта работы с которыми у российских специалистов тоже немного. В результате есть методологическая неготовность, что мешает понимать, как делать проекты, и технологическая — из-за отсутствия необходимых программных компетенций. »

« Западные кейсы мало на кого производят впечатление, потому что российские реалии довольно сильно отличаются. Поэтому на данном этапе рынок Big Data двигают компании, которые не боятся экспериментировать, вкладываться в исследовательские проекты, в расчете на те выгоды и конкурентные преимущества, которые Big Data может принести, - добавляет Иван Вахмянин. »

Проблемы качества данных

Важной проблемой для применения технологий Big Data в России является отсутствие практики накопления больших данных и низкое качество этих данных.

По мнению Любови Ведешиной из «Интерпроком», даже если потенциальный заказчик сформировал понимание своих выгод от анализа Big Data и нашел отраслевых экспертов-аналитиков в области больших данных, он сталкивается с проблемой качества и количества данных, которые у него накоплены. Как правило, данные, стихийно накопленные заказчиками, находятся в состоянии, не пригодном для анализа и получения выгоды для компании, отмечает она.

Такую же проблему видит и Павел Адылин из Artezio. По его словам качество данных оставляет желать лучшего из-за наличия искажений (выбросов) и недостаточной глубины. Таким образом, требуется значительно расширять наборы данных для анализа, но для этого нет возможности, т.к. в связи с защитой персональных данных в нашей стране практически отсутствует рынок купли/продажи информации в виде бирж данных (Data Exchange).

« Возможно, накоплению данных могла бы помочь программа государственной поддержки открытых источников оцифрованных данных, например, доступ к первичным данным Росстата и т.д., - считает эксперт. »

Глава Роскомнадзора считает, что в России необходим госоператор Big Data

Глава Роскомнадзора Александр Жаров считает, что в России необходимо создать государственного оператора больших пользовательских данных. Чиновник обосновал это тем, что, по его мнению, такая информация является национальным достоянием, а не собственностью компаний, обрабатывающих данные.

"Я считаю, что государственный оператор больших пользовательских данных должен быть. Я поддерживаю позицию, которую озвучили эксперты. О том, что это национальное достояние, а не собственность компаний, которые обрабатывают данные. Это очевидно является собственностью гражданина. Но понять, до какой глубины должна структурироваться информация о личности, каждый человек не может. Это должно быть национальным достоянием", — цитирует RNS комментарий Жарова.

Глава РКН уточнил, что в понятие "больших пользовательских данных" входят геолокация, биометрия, пользовательское поведение на различных сайтах и т.п.

"Все это оставляет следы в интернете, является предметом анализа транснациональных интернет-компаний и, очевидно, требует также регулирования, как сейчас работает 152-й закон — "О защите персональных данных", - добавил Жаров. По его словам, речь идет о создании нового закона, и этим уже занимается рабочая группа под руководством помощника президента РФ Игоря Щеголева. На данный момент вопрос регулирования прорабатывается с экспертами, до конца 2016 года должны быть сформулированы конкретные предложения.

2014

TAdviser - 100 стратегий заказчиков в сфере Big Data

Аналитики центра TAdviser провели исследование рынка Big data в России. В ходе исследования эксперты опрашивали ключевых ИТ-заказчиков, с тем чтобы определить существующую конъюнктуру спроса на подобные технологии, а также обозначить его потенциал.

Подробнее: 100 профайлов топ-компаний России о стратегии в Big data (отчет)

CNews Analytics: Уровень зрелости рынка повысился

Согласно результатам исследования СNews Analytics и Oracle, уровень зрелости российского рынка Big Data за 2014 год повысился.

Опрошенные заказчики продемонстрировали более высокую степень осведомленности об этих технологиях, а также понимания потенциала подобных решений для своего бизнеса. Более трети опрошенных уже приступили к использованию технологий Big Data в России. Можно отметить, что на российском рынке уже складывается единое понятийное поле этого сегмента.

Yandex Data Factory формирует предложения в сфере Big data

По сообщению Интерфакс, подразделение Yandex Data Factory (YDF) компании Яндекс намерена заняться задачей разработки предложений для удержания абонентов. В начале 2015 года сообщалось, что YDF проанализировал более 100 параметров, описывающих поведение 100 тысяч игроков World of Tanks. Получившаяся в итоге модель прогноза оттока игроков, оказалось на 20-30% точнее стандартных для игровой индустрии инструментов анализа.

Леонид Делицын, аналитик инвестиционного холдинга Финам:

Вряд ли Яндекс действительно возьмёт на себя задачу разработки предложений для удержания чужих абонентов. Удержать своих абонентов может только сам оператор. Мне не удалось найти запись в блоге или в корпоративном разделе, на который ссылаются новостное агентство, но думаю, что речь шла только о прогнозировании оттока абонентов. Для этого требуется оценить так называемую `функцию дожития` абонента, или, альтернативно, функцию риска оттока пользователя. Эти задачи хорошо известны в статистике, в отличие от успешных кейсов их применения на практике.
Яндексу, безусловно, нужен поток позитивных новостей, и большие данные – благодарная тема с точки зрения их генерации. Мы вступаем в эпоху, когда машины ежесекундно собирают о нас информацию, куда-то её отправляют, где-то архивируют и хранят, и иногда даже перерабатывают. Машины уже знают о каждом из нас гораздо больше, чем мы сами. Вряд ли сами игроки в World of Tanks способны измерять своё поведение при помощи 100 параметров. И вряд ли все они сегодня знают, как долго останутся в игре. Конечно, не все эти 100 параметров одинаково важны, вот только заранее неизвестно, какие – важны, а какие – не очень. Чтобы выделить важные параметры, требуется изучить поведение 100 тысяч игроков - но поскольку Яндекс подсказывает ответы сотне миллионов посетителей, эта задача ему по силам.
Вообще говоря, применений методов машинного обучения к большим данным довольно много, многие из них - довольно яркие и могут генерировать популярные новости. Это хорошо для компании как само по себе, так и для решения задачи ободрения аналитиков фондового рынка. Именно эта задача – самая сложная сегодня для Яндекса. А задача прогнозирования оттока клиентов – довольно старая и хорошо изученная, подходы к ее решению опубликованы. Вопрос лишь в практической реализации тех подходов, которые работоспособны, когда клиентские базы насчитывают миллионы пользователей. В этой области на `шлифование` решения с целью сделать его пригодным для решения практических задач может уйти больше лет и средств, чем на разработку теории. По сообщениям новостных агентств благодаря использованию проприетарных алгоритмов Яндексу удаётся строить на 20-30% более точные решения, чем удается конкурентам. Эта разница не выглядит такой уж существенной. Думаю, что главное конкурентное преимущество Яндекса – в наличии штата опытных специалистов, софта и `железа`.
Помимо активизации Яндекса в b2b секторе, важно ещё следующее. Судя по всему, повторяется (или продолжается история с SaaS), когда вместо возникновения новых, независимых компаний мы наблюдаем возникновение нового канала продаж у крупных производителей и дистрибьюторов программного обеспечения. Большие данные являются вторым из наиболее популярных у венчурных фондов направлений инвестирования, согласно результатам исследования Venture Barometer Russia 2014, они уступают только финансовым технологиям, да и то, отставание нельзя назвать значимым. Инвесторы понимают перспективность машинного обучения в период растущей волны M2M-технологий – ведь устройства должны не просто обмениваться данными, но и изменять своё поведение в зависимости от полученной информации. Короче говоря, инвесторы хотят вложить деньги в направление `большие данные`. Но вряд ли могут.
Дело в том, что в случае больших данных, требуются, во-первых, мощная аппаратная база, а во-вторых, действительно, высокие технологии. На одном лишь поверхностном знании методов машинного обучения много не построишь, поскольку для работы с большими данными методы должны быть быстрыми и устойчивыми. Практически полезные методы отшлифованы годами практики – и у Яндекса такая практика есть, а у новых игроков её, скорее всего нет. Объём первоначальных вложений, по-видимому, тоже превосходит сумму, на которую венчурные инвесторы были бы готовы рискнуть, чтобы попробовать новое направление. Простые задачи, которые можно решить при помощи не очень больших данных и специалистов обычной квалификации за сравнительно небольшую сумму, вряд ли принесут высокую прибыль, - просто потому, что решить их могут многие, а значит, неизбежна жёсткая конкуренция. Яндекс в этой ситуации оказался защищён уникальным барьером, естественно построенным за годы работы над поисковой машиной, Яндекс-маркетом и системой управления контекстной рекламой.
Поэтому в области `больших данных`, как и в индустрии SaaS, главными игроками рынка окажутся не независимые стартапы, а уже хорошо известные крупные компании. Кстати, услугу по прогнозированию оттока абонентов Web-сайтам мог бы предоставлять не только Яндекс, но и, например, российские интернет-счётчики, LiveInternet, OpenStat и другие. Если Яндекс раскрутит эту услугу, то она войдёт в моду, и для других игроков возникнет поле деятельности – поиск минимально затратной реализации решений наиболее ходовых задач.

2013

Несколько десятков пилотов на всю страну

Взрывной рост данных, а также стремление получить больше знаний о своих клиентах толкает крупные компании на поиски технологий, которые помогут сохранять огромные объемы данных, получать и анализировать информацию из недоступных или труднодоступных ранее источников (например, потоковое видео, sentence-анализ при обращении в колл-центр). Кроме того, в традиционных системах стоимость хранения 1ТБ данных достаточна высока, применение решений на базе технологий Big Data позволяет значительно сократить затраты за счет использования более дешевого оборудование.

На 2013-2014 годы тренд Big Data пока не дошел до России в полной мере. Распространение этой концепции в нашей стране пока ограничивается пилотными внедрениями и апробацией. Например, у компании "Крок" в 2013 году было три «пилота», рассказал Максим Андреев, руководитель направления бизнес-приложений компании КРОК. Один из них - для крупной телекоммуникационной компании по отслеживанию социальных связей между абонентами и выявлению уровней влияния. Цель проекта - уменьшение оттока клиентов.

При этом в России в это время доступны все имеющиеся в мире наработки в области Big Data – начиная от open source, заканчивая решениями крупных вендоров. Что касается стоимости, то она варьируется в зависимости от задачи и подходящего под нее решения. Использование этой технологии для компаний – это возможность уйти в отрыв от конкурентов за счет совершенствования предлагаемых продуктов или услуг, либо существенной оптимизации производственных и бизнес-процессов. Поэтому Big Data востребованы всеми компаниями, живущими в условиях высокой конкурентности, в частности, банками, ритейлом, телеком-операторами и прочими.

«Интерес к Big Data по-прежнему виден, а вот проектов единицы. До сих пор большинство специалистов не понимают, что такое Big Data, да и, честно говоря, пока не так много компаний в России, у которых данных по-настоящему много и они не структурированы», - прокомментировал Георгий Нанеишвили, директор по работе с партнерами Qlik.
По его словам, телеком и поисковые системы используют данные технологии, но пока для решения очень ограниченного класса задач.

Таким образом, технологии уже больше пяти лет, однако, именно в последние годы появились реальные проекты в компаниях, в том числе российских, чей бизнес существенно меньше, чем, например, Facebook. Саму технологию Hadoop могут себе позволить многие российские компании разного уровня, работающие в сфере телеком- и интернет-услуг, государственного управления, финансовой сферы и других направлений, считает он.

Юрий Колбасин, директор центра компетенций блока BI компании AT Consulting (ЭйТи Консалтинг)(АТ Консалтинг) рассказал TAdviser, что его компанией также завершен пилотный проект в одном из российских операторов сотовой связи. На базе open source решения был создан кластер, в который загружаются все СDR и строится аналитика о геолокации абонента в момент совершения транзакции. Это позволяет получить информацию о распределении абонентов на карте, а также помогает работать с абонентами более таргетировано. Весь поток данных обрабатывался в десятки раз быстрее, чем в традиционных системах, при этом стоимость кластера дешевле на порядки. В результате пилотного проекта были сформированы области применения технологии больших данных в телеком-индустрии, показана их эффективность как с точки зрения сокращения затрат, так и с точки зрения повышение производительности.

Все ведущие вендоры представлены в эко-системе Big Data. Кроме того, существует открытое ПО Apache Hadoop, которое составляет основу в коммерческих релизах. На российском рынке, с точки зрения аналитических систем на базе BigData, наиболее «удобными» являются решения от IBM, Oracle и Teradata, считают системные интеграторы.

В России технологии Big Data могут быть востребованы в любых компаниях, где руководители готовы к серьезным инновациям с горизонтом отдачи в 5 лет. Сам по себе объем данных роли практически не играет, они всегда есть, надо лишь иметь хоть какую-то идею, как извлечь из них ценность для бизнеса. Промышленные компании, например, могут обратиться к уровню АСУТП, данных там хватает, но пока не очень много идей, как они могут помочь на управленческом уровне, на уровне бизнес-процессов.

В целом опрошенные TAdviser эксперты ожидают, что после 2103 года рынок технологий big data в России перейдет от стадии тестирования и интереса у заказчиков к реальным коммерческим развертываниям.

В России рынок Big Data пока невелик. Это несколько десятков проектов – пилотных, либо на начальной стадии внедрения. Компания IDC полагает, что этот сектор рынка составляет порядка $340 миллионов. Около $100 миллионов приходится на решения по бизнес-аналитике SAP, примерно $250 миллионов составляют аналогичные решения Oracle, IBM, SAS, Microsoft.

Данные EMC

В октябре 2013 года Dell EMC опубликовала результаты опроса, в рамках которого 678 ИТ-руководителей российских предприятий поделились своими взглядами на то, какие задачи и возможности, и, в том числе, новые компетенции, связывают они с большими данными и ИТ-трансформацией.

Российские специалисты отмечают, что использование больших данных ведет к существенному улучшению процессов принятия решений, положительно отражается на конкурентоспособности компаний и упрощает управление рисками.

  • 70% респондентов в России считают, что анализ данных их компании поможет принимать более взвешенные решения, а 35% респондентов подтверждают, что высшее руководство их компаний полагается на результаты аналитики больших данных при принятии принципиальных бизнес-решений.
  • 31% респондентов сообщили, что их компании получили конкурентное преимущество в результате внедрения технологий больших данных, а 51% респондентов считают, что отрасли, в которых используются такие инструменты, покажут наиболее высокий рост.
  • Более половины (51%) респондентов согласны, что технологии анализа больших данных сыграют решающую роль в выявлении и предотвращении кибер-атак; это может оказаться решающим фактором, так как только 67% респондентов в России уверены, что они смогут в случае необходимости полностью восстановить все свои данные.

В то же время опрос выявил ряд причин, влияющих на принятие решений о внедрении аналитики больших данных в российских компаниях:

  • 25% компаний, участвовавших в опросе, на данный момент не планируют внедрять технологии больших данных.
  • среди респондентов, не планирующих внедрение больших данных, 37% назвали основной причиной, препятствующей их внедрению, нерелевантность для бизнеса.

Поскольку компании в России по-прежнему видят в ИТ-инновациях основу конкурентного преимущества на внутреннем и внешнем рынке:

  • в число самых распространенных приоритетов для бизнеса, стимулирующих трансформацию ИТ, вошли эффективность бизнес-процессов/операционной деятельности (68%), улучшение обслуживания заказчиков и взаимодействия с ними (37%);
  • 76% респондентов отмечают, что инвестирование в технологии является стратегически важным фактором достижения
  • бизнес-целей их предприятия;
  • 71% респондентов прогнозируют, что в ближайшие три года важной задачей станет поддержание навыков специалистов на уровне, соответствующем темпам развития ИТ-технологий.

См. также

Большие данные (Big Data)

Большие данные (Big Data) мировой рынок

Обзор BI и Big Data

Business Intelligence (рынок России)

Главные тенденции рынка BI в России

Специалист по работе с большими данными (big data)

Большие данные (Big Data)

Business Intelligence (мировой рынок)

География BI-проектов

Российский BI: отраслевая специфика

Внедрения BI в России: типичные ошибки


Технологии: BI
География: Россия