Заказчики: Square Kilometre Array Подрядчики: IBM Дата проекта: 2012/04 — 2024/04
|
IBM работает над созданием новых технологий дата менеджмента и аналитики для крупнейшего в мире радио телескопа Square Kilometre Array (SKA).
Новый телескоп заработает только в 2024 году, причем он будет производить столько данных, что даже компьютеры будущего будут обрабатывать их с большим трудом, прогнозирует компания. «Это исследовательский проект, в рамках которого целью является создание системы, способной обрабатывать сотни экзабайт данных ежедневно», - заявил Тон Энгберсен (Ton Engbersen), директор проекта со стороны IBM.
Нидерланды выделили IBM и Институту радио астрономии Нидерландов (Netherlands Institute for Radio Astronomy, ASTRON) пятилетний грант на сумму $43,6 млн, покрывающий расходы на создание такой системы.
Работу над SKA ведет консорциум из 20 правительственных агентств. Это будет не только самый крупный, но и самый чувствительный в мире радио телескоп. Возможно, он позволит ученым ответить на вопрос, как именно произошел «Большой взрыв» около 13 млрд лет назад. SKA будет состоять из 3 тыс. небольших антенн, каждая из которых будет производить непрекращающийся поток данных.
Как только SKA заработает на полную мощность, он будет производить более 1 экзабайта данных в день
Как только SKA заработает на полную мощность, он будет производить более 1 экзабайта данных в день (1 экзабайт = 1 млрд гигабайт). По оценкам IBM, эти данные будут превышать по объему ежедневный входящий трафик всемирной паутины. Данные будут сниматься с телескопа, расположенного в Австралии или Южной Африке, а затем суммироваться и рассылаться ученым по всему миру. Обработка информации будет сводиться к сбору пакетов данных от каждой отдельно взятой антенны. 28 мая министр цифрового развития Максут Шадаев выступит на TAdviser SummIT
По словам Энгберсен, ученые планируют использовать для обработки данных самое современное оборудование, но в проектировании системы им все равно придется шагнуть за рамки существующих технологических возможностей.
Пока также не решено, будут ли данные стекаться в единый центр обработки данных (ЦОД) или таковых будет несколько. Еще одной задачей, которую нужно решить, является обеспечение энергией такого большого количества оборудования. Необходимо настроить и алгоритмы передачи данных в соответствии с конфигурацией оборудования.
В результате высоко производительная система сможет обрабатывать от 300 до 1500 петабайт данных в год. Это в десятки раз больше, чем производит самый крупный научный генератор данных в мире – Большой адронный коллайдер (15 петебайт ежегодно).