Исполнительный директор РСК Алексей Шмелев о разработке кластерного решения «РСК Торнадо» на базе Intel Xeon Scalable. Информационные технологии, Электротехника и микроэлектроника, Суперкомпьютер, Центры обработки данных - технологии для ЦОД, Россия
 
2017/11/14 12:34:37

Глава РСК Алексей Шмелев о ноу-хау кластерного решения «РСК Торнадо» на базе новой платформы Intel

Компания РСК разработала обновленное сверхплотное, масштабируемое и энергоэффективное кластерное решение «РСК Торнадо». Впервые оно было представлено в 2017 году на международной конференции ISC’17 во Франкфурте-на-Майне. Решение представляет собой набор компонент для создания современных вычислительных систем различного масштаба с 100% жидкостным охлаждением на горячей воде. Оно включает высокопроизводительные вычислительные узлы на базе процессоров Intel Xeon Phi 7290 и Intel Xeon E5-2697А v4 в сочетании с первым в мире высокоскоростным коммутатором Intel Omni-Path с аналогичным охлаждением на "горячей воде". На вопросы TAdviser об «РСК Торнадо» ответил Алексей Шмелев, исполнительный директор группы компаний РСК.

«РСК Торнадо» на базе серверных процессоров Intel обладает передовыми показателями компактности и вычислительной плотности - до 153 узлов в одном стандартном шкафу 80см x 80см x 42U. Работа в режиме «горячая вода» позволяет применить круглогодичный режим free cooling (24x365), используя только сухие градирни, работающие при температуре окружающего воздуха до +50 °С, что, в свою очередь, позволяет полностью избавиться от фреонового контура и чиллеров. В результате среднегодовой показатель PUE системы, отражающий уровень эффективности использования электроэнергии, составляет менее чем 1,06. То есть на охлаждение расходуется менее 6% всего потребляемого электричества, что является выдающимся результатом для HPC-индустрии.

Программный стек «РСК БазИС» служит целям администрирования и мониторинга кластерными системами «РСК Торнадо». «РСК БазИС» является открытой и легко расширяемой платформой, созданной на основе ПО с открытым исходным кодом и микроагентной архитектуры. Такой подход позволяет осуществлять управление как центром обработки данных в целом, так и отдельными его элементами, такими как вычислительные узлы, коммутаторы, инфраструктурные компоненты, задачи и процессы. Все элементы комплекса (вычислительные узлы, блоки питания, модули гидрорегулирования и др.) имеют встроенный модуль управления, что обеспечивает широкие возможности для детальной телеметрии и гибкого управления.

Алексей Шмелев, исполнительный директор группы компаний РСК, в беседе с TAdviser рассказал подробнее о новом решении.

Алексей
Шмелев
Оперативный переход на новую платформу стал возможен благодаря многолетнему сотрудничеству РСК с Intel

Чем характерно решение РСК на платформе Intel Purley?

Алексей Шмелев: Наши специалисты начинают работу над своими новыми решениями заранее, Intel предоставляет образцы своих новых продуктов за несколько месяцев до официального анонса. Мы получаем возможность оценить их свойства и применимость к нашим задачам, выбираем те типы процессоров, плат и другие компоненты платформ Intel, которые могут быть наиболее востребованы у наших заказчиков. Далее начинается долгая, кропотливая, но и очень захватывающая работа по созданию законченного решения для наших заказчиков. Важнейшим условием на высококонкурентном рынке является обеспечение лидерских, важных для клиента свойств выпускаемого решения и, конечно, жесткий график выпуска непосредственно к анонсу новых процессоров/платформы Intel.

Вот почему первая демонстрация вычислительных узлов «РСК Торнадо» на базе новых процессоров Intel Xeon Scalable, служащих ядром платформы Purley, состоялась на международной промышленной выставке «Иннопром 2017», прошедшей 10-13 июля в Екатеринбурге. На ней удалось показать рекордный результат для высокопроизводительных решений, основанных на процессорах Intel Xeon — 685,44 ТФЛОПС в стандартном вычислительном шкафу 42U (80x80x200 см), что в 2,65 раза превышает производительность «РСК Торнадо» на базе самой старшей модели процессора предыдущего поколения семейства Intel Xeon E5-2600 v4.

При переходе на Purley нам пришлось уделить внимание подсистеме охлаждения узла, с учетом повышения требования к энергопотреблению отдельного сокета. Накопленный опыт позволил обойтись без особых сложностей, поскольку наша технология охлаждения «горячей водой» позволяет снимать более 1,5 кВт с одного узла, что существенно превышает ~600 Вт порог стандартного высоконагруженного сервера новой платформы. Важным элементом ноу-хау РСК является технология отведения большого количества тепла от очень малой (несколько квадратных сантиметров) зоны на поверхности процессора с необходимой для его правильного функционирования скоростью. Такое решение было опробовано нами еще в конце 2015 года для создания сервера на основе самого старшего процессора линейки - Intel Xeon Phi 7290 – процессоре специально спроектированным для жидкостного охлаждения – 265 Вт на сокет.

К тому же платформа Purley (если говорить о плате Intel для HPC) выполнена в похожем половинном по ширине форм-факторе (немного длиннее предшественницы) с похожим на предыдущую платформу энергопотреблением, что позволило нам достаточно просто адаптировать ее для использования в линейке «РСК Торнадо».

Каковы первые впечатления от новых микропроцессоров?

Алексей Шмелев: Линейка процессоров Intel Xeon Scalable, состоящая из четырех серий Bronze, Silver, Gold и Platinum, открывает широкие возможности по подбору типа процессора для каждого конкретного случая. Но для высокопроизводительных решений интересными представляются Platinum и Gold. Для HPC-систем по критерию «цена/производительность» наиболее привлекательной выглядят старшие модели семейства Intel Xeon Scalable – 6132-6154. Мы полагаем, что наиболее востребованными для наших клиентов будут модели процессоров Intel Xeon Platinum и Intel Xeon Gold.

Где вы представляете новые решения, что думаете об их перспективах?

Алексей Шмелев: В Москве демонстрация сверхплотного, масштабируемого и энергоэффективного кластерного решения «РСК Торнадо» на базе новых процессоров Intel Xeon Scalable состоялась в рамках конференции «Суперкомпьютерные дни в России» (25-26 сентября 2017 г.). Также оно представлено на крупнейшей мировой суперкомпьютерной выставке SC17 в США (Денвер, 13-16 ноября 2017 г.).

На отечественном рынке мы, как всегда, рассчитываем на конец года, когда заказчики начинают оценивать перспективы на следующий год. Наш оптимизм поддерживается серьезным ростом интереса к HPC-решениям со стороны госструктур, научных и образовательных учреждений, а также из различных отраслей промышленности.

215