Translated by PROMT
2010/10/04 21:55:10

Сертификация Uptime Institute Tier

Определением уровня надежности датацентра занимается ассоциация предприятий, собранной под флагом Uptime Institute.

Каталог TAdviser Дата-центров России и технологий для дата центров.

Содержание

Для каждого из выделенных уровней надежности в стандарте TIA EIA 942 приводится детальное описание, требования и рекомендации к следующим системам и элементам: архитектурным решениям, электроснабжению, охлаждению, безопасности, противопожарной системе, структурированной кабельной системы, системе кабелепроводов, телекоммуникациям. Например, в стандарте приводится описание требований и рекомендаций по минимальной высоте фальшпола для определенного уровня надежности.

В стандарте при описании требования к количеству ресурсов используется буква «N» (сокращение от слова need) и простейшие математические формулы с операциями сложения и умножения. Операция сложения обозначает увеличение потребности на одну условную единицу (например, N+1 означает, что необходимо иметь запас ресурсов в одну единицу), а операция умножения увеличение потребностей в несколько раз (например, N*2 означает полное дублирование потребностей).

1-й уровень надежности ЦОД — Tier-1

Базовый уровень надежности ЦОД ((по классификации The Uptime Institute)). Этот уровень применялся для дата-центров в 60-е и 70-е годы прошлого столетия. Ошибки и отказы в работе систем и оборудования на этом уровне приводят к сбоям в работе всего ЦОД. Также работа центра обработки данных прерывается для проведения профилактических и ремонтных работ. В ЦОД может не быть фальшполов, резервных источников электроснабжения и источников бесперебойного питания (ИБП). Инженерная инфраструктура создана только для удовлетворения текущих потребностей, то есть без резервирования и избыточных ресурсов (обеспечение потребностей выражается в виде буквы «N»)

  • Время простоя за год — 28,8 часов
  • Коэффициент отказоустойчивости 99,671%

Сами уровни Tier начали формулироваться американским Uptime Institute еще в 1995 году, а чуть позже – Telecommunication Industry Association в Европе. Целью этих мероприятий было определение требований к центрам обработки данных, в которых будут запущены критически важные процессы. При этом исходили разработчики из чисто практических аспектов. Например, для Tier I доступность осуществляется просто за счет повышенной надежности инженерных систем. Tier II подразумевает резервирование критически важных узлов инфраструктуры. В Tier III необходимо дублировать пути получения электроэнергии и хладагента, а Tier IV требует полного резервирования всей инфраструктуры и уход от городской или федеральной электросети как основного источника энергии.

Исходя из статистических расчетов и исследований, для каждого Tier был определен показатель доступности. Так, выполнение требований Tier I обеспечивает работу серверов в 99,671% времени, а Tier IV – как минимум 99,995%. Однако следует помнить, что все это – лишь статистика, и к реальной жизни она имеет такое же отношение, как наличие талона техосмотра к факту функционирования тормозной системы ABS.

2-й уровень надежности ЦОД - Tier-2

Дата-центры на второго уровня имеют небольшой уровень резервирования работоспособности систем и имеют небольшие избыточные ресурсы в инженерных системах датацентра. Но все равно подвержены перебоям из-за плановых и неплановых отказов работы оборудования в дата-центрах. Для этого уровня необходимо иметь фальшпол, резервные источники электроснабжения ЦОД. Проведение технических и ремонтных работ потребует остановку работы центра обработки данных. Система не имеет полного резервирования, однако установлены дополнительные элементы в системах охлаждения и энергоснабжения ЦОД (обеспечение потребностей выражается в виде формулы «N+1»)

  • Время простоя за год — 22,0 часа
  • Коэффициент отказоустойчивости 99,749%

3-й уровень надежности ЦОД — Tier-3

Даже ЦОД, построенный по всем правилам, может быть недостаточно надежным из-за неквалифицированной эксплуатации, незнания инженерами регламентов обслуживания. Потому Uptime Institute вводит понятие Operational Sustainability («эксплуатационная устойчивость»), учитывающее общие принципы организации работы команды по эксплуатации дата-центра: определение нагрузки на персонал, актуальность регламентов, определение зон ответственности в случае аварий и строгое следование инструкциям.

Дата-центр с указанным уровнем надежности позволяет провести ремонтно-профилактические работы без остановки работы ЦОД. То есть возможна одновременно эксплуатация и техническое обслуживание центра обработки данных вплоть до замены компонентов системы, добавления и удаления вышедшего из строя оборудования. Чтобы обеспечить 3-й уровень уже необходимо для системы охлаждения спроектировать и построить два трубопровода, обеспечить резервными мощностями работу всего оборудования с учетом выхода из строя или профилактики системы электроснабжения. Но ошибки в работе и отказы могут вызывать перебои в работе дата-центра. Имеет несколько путей (каналов) для распределения электропитания и охлаждения, но лишь один из них активен; имеет резервированные компоненты (обеспечение потребностей выражается в виде формулы «N+1»)

  • Время простоя за год — 1,6 часа
  • Коэффициент отказоустойчивости 99,982%

4-й уровень надежности датацентра — Tier - 4

Отказоустойчивый дата-центр с резервированием всех систем, позволяющий выполнить любые плановые и внеплановые работы без прерывания работы ЦОД. На этом уровне обеспечивается надежная защита от сбоев. Чтобы отвечать требованию 4-го уровня надежности необходимо дублирование всех систем с учетом того, что в каждой системе и ее «резервной копии» будет находиться, как минимум, еще один дополнительный компонент, обеспечивающий резервирование по схеме «N+1». То есть в дата-центре должно быть резервирование системы на уровне «N+1» и сама система еще должна быть, как минимум, продублирована. Отказы могут иметь место в случаях ручного аварийного отключении системы электроснабжения и срабатывания системы пожарной безопасности. На 4-м уровень даже структурированная кабельная система должна быть полностью зарезервирована.

Системы имеют двойное резервирование с учетом, как минимум, дополнительного компонента Имеет несколько активных путей распределения нагрузки и охлаждения с резервными компонентами 2 (N+1), т.е. 2 ИБП с избыточностью N+1 каждый (обеспечение потребностей выражается в виде формулы «2 (N+1)»)

  • Время простоя за год — 0,4 часа
  • Коэффициент отказоустойчивости 99,995%

Смотрите также