2010/08/23 11:22:14

ЦОД Как снизить риск человеческого фактора в работе центра обработки данных

По данным еженедельника ComputerWorld, одной из главных причин сбоев, возникающих в работе центров обработки данных, является человеческий фактор. Согласно результатам специального исследования, проведенного этим еженедельником, 70 % проблем современных дата центров обусловлены как раз человеческим фактором.

Каталог TAdviser Дата-центров России и технологий для дата центров.

Можно ли снизить вероятность простоев в работе оборудования, возникающих по вине сотрудников? Специалисты по работе с персоналом пришли к выводу, что это можно сделать, если придерживаться следующих, разработанных ими правил.

  1. Защита кнопок аварийного отключения питания. В датацентрах кнопка аварийного отключения питания обычно находится возле входа в помещение. Чаще всего эти кнопки открыты и не имеют точной маркировки, зачастую их можно нажать по ошибке и тем самым отключить весь дата-центр от электроснабжения. Маркировка и ограничение доступа к этим кнопкам может предотвратить их случайное нажатие.
  2. Письменные инструкции. Подробные письменные инструкции снижают или устраняют риски, связанные с выполнением технического обслуживания. Желательно организовать процесс техобслуживания так, чтобы сотрудники могли заменять друг друга в случае не выхода на работу кого-то из них. Хорошо проработанные инструкции помогут также при приеме новых сотрудников.
  3. Правильная маркировка компонентов. Для правильной и безопасной эксплуатации энергетической системы все коммутирующие устройства должны иметь соответствующую маркировку. Наличие инструкций и правильной маркировки обеспечивает двойной контроль работы центра обработки данных.
  4. Последовательный технологический режим. Иногда администраторы data центров теряют бдительность и при выполнении определенных процедур действуют не в соответствии с инструкцией. Например, они забывают или пропускают отдельные шаги, или же выполняют всю процедуру по памяти и случайно отключают не то оборудование. Поэтому при выполнении какой-либо процедуры, весь персонал должен строго соблюдать разработанный технологический режим. Для этого можно распечатать и повесить на стену инструкции или описание отдельных действий.
  5. Текущее обучение персонала. Обеспечивайте всех лиц, имеющих доступ в дата-центр, в том числе ИТ-специалистов, сотрудников службы безопасности и обслуживающий персонал, основными сведениями об оборудовании в целях предотвращения его ошибочного отключения.
  6. Правила безопасного доступа. Правила доступа, предусматривающие сопровождение всех посетителей, например, поставщиков, позволяют администраторам дата-центров быть в курсе всех посещений.
  7. Введение правил употребления пищевых продуктов и напитков. Жидкости представляют наибольшую опасность, так как их попадание на компьютерное оборудование может спровоцировать его поломку и даже короткое замыкание. Наилучшим способом оповещения о требованиях к пищевым продуктам и напиткам является размещение объявления возле дверей дата-центра с указанием сути и строгости этих требований.
  8. Предотвращение попадания загрязняющих веществ. Попадание пыли внутрь серверов и другого компьютерного оборудования крайне нежелательно, так как тоже может нарушить их работу. В основном эту проблему можно решить, требуя от сотрудников носить антистатическую обувь или положив специальный коврик перед входом в Центр обработки данных ЦОД. Упаковку и распаковку оборудования также необходимо производить за пределами центра обработки данных. Попадание волокон упаковочного материала также может вызвать нежелательные сбои в работе центра.



Следование этим простым правилам значительно снижает возможность остановки работы дата центра по вине работающих в нем сотрудников.