ИТ Сервис-менеджмент. Введение
Шрифт:
• Процесс Управления Непрерывностью ИТ-сервисов (ITSCM) – это процесс, предназначенный для противодействия на случай чрезвычайных обстоятельств, затрагивающих ИТ-услуги, и восстановления сервисов, необходимых для возобновления бизнес-операций.
Процесс Управления Непрерывностью ИТ-сервисов является частью общего процесса Управления Непрерывностью Бизнеса, и он зависит от информации, которую предоставляет процесс ВСМ. Доступность ИТ-сервисов обеспечивается благодаря сочетанию мер по уменьшению степени риска (например, использование высоконадежных систем) и способов восстановления (например, запасные и параллельно работающие системы). Для успешной реализации процесса требуются поддержка со стороны всей организации, твердое
Процесс Управления Непрерывностью ИТ-сервисов взаимодействует со всеми другими процессами ИТ Сервис-менеджмента, особенно с такими как:
• Управление Уровнем Сервиса: предоставляет информацию об обязательствах во предоставлению ИТ-услуг.
• Управление Доступностью: поддерживает процесс ITSCM в части разработки и внедрения превентивных мер.
• Управление Конфигурациями: определяет базисные конфигурации и элементы ИТ-инфраструктуры, информация о которых используется при восстановлении после чрезвычайной ситуации.
• Управление Возможностями: гарантирует поддержку требований бизнеса соответствующими ИТ-ресурсами.
• Управление Изменениями: обеспечивает правильность и актуальность всех планов в рамках процесса ITSCM благодаря вовлечению ITSCM в работу над всеми изменениями, которые могут повлиять на превентивные меры и Планы восстановления.
13.4. Виды деятельности
На рис 13.1 показаны виды работ, выполняемые в рамках процесса ITSCM. Цифры обозначают подразделы раздела 13.4, в которых описывается тот или иной вид деятельности.
Рис. 13.1. Модель Процесса Управления Непрерывностью ИТ-Сервисов (на основе модели OGC)
13.4.1. Определение охвата (области действия) [212] Процесса Управления Непрерывностью ИТ-сервисов
При инициализации процесса ITSCM необходимо рассмотрение всей организации в целом и выполнение следующих действий:
• Определение политики – определение политики организации в отношении Управления Непрерывностью ИТ-сервисов следует осуществить по возможности быстрее и довести ее до сведения каждого сотрудника организации, чтобы все знали о необходимости процесса ITSCM. Руководство должно продемонстрировать свое твердое намерение реализовать данный процесс.
212
Scope.
• Определение области действия процесса и других важных для процесса областей – при выборе подхода к оценке риска и Анализу воздействия на бизнес (Business Impact Analysis) и методов их выполнения используются страховые требования, стандарты качества, такие как серия ISO-9000, стандарты Управления Безопасностью, например, BS7799 и общие принципы определения политики в области бизнеса. На этом этапе также определяются соответствующая структура менеджмента и процессов на случай чрезвычайной ситуации.
• Выделение ресурсов – развертывание ИТ-среды на случай чрезвычайных обстоятельств потребует значительных затрат на персонал и ресурсы. Должно быть проведено обучение персонала для подготовки к выполнению второго этапа процесса ITSCM (Требования и стратегия).
• Подготовка проектной организации – рекомендуется использовать формальные методы Управления Проектом, такие как PRINCE 2, совместно с программным обеспечением, предназначенным для целей планирования.
13.4.2. Анализ воздействия на бизнес [213]
Перед
проведением анализа ИТ-услуг рекомендуется установить причины, почему компании необходимо включать Процесс Управления Непрерывностью ИТ-сервисов в общий Процесс Управления Непрерывностью Бизнеса, и определить потенциальное воздействие серьезных сбоев услуг. В некоторых случаях при возникновении чрезвычайной ситуации бизнес некоторое время еще может функционировать, и тогда основное внимание уделяется восстановлению услуг, в других случаях бизнес не может работать без ИТ-услуг, поэтому основное внимание уделяется предотвращению чрезвычайных ситуаций. В большинстве случаев необходимо найти баланс между этими двумя крайностями.213
Business Impact Analysis.
Среди возможных причин внедрения этого процесса могут быть следующие:
• защита бизнес-процессов;
• быстрое восстановление сервиса;
• необходимость выдержать конкуренцию;
• сохранение позиций на рынке;
• сохранение прибыльности;
• защита репутации компании.
Эти причины могут быть комбинированы. В финансовой сфере, например, в торговле валютными средствами, отсутствие информации о рынке ведет к приостановке торговли (основного бизнес-процесса), что означает потерю денег. Более того, если существует государственное требование регистрировать все валютные операции с использованием специализированной системы, то можно продолжать ведение бизнеса даже в случае повреждения этой системы, но рано или поздно это требование все равно будет нарушено, и тогда возможно наложение штрафа. В обоих случаях компания может потерять заказчиков и свои позиции на рынке.
Анализ сервисов
После того, как определена необходимость внедрения Процесса Управления Непрерывностью ИТ-сервисов, следует провести анализ ИТ-услуг, необходимых для бизнеса (например, информационные системы, офисные приложения, бухгалтерские приложения, электронная почта и т. д.), которые должны быть доступны в соответствии Соглашениям об Уровне Сервиса. Для некоторых услуг невысокой значимости могут быть достигнуты договоренности о предоставлении экстренного сервиса с ограниченными возможностями и доступностью. Уровни Сервиса во время восстановления могут быть изменены только по договоренности с заказчиком. Для критически важных услуг необходимо найти компромисс между превентивными мерами и способами восстановления.
Инфраструктура
После анализа сервисов выполняется оценка зависимостей между сервисами и ИТ-ресурсами. Информация из Процесса Управления Доступностью используется для анализа степени критичности ИТ-ресурсов для поддержки описанных ранее ИТ-услуг. Процесс Управления Возможностями предоставляет информацию о необходимых мощностях, а также помогает определить, на какое время эти услуги могут быть приостановлены с момента сбоя сервиса до его восстановления. В последствии такая информация может быть использована для определения способов восстановления по каждой услуге.
13.4.3. Оценка рисков
Официальная статистика по чрезвычайным ситуациям отсутствует, но во всем мире известны такие катастрофы, как:
Отравление газом | Токийское метро, Япония (март 1995) |
Отключение электроэнергии | Окланд, Новая Зеландия (декабрь 1997) |
Землетрясения | Лос-Анджелес, США (январь 1994) |
Кобе, Япония (январь 1995) | |
Атаки террористов | Всемирный торговый центр, Нью-Йорк, США (февраль 1993) |