Upload
jurko-banzaj
View
683
Download
0
Embed Size (px)
DESCRIPTION
Citation preview
Тбилиси, 2011 г.
Геннадий КарповДиректор по технологиям
Непрерывность ИТ:облачный подход
2
Информационные системы в структуре бизнеса
ИТ-сервисы используются для автоматизации основных и существенных бизнес- процессов. Автоматизация обеспечивает эффективность (максимизацию прибыли) и конкурентоспособность предприятия.
Бизнес-приложения являются основой ИТ-сервисов. От их функциональности зависит:
эффективность автоматизации бизнес-процессов (затраты рабочего времени бизнес-сотрудников на выполнение характерных для конкретного бизнес-процесса операций)
спектр доступных продуктов/услуг и скорость вывода на рынок новых
обоснованность стратегических и тактических решений (в т.ч. в контексте управлении рисками)
ИТ-инфраструктура является средой для производства ИТ-сервисов и их доставки конечному потребителю (бизнес-сотруднику). От нее зависит:
стоимость ИТ-сервисов как совокупность операционных затрат на их поддержание
соответствие качества ИТ-сервисов потребностям бизнеса (скорость работы, непрерывность, информационная безопасность)
возможность масштабирования информационной системы при изменении масштабов бизнеса и интенсивности бизнес-процессов
Непрерывность ИТ-сервисов – вклад ИТ-службы в обеспечение непрерывности бизнеса.
Угрозы непрерывности ИТ-сервисов
Непрерывность ИТ-сервисов
Внешние деструктивные
факторы (катастрофы)
Отказы оборудования и
сбои ПО
Логическое разрушение
данных
Изменения (включая M&A и миграцию ЦОД)
Регламентные работы
3
4
Классика противодействия угрозам (ассоциативный ряд ИТ-директора)
Катастрофы
Локальные отказы
Разрушение данных
Изменения
Регламентные работы
резервный ЦОД + план восстановления
дублирование компонент, кластеры
резервное копирование
отказ от изменений,надежда на лучшее
выбор приемлемого окна
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
Классический подход и его применимость в современных условиях
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
APP
OSDT
HA
Резервный ЦОД Основной ЦОД
Основная проблема классического подхода – сложность, приводящая к
неуправляемости
6
Классические проблемы классического подхода
резервный ЦОД + план восстановления
дублирование компонент, кластеры
резервное копирование
отказ от изменений,надежда на лучшее
выбор приемлемого окна
Сложность DRP-процесса, человеческий фактор
Большая избыточность оборудова-ния, сложность администрирования
Неприемлемая трудоемкость проверки восстановимости
Снижение адаптивности информационной системы
требуемое окно доступно не во всех случаях
Унаследованная архитектура – главное препятствие на пути
достижения непрерывности ИТ
7
5 вопросов аудита или типичная картина в области непрерывности ИТ
Q: Непрерывность каких ИТ-сервисов обеспечена?A: Разные ИТ-сервисы в разной степени защищены от угроз. Приоритет отдается «наиболее критичным». Степень критичности определяется интуитивно, без анализа взаимозависимостей ИТ-сервисов и их влияния на бизнес-процессы.
Q: Покажите ваш DRP. Когда он в последний раз обновлялся и проверялся?A: План восстановления (DRP) фрагментарный. Его актуальность и реализуемость неподтверждена. Периодическое тестирование не проводится. RTO/RPO неопределены и/или непредсказуемы.
Q: Как часто проводится тестовая активация резервного ЦОД?A: Готовность резервного ЦОД к активации неподтверждена. Периодическое тестирования возможности миграции ИТ-сервисов в резервный центр не проводится.
Q: Насколько персонал готов к исполнению DRP?A: Готовность неподтверждена. Периодические тренировки не проводятся
Q: Пригодны ли резервные копии данных для восстановления ИТ-сервисов?A: Возможность восстановления ИТ-сервисов в случае разрушения данных неподтверждена. Тестирование пригодности резервных копий к восстановлению не проводится.
Операционная система ЦОД – универсальный инструмент обеспечения непрерывности ИТ
ОПЕРАЦИОННАЯ СИСТЕМА ЦОД
(слой виртуализации и автоматизации)
Антивирусная защита
Отказо-устойчивоть
Балансировка нагрузки
Backup & Recovery
Планирование мощностей
Сетевая безопасность
Мониторинг SLA
Устойчивость к катастрофам
Авто
мати
заци
я уп
равл
ения
жи
знен
ным
цикл
ом о
бору
дова
ния,
VM
и И
Т-се
рвис
ов
Порт
ал
само
обсл
ужив
ания
APP
Thin OS
APP
Thin
OS
APP
Thin OS
APP
Thin OS
APP
Thin OS
APP
Thin OS
APP
Thin OS
Мобильно-адаптивные ИТ-сервисы
X-Block X-Block X-Block X-Block
• толерантность к отказам оборудования• не требуются «окна» для проведения регламентных работ• управление репликацией и мгновенными копиями• динамическое порождение и прозрачная миграция операционных сред• клонирование операционных сред и логических архитектур• агенты защиты данных (резервное копирование-восстановление,
блокирование вредоносного контента)
Новый подход к обеспечению непрерывности ИТ
Операционная система ЦОД
DT High Availability
Резервный ЦОД Основной ЦОД
Облачная модель:одна проблема – одно решение
APP
OS
APP
OS
APP
OS
ОС ЦОД
DTHigh Availability
TEST
OS
DEV
OS
Кушаем слона по частям: программа проектов обеспечения непрерывности ИТ
10
Унификация репликации,автоматизация DRP
Унификация технологий
Консолидация и виртуализация
вычислительной инфраструктуры
Катастрофо-устойчивость ИТ- инфраструктуры
Централизованная защита данных
Tra
nsf
orm
atio
n A
sses
smen
t
Инвентаризация активов,ТЗ на проектирование
Классификация данных,RTO/RPO,
ТЗ на проектирование
Классификация сервисов,ТЗ на проектирование
Устойчивость к локальным отказам
оборудования
Устойчивость к логическому
разрушению данных(ошибки ПО и
пользователей)
Устойчивость к катастрофам
Аренда или создание
резервного ЦОД
Управление инцидентами и
проблемами
Управление изменениями
Виртуализация рабочих мест
ТЗ на проектирование (требования к
инженерным системам)
Инвентаризация активов, оценка реализуемости
Мониторинг и управление ИТ-
инфраструктурой
Автоматическое обнаружение инцидентов
Актуальная CMDB
Актуальный автомати-
зированный DRP
Средства разрешения инцидентов
Централизация данных и
вычислений
Ресурсы
Инвентаризация активов, ограничения
Инвентаризация процессов
Исполнение DRP
Многоцелевая среда
тестирования
Безопасность изменений
Проверка восстанови-
мости
Тестирование DRP, тренинг
персонала
Решение проблемы окна регламентных
работ
Безопасность именений
TransformationAssessment
Виртуальная инфраструктура
Красная кнопка
Защита данных в облаке
Виртуализация рабочих мест
DRP-Лаборатория
11
– Упрощает и автоматизирует процедуры восстановления в случае катастроф:
• настройку• тестирование• восстановление
– Заменяет ручные процедуры автоматизированными планами восстановления
– Предоставляет централизованное управление планами восстановления из VirtualCenter
Базовая технология – VMware Site Recovery Manager
vSphere+SRM
Основной
vSphere+SRM
Резервный
Делает процесс восстановления после катастроф быстрым, надёжным, управляемым и доступным
«Красная кнопка»: инструмент поддержки BCP/DRP-процесса #1
«Красная кнопка» - эффекты внедрения
12
Как было Как стало
Тестирование процедур восстановления сервисов требует остановки на продолжительное время сервисов ИС
Тестирование процедур восстановления не требует остановки сервисов ИС основного центра
Время активации резервного ЦОД:4-5 часов с момента инициации процедур (100 серверов) - при наличии актуальных процедур и обученного персонала.
Время активации резервного ЦОД: менее 50 минут (100 виртуальных машин). Актуальность DR-плана поддерживается автоматически.
Процедуры восстановления сервисов на производятся в ручном режиме (в соответствии с пошаговой инструкцией - при наличии).
Процедуры восстановления автоматизированы, запускаются по команде оператора и выполняются в соответствии с заранее подготовленными и протестированными сценариями.
Процедуры восстановления требуют участия квалифицированных в различных областях специалистов.
Процедуры восстановления автоматизированы, запускаются по команде одного оператора.
13
«Красная кнопка»: содержание проекта
Классификация бизнес-приложений и сервисов по критерию критичности для бизнеса; определение взаимосвязанности систем и комплексов; ролей и прав персонала, участвующего в процедурах сопровождения.
Развертывание сервисов Site Recovery Manager (SRM) на базе виртуальной инфраструктуры VMware, настройка механизмов интеграции с сервисами репликации дисковых массивов.
Разработка эксплуатационной документации
Написание, моделирование и документирование процедур тестирования восстановления и процедур восстановления сервисов в случае катастроф.
«Красная кнопка» – продукт, проверенный практикой
Подтвержденное качество предоставляемых услуг и уверенность наших клиентов в успехе проекта
«DRP-Лаборатория»: инструмент поддержки BCP/DRP-процесса #2
15
Создание лаборатории, логически изолированной от продуктивной части информационной системы, для:
тестирования обновлений перед внесением изменений в продуктивный сегмент
регулярной автоматизированной проверки возможности восстановления ИТ-сервисов из резервных копий
Документирование процедур восстановления и создание автоматизированных сценариев тестирования
Настройка автоматической генерации отчетов о результатах тестирования, пригодных для использования при проведении аудиторских проверок
Интеграция со смежными решениями
Базовая технология – VMware LabManager + Orchestrator
«DRP-Лаборатория»:составляющие решения от De Novo
16
• Автоматизация процедур тестового восстановления и интеграция с системами UNIX (HP-UX, AIX, Solaris) с помощью VMware Orchestrator
• Интеграция с системой резервного копирования (экспертиза в области Symantec NetBackup и BackupExec, IBM Tivoli Storage Manager, EMC Networker, HP Data Protector)
• Реинжиниринг связанных процессов ITIL – Change Management, Release and Deployment Management, IT Service Continuity Management
«DRP-Лаборатория» – продукт, проверенный практикой
Подтвержденное качество предоставляемых услуг и уверенность наших клиентов в успехе проекта
18
Противодействия угрозам непрерывности ИТ: новые ассоциации
Катастрофы
Локальные отказы
Разрушение данных
Изменения
Регламентные работы
приватное облако + резервное облако + «Красная кнопка»
облачная инфраструктура (операционная система ЦОД)
резервное копирование +DRP-Лабораторая
DRP-Лаборатория
облачная инфраструктура (операционная система ЦОД)
19
De Novo обращает ваше внимание что…
• Большинство задач непрерывности ИТ решаются на уровне инфраструктуры
• Унаследованная архитектура устарела и в принципе не позволяет достичь приемлемого уровня непрерывности.
• Облачная (виртуальная) инфраструктура позволяет эффективно и однократно обеспечить непрерывность ИТ. Многие задачи решаются просто как «побочный эффект» построения внутреннего облака.
• Используйте эволюционный подход к решению задачи непрерывности ИТ путем построения внутреннего облака в виде программы проектов. У De Novo есть продукты необходимые для реализации этих проектов.
20
Полную гарантию может дать только страховой полис... (с) О. Бендер
21
Спасибо за внимание
Геннадий Карпов
директор по технологиям De Novo
www.de-novo.biz