Upload
-
View
296
Download
1
Embed Size (px)
Citation preview
Андрей Шоринзаместитель директора эксплуатации hh.ru
учился в МФТИ на ФУПМ
оптимизировал .masterhost в 1,5 раза
повысил надежность работы hh.ru в 10 раз
hh.ru2013 2016
uptime 99,6% 99,9%
время простоя за квартал
8,5 ч 2⅓ ч
критерий 60 ошибок/сек 20 ошибок/сек
шаги к аптайму
формально опеределить uptime
регистрировать инциденты
анализировать причины инцидентов
шаги к аптаймуформально опеределить uptime
регистрировать инциденты
анализировать причины инцидентов
использовать автотесты
шаги к аптаймурегистрировать инциденты
анализировать причины инцидентов
использовать автотесты
выпускать релизы автоматически
шаги к аптаймуанализировать причины инцидентов
использовать автотесты
выпускать релизы автоматически
тестировать уменьшенную копию сайта
шаги к аптаймуиспользовать автотесты
выпускать релизы автоматически
тестировать уменьшенную копию сайта
тестировать файлы конфигурации
шаги к аптаймувыпускать релизы автоматически
тестировать уменьшенную копию сайта
тестировать файлы конфигурации
исследовать приложения в мониторинге
причины инцидентовошибка службы эксплуатации
проблемный релиз
ошибка в приложении
железо, сеть, каналы, датацентр
проблемный релиз
ошибка в приложении
железо, сеть, каналы, датацентр
проблемы с базой данных
причины инцидентов
причины инцидентовошибка в приложении
железо, сеть, каналы, датацентр
проблемы с базой данных
внешние проблемы
железо, сеть, каналы, датацентр
проблемы с базой данных
внешние проблемы
плановый downtime
причины инцидентов
DevOps FundamentalsInfrastructure as a Code
Automated Testing
Continuous Integration
Continuous Deployment
Automated Testing
Continuous Integration
Continuous Deployment
Release Management
DevOps Fundamentals
DevOps FundamentalsContinuous Integration
Continuous Deployment
Release Management
Configuration Management
DevOps FundamentalsContinuous Deployment
Release Management
Configuration Management
Application Performance Monitoring
Release Management
Configuration Management
Application Performance Monitoring
Availability Monitoring
DevOps Fundamentals