Upload
ontico
View
223
Download
2
Embed Size (px)
Citation preview
Нужно ли внедрять DevOps?Как добиться чего-то от эксплуатации
Андрей Шоринзаместитель директора эксплуатации hh.ru
учился в МФТИ на ФУПМ
оптимизировал .masterhost в 1,5 раза
повысил надежность работы hh.ru в 10 раз
все в порядке, этот слайд пустой
в докладе будут и еще пустые слайды
hh.ru2013 2016
uptime 99,6% 99,9%
время простоя за квартал
8,5 ч 2⅓ ч
критерий 60 ошибок/сек 20 ошибок/сек
шаги к аптайму
формально опеределить uptime
шаги к аптайму
формально опеределить uptime
регистрировать инциденты
шаги к аптайму
формально опеределить uptime
регистрировать инциденты
анализировать причины инцидентов
шаги к аптаймуформально опеределить uptime
регистрировать инциденты
анализировать причины инцидентов
использовать автотесты
шаги к аптаймурегистрировать инциденты
анализировать причины инцидентов
использовать автотесты
выпускать релизы автоматически
шаги к аптаймуанализировать причины инцидентов
использовать автотесты
выпускать релизы автоматически
тестировать уменьшенную копию сайта
шаги к аптаймуиспользовать автотесты
выпускать релизы автоматически
тестировать уменьшенную копию сайта
тестировать файлы конфигурации
шаги к аптаймувыпускать релизы автоматически
тестировать уменьшенную копию сайта
тестировать файлы конфигурации
исследовать приложения в мониторинге
формально
определить
uptime и downtime
анализ
причин инцидентов
причины инцидентов
ошибка службы эксплуатации
причины инцидентов
ошибка службы эксплуатации
проблемный релиз
причины инцидентов
ошибка службы эксплуатации
проблемный релиз
ошибка в приложении
причины инцидентовошибка службы эксплуатации
проблемный релиз
ошибка в приложении
железо, сеть, каналы, датацентр
проблемный релиз
ошибка в приложении
железо, сеть, каналы, датацентр
проблемы с базой данных
причины инцидентов
причины инцидентовошибка в приложении
железо, сеть, каналы, датацентр
проблемы с базой данных
внешние проблемы
железо, сеть, каналы, датацентр
проблемы с базой данных
внешние проблемы
плановый downtime
причины инцидентов
причины инцидентовпроблемы с базой данных
внешние проблемы
плановый downtime
ошибка мониторинга
причины инцидентов
улучшить
управляемость
релизов
тестировать
уменьшенную
копию сайта
исследовать поведение
приложений
с помощью мониторинга
1Q/2013 1Q/2016
99,6% 99,9%
1Q/2013 1Q/2016
99,6% 99,9%
8,5 ч 2⅓ ч
1Q/2013 1Q/2016
99,6% 99,9%x 3,5
8,5 ч 2⅓ ч
1Q/2013 1Q/2016
99,6% 99,9%
8,5 ч 2⅓ ч
60 err/sec 20 err/sec
1Q/2013 1Q/2016
99,6% 99,9%
8,5 ч 2⅓ ч
60 err/sec 20 err/sec
x 10,5
DevOps Fundamentals
Infrastructure as a Code
DevOps Fundamentals
Infrastructure as a Code
Automated Testing
DevOps Fundamentals
Infrastructure as a Code
Automated Testing
Continuous Integration
DevOps FundamentalsInfrastructure as a Code
Automated Testing
Continuous Integration
Continuous Deployment
Automated Testing
Continuous Integration
Continuous Deployment
Release Management
DevOps Fundamentals
DevOps FundamentalsContinuous Integration
Continuous Deployment
Release Management
Configuration Management
DevOps FundamentalsContinuous Deployment
Release Management
Configuration Management
Application Performance Monitoring
Release Management
Configuration Management
Application Performance Monitoring
Availability Monitoring
DevOps Fundamentals
linkedin.com/in/andshorin
слайды нужно ли внедрять DevOps
bit.ly/implementdevops
Андрей Шорин