Upload
joao-galdino-mello-de-souza
View
3.351
Download
1
Embed Size (px)
Citation preview
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
18 de maio de 2016
Daniel Segabinazzi BorbaJosé Luiz Filho
Cloud - Continuidade do Negócio através da tolerância a desastres
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Agenda
1. Introdução
2. Método de pesquisa
3. Considerações
4. Tecnologia aplicada
5. Análise
6. Conclusão
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Introdução
Uso da Computação em Nuvem;
Continuidade dos Negócios;
Alinhamento da tecnologia para atender ao negócio;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Introdução
A Computação em Nuvem já é realidade e fator decisivo não apenas na continuidade dos negócios mas também na competitividade de tal maneira a deixar menos competitiva àquela organização que não quiser adotá-la.
IaaS – Infrastructure as a Service
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Introdução
Essa nova visão de entrega de TI como serviço assegura a integridade dos dados através do uso da tecnologia para a sua salvaguarda.
Cenário analisado: considerado 7 tipos de situações de incidentes que podem impactar o negócio.
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Introdução
Definição do impacto para a área de negócio em caso de uma catástrofe com a infraestrutura de TI.
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Método de pesquisa
7
PROBLEMA HIPÓTESE
REFUTAÇÃO ; NÃO REFUTAÇÃO EXPERIMENTO
questões
metodologia
análises
observações
Continuidade do Negócio utilizando a Cloud.
Análise de resultado e conclusões
1) Uso da Cloud?2) Qual catástrofe está sendo
coberta?3) TI alinhada ao negócio?
1) Adoção da Cloud (Gartner)2) 7x cenários de catástrofes3) Matriz de criticidade para
alinhar TI ao negócio
Base em estudo de conceito não ocorreu reprodução em laboratório.1)3x Whitepapers de soluções de Mercado2)5x Artigos científicos de 37 verificados3)1x web site (Gartner)4)Norma ISO continuidade de negócios5)1x estudo de caso
1) Definição da tecnologia para suportar a continuidade do negócio após a definição de R.P.O. igual ou maior que zero;
1) R.P.O. = 0 ; replicação síncrona com PIT e Max. Writes para o link;
2) R.P.O. > 0 ; replicação assíncrona com PIT e Média Writes para o link;
3) Mais de uma falha pode causar I/O outage;
Trabalhos futuros:1)Performance do link de replicação;2)Segurança acesso a informação;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Método de pesquisa
Pesquisa de soluções de mercado para atender a continuidade de negócios;
Base em documentação e whitepapers além de artigos de Cloud Computing;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Método de pesquisa
Virtualização dos Subsistemas de Armazenamento de Dados de diferentes localidades com o uso de point-in-times;
Ferramentas;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Considerações
ADOÇÃO DA COMPUTAÇÃO EM NUVEM
Segundo Gartner, a questão é "em qual estágio da cloud a sua organização se encontra?”
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Considerações
ADOÇÃO DA COMPUTAÇÃO EM NUVEM
Nuvem PrivadaPrivadaSite Produção
Nuvem PúblicaPúblicaSite Contingência
Nuvem PúblicaPúblicaSite Produção Site Contingência
Cenário-01
Cenário-02
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Considerações
IaaS - SERVIÇO DE RECUPERAÇÃO DE DESASTRES
Ao selecionar o fornecedor de Computação em Nuvem, é necessário averiguar por meio de qual tecnologia a recuperação de desastre é feita.
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Considerações
IaaS - SERVIÇO DE RECUPERAÇÃO DE DESASTRES
Parâmetros sugeridos durante a contratação desse tipo de serviço;
Cenários contemplados:Corrupção de dados;Propagação de vírus;Indisponibilidade elétrica;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Considerações
IaaS - SERVIÇO DE RECUPERAÇÃO DE DESASTRES
Falha parcial ou completa de infraestrutura;
Quantidade de Sites;
Alta utilização do link de replicação entre Sites;
Indisponibilidade de link(s);
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Considerações
IaaS - SERVIÇO DE RECUPERAÇÃO DE DESASTRES
Quantidade de informação tolerável a se perder;
R.P.O. = Recovery Point Objective
Tempo de recuperação do ambiente;
R.T.O. = Recovery Time Objective
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
• TECNOLOGIA DE REPLICAÇÃO DE DADOS Síncrona;
Assíncrona;
• USO DO POINT IN TIME (PIT)
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
Fonte: http://http://marinhoti.blogspot.com.br/2015_01_01_archive.html
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
Até 100km de distância entre Sites;
Fonte: http://www..... Figure 8. Example of deployment between datacenters
Latência até 5m; Witness em um terceiro Site;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
Mesma funcionalidade do anterior, porém por comportar uma distância maior de até 50m de RTT, trabalha de forma assíncrona
Fonte: http://www.....com/collateral/hardware/white-papers/h8232-vplex-architecture-wp.pdf Figure 9. Example of a VPLEX Geo deployment between datacenters
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
http://www......m/collateral/software/white-papers/h4175-recoverpoint-clr-operational-dr-wp.pdfFigure 1. Data protection modes
• Utilização da tecnologia de replicação de dados com "point-in-time"
• Recuperação
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
O "JOURNAL" é a área responsável por armazenar os “snapshots” geradas do ambiente;
Ao distribuir os “snapshots” para as áreas target da replicação, obtém-se o point in time (PIT);
O “PIT” possui uma imagem íntegra;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
O usuário seleciona uma imagem apropriada no tempo ou um bookmark consistente através do JOURNAL fazendo a requisição de acesso e habilitando assim o modo de acesso a imagem
O Bookmark permite criar um “alias” para o PIT, facilitando a identificação para uma recuperação de desastre;
Pode ser feito manual ou automático;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
É possível habilitar uma imagem na Contingência sem interromper a Produção e depois descarta-la, respeitando a capacidade do “JOURNAL”;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
• Exemplo: 2x Sites ; splitter na SAN ; • Fonte:http://www......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery
splitter splitter
Site-01 Site-02
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
• Estrutura - Consistency Group• Fonte:http://www........com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery
Consistency Group
LUN-01 LUN-01Replicantion Set 01
LUN-02 LUN-02Replicantion Set 02
... ... ...
LUN-n LUN-nReplicantion Set-n
JOURNAL - Site 02Point-in-Time
JOURNAL - Site 01Point-in-Time
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
• Replicação de Dados• Fonte:http://www.......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery
JOURNAL
Storage: No Access
Site-01 Site-02
JOURNAL
Image: Distributing
Storage: Direct Access
Image: N/A
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
• Cenário: Para recuperação de imagem • Fonte:http://www......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery
Imagem
Está íntegra?Ativar outra imagem Failover
Fim
Não Sim
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
• Splitter• Fonte:http://www.......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada
• Link• Fonte:http://www......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Tecnologia aplicada• Virtualização de Storages
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
TOLERÂNCIA A FALHAS EM DESASTRES
Definição da criticidade de cada Item de Configuração;
R.P.O.
Matriz de criticidade alinhada ao negócio; Definição de um Desastre;
Tempo de indisponibilidade tolerável;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
TOLERÂNCIA A FALHAS EM DESASTRES Matriz de Criticidade vs Itens de Configuração
Ref: https://www.xxxxxx.com.br/tratadoaprendizagem/wp-content/files_mf/1417114470TCC_DacyrDantedeOliveiraGatto.PDF
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
TOLERÂNCIA A FALHAS EM DESASTRES
Atingir o resultado: R.P.O.
TEMPO, ESCRITAS ou QUANTIDADE DE DADOS aceitáveis numa possível perda;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
TOLERÂNCIA A FALHAS EM DESASTRES R.P.O. = 0
Cenário-01 (híbrida)
Cenário-02 (pública)
ou
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
TOLERÂNCIA A FALHAS EM DESASTRES
Replicação síncrona entre os Sites da nuvem;
Uso de PIT;
Corrupção de dados;Propagação de vírus;
Indisponibilidade elétrica;Falha parcial ou completa de infraestrutura;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
AnáliseTOLERÂNCIA A FALHAS EM DESASTRES
Redundância do fornecedor de link;
MáximoMáximo da taxa de escrita do ambiente alvo do estudo num determinado intervalo de tempo;
Alta utilização do link de replicação entre Sites;
Indisponibilidade de link(s);
Balanceamento de carga entre os links;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
TOLERÂNCIA A FALHAS EM DESASTRES R.P.O. > 0
Cenário-01 (híbrida)
Cenário-02 (pública)
ou
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
TOLERÂNCIA A FALHAS EM DESASTRES
Replicação Assíncrona;
Lag de dados; Aceita maiores distâncias entre Sites;
Uso de PIT;
Corrupção de dados;Propagação de vírus;
Indisponibilidade elétrica;Falha parcial ou completa de infraestrutura;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
TOLERÂNCIA A FALHAS EM DESASTRES
Redundância do fornecedor de link;
MédiaMédia da taxa de escrita do ambiente alvo do estudo num determinado intervalo de tempo;
Alta utilização do link de replicação entre Sites;Indisponibilidade de link(s);
Balanceamento de carga entre os links;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
TOLERÂNCIA A FALHAS EM DESASTRES R.P.O. = 0
Replicação síncrona; Ferramenta Uso de PIT;
R.P.O. > 0 Replicação assíncrona;
Ferramenta; Uso de PIT;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
• Cenários de falha nos Sites
Falha Parcial, não interrompe a ProduçãoFalha Parcial, não interrompe a Produção
I/O OutageI/O Outage
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
Falha Parcial, não interrompe a ProduçãoFalha Parcial, não interrompe a Produção
1) Falha de um dos Sites:
2) Falha de um dos links de comunicação entre Sites:
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
Falha Parcial, não interrompe a ProduçãoFalha Parcial, não interrompe a Produção
3) Falha de dois links de comunicação entre Sites:
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
I/O OutageI/O Outage
3) Queda de um dos Sites (exceto Witness) e perda de comunicação do Witness com o Site “sobrevivente”:
4) Falha de comunicação entre todos os Sites:
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
I/O OutageI/O Outage
1) Queda dupla de Sites, incluindo o Witness:
2) Queda do Witness e da comunicação entre Sites “sobreviventes”:
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Análise
Plano de Recuperação; R.T.O.
Testes periódicos que comprovam o serviço contratado;
RECUPERAÇÃO DE DESASTRES
Procedimentos operacionais; Equipes responsáveis; Sequencia das atividades; Plano de comunicação;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Conclusão
Fonte: http://www.sinestec.com.br/blog/qual-a-importancia-de-ter-bons-niveis-de-rto-e-rpo/
Indisponibilidade de um serviço; Identificar o C. I,; Matriz de criticidade;
Identificar o tipo de incidente ou o tempo limite de indisponibilidade, o que ocorrer primeiro;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Conclusão
Fonte: http://www.sinestec.com.br/blog/qual-a-importancia-de-ter-bons-niveis-de-rto-e-rpo/
Tempo de Indisponibilidade; Identificado o impacto;
Impacto Configuration Item (C.I.) Matriz de Criticidadeserviço servidor físico Business Critical(...) servidor virtual Critical
Storage High(...) Normal
Low
Impacto Configuration Item (C.I.) Matriz de Criticidade
serviço servidor físico Business Critical(...) servidor virtual Critical
Storage High(...) Normal
Low
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Conclusão
Fonte: http://www.sinestec.com.br/blog/qual-a-importancia-de-ter-bons-niveis-de-rto-e-rpo/
Respeitar o R.P.O.; Acionar os pontos focais
seguindo o plano de comunicação;
Ou se até mesmo já se encontra na Contingência;
Tomada de decisão se é necessário acionar o Site de Contingência ou não;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Conclusão
Estabelece-se uma regra dependendo do R.P.O. para iniciar ou não o plano de Recuperação;
Matriz de Criticidade R.P.O.Business Critical ------------------------- 0Critical ------------------------- até 5minHigh ------------------------- até 10minNormal ------------------------- até 4hsLow ------------------------- até 8hs
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Conclusão
Desejável que essa regra seja antes do R.P.O estipulado para o(s) C.I.(s) (configuration item), com base na matriz de criticidade;
Tipo de Incidentecorrupção de dadospropagação de vírusindisponibilidade elétricafalha parcial ou completa de infraestruturaAlta utilização de link de replicação entre SitesIndisponibilidade de link
Checar a necessidade do uso da tecnologia de acordo com o tipo de incidente;
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Conclusão
Fonte: http://www.sinestec.com.br/blog/qual-a-importancia-de-ter-bons-niveis-de-rto-e-rpo/
E finalmente aplica-se o plano de recuperação respeitando-se o R.T.O.;
Tipo de Incidente R.T.O. Plano de Recuperaçãocorrupção de dados 30min Acionar Contingênciapropagação de vírus 30min Acionar Contingênciaindisponibilidade elétrica 0min Acionar Contingênciafalha parcial ou completa de infraestrutura 0min Acionar ContingênciaAlta utilização de link de replicação entre Sites 0min Não acionar ContingênciaIndisponibilidade de link 0min Não acionar Contingência
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Conclusão
Tecnologias de Recuperação de desastre; Parâmetros e condições para a contratação de
um serviço de Cloud que ofereça esse serviço; R.P.O. e R.T.O. para alinhamento de risco e de
expectativas; Norma ISO 20000 na Gestão de Serviços de
TI; Norma ISO 22301 (Business Continuity
Management Systems)
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.
Obrigado!
Daniel S. Borba [email protected]
José Luiz [email protected]