54
Proibida cópia ou divulgação sem permissão escrita do CMG Brasil. 18 de maio de 2016 Daniel Segabinazzi Borba José Luiz Filho Cloud - Continuidade do Negócio através da tolerância a desastres

Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Embed Size (px)

Citation preview

Page 1: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

18 de maio de 2016

Daniel Segabinazzi BorbaJosé Luiz Filho

Cloud - Continuidade do Negócio através da tolerância a desastres

Page 2: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Agenda

1. Introdução

2. Método de pesquisa

3. Considerações

4. Tecnologia aplicada

5. Análise

6. Conclusão

Page 3: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Introdução

Uso da Computação em Nuvem;

Continuidade dos Negócios;

Alinhamento da tecnologia para atender ao negócio;

Page 4: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Introdução

A Computação em Nuvem já é realidade e fator decisivo não apenas na continuidade dos negócios mas também na competitividade de tal maneira a deixar menos competitiva àquela organização que não quiser adotá-la.

IaaS – Infrastructure as a Service

Page 5: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Introdução

Essa nova visão de entrega de TI como serviço assegura a integridade dos dados através do uso da tecnologia para a sua salvaguarda.

Cenário analisado: considerado 7 tipos de situações de incidentes que podem impactar o negócio.

Page 6: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Introdução

Definição do impacto para a área de negócio em caso de uma catástrofe com a infraestrutura de TI.

Page 7: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Método de pesquisa

7

PROBLEMA HIPÓTESE

REFUTAÇÃO ; NÃO REFUTAÇÃO EXPERIMENTO

questões

metodologia

análises

observações

Continuidade do Negócio utilizando a Cloud.

Análise de resultado e conclusões

1) Uso da Cloud?2) Qual catástrofe está sendo

coberta?3) TI alinhada ao negócio?

1) Adoção da Cloud (Gartner)2) 7x cenários de catástrofes3) Matriz de criticidade para

alinhar TI ao negócio

Base em estudo de conceito não ocorreu reprodução em laboratório.1)3x Whitepapers de soluções de Mercado2)5x Artigos científicos de 37 verificados3)1x web site (Gartner)4)Norma ISO continuidade de negócios5)1x estudo de caso

1) Definição da tecnologia para suportar a continuidade do negócio após a definição de R.P.O. igual ou maior que zero;

1) R.P.O. = 0 ; replicação síncrona com PIT e Max. Writes para o link;

2) R.P.O. > 0 ; replicação assíncrona com PIT e Média Writes para o link;

3) Mais de uma falha pode causar I/O outage;

Trabalhos futuros:1)Performance do link de replicação;2)Segurança acesso a informação;

Page 8: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Método de pesquisa

Pesquisa de soluções de mercado para atender a continuidade de negócios;

Base em documentação e whitepapers além de artigos de Cloud Computing;

Page 9: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Método de pesquisa

Virtualização dos Subsistemas de Armazenamento de Dados de diferentes localidades com o uso de point-in-times;

Ferramentas;

Page 10: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Considerações

ADOÇÃO DA COMPUTAÇÃO EM NUVEM

Segundo Gartner, a questão é "em qual estágio da cloud a sua organização se encontra?”

Page 11: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Considerações

ADOÇÃO DA COMPUTAÇÃO EM NUVEM

Nuvem PrivadaPrivadaSite Produção

Nuvem PúblicaPúblicaSite Contingência

Nuvem PúblicaPúblicaSite Produção Site Contingência

Cenário-01

Cenário-02

Page 12: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Considerações

IaaS - SERVIÇO DE RECUPERAÇÃO DE DESASTRES

Ao selecionar o fornecedor de Computação em Nuvem, é necessário averiguar por meio de qual tecnologia a recuperação de desastre é feita.

Page 13: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Considerações

IaaS - SERVIÇO DE RECUPERAÇÃO DE DESASTRES

Parâmetros sugeridos durante a contratação desse tipo de serviço;

Cenários contemplados:Corrupção de dados;Propagação de vírus;Indisponibilidade elétrica;

Page 14: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Considerações

IaaS - SERVIÇO DE RECUPERAÇÃO DE DESASTRES

Falha parcial ou completa de infraestrutura;

Quantidade de Sites;

Alta utilização do link de replicação entre Sites;

Indisponibilidade de link(s);

Page 15: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Considerações

IaaS - SERVIÇO DE RECUPERAÇÃO DE DESASTRES

Quantidade de informação tolerável a se perder;

R.P.O. = Recovery Point Objective

Tempo de recuperação do ambiente;

R.T.O. = Recovery Time Objective

Page 16: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

• TECNOLOGIA DE REPLICAÇÃO DE DADOS Síncrona;

Assíncrona;

• USO DO POINT IN TIME (PIT)

Page 17: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

Fonte: http://http://marinhoti.blogspot.com.br/2015_01_01_archive.html

Page 18: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

Até 100km de distância entre Sites;

Fonte: http://www..... Figure 8. Example of deployment between datacenters

Latência até 5m; Witness em um terceiro Site;

Page 19: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

Mesma funcionalidade do anterior, porém por comportar uma distância maior de até 50m de RTT, trabalha de forma assíncrona

Fonte: http://www.....com/collateral/hardware/white-papers/h8232-vplex-architecture-wp.pdf Figure 9. Example of a VPLEX Geo deployment between datacenters

Page 20: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

http://www......m/collateral/software/white-papers/h4175-recoverpoint-clr-operational-dr-wp.pdfFigure 1. Data protection modes

• Utilização da tecnologia de replicação de dados com "point-in-time"

• Recuperação

Page 21: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

O "JOURNAL" é a área responsável por armazenar os “snapshots” geradas do ambiente;

Ao distribuir os “snapshots” para as áreas target da replicação, obtém-se o point in time (PIT);

O “PIT” possui uma imagem íntegra;

Page 22: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

O usuário seleciona uma imagem apropriada no tempo ou um bookmark consistente através do JOURNAL fazendo a requisição de acesso e habilitando  assim o modo de acesso a imagem

O Bookmark permite criar um “alias” para o PIT, facilitando a identificação para uma recuperação de desastre;

Pode ser feito manual ou automático;

Page 23: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

É possível habilitar uma imagem na Contingência sem interromper a Produção e depois descarta-la, respeitando a capacidade do “JOURNAL”;

Page 24: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

• Exemplo: 2x Sites ; splitter na SAN ; • Fonte:http://www......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery

splitter splitter

Site-01 Site-02

Page 25: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

• Estrutura - Consistency Group• Fonte:http://www........com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery

Consistency Group

LUN-01 LUN-01Replicantion Set 01

LUN-02 LUN-02Replicantion Set 02

... ... ...

LUN-n LUN-nReplicantion Set-n

JOURNAL - Site 02Point-in-Time

JOURNAL - Site 01Point-in-Time

Page 26: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

• Replicação de Dados• Fonte:http://www.......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery

JOURNAL

Storage: No Access

Site-01 Site-02

JOURNAL

Image: Distributing

Storage: Direct Access

Image: N/A

Page 27: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

• Cenário: Para recuperação de imagem • Fonte:http://www......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery

Imagem

Está íntegra?Ativar outra imagem Failover

Fim

Não Sim

Page 28: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

• Splitter• Fonte:http://www.......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery

Page 29: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada

• Link• Fonte:http://www......com/c/en/us/td/docs/solutions/Enterprise/Data_Center/msxchng_cmcvmdc.html• Figure 55 RecoverPoint GUI after SRM Recovery

Page 30: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Tecnologia aplicada• Virtualização de Storages

Page 31: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

TOLERÂNCIA A FALHAS EM DESASTRES

Definição da criticidade de cada Item de Configuração;

R.P.O.

Matriz de criticidade alinhada ao negócio; Definição de um Desastre;

Tempo de indisponibilidade tolerável;

Page 32: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

TOLERÂNCIA A FALHAS EM DESASTRES Matriz de Criticidade vs Itens de Configuração

Ref: https://www.xxxxxx.com.br/tratadoaprendizagem/wp-content/files_mf/1417114470TCC_DacyrDantedeOliveiraGatto.PDF

Page 33: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

TOLERÂNCIA A FALHAS EM DESASTRES

Atingir o resultado: R.P.O.

TEMPO, ESCRITAS ou QUANTIDADE DE DADOS aceitáveis numa possível perda;

Page 34: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

TOLERÂNCIA A FALHAS EM DESASTRES R.P.O. = 0

Cenário-01 (híbrida)

Cenário-02 (pública)

ou

Page 35: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

TOLERÂNCIA A FALHAS EM DESASTRES

Replicação síncrona entre os Sites da nuvem;

Uso de PIT;

Corrupção de dados;Propagação de vírus;

Indisponibilidade elétrica;Falha parcial ou completa de infraestrutura;

Page 36: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

AnáliseTOLERÂNCIA A FALHAS EM DESASTRES

Redundância do fornecedor de link;

MáximoMáximo da taxa de escrita do ambiente alvo do estudo num determinado intervalo de tempo;

Alta utilização do link de replicação entre Sites;

Indisponibilidade de link(s);

Balanceamento de carga entre os links;

Page 37: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

TOLERÂNCIA A FALHAS EM DESASTRES R.P.O. > 0

Cenário-01 (híbrida)

Cenário-02 (pública)

ou

Page 38: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

TOLERÂNCIA A FALHAS EM DESASTRES

Replicação Assíncrona;

Lag de dados; Aceita maiores distâncias entre Sites;

Uso de PIT;

Corrupção de dados;Propagação de vírus;

Indisponibilidade elétrica;Falha parcial ou completa de infraestrutura;

Page 39: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

TOLERÂNCIA A FALHAS EM DESASTRES

Redundância do fornecedor de link;

MédiaMédia da taxa de escrita do ambiente alvo do estudo num determinado intervalo de tempo;

Alta utilização do link de replicação entre Sites;Indisponibilidade de link(s);

Balanceamento de carga entre os links;

Page 40: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

TOLERÂNCIA A FALHAS EM DESASTRES R.P.O. = 0

Replicação síncrona; Ferramenta Uso de PIT;

R.P.O. > 0 Replicação assíncrona;

Ferramenta; Uso de PIT;

Page 41: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

• Cenários de falha nos Sites

Falha Parcial, não interrompe a ProduçãoFalha Parcial, não interrompe a Produção

I/O OutageI/O Outage

Page 42: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

Falha Parcial, não interrompe a ProduçãoFalha Parcial, não interrompe a Produção

1) Falha de um dos Sites:

2) Falha de um dos links de comunicação entre Sites:

Page 43: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

Falha Parcial, não interrompe a ProduçãoFalha Parcial, não interrompe a Produção

3) Falha de dois links de comunicação entre Sites:

Page 44: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

I/O OutageI/O Outage

3) Queda de um dos Sites (exceto Witness) e perda de comunicação do Witness com o Site “sobrevivente”:

4) Falha de comunicação entre todos os Sites:

Page 45: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

I/O OutageI/O Outage

1) Queda dupla de Sites, incluindo o Witness:

2) Queda do Witness e da comunicação entre Sites “sobreviventes”:

Page 46: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Análise

Plano de Recuperação; R.T.O.

Testes periódicos que comprovam o serviço contratado;

RECUPERAÇÃO DE DESASTRES

Procedimentos operacionais; Equipes responsáveis; Sequencia das atividades; Plano de comunicação;

Page 47: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Conclusão

Fonte: http://www.sinestec.com.br/blog/qual-a-importancia-de-ter-bons-niveis-de-rto-e-rpo/

Indisponibilidade de um serviço; Identificar o C. I,; Matriz de criticidade;

Identificar o tipo de incidente ou o tempo limite de indisponibilidade, o que ocorrer primeiro;

Page 48: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Conclusão

Fonte: http://www.sinestec.com.br/blog/qual-a-importancia-de-ter-bons-niveis-de-rto-e-rpo/

Tempo de Indisponibilidade; Identificado o impacto;

Impacto Configuration Item (C.I.) Matriz de Criticidadeserviço servidor físico Business Critical(...) servidor virtual Critical

Storage High(...) Normal

Low

Impacto Configuration Item (C.I.) Matriz de Criticidade

serviço servidor físico Business Critical(...) servidor virtual Critical

Storage High(...) Normal

Low

Page 49: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Conclusão

Fonte: http://www.sinestec.com.br/blog/qual-a-importancia-de-ter-bons-niveis-de-rto-e-rpo/

Respeitar o R.P.O.; Acionar os pontos focais

seguindo o plano de comunicação;

Ou se até mesmo já se encontra na Contingência;

Tomada de decisão se é necessário acionar o Site de Contingência ou não;

Page 50: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Conclusão

Estabelece-se uma regra dependendo do R.P.O. para iniciar ou não o plano de Recuperação;

Matriz de Criticidade R.P.O.Business Critical ------------------------- 0Critical ------------------------- até 5minHigh ------------------------- até 10minNormal ------------------------- até 4hsLow ------------------------- até 8hs

Page 51: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Conclusão

Desejável que essa regra seja antes do R.P.O estipulado para o(s) C.I.(s) (configuration item), com base na matriz de criticidade;

Tipo de Incidentecorrupção de dadospropagação de vírusindisponibilidade elétricafalha parcial ou completa de infraestruturaAlta utilização de link de replicação entre SitesIndisponibilidade de link

Checar a necessidade do uso da tecnologia de acordo com o tipo de incidente;

Page 52: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Conclusão

Fonte: http://www.sinestec.com.br/blog/qual-a-importancia-de-ter-bons-niveis-de-rto-e-rpo/

E finalmente aplica-se o plano de recuperação respeitando-se o R.T.O.;

Tipo de Incidente R.T.O. Plano de Recuperaçãocorrupção de dados 30min Acionar Contingênciapropagação de vírus 30min Acionar Contingênciaindisponibilidade elétrica 0min Acionar Contingênciafalha parcial ou completa de infraestrutura 0min Acionar ContingênciaAlta utilização de link de replicação entre Sites 0min Não acionar ContingênciaIndisponibilidade de link 0min Não acionar Contingência

Page 53: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Conclusão

Tecnologias de Recuperação de desastre; Parâmetros e condições para a contratação de

um serviço de Cloud que ofereça esse serviço; R.P.O. e R.T.O. para alinhamento de risco e de

expectativas; Norma ISO 20000 na Gestão de Serviços de

TI; Norma ISO 22301 (Business Continuity

Management Systems)

Page 54: Cloud Computing - Continuidade do Negócio através da tolerância a desastres

Proibida cópia ou divulgação sem permissão escrita do CMG Brasil.

Obrigado!

Daniel S. Borba [email protected]

José Luiz [email protected]