Paul Fleet - Fotolia
O que fazer quando um plano de BC/DR dá errado
Testes insuficientes ou não saber o que esperar podem levar a um plano de continuidade de negócios com falha. Felizmente, existem etapas que você pode executar se seu planejamento de continuidade de negócios ou recuperação de desastres der errado.
Mesmo nas melhores circunstâncias de recuperação, sempre existe a possibilidade de que algo dê errado. Não importa o quão minucioso seja o seu planejamento, ou quantos cenários você imaginou, não há garantia de que tudo correrá de acordo com o planejado.
Eu trabalhava para uma empresa de software no sul da Flórida, bem no meio de um "beco de furacões", aquele trecho quente do Oceano Atlântico onde os furacões se formam, aumentam de intensidade e, por fim, atingem a terra firme. A empresa tinha um forte plano de continuidade de negócios e recuperação de desastres - "futebol nuclear", como o chamávamos carinhosamente. Era um plano muito detalhado do BC/DR sobre como a empresa se recuperaria da perda de dados, aplicativos, sistemas e operações. Estávamos prontos para o que um furacão poderia lançar sobre nós, ou assim pensávamos.
Então, um furacão atingiu uma semana antes do lançamento de um software importante. O resultado foi uma comédia de erros, nosso plano BC/DR nunca teve uma chance.
O prédio perdeu energia. Não tem problema, o prédio tem gerador. Posteriormente, descobrimos que a administração do prédio se esqueceu de comprar gás diesel para o gerador. Bom. Vamos comprar diesel de uma empresa de gás do porto. Acontece que a empresa que forneceu o combustível diesel não tinha o combustível sem chumbo necessário para operar as bombas de diesel para fornecer o combustível econômico de que tanto precisávamos. Todo o sul da Flórida não tinha energia. E, na época, a virtualização era muito nova, então não havia a ideia de ter máquinas virtuais replicadas em infraestrutura baseada em nuvem. Portanto, não havia energia nem infraestrutura e tínhamos o lançamento de um produto em uma semana.
Estávamos entediados.
Como BC/DR pode dar errado
Você pode não enfrentar um desastre da magnitude mencionada acima, mas sempre há a possibilidade de que as etapas de recuperação que você acredita que trarão a organização de volta a um estado de operação podem não funcionar por vários motivos:
- Falta de planejamento. Sua estratégia de BC/DR deve incluir todos os detalhes de recuperação, processo e contingência. Se o seu plano não levar em conta cenários de desastre específicos e fornecer as etapas de recuperação necessárias para você começar, as coisas podem dar errado rapidamente para você.
- Falta de evidências. Uma vez me disseram que um plano de BC/DR não vale a pena no papel em que está impresso. Sem realmente testar o plano, essa afirmação é 100% verdadeira. Por exemplo, se você planeja recuperar para a nuvem, não deve apenas testar a recuperação lá, mas também as operações em um estado de failover, bem como a recuperação de falhas. Sem testes, seu plano é apenas uma ideia muito boa não comprovada.
- Falta de resultados. Mesmo com um plano testado trimestralmente, você ainda não sabe ao certo se os backups mais recentes são bons ou consistentes com os backups de aplicativos e serviços dependentes. Portanto, ainda é possível ver os esforços de recuperação terminarem com um resultado inesperado.
- Só não esteja preparado. Como minha experiência com furacões, pode haver um cenário de desastre que você simplesmente não pode planejar. Eu sou um grande fã de ter um plano de BC/DR que não cobre apenas como abordar a recuperação de um determinado conjunto de sistemas e aplicativos. Gosto da ideia de ter planos específicos para lidar com cenários específicos de desastres. A recuperação de um sistema operacional corrompido é muito diferente do processo de recuperação quando o prédio é incendiado.
Quando um plano de BC/DR falha
Pense no restante deste artigo como uma espécie de modelo de resposta a incidentes. Ou seja, caso seu plano de BC/DR falhe, você tem um plano de backup (de alguma forma intencional) para tirá-lo da situação em que se encontra.
Problemas com o planejamento de BC/DR podem levar a perdas operacionais e financeiras para uma organização.
As três etapas a seguir fornecem uma visão geral de onde sua cabeça deve estar:
- Em teoria, você deveria ter feito isso. Você precisa listar os sistemas que são mais críticos para sua operação em ordem de prioridade, para que possa concentrar seus esforços nos aplicativos, serviços, sistemas e dados que terão o maior impacto positivo em seus negócios.
- Dadas as atuais circunstâncias de seu desastre, você deve determinar suas opções. Qual é a maneira mais rápida de se recuperar? Precisa trabalhar com um parceiro de recuperação de infraestrutura baseada em nuvem? Tem um local alternativo? Qualquer que seja a barreira para a recuperação, você precisa formular rapidamente uma estratégia de como fará a recuperação acontecer.
- Está tarde. Seu plano falhou, você precisava gastar tempo priorizando e descobrindo como e onde se recuperar. Se você tem um novo plano de contingência aprovado pela equipe executiva, siga em frente. Essa mesma equipe executiva provavelmente será capaz de calcular o valor da receita que a empresa está perdendo a cada minuto que leva para se recuperar. Aumente o ritmo e trabalhe com urgência para se recuperar o mais rápido possível.
No caso do meu antigo empregador, precisamos remover os servidores e suas unidades dos racks; leve-os para Orlando cerca de três horas ao norte de nós; construir um data center ad hoc em um quarto de hotel, completo com cabeamento CAT5 que corria pelo corredor até uma sala de conferências onde a equipe de desenvolvimento estava trabalhando para lançar o produto; e executar operações de lá, o que definitivamente não estava no plano.
Conforme você constrói, revisa, atualiza e testa sua estratégia de BC/DR, tenha um plano de backup para o caso de tudo acontecer. Isso irá acelerar o processo de recuperação, garantindo sua capacidade de colocar o negócio em funcionamento, mesmo nas piores circunstâncias.