Qué hacer cuando un plan de BC/DR va mal
Pruebas insuficientes o no saber qué esperar podría dar lugar a un plan de continuidad empresarial fallido. Afortunadamente, hay pasos que puede tomar si su planificación de continuidad de negocios o recuperación de desastres se arruina.
Incluso en las mejores circunstancias de recuperación, siempre existe la posibilidad de que algo salga mal. No importa cuán minuciosa sea su planificación, o cuántos escenarios haya imaginado, no hay garantía de que todo saldrá de acuerdo con el plan.
Solía trabajar para una compañía de software en el sur de la Florida, justo en el medio de un "callejón de huracanes", ese cálido tramo del Océano Atlántico donde se forman los huracanes, crecen en fuerza y finalmente llegan a tierra. La compañía tenía un sólido plan de continuidad de negocios y recuperación de desastres: el "fútbol nuclear", como lo llamábamos con cariño. Era un plan muy detallado de BC/DR sobre cómo la empresa se recuperaría de la pérdida de datos, aplicaciones, sistemas y operaciones. Estábamos listos para lo que un huracán pudiera lanzarnos, o eso pensábamos.
Luego, un huracán azotó una semana antes del lanzamiento de un software importante. Las consecuencias fueron una comedia de errores, nuestro plan de BC/DR nunca tuvo una oportunidad.
El edificio perdió poder. No hay problema, el edificio tiene un generador. Luego descubrimos que la administración del edificio olvidó comprar gas diesel para el generador. Bueno. Iremos a comprar diesel a una compañía de gas en el puerto. Resulta que la compañía que proporcionó el combustible diesel no tenía el combustible sin plomo necesario para hacer funcionar las bombas diesel para entregar el combustible que salva el negocio que necesitábamos desesperadamente. Todo el sur de la Florida no tenía poder. Y en ese momento, la virtualización era muy nueva, por lo que no existía la idea de tener máquinas virtuales replicadas en la infraestructura basada en la nube. Así que no había energía, ni infraestructura y teníamos un lanzamiento de producto en una semana.
Estábamos fastidiados.
Cómo BC/DR puede salir mal
Tal vez no enfrentará un desastre en la magnitud de la mencionada anteriormente, pero siempre existe la posibilidad de que los pasos de recuperación que cree que harán que la organización vuelva a un estado de operación no funcionen por varias razones:
- Falta de planificación. Su estrategia BC/DR debe incluir cada último detalle de recuperación, proceso y contingencia. Si su plan no tiene en cuenta los escenarios de desastre específicos, y proporciona los pasos de recuperación necesarios para que pueda comenzar a operar, las cosas pueden ir mal para usted rápidamente.
- Falta de pruebas. Una vez me dijeron que un plan de BC/DR no vale la pena en el papel en el que está impreso. Sin probar realmente el plan, esa afirmación es 100% cierta. Por ejemplo, si planea recuperarse en la nube, no solo debe probar la recuperación allí, sino también las operaciones en un estado de conmutación por error, así como la recuperación de fallos. Sin pruebas, su plan es solo una muy buena idea no probada.
- Falta de resultados. Incluso con un plan que se prueba trimestralmente, aún no sabe con certeza si las copias de seguridad más recientes son buenas o son consistentes con las copias de seguridad de las aplicaciones y servicios dependientes. Así que todavía es posible ver que los esfuerzos de recuperación terminen con un resultado inesperado.
- Simplemente no estar preparado. Al igual que mi experiencia con huracanes, puede haber un escenario de desastre que simplemente no puede planear. Soy un gran fan de tener un plan de BC/DR que no solo cubra cómo abordar la recuperación de un conjunto dado de sistemas y aplicaciones. Me gusta la idea de tener planes específicos para abordar escenarios de desastre específicos. La recuperación de un sistema operativo corrupto es muy diferente del proceso de recuperación cuando el edificio se quema.
Cuando un plan de BC/DR falla
Piense en el resto de este artículo como una especie de plantilla de respuesta a incidentes. Es decir, en el caso de que su plan de BC/DR falle, usted tiene un plan de respaldo (de alguna forma intencional) para sacarlo de la situación en la que se encuentra.
Los problemas con la planificación de BC/DR pueden generar pérdidas operativas y financieras para una organización.
Los siguientes tres pasos proporcionan una descripción general de dónde debe estar su cabeza:
- En teoría, debería tener esto hecho. Es necesaria una lista de los sistemas que son más críticos para la operación en orden de prioridad, para que pueda concentrar sus esfuerzos en las aplicaciones, servicios, sistemas y datos que tendrán el mayor impacto positivo en el negocio.
- Dadas las circunstancias actuales de su desastre, debe determinar sus opciones. ¿Cuál es la forma más rápida de recuperarse? ¿Necesita trabajar con un socio de recuperación con infraestructura basada en la nube? ¿Tiene una ubicación alternativa? Cualquiera que sea la barrera para la recuperación, debe formular rápidamente una estrategia de cómo simplemente va a hacer que la recuperación se realice.
- Ya está tarde. Su plan fracasó, ha necesitado dedicar tiempo a la priorización y a averiguar cómo y dónde recuperarse. Si tiene un nuevo plan de contingencia aprobado por el equipo ejecutivo, muévase. Es probable que ese mismo equipo ejecutivo pueda calcular la cantidad de ingresos que la empresa está perdiendo por cada minuto que lleva su recuperación. Aumente el ritmo y trabaje con urgencia para recuperarse lo más rápido posible.
En el caso de mi antiguo empleador, necesitamos extraer los servidores y sus unidades de los racks; llevarlos a Orlando unas tres horas al norte de nosotros; construir un centro de datos ad hoc en una habitación de hotel, completo con el cableado CAT5 que se extendía por el pasillo a una sala de conferencias donde el equipo de desarrollo estaba trabajando para hacer el lanzamiento del producto; y ejecutar operaciones desde allí, algo que definitivamente no estaba en el plan.
A medida que construya, revise, actualice y pruebe su estrategia de BC/DR, tenga un plan alternativo en caso de que se desate un infierno. Si lo hace, acelerará el proceso de recuperación, asegurando su capacidad para poner en marcha el negocio y operarlo, incluso en las peores circunstancias.