Conceptos comunes de recuperación de desastres que debe conocer
Después de sufrir un desastre, usted estará mucho mejor preparado si tiene un mejor entendimiento de cómo volver a la normalidad.
Es importante que los usuarios y los administradores de TI protejan sus negocios de que algo salga mal. Pero incluso cuando usted cree que ha tomado todas las medidas preventivas adecuadas, el desastre puede ocurrir. Cuando suceda, esté listo. Tener un sólido plan de recuperación de desastres es la clave para lograr que su negocio vuelva a funcionar con poco o ningún tiempo de inactividad.
En el diseño de un plan, hay muchas cosas que considerar, como el tiempo, el costo y la seguridad. Aquí hay un puñado de términos de recuperación de desastres con los que debe estar familiarizado.
Recuperación de desastres
Primero lo primero, ¿qué es exactamente la recuperación de desastres? Es la parte del plan de seguridad que se encarga de proteger a una organización de un evento negativo. Ese acontecimiento negativo podría ser algo relacionado con el equipo o un virus, así como un desastre natural como un incendio o un terremoto. Un plan de recuperación de desastres es lo que las empresas utilizan para volver a la pista después de la catástrofe.
Se crea el plan para minimizar el efecto del evento negativo. Su objetivo debe ser limitar el efecto de la catástrofe y permitir que la empresa continúe de manera normal tan pronto como sea posible.
Conmutación por error, o failover
Un término que flota alrededor de la recuperación de desastres es la conmutación por error. Este concepto se refiere a un modo de operación de respaldo que se utiliza cuando el primario no está disponible. La conmutación por error es muy importante para los sistemas de misión crítica que necesitan funcionar constantemente y trabajar incluso después de un desastre.
Un sistema secundario toma el control de ciertos componentes, tales como un servidor, la red o un procesador, cuando el sistema primario se ha caído.
Objetivo de punto de recuperación
El objetivo de punto de recuperación (RPO) es la máxima cantidad de tiempo que puede tardar la recuperación de archivos del almacenamiento de las copias de seguridad para reanudar las operaciones de manera normal después de un desastre. El RPO también determina la frecuencia con la que se deben crear los archivos de copia de seguridad.
Si un archivo se le asignó un RPO de un día, entonces los archivos de copia de seguridad tendrían que ser hecho por lo menos una vez al día. Si el RPO dado fue de tres días, o de 72 horas, entonces los respaldos de ese archivo se deben crear en intervalos de 72 horas o menos.
Objetivo de tiempo de recuperación
Al igual que el RPO, el objetivo de tiempo de recuperación (RTO) es una parte vital de la recuperación de desastres. El RTO es la máxima cantidad de tiempo que una computadora, sistema, aplicación o red puede estar inactiva después de que ocurre un desastre o falla. Básicamente, es el tiempo deseado para que todo esté de nuevo en marcha después de que sucede un desastre.
Las empresas que necesitan estar de nuevo en marcha y funcionando más rápido necesitarán un RTO más corto, mientras que los que no tienen ninguna prisa pueden utilizar un RTO más largo. Los RTO varían entre las diferentes cargas de trabajo en una empresa, con aplicaciones más críticas que necesitan ser restauradas más rápido.
Réplica de Hyper-V
Una herramienta de recuperación de desastres que puede utilizar es Hyper-V Replica. Es una herramienta gratuita que se ofrece en Hyper-V 3.0 que crea y mantiene copias de las máquinas virtuales (VM). Si un desastre ocurre, los usuarios pueden usar la conmutación por error para replicar máquinas virtuales que Hyper-V Replica creó y continuar con sus asuntos cotidianos.
Dentro de Hyper-V Replica, un escritor VSS crea una instantánea de la máquina virtual en el host primario y se copia en el huésped secundario. Cuando sucede un desastre, el administrador tiene copias de las máquinas virtuales disponibles.
Gestión de la recuperación del site de VMware
Otra forma de proteger su medio ambiente es a través del uso del Administrador de Recuperación del Sitio vSphere de VMware (Site Recovery Manager). Esta herramienta proporciona pruebas automatizadas de recuperación de desastres y conmutación por error.
Las empresas quieren ser capaces de recuperarse rápidamente de un desastre virtual y la herramienta Site Recovery Manager (SRM) ofrece algunas opciones para que esto suceda. SRM puede priorizar el proceso de recuperación, seleccionando el orden en que las máquinas virtuales se reinician.