kentoh - Fotolia
Tipos de copias de seguridad explicados: incremental, diferencial o de espejo
Existen diferentes tipos de copia de seguridad o respaldo. Aquí le ofrecemos algunos consejos para salvaguardar sus datos y recuperarse adecuadamente de un evento en caso de un incidente.
Proteger los datos contra la pérdida, el deterioro, las catástrofes (naturales o por obra del hombre) y demás problemas es una de las máximas prioridades de las empresas de informática. Conceptualmente, las ideas son sencillas, aunque puede resultar difícil implantar un conjunto de operaciones de respaldo eficiente y efectivo.
Durante las últimas décadas, el término backup se ha convertido en sinónimo de protección de datos, y se puede llevar a cabo mediante diversos métodos. Se han desarrollado aplicaciones de software de respaldocopia de seguridad para reducir la complejidad de la ejecución de operaciones de respaldo y restauración. Hacer copias de seguridad de los datos sólo es una parte de un plan de protección contra los desastres, y si el proceso no se diseña y somete a prueba concienzudamente, es posible que no proporcione el nivel de capacidades de recuperación de desastres y de protección de datos deseado.
Las aplicaciones de copia de seguridad han ofrecido, durante mucho tiempo, distintos tipos de operaciones de respaldo. Los tipos de backup más corrientes son el respaldo completo, el incremental y el diferencial. Existen otros tipos de backup, como el backup completo sintético o la copia en espejo, así como la protección de datos continua (CDP).
En el debate sobre las copias de seguridad en la nube contra el respaldo local, existen algunos tipos de backup que funcionan mejor en ciertas ubicaciones. Si usted trabaja con copias de seguridad en la nube, los respaldos incrementales generalmente son más adecuados porque consumen menos recursos. Tal vez deba empezar con una copia de seguridad completa en la nube y después hacer respaldos incrementales. El respaldo de espejo suele funcionar mejor para copias de seguridad en las instalaciones porque frecuentemente implica el uso de discos.
Backups completos
El tipo de operación de backup más básico y completo es el backup completo. Como su propio nombre indica, este tipo de respaldo copia la totalidad de los datos en otro juego de soportes, que puede consistir en cintas o discos. La ventaja principal de la realización de un backup completo en cada operación es que se dispone de la totalidad de los datos en un único conjunto. Esto permite restaurar los datos en un tiempo mínimo, lo cual se mide en términos de objetivo de tiempo de recuperación (RTO). No obstante, el inconveniente es que lleva más tiempo realizar un respaldo completo que de otros tipos (a veces se multiplica por un factor 10 o más), y requiere más espacio de almacenamiento.
Por lo tanto, sólo se suelen realizar backups completos periódicamente. Los centros de datos que manejan un volumen de datos (o de aplicaciones críticas) reducido pueden optar por realizar un backup completo cada día, o más a menudo aún en ciertos casos. Lo normal es que en las operaciones de respaldo se combine la copia de seguridad completa con backups incrementales o diferenciales.
Backups incrementales
Una operación de respaldo incremental sólo copia los datos que han variado desde la última operación de backup de cualquier tipo. Se suele utilizar la hora y fecha de modificación estampada en los archivos, comparándola con la hora y fecha de la última copia de seguridad. Las aplicaciones de respaldo identifican y registran la fecha y hora de realización de las operaciones de respaldo para identificar los archivos modificados desde esas operaciones.
Como un backup incremental sólo copia los datos a partir del último respaldo de cualquier tipo, se puede ejecutar tantas veces como se desee, pues sólo guarda los cambios más recientes. La ventaja de un backup incremental es que copia una menor cantidad de datos que un respaldo completo. Por ello, esas operaciones se realizan más deprisa y exigen menos espacio para almacenar la copia de seguridad.
Backups diferenciales
Una operación de backup diferencial es similar a un respaldo incremental la primera vez que se lleva a cabo, pues copiará todos los datos que hayan cambiado desde la copia de seguridad anterior. Sin embargo, cada vez que se vuelva a ejecutar, seguirá copiando todos los datos que hayan cambiado desde el respaldo completo anterior. Por lo tanto, en las operaciones subsiguientes almacenará más datos que un backup incremental, aunque normalmente muchos menos que un backup completo. Además, la ejecución de los respaldos diferenciales requiere más espacio y tiempo que la de los incrementales, pero menos que la de los completos.
Cada tipo de respaldo funciona de forma diferente. Una organización debe realizar una copia de seguridad completa al menos una vez. Después, se puede realizar otro respaldo completo, incremental o diferencial. El primer backup parcial realizado, ya sea diferencial o incremental, guardará los mismos datos. En la tercera operación de respaldo, los datos copiados con una copia incremental se limitan a los cambios desde el último respaldo incremental. En cambio, el tercer backup con respaldo diferencial copiará todos los cambios desde el primer backup completo (Respaldo 1).
A partir de estos tres tipos de backup principales, se puede definir una estrategia propia para la protección de datos. Normalmente se utiliza uno de los enfoques siguientes:
- Completo diario
- Completo semanal + Diferencial diario
- Completo semanal + Incremental diario
En la elección de la estrategia de backup óptima hay que sopesar numerosas consideraciones. Normalmente, cada alternativa y opción estratégica tiene sus ventajas e inconvenientes en términos de rendimiento, niveles de protección de los datos, cantidad total de datos conservados, y costo.
A continuación se indican las necesidades típicas de capacidad y soportes de recuperación de tres estrategias de backup. Esos cálculos se basan en un volumen total de datos de 20 TB, con una variación diaria del 5% de los datos, y sin incremento del almacenamiento total durante el periodo considerado. Los cálculos se basan en un supuesto de 22 días hábiles al mes y de un periodo de conservación de los datos de un mes.
Impacto de las estrategias de respaldo en las necesidades de espacio
Escenarios comunes de respaldo | Espacio promedio requerido para un mes (20 TB, con una variación diaria del 5%) |
Tipo de medio requerido para la recuperación |
Completo diario (días laborables) | Espacio para 22 backups diarios completos (22 * 20 TB) = 440.00 TB |
Backup más reciente solamente |
Completo (semanal) + Diferencial (días laborables) | Completos, más el diferencial más reciente desde el último completo (5 * 20 TB) + (22 * 5%* 20 TB) = 122 TB |
Completo más reciente + diferencial más reciente |
Completo (semanal) + Incremental (días laborables) | Completos, más todos los incrementales desde el último completo semanal (5 * 20 TB) + (22 * 5% * 20 TB) = 122.00 TB |
Completo más reciente + todos los incrementales desde el último completo |
Como se puede observar en la tabla, lo que más cantidad de espacio y más tiempo requiere es realizar un respaldo completo diario. Sin embargo, se dispone de más copias totales de los datos, y para realizar una operación de restauración hay que recurrir a menos soportes. Por ello, la implantación de esta política de backup presenta una mayor tolerancia a las catástrofes, y ofrece la restauración más rápida, puesto que cualquier conjunto de datos necesarios se encontrará en un máximo de un conjunto de copias de seguridad.
Alternativamente, la realización de un backup completo semanal combinado con la ejecución de respaldos incrementales diarios ofrece la mayor rapidez de realización de las copias de seguridad en días laborables y utiliza la menor cantidad de espacio de almacenamiento. Sin embargo, se dispone de menos copias de los datos y la restauración lleva más tiempo, pues es posible que haya que utilizar hasta seis soportes para recuperar la información necesaria. Si se necesitan datos de la copia de seguridad de un miércoles, hay que recurrir a los conjuntos que contienen el backup completo del domingo, más los soportes que contienen los respaldos incrementales del lunes, el martes y el miércoles. Esto puede prolongar espectacularmente los tiempos de recuperación, y exige que cada copia funcione correctamente; un fallo en un juego de backup puede comprometer toda la restauración.
La ejecución de un backup completo semanal más respaldos diferenciales diarios ofrece resultados intermedios entre las otras alternativas. Concretamente, para restaurar los datos hacen falta más juegos de soportes de respaldo que con una política de backup diario completo, pero menos que con una política de backup diario incremental. Además, el tiempo de restauración es menor que cuando se utilizan respaldos diarios incrementales, y mayor que con respaldos diarios completos. Para restaurar los datos de un día concreto, hay que recurrir a un máximo de dos juegos de soportes, lo cual reduce el tiempo necesario para la recuperación y los problemas potenciales planteados por una copia de seguridad ilegible.
Backups de espejo
Un respaldo en espejo es comparable a una copia de seguridad completa. De acuerdo con un blog del vendedor Nakivo, "este tipo de respaldo crea una copia exacta del conjunto de datos, pero solamente se almacena la última versión de datos en el repositorio de los respaldos, sin rastro de las distintas versiones de los archivos." El respaldo es un espejo de la fuente de datos, de ahí su nombre. Todos los archivos diferentes se almacenan por separado, tal como se ubican en la fuente.
Uno de los beneficios del respaldo en espejo es un tiempo de recuperación veloz. También es fácil acceder a archivos individuales ya respaldados.
Sin embargo, una de las desventajas es la cantidad de espacio de almacenamiento que se requiere. Con tanto almacenamiento extra, las organizaciones deben estar conscientes del incremento en los costos y las necesidades de mantenimiento. Además, si hay un problema en el conjunto de la fuente de datos, como corrupción o borrado, la copia en espejo experimentará lo mismo. Como resultado, no es buena idea confiar en las copias de seguridad en espejo para todas sus necesidades de protección de datos, y sí se aconseja tener otros tipos de respaldo para los datos. Tal vez quiera seguir la regla 1-2-3 del respaldo, que incluye tres copias de datos en dos medios distintos, con una copia fuera de las instalaciones.
Un tipo específico de espejo, el espejo en discos (o disk mirroring) también se conoce como RAID 1. Este proceso replica datos a dos o más discos. El espejo en discos en una opción sólida para los datos que necesitan alta disponibilidad debido a un veloz tiempo de recuperación. También es útil para recuperación de desastres debido a su capacidad inmediata de conmutación por error, o failover. El espejo en discos requiere al menos dos unidades físicas. Si una unidad falla, la organización puede usar la copia en espejo. Si bien este método de respaldo en espejo ofrece protección completa de datos, también requiere una gran capacidad de almacenamiento.
Hagan lo correcto para su organización
En las organizaciones que tienen volúmenes de datos reducidos, la ejecución de un respaldo diario completo depara un alto nivel de protección sin gran costo adicional de espacio de almacenamiento. Para las entidades más grandes o con más datos, la mejor opción es la copia de seguridad completa semanal combinada con respaldos diarios incrementales o diferenciales. La utilización de copias diferenciales brinda un mayor nivel de protección de datos con tiempos de restauración más cortos en la mayor parte de los casos, con un pequeño incremento del volumen de almacenamiento. Por ese motivo, la utilización de una estrategia de backups completos semanales junto con respaldos diarios diferenciales es una buena opción para numerosas empresas.
La mayor parte de las opciones de respaldo avanzadas, como la copia completa sintética, la copia en espejo, el backup incremental inverso y CDP requieren que el destino del respaldo sea un almacenamiento en disco. Un backup completo sintético simplemente reconstruye la imagen de la copia completa utilizando todos los respaldos incrementales o el diferencial guardado en disco. A continuación, ese respaldo completo sintético se puede restaurar en cinta para su almacenamiento fuera de la sede, y la ventaja es que se reduce el tiempo de restauración. La copia en espejo consiste en copiar los datos almacenados en el disco de respaldo a otro juego de discos, y las copias incrementales inversas se utilizan para añadir soporte de backup de tipo incremental. Por último, la protección continua de datos permite un mayor número de puntos de restauración que las opciones de respaldo tradicionales.
A la hora de decidir el tipo de estrategia de respaldo, la cuestión es qué tipo de copia de seguridad utilizar, cuándo utilizar cada una de las opciones y cómo combinarlas con la realización de pruebas para cumplir los objetivos generales de costos comerciales, rendimiento y disponibilidad.
El propósito de la mayoría de las copias de seguridad es crear una copia de los datos de maner que un archivo o aplicación en particular puedan ser restaurados después de un incidente de borrado, corrupción o pérdida de datos. Por ello, el mecanismo de respaldo no es la meta sino el medio para conseguir el objetivo de proteger los datos. Realizar pruebas a los respaldos es tan importante como el proceso de respaldo y restauración de datos. Nuevamente, el punto de hacer las copias de seguridad es la restauración de los datos en un punto posterior en el tiempo. Sin pruebas periódicas, no es posible garantizar que se cumple con el objetivo de proteger los datos.