Respaldo contra archivado
Conozca la diferencia entre las copias de seguridad y el archivado, sus características, y en casos aplica su uso dentro de las empresas.
Cuando se discute la diferencia entre las copias de seguridad y el archivado, probablemente deberíamos comenzar con la introducción de algunas definiciones generalmente aceptadas para los términos “respaldo” y “archivado”. Yo uso el calificativo “generalmente aceptado” porque en TI, la terminología no suele ser absoluta. Además, el mundo de las TI está lleno de personas inteligentes, y a las personas inteligentes les gusta discutir mucho.
Backup: Un respaldo se refiere a una copia de los datos que se puede utilizar para restaurar los originales en el caso de que este último se pierda o se dañe sin posibilidad de reparación. Es una garantía para los datos que se están utilizando.
Archivado: Un archivo se refiere a un solo documento o a una colección de documentos históricos, específicamente seleccionados para retención a largo plazo y futuras referencias. Por lo general son datos que ya no se se utilizan activamente.
Una de las diferencias dignas de mención en las descripciones anteriores, es que el respaldo es siempre una copia, mientras que un archivo debe ser el original que fue removido de su ubicación inicial y enviado a otro lugar para su retención a largo plazo.
Con frecuencia, el software de respaldo está configurado en un intento de cumplir ambas funciones. Los horarios de respaldo de datos a menudo incluyen copias diarias de seguridad incrementales que se mantienen durante siete días, una copia completa semanal que se mantiene durante un mes, una mensual completa que se mantiene durante un año, y por último, una copia anual que se conservará durante siete años. A los respaldos completos anuales a menudo se les llama archivos de siete años. El problema con ese esquema es que se hace muy difícil destacar archivos específicos para la retención a largo plazo en un trabajo entero de respaldo, por lo que un usuario de este método generalmente termina por tener que agrupar todo en un gran paquete “archivo”, lo cual es un respaldo completo. Algunos programas de correo electrónico permiten crear los llamados archivos desde el buzón de un usuario, pero todos terminan en un solo gran archivo (por ejemplo, un archivo PST para Exchange). Por lo tanto, recuperar un registro archivado puede llegar a ser una tarea desalentadora.
El ciclo de vida de las copias de seguridad
Cuando ya no necesitela copia de respaldo de un archivo, generalmente porque tenemos un número suficiente de copias de punto en el tiempo, simplemente borramos la copia más antigua o el trabajo de respaldo del cual el archivo es parte. Este paso suele estar automatizado para nosotros. Del mismo modo, cuando restauramos un archivo desde una copia de respaldo, sabemos lo que estamos buscando, y podemos optar por seleccionar una copia o versión de punto en el tiempo en función de un criterio de fecha.
Si los respaldos a largo plazo son utilizados en lugar de los archivos, las cosas pueden volverse mucho más complicadas. Aparte de satisfacer un requisito de cumplimiento legal o reglamentaria, los archivos se utilizan para liberar espacio de almacenamiento en disco primario (producción) de datos que ya no se utilizan activamente, pero se deben conservar. Mantener un trabajo de respaldo entero durante siete años, como en el ejemplo anterior, no es una forma muy rentable de utilizar el almacenamiento. Debido a que las copias de seguridad solo copian datos, el archivo original permanece en su lugar, lo que no libera espacio en absoluto. Además, el respaldo crea otra copia de los datos, lo que significa que ahora estamos utilizando el doble de espacio de almacenamiento que antes, a menos que los archivos se eliminen manualmente después del respaldo. Esto solo añade más sobrecarga a la administración de datos.
Además, debido a que una gran cantidad de respaldos se organizan en una secuencia (por ejemplo, completas e incrementales), una copia de seguridad completa tiene que ser potencialmente sacada fuera de secuencia para capturar la deseada copia completa de punto en el tiempo de un archivo. El día 3 de una secuencia de respaldo incremental sería inútil sin los anteriores respaldos completos e incrementales.
Los archivos
Una manera en que el software de archivado es diferente del software de respaldo es la capacidad de catalogación y búsqueda. Los metadatos sobre los objetos archivados se almacenan en una base de datos, y se les puede buscar con base en criterios proporcionados por el usuario. Algunos productos de software de respaldo también ofrecen capacidades básicas de archivado, donde los archivos pueden ser archivados, en forma individual o en grupos, y retenidos independientemente de las copias de respaldo. Los objetos archivados pueden ser nombrados o etiquetados en función del tipo de datos, la fecha, la propiedad o cualquier otro criterio de búsqueda que se considere apropiado para facilitar el proceso de búsqueda para futuras referencias.
Sin embargo, para las organizaciones que generan y manejan grandes volúmenes de archivos, como el correo electrónico, datos de imagen, etc., la capacidad de crear una simple etiqueta de búsqueda ya no es suficiente. Se requiere soluciones de archivado más sofisticadas, que proporcionen capacidades de búsqueda basadas en contenido, propiedad, etc. Imagínese tratando de encontrar el registro de un paciente de 5 años de antigüedad, o la transcripción de un caso judicial utilizando el asistente de búsqueda de su software de respaldo.
Otro de los retos con los archivos que el software de respaldo simplemente no puede manejar es la naturaleza estática de los datos archivados viejos contra la tecnología muy dinámica utilizada para acceder a esos mismos datos. Por mucho que los proveedores de software tratan de mantener la compatibilidad hacia atrás con algunas aplicaciones, los datos eventualmente envejecen hasta un punto en que ya no pueden ser accesibles fácilmente o de manera útil con la última versión de una aplicación. Algunas soluciones de archivado sofisticadas han integrado capacidades de conversión para permitir acceso futuro a ciertos datos utilizando un formato más universal. Un ejemplo sería la conversión de informes a formato PDF, que permite el acceso futuro a dichos informes, sin necesidad de la aplicación que los creó. Los documentos archivados se mantienen típicamente “tal cual” y no son modificables.
Así, un archivo en realidad no es una copia de respaldo que se mantiene durante mucho tiempo. También podemos añadir que el uso de software de respaldo para producir grandes cantidades de archivos que se puede necesitar buscar (en el caso del descubrimiento legal) es una mala idea.
Sobre el autor: Pierre Dorion es el Director del Área de Centro de Datos y consultor senior en Long View Systems Inc., y se especializa en las áreas de continuidad del negocio y servicios de planificación de recuperación de desastres y protección de datos corporativos.