Tecnologías para la duplicación de datos y guía práctica sobre la recuperación de desastres
En esta guía práctica podrá aprender a elegir el mejor producto para realizar duplicados y conocerá tecnologías como la deduplicación de datos y los servidores virtuales que están cambiando la duplicación.
La duplicación de datos es el proceso que consiste en copiar datos desde un lugar a otro en una red de almacenamiento (SAN, storage area network), una red LAN o una red WAN local para tener varias copias actualizadas de los datos. En la recuperación ante desastres, la duplicación se produce normalmente entre una ubicación de almacenaje primario y una segunda ubicación externa.
La duplicación es una tecnología clave en la recuperación ante desastres y normalmente trabaja junto con la deduplicación, los servidores virtuales o la nube para desempeñar su función de recuperación ante desastres.
En esta guía práctica sobre la duplicación de datos y la recuperación ante desastres aprenderá a elegir el mejor producto de duplicación, las diferencias entre la duplicación de datos basada en el oDRenador central, en la matriz y en la red y conocerá nuevas tecnologías como la deduplicación de datos y los servidores virtuales que están cambiando la duplicación y la recuperación ante desastres.
TABLA DE CONTENIDOS DE LA GUÍA PRÁCTICA SOBRE LA DUPLICACIÓN DE DATOS Y LA TECNOLOGÍA DE RECUPERACIÓN ANTE DESASTRES
-Elegir un producto de duplicación para la recuperación ante desastres
-Duplicación basada en la matriz, en el oDRenador central y en la red
-Deduplicación de datos y duplicación de datos
-Servidores virtuales y duplicación de datos
-Almacenamiento en nube y duplicación de datos
ELEGIR UN PRODUCTO DE DUPLICACIÓN DE DATOS
Existen varios factores que determinan el tipo de producto de duplicación de datos que es mejor para una empresa. Existen dos tipos de productos de duplicación de datos: síncronos o asíncronos. La duplicación síncrona escribe datos en los sitios primario y secundario a la vez. Con la duplicación asíncrona hay un retraso antes de que los datos se escriban en el sitio secundario.
Ambos tipos tienen ventajas e inconvenientes. Mientras que los datos están siempre actualizados entre los sitios con la duplicación síncrona, es más cara que la duplicación asíncrona, introduce un elemento de latencia que ralentiza la aplicación primaria y sólo funciona con distancias de entre 50 y 300 km. La duplicación síncrona es la preferida para aplicaciones con objetivos de tiempo de recuperación bajos (RTO, Recovery Time Objective) que no pueden permitirse péDRida de datos.
Debido a que la duplicación asíncrona está diseñada para funcionar en largas distancias y necesita un ancho de banda menor, normalmente es una opción mejor para la recuperación ante desastres. Sin embargo, la duplicación asíncrona se arriesga a sufrir una péDRida de datos durante un apagón del sistema porque los datos en el dispositivo de destino no están actualizados con los datos de origen.
DUPLICACIÓN BASADA EN MATRICES, ODRENADORES CENTRALES Y REDES
Otro elemento diferenciador es el lugar donde se produce la duplicación. La duplicación tiene lugar en uno de estos tres lugares: en la matriz de almacenamiento, en el host (servidor) o en la red. La mayoría de las duplicaciones se producen todavía en la matriz, aunque esto está cambiando a medida que mejoran las opciones basadas en el host y en la red.
Duplicación basada en la matriz: La mayoría de los distribuidores de almacenamiento de datos para las empresas incluyen el software para la duplicación en sus matrices de almacenamiento de gama alta y media. Entre ellos se incluyen la duplicación incorporada de Dell EqualLogic; Symmetrix Remote Data Facility (SDRF) para las matrices de alta gama de EMC Corp., EMC MirrorView para las matrices de gama media Clariion de EMC; Hewlett-PackaDR (HP) Co. StorageWorks XP Continuous Access para las matrices HP XP y Continuous Access EVA para las matrices de gama media de HP; Hitachi Data Systems (HDS) Universal Replicator para la duplicación asíncrona y TrueCopy para la duplicación asíncrona; IBM Corp. Global Mirror para la duplicación asíncrona e IBM Metro Mirror para la duplicación síncrona.
El principal inconveniente de una duplicación basada en la matriz es que no existe una admisión heterogénea. Excepto Hitachi Data Systems, que admite el almacenamiento de otros distribuidores con sus sistemas USP V, el software de un distribuidor sólo admite la duplicación entre las matrices iguales. EMC ni siquiera permite la réplica entre su sistema de alta gama Symmetrix y su sistema de gama media Clariion.
Duplicación basada en el host: El software de duplicación basado en host se ejecuta en servidores estándar, por lo que es la forma más barata y más fácil de duplicación a la hora de gestionarla. Sin embargo, pone a prueba la CPU del servidor. Entre los productos de duplicación basados en host se incluyen CA XOsoft, Double-Take Software, InMage System Scout, Neverfail y SteelEye Data Replication. Las aplicaciones de copia de seguridad de datos suelen incluir opciones basadas en host, como Real-Time Data Protector de BakBone, CommVault Continuous Data Replication (CDR), EMC RepliStor y Symantec Corp. Backup Exec Continuous Protection Server (CPS) para NetBackup.
Duplicación basada en la red: La duplicación en la red requiere un dispositivo adicional, ya sea un conmutador inteligente o una aplicación en línea como IBM SAN Volume Controller (SVC) o StoreAge Storage Virtualization Manager (SVM) de LSI Corp. Entre el software de duplicación que se ejecuta en conmutadores inteligentes se incluye EMC RecoverPoint y FalconStor Continuous Data Protector (CDP).
La duplicación basada en las matrices de discos normalmente duplica sólo entre el mismo tipo de matriz, mientras que la duplicación basada en la red y la basada en las matrices funciona en todas las plataformas de almacenaje. Otra diferencia es que la duplicación basada en host sólo admite la duplicación asíncrona, mientras que la duplicación basada en la matriz y en la red puede ser asíncrona o síncrona.
DEDUPLICACIÓN Y DUPLICACIÓN DE DATOS
La deduplicación de datos -- la tecnología más moderna para realizar copias de seguridad de datos hoy en día -- suele combinarse con la duplicación con propósitos de recuperación ante desastres. La deduplicación disminuye la cantidad de datos que se duplican y reduce el requisito de ancho de banda para copiar datos externos.
Los distribuidores más importantes de deduplicación como EMC/Data Domain, FalconStor Software, IBM/Diligent, Quantum Corp. y Sepaton Inc. han añadido o ampliado sus capacidades de duplicación este año.
Existen algunos inconvenientes en la combinación deduplicación/duplicación. La deduplicación en línea, que se produce mientras los datos se escriben en el disco, puede tener cierto impacto en el rendimiento de la copia de seguridad. La deduplicación es posterior al proceso, se produce cuando se termina la copia de seguridad, por lo que puede retrasar la duplicación. Aún así, los datos deduplicados y duplicados de forma externa pueden recuperarse mucho más rápido que los datos que se copian en copias de seguridad en cintas y se almacenan de forma externa para una recuperación ante desastres.
Los dispositivos de optimización de redes WAN como los de Cisco Systems, Blue Coat Systems, Riverbed Technology y Silver Peak Systems también utilizan la deduplicación de datos a la hora de complementar la duplicación en la red WAN para la recuperación ante desastres.
SERVIDORES VIRTUALES Y DUPLICACIÓN DE DATOS
La virtualización del servidor es un controlador para la recuperación ante desastres porque la virtualización reduce el número de servidores necesarios en un sitio de recuperación de desastres. Los servidores virtuales se almacenan como archivos o imágenes de máquinas virtuales en el oDRenador central y pueden moverse copiando el archivo de la imagen de la máquina virtual y cargándolo en otro oDRenador central mientras que para los servidores físicos es necesario el mismo haDRware en el sitio de recuperación ante desastres.
Entre las herramientas para la duplicación de máquinas virtuales se incluyen PHD Virtual esXpress, Vizioncore vReplicator o VMware Site Recovery Manager -- si su matriz lo admite -- o herramientas incorporadas en aplicaciones como Oracle que duplican datos entre servidores.
ALMACENAMIENTO EN NUBE Y DUPLICACIÓN DE DATOS
La nube también se adapta a la duplicación porque puede eliminar costes y complejidad en la recuperación ante desastres. Elimina la necesidad de adquirir y gestionar una ubicación externa.
La duplicación basada en host suele ser la mejor opción para la recuperación ante desastres a través de la nube porque las duplicaciones basadas en la matriz y en la red necesitan dispositivos en las ubicaciones de origen y de destino. La duplicación basada en host le permite mover datos desde servidores estándar en su entorno a servidores externos del proveedor.