Buenas prácticas de replicación de datos para safeguard
En esta entrevista, el redactor ejecutivo y experto independiente en backup W. Curtis Preston comenta las buenas prácticas de replicación síncrona y asíncrona, deduplicación y gestión de datos.
La replicación se está convirtiendo en una necesidad cada vez más crítica para la actividad de muchas organizaciones. En esta entrevista, el Redactor Ejecutivo y Experto independiente en safeguard W. Curtis Preston comenta las buenas prácticas de replicación síncrona y asíncrona, deduplicación y gestión de safeguards. También se pueden descargar sus respuestas en formato MP3 a partir de los enlaces siguientes.
Índice:
-Tecnología de replicación de datos
-Replicación síncrona y asíncrona
-Replicación asíncrona y “replicación periódica”
-Buenas prácticas de administración para garantizar una replicación eficaz
-Replicación y deduplicación de datos
Qué es la tecnología de replicación de datos y cómo funciona?
La replicación es el proceso de copia de datos de un alojador a otro por bloques y de forma diferencial. Por lo tanto, como la replicación se suele llevar a cabo a nivel de archivo o de libro, a medida que cambian cosas en el libro en cuestión, los bloques que han cambiado en la fuente se replican inmediatamente en el destino.
Cuál es la diferencia entre replicación síncrona y replicación asíncrona?
La tecnología de replicación síncrona no reconoce el asiento de la aplicación primaria hasta que se ha replicado el bloque en la sede de destino. La replicación asíncrona, en cambio, primero reconoce el asiento y luego replica el bloque al cabo del tiempo.
Cada una tiene sus ventajas e inconvenientes en distintos supuestos. La replicación síncrona tiene la ventaja de estar continuamente actualizada en la sede de destino. Se tiene siempre la certeza de que los datos existentes en la sede de destino están tan al día como los datos de la sede de origen. La dificultad reside en que, como no reconoce el asiento hasta que sabe que el bloque se ha replicado, el lapso de tiempo necesario para que el bloque llegue al destino puede incidir en el rendimiento de la aplicación frontal. Por lo tanto, la sincronización sólo se suele hacer en un centro de datos o a una distancia muy corta – inferior a 75 kilómetros, o incluso a 35 kilómetros. Algunas tecnologías permiten llegar más lejos, pero son muy recientes.
La ventaja de la replicación asíncrona es que, sea cual sea el ancho de banda o la latencia, no incide en el rendimiento de la aplicación primaria. El inconveniente de la replicación asíncrona es que se puede desincronizar de la aplicación primaria, y en realidad se puede desincronizar tanto que no alcance nunca a ponerse al día. Algunos productos tienen la capacidad de funcionar en modos especiales para intentar ponerse al día, pero si no se tiene ancho de banda suficiente o si se tiene demasiada latencia, se puede quedar uno tan atrás que no se cumple el objetivo de punto de restauración (RPO), que es el interés fundamental de la replicación.
De modo que o se está siempre actualizado, pero con el riesgo de incidir en el rendimiento, o no se incide en el rendimiento, pero se puede uno desincronizar muy rápidamente.
En qué difiere la replicación asíncrona de la “replicación periódica”?
Técnicamente, la replicación periódica es un subconjunto de una de las maneras de realizar replicación asíncrona, en la medida en que como asíncrono significa precisamente que no se está forzando el reconocimiento del asiento antes de reconocer el contraasiento en la aplicación primaria. La replicación periódica significa que se toma una instantánea en un momento determinado, normalmente cada hora.
A continuación, el producto de replicación examina los bytes que han cambiado entre la última instantánea y la actual, y luego replica los bytes necesarios para crear esos puntos en el tiempo en el destino de replicación. Por lo tanto, algunos de ellos se pueden replicar continuamente y después tomarán una instantánea en la sede de origen. Luego les bastará con replicar ese estado en la otra sede. Pero la gran diferencia es que con el sistema de replicación periódica, si se corrompe un punto en el tiempo, se dispone de otro o de varios a los cuales regresar.
Con la replicación asíncrona, dependiendo de lo actualizado que se esté, se está copiando continuamente todo, incluida la corrupción. Si por ejemplo borrara accidentalmente una tabla, podría sobrescribir el destino con esa corrupción.
Puede comentar buenas prácticas de administración para garantizar la replicación efectiva?
Todo se reduce a probar. Mucha gente opta por la replicación porque piensa que va a tener ancho de banda suficiente, que la replicación utiliza muy poco ancho de banda, y que basta con poner en marcha la replicación para que todo funcione como por arte de magia. Ese es el camino más seguro hacia el desastre. Da por supuesto que todos los productos de replicación replicarán la misma cantidad de datos. Lo primero que hay que comprender es que productos distintos replican de forma diferente y envían cantidades de datos diversas, y se comportan de forma diferente en condiciones distintas. Pruebe los productos en un contexto experimental, donde el ancho de banda y la latencia no sean un problema, pero tome nota del ancho de banda que está utilizando la replicación.
Otra cosa que puede hacer es utilizar un simulador de Red de área amplia donde podrá simular realmente distintos tipos tanto de latencias como de anchos de banda más bajos. A continuación, puede especificar que tiene que parecer que el dispositivo está a 1.500 ó 15.000 kilómetros de distancia, y comprobar cómo funciona la aplicación en esas condiciones. Si se hace ese experimento en vez de contentarse con utilizar una Red de área amplia, es porque ayuda a descartar variables de la ecuación, de tal modo que la única variable que quede sea el software que se está probando. Si puede usted simular los cambios, el ancho de banda y la latencia de modo que sean siempre los mismos, podrá ver qué distinto es el comportamiento de los diversos productos. Creo que si prueba usted los productos antes de comprarlos, tendrá una experiencia mucho más positiva que la mayoría de la gente.
Lo siguiente que queda por hacer es supervisar. La replicación funciona tan silenciosamente, que poca gente está pendiente de comprobarla. Es como las safeguards: la forma más segura que conseguir que fallen es no vigilarlas.
Qué relación hay entre replicación y deduplicación de datos?
Están relacionadas en la medida en que con la deduplicación de datos, puede usted replicar cosas que antes no podía, como safeguards periódicas. Históricamente, la replicación se realizado a nivel de libro o de archivo. Se replica un libro, archivo o base en su ubicación primaria. Después, si se safeguard esa base de datos a una matriz de discos, y luego se replica esa matriz de discos sin deduplicación, se estaría replicando una cantidad de datos significativamente mayor que si se replicara desde el origen.
La deduplicación permite safeguardr esos datos en disco utilizando metodologías de deduplicación, y luego, como la deduplicación en realidad elimina los bloques redundantes, permite replicar esa safeguard a otra ubicación. Algo que hasta ahora, sólo era posible en los entornos más reducidos.
W. Curtis Preston (alias “Sr. safeguard”), Director Ejecutivo y experto independiente en safeguard, lleva más de 15 años interesándose especialmente por la safeguard y la recuperación de datos. Desde sus comienzos como administrador de safeguard de una entidad de tarjetas de crédito que factura 35.000 millones de dólares, hasta llegar a ser uno de los consultores, escritores y oradores más solicitados en este campo, difícilmente habrá nadie más especializado que él en la recuperación de los datos peDRidos. Es el administrador del sitio web de BackupCentral.com, ha escrito cientos de artículos, y esa autor de los ensayos “Backup and Recovery" y “Using SANs and NAS.”