Sergey Nivens - Fotolia
La replicación de la arquitectura hiperconvergente impacta el rendimiento
La replicación en una arquitectura hiperconvergente permite una movilidad de datos más flexible, pero la tecnología puede afectar el rendimiento y la capacidad disponible.
Uno de los componentes clave, si no el más importante, de una arquitectura hiperconvergente es cómo gestiona el almacenamiento. La mayoría de las arquitecturas hiperconvergentes crean un nuevo silo de almacenamiento que necesita ser manejado por separado de las otras infraestructuras de almacenamiento en el centro de datos. La infraestructura de almacenamiento con arquitectura hiperconvergente crea capacidad desde los dispositivos de almacenamiento internos de los servidores o nodos que forman parte del clúster del hipervisor. Comprender cómo cada tipo de arquitectura hiperconvergente gestiona el almacenamiento es fundamental para seleccionar la mejor para su entorno.
Dos de los aspectos más importantes de cualquier infraestructura de almacenamiento que soporta un entorno virtualizado son cómo va a proteger los datos y a permitir la movilidad de las máquinas virtuales (VM). Las arquitecturas hiperconvergentes no son diferentes. Estas arquitecturas protegen los datos a través de la replicación o la codificación de borrado. Este consejo discute el modelo de replicación, en el que los datos de una máquina virtual determinada se almacenan en el host físico en el que reside la máquina virtual y también se replican en otros hosts –normalmente dos o tres– a medida que cambia.
En un entorno hiperconvergente, la mayor ventaja de un modelo de replicación es su simplicidad. Los requisitos de CPU para copiar datos son mínimos, y conservar la CPU es crítico para una arquitectura que va a compartir el poder de CPU disponible entre una variedad de tareas.
El modelo de replicación también reduce los requisitos de red. Si bien puede generar una gran cantidad de tráfico durante las operaciones de escritura, prácticamente no requiere ancho de banda de red para la operación de lectura. El requisito de red rebajado se debe a que la mayoría del software de arquitectura hiperconvergente que aprovecha el modelo de replicación entiende la relación entre una máquina virtual y sus datos; siempre que sea posible, atenderá a leer I/O desde el nodo servidor donde está la máquina virtual.
Comprender la relación entre la VM y los datos conduce a un mejor rendimiento, ya que las lecturas son locales al servidor en el cual la máquina virtual se ejecuta. El rendimiento mejorado de VM es especialmente evidente si los productos hiperconvergentes utilizan almacenamiento flash de alto rendimiento, tales como PCI Express (PCIe) o módulos de memoria dual en línea Flash. Estos dispositivos aprovechan el bus PCIe o el bus de memoria para proporcionar muy baja latencia de acceso a los datos, eliminando la sobrecarga de red para que puedan alcanzar todo su potencial de rendimiento.
Desde el punto de vista de la movilidad, una arquitectura hiperconvergente que utiliza la replicación normalmente permitirá la migración de VM a cualquier otro host. Si el host de destino tiene los datos de la máquina virtual, los accederá de forma local como se explicó anteriormente. Si el host no tiene acceso a los datos, accederá a ellos a través de la red, mientras –o hasta que– los datos de VM se replican a nivel local hacia ese nuevo nodo de servidor.
Las desventajas de la replicación para su entorno hiperconvergente
La desventaja más evidente del modelo de replicación de arquitectura hiperconvergente es que el consumo de la capacidad aumenta en un factor de al menos dos, pero típicamente de tres. Esto significa que si el entorno es responsable de 25 TB de datos, los planificadores de TI necesitan 75 TB de capacidad para almacenar copias totalmente protegidas de cada máquina virtual.
Otra desventaja cuando una VM se migra a un host sin acceso local a los datos, es que todas las lecturas y escrituras tienen que ir a través de la red, lo que repercute negativamente en el rendimiento. Copiar los datos al nuevo host para que pueda tener acceso local a los datos de esa VM también impacta al rendimiento de red.
Por último, está el impacto potencial de un error de protección de datos. Por ejemplo, si el nivel de replicación se establece en tres y un nodo falla, el software de arquitectura hiperconvergente debe crear rápidamente una tercera copia para cumplir con la política de protección de datos, impactando aún más el rendimiento de la red. También hay cierta preocupación por el mantenimiento temporal. Por ejemplo, si un nodo de servidor tiene que ser bajado de forma temporal o reiniciado, ¿hay una manera de retrasar la política hasta que el nodo servidor esté de nuevo en línea?