Tutorial RAID: cómo elegir el nivel RAID adecuado

Descubra cómo elegir un nivel RAID eficaz teniendo en cuenta el tipo de datos de sus aplicaciones, el nivel de relevancia de sus datos y el número de usuarios.

Los grupos RAID pueden parecer más complejos de lo que realmente son. Esto se debe a que, actualmente, hay aproximadamente 12 tipos o variedades distintas de RAID disponibles en el mercado (y aún son más las que se han desarrollado). Sin embargo, para la gran mayoría de pequeñas y medianas empresas (PyME), sólo hay seis niveles RAID realmente relevantes. Elegir el nivel RAID adecuado dependerá del tipo de datos de las aplicaciones, del nivel de relevancia de esos datos y del número de usuarios.

Antes de nada, es necesario tener algunos conocimientos básicos sobre lo que puede hacer cada uno de estos seis niveles RAID.

RAID 0

Una RAID 0 divide o reparte los datos entre todas las unidades del grupo RAID. La ventaja de la RAID 0 es que ofrece un mayor rendimiento de los datos. El inconveniente es que aunque carecer de redundancia mejora el rendimiento, cualquier fallo o avería en uno de los discos conlleva una pérdida total de los datos.

RAID 0 es la mejor opción cuando es primordial obtener un mayor rendimiento del almacenamiento, cuando el presupuesto es muy limitado y cuando una posible pérdida de los datos no supone mayor problema. Por ejemplo, algunos datos que funcionan bien en este nivel son los archivos temporales de edición de fotografía o vídeo.

RAID 1

Una RAID 1 duplica en espejo todos los datos de cada unidad de forma sincronizada a una unidad de duplicación exacta. Si se produce algún fallo o avería en alguna de las unidades, no se pierde ningún dato. La ventaja de utilizar una RAID 1 es disponer de un mayor rendimiento de lectura multiusuario, puesto que pueden leerse ambos discos al mismo tiempo. La desventaja es que el costo de la unidad de almacenamiento por byte usable se multiplica por dos, puesto que se necesitan dos unidades para almacenar los mismos datos.

Elija una RAID 1 para aplicaciones que requieran de una “red de seguridad” (es decir, cuando no pueda permitirse la posibilidad de que se pierdan o estropeen los datos de la aplicación) además de lecturas aleatorias de alto rendimiento. Un buen ejemplo para este tipo de RAID puede ser la base de datos de sólo lectura de una tienda de venta al por menor no virtual. Una RAID 1 también es una buena elección  para sistemas de nivel básico en los que sólo están disponibles dos unidades, como en el caso de un pequeño servidor de archivos.

RAID 10 (es decir, RAID 1+0 y RAID 0+1)

Una RAID 10 es la combinación de una RAID 0 y una RAID 1. La ventaja de utilizar una RAID 10 es disponer de la redundancia de la RAID 1 y del nivel de rendimiento de la RAID 0. El rendimiento del sistema durante la reconstrucción de una unidad también es sensiblemente superior en comparación con los niveles RAID basados en paridad (es decir, la RAID 5 y la RAID 6). Esto se debe al hecho de que los datos no necesitan realizar procesos de regeneración de la información de la paridad porque ésta se copia de la otra unidad replicada. El inconveniente es el costo, muy superior (normalmente, entre un 60 y un 80% más caro) al de los niveles RAID con paridad.

Hay dos tipos de RAID 10. El primero es la RAID 0+1, en la que se dividen los datos entre múltiples discos y, después, se duplican en espejo los discos distribuidos en un grupo de discos idéntico. La segunda clase es la RAID de nivel 1+0, que duplica en espejo los datos en los casos en los que las réplicas se han distribuido entre distintas unidades.

Debería decantarse por las RAID 10 cuando utilice aplicaciones que requieran del alto rendimiento de una RAID 0 y de la incomparable protección de los datos que ofrece una RAID 1. Las bases de datos transaccionales en línea suelen encajar en este perfil.

RAID 5

La RAID 5 está diseñada para ofrecer el nivel de rendimiento de una RAID 0 con una redundancia más económica y es el nivel RAID más habitual en la mayoría de empresas. Lo consigue distribuyendo bloques de datos entre distintas unidades y repartiendo la paridad entre ellas. No se dedica ningún disco a la paridad de forma exclusiva. Las ventajas de utilizar una RAID 5 consisten en poder realizar operaciones de lectura y escritura de forma solapada (es decir, en poder hacer un uso más eficiente de las unidades de disco), lo que acelera los pequeños procesos de escritura en un sistema multiprocesador y facilita una cantidad de almacenamiento usable superior al de la RAID 1 o 10 (dado que la redundancia acarrea una reducción del almacenamiento de, aproximadamente, el 20%, en vez del 50%). La protección de los datos reside en la información de la paridad que se utiliza para reconstruir los datos si una unidad del grupo RAID falla o sufre una avería. Entre los inconvenientes, se encuentran: la necesidad de un mínimo de tres (y, normalmente, cinco) discos por grupo RAID, un nivel de rendimiento del sistema de almacenamiento significativamente inferior mientras se lleva a cabo la reconstrucción de una unidad, y la posibilidad de peDRer totalmente los datos de un grupo RAID si falla una segunda unidad mientras se está realizando la reconstrucción de la primera. Además, el rendimiento de lectura suele ser inferior al de otras modalidades de RAID porque los datos de la paridad se distribuyen entre cada una de las unidades.

Debería decantarse por una RAID 5 para la gran mayoría de aplicaciones, siempre y cuando las unidades de disco no sean unidades SATA de gran capacidad. Las unidades SATA tienen ciclos de trabajo más cortos que las unidades SAS o de canal de fibra, e índices MTBF inferiores. Y, dado que las unidades SATA tienen una gran capacidad (de 500 a 1000 GB), los tiempos de reconstrucción son muy largos y conllevan una degradación del rendimiento del controlador. Las unidades SATA de gran capacidad también aumentan la probabilidad de que se produzca un fallo o avería en una segunda unidad, lo que ocasionaría una pérdida total de los datos.

RAID 6

La RAID 6 es similar a la RAID 5 e incluye un segundo sistema de paridad distribuido entre las unidades del grupo RAID. La ventaja de utilizar una RAID 6 es que la segunda paridad sirve de protección ante una posible péDRida de los datos en caso de que falle o se averíe una segunda unidad dentro del grupo RAID. Esto hace que las unidades SATA de gran capacidad sean más viables y económicas que la RAID 1 o la RAID 10. El inconveniente de utilizar una RAID 6 es que se obtiene un nivel de rendimiento del sistema de almacenamiento mucho menor cuando se está llevando a cabo la reconstrucción de dos unidades de forma simultánea (normalmente, por debajo del 20%).

Debería decantarse por una RAID 6 en el caso de unidades SATA de gran capacidad y aplicaciones que puedan tolerar un nivel de rendimiento reducido en ciertas ocasiones. Algunas aplicaciones que encajan en este perfil son los archivos de datos multimedia no dinámicos como los JPEGs y el vídeo en streaming.

RAID 50 (también conocida como RAID 5+0 y RAID 0+5)

La RAID 50 es la combinación de una RAID 0 y una RAID 5. Toma grupos RAID 5 y los distribuye como si fueran RAID 0, lo que aumenta el nivel de rendimiento. La ventaja de la RAID 50 es su mayor rendimiento en comparación con la RAID 5 estándar. Las desventajas son su mayor costo y que tiene menos capacidad usable.

Existen dos variedades de RAID 50. La RAID 0+5 utiliza múltiples grupos de RAID 5 distribuidos en un solo grupo RAID. Esto hace que la fiabilidad del grupo RAID aumente, ya que, ahora, puede tolerar que una unidad falle o se averíe en uno o en ambos conjuntos de RAID 5 sin que se pieDRan los datos. La RAID 5+0, la RAID 50 más habitual, toma grupos de RAID 5 y los distribuye como si fueran RAID 0. Debería decantarse por la RAID 50 para aplicaciones en las que sea importante el ahorro económico de las RAID 5 y en las que también se necesite un mejor rendimiento.

Sobre el autor: Marc Staimer es el Presidente y CDS de la empresa consultora Dragon Slayer Consulting en Beaverton (Oregón, E.U.). Es muy conocido por ser uno de los principales analistas de mercado en el ámbito de la gestión del almacenamiento y el almacenamiento en red.

Investigue más sobre Infraestructura empresarial y DC