Alternativas a RAID: ¿Será reemplazado por los códigos de borrado?
Estudios recientes han establecido dos cosas acerca de los datos almacenados en conjuntos de discos magnéticos RAID que sugieren que no son tan confiables como antes se creía.
Estudios empíricos recientes han establecido dos cosas acerca de los datos almacenados en conjuntos de discos magnéticos RAID que sugieren que no son tan confiables como antes se creía, y pueden dar lugar a la utilización de alternativas para RAID.
En primer lugar, las unidades fallan con mucha más frecuencia de lo que se pensaba –tal vez hasta 1,500 veces más frecuentemente de lo que el tiempo estimado por el proveedor en sus estadísticas de fallas podría sugerir. Por extensión, la frecuencia de fallo del disco pone a los conjuntos RAID en un alto riesgo de varios fallos de unidad simultáneos que pueden comprometer la uber-disco que crea RAID.
En segundo lugar, muchos estudios han confirmado que los errores de bits, el deterioro de los bits y eventos de corrupción silenciosa –problemas que pueden introducir errores al momento en que los datos se escriben en el disco magnético o, alternativamente, a la degradación de la integridad de los bits en el tiempo– plantea un mucho mayor desafío a la integridad de datos en arreglos RAID de lo que se pensaba. Los bits dañados pueden tener un impacto limitado en los archivos individuales, pero si se producen en el lugar equivocado, pueden acabar con un grupo RAID completo.
Algunos vendedores RAID han tratado de minimizar la importancia de estos factores, pero con unidades de alta capacidad que tienen largos tiempos de reconstrucción si falla la unidad RAID, entonces RAID puede convertirse en parte del problema de la disponibilidad de los datos, en lugar de ser parte de la solución.
Esto ha influido en la introducción de una serie de técnicas RAID propietarias, que no forman parte de los cinco esquemas originales (seis, si no se cuenta a RAID en absoluto) descritas en un documento de 1987 de la Universidad de California, en Berkeley.
Las técnicas anteriores a RAID, como la codificación de borrado, han vuelto a generar discusiones de la arquitectura de matriz de almacenamiento. En algunos casos, RAID se está reconsiderando como una técnica aplicada a los sistemas de almacenamiento que dejan sus datos a través de una rejilla en lugar de hacerlo en franjas en pistas concéntricas. Ahora, las alternativas a RAID han tomado el centro del escenario, en parte sobre la base de la ingeniería y la evangelización de los proveedores de almacenamiento establecidos, desde NEC hasta Hitachi Data Systems (HDS) y los recién llegados, como Amplidata y Cleversafe.
La codificación de borrado fue concebida originalmente como un medio para proteger los datos transmitidos a través de canales o redes no confiables. Los códigos de borrado expanden los datos, haciendo que los datos sean redundantes internamente para que puedan ser reconstruidos a partir de la porción restante, incluso si parte de los datos transmitidos se pierde. La tecnología BitSpread de Amplidata propone hacer lo mismo. En pocas palabras, la tecnología BitSpread toma los datos de entrada, los convierte en un objeto binario y luego aplica algoritmos para generar un número configurable de fragmentos de objetos de reconstrucción. Estos fragmentos se dispersan a través del objetivo de almacenamiento –una rejilla (grid), en el caso de Amplidata. Si no se encuentra ningún dato corrupto dentro de lo que fue codificado, puede ser reconstruido rápidamente mediante la localización de los dos fragmentos de objetos y la aplicación de un algoritmo de reconstrucción.
Mientras Amplidata promueve su tecnología como un reemplazo al por mayor de RAID, algunos vendedores se resisten a entrar a la discusión en términos de “esto-o lo otro”. NetApp, por ejemplo, considera que las solicitudes de codificación de borrado, como archivo profundo y otras, son técnicas RAID mejoradas, aprovechando el clustering de alta disponibilidad, los datos y la información de paridad de dispersión y paralelización de hardware.
NetApp ha argumentado que algunos algoritmos utilizados por la tecnología de codificación de borrado implican cómputo más intensivo que RAID, e imponen una mayor carga de procesamiento que se muestra como un lento desempeño del almacenamiento. El clustering de alta disponibilidad con failover, dicen, es una forma efectiva para mitigar el impacto de una falla del conjunto RAID y es mucho más rápido que el borrado de codificación como un medio para "recuperar" la disponibilidad de datos.
Hu Yoshida, vicepresidente y director de tecnología de HDS, ha sugerido que el RAID 6 (preferido por HDS en sus plataformas) utiliza la paridad redundante, generando tolerancia a fallos de doble disco, pero reconoce que las futuras densidades de unidad con el tiempo producirán tres o más fallos en el disco en un conjunto RAID, lo que requiere un reemplazo para RAID.
Por lo tanto, ¿las alternativas RAID, tales como la codificación de borrado y almacenamiento de red, sustituirán esta técnica? Mucho depende de los gastos de tecnología de sustitución y el desarrollo de normas que pueden contener los costos asociados con la protección de datos que RAID ha efectuado por cerca de 30 a 40 años (si contamos desde la primera técnica proto-RAID, patentada por IBM en 1977).