RAID 5 vs. RAID 10

UNA RAID (matriz redundante de discos independientes) combina varias unidades físicas en un dispositivo de almacenamiento virtual que ofrece más almacenamiento y, en la mayoría de los casos, tolerancia a fallos para que los datos puedan recuperarse incluso si falla uno de los discos físicos.

Las configuraciones de RAID se organizan en niveles como RAID 0, RAID 1, RAID 5, RAID 6 y RAID 10. Los niveles de RAID del 0 al 6 se denominan niveles estándar. Las configuraciones RAID más comunes son RAID 0 (división, donde los datos se dividen en bloques almacenados en diferentes discos físicos), RAID 1 (reflejo, donde se guardan múltiples copias de datos en discos separados para redundancia), RAID 5 (paridad distribuida, que incluye trazado de franjas más información de paridad de almacenamiento para recuperación de errores, y RAID 6 (paridad dual).

Esta comparación mira a RAID 5 y RAID 10 en detalle.

Gráfica comparativa

Tabla de comparación de RAID 10 versus RAID 5
RAID 10RAID 5
Función clave Banda de espejos: combina raya y espejado para la tolerancia a fallas y el rendimiento. Franja con paridad
Rayas Sí; los datos se dividen (o se dividen) uniformemente en grupos de discos. Cada grupo tiene 2 discos que se configuran como imágenes de espejo entre sí. Así RAID 10 combina características de RAID 0 y RAID 1. Sí; los datos se dividen (o se dividen) uniformemente en todos los discos en la configuración RAID 5. Además de los datos, la información de paridad también se almacena (una vez) para que los datos puedan recuperarse si falla una de las unidades.
Reflejo, redundancia y tolerancia a fallos. Sí. La duplicación de datos hace que el sistema RAID 10 sea tolerante a fallos. Si falla una de las unidades, los datos se pueden reconstruir rápidamente simplemente copiando desde otros discos. Sin duplicación ni redundancia; la tolerancia a fallos se logra calculando y almacenando información de paridad. Puede tolerar el fallo de 1 disco físico..
Actuación Las lecturas son rápidas debido a las rayas. Las escrituras también son rápidas porque a pesar de que cada bloque de datos debe escribirse dos veces (duplicación), las escrituras ocurren en 2 unidades diferentes para que puedan ocurrir en paralelo. La información de paridad no necesita ser calculada. Lecturas rápidas debido a la división (datos distribuidos en muchos discos físicos). Las escrituras son un poco más lentas porque la información de paridad necesita ser calculada. Pero como la paridad se distribuye, 1 disco no se convierte en un cuello de botella (como lo hace en RAID 4).
Aplicaciones Cuando el rendimiento es importante para las lecturas y escrituras, y cuando es importante recuperarse del error rápidamente. Buen equilibrio de almacenamiento eficiente, rendimiento decente, resistencia a fallos y buena seguridad. RAID 5 es ideal para servidores de archivos y aplicaciones que tienen un número limitado de unidades de datos.
Número mínimo de discos físicos requeridos 4 3
Disco de paridad? No; la paridad / suma de comprobación no se calcula en una configuración RAID 10. La información de paridad se distribuye entre todos los discos físicos en el RAID. Si uno de los discos falla, la información de paridad se usa para recuperar los datos almacenados en esa unidad.
Ventajas Recuperación rápida de datos en caso de fallo del disco.. Lecturas rápidas; redundancia y tolerancia a fallos de bajo costo; se puede acceder a los datos (aunque a un ritmo más lento) incluso cuando una unidad fallida está en proceso de reconstrucción.
Desventajas La utilización del disco es solo del 50%, por lo que RAID 10 es una forma costosa de obtener redundancia de almacenamiento en comparación con el almacenamiento de información de paridad.. La recuperación de una falla es lenta debido a los cálculos de paridad involucrados en la restauración de datos y la reconstrucción de la unidad de reemplazo. Es posible leer desde el RAID mientras esto ocurre, pero las operaciones de lectura durante ese tiempo serán bastante lentas.

Contenido: RAID 5 vs RAID 10

  • 1 Configuración
    • 1.1 Configuración de RAID 0, RAID 1 y RAID 10
    • 1.2 configuración RAID 5
  • 2 Redundancia y tolerancia a fallos
    • 2.1 RAID 5
    • 2.2 RAID 10
  • 3 Rendimiento
  • 4 Pros y Contras
  • 5 aplicaciones
  • 6 referencias

Configuración

Configuración de RAID 0, RAID 1 y RAID 10

RAID 10 también se llama RAID 1 + 0 o RAID 1 & 0. Es un nivel RAID anidado, lo que significa que combina dos niveles RAID estándar: RAID 0 y RAID 1. Veamos las configuraciones de estos niveles RAID estándar, para que podamos entender cómo se construye RAID 10.

Almacenamiento de datos en una configuración RAID 0 Almacenamiento de datos en una configuración RAID 1

Como se muestra arriba, RAID 0 utiliza la distribución en bandas, es decir, los datos se dividen en bloques que se almacenan en varios discos. Esto aumenta considerablemente el rendimiento de lectura y escritura, ya que los datos se leen y escriben en paralelo en todos los discos. La desventaja de RAID 0 es que no hay redundancia o tolerancia a fallos. Si una de las unidades físicas falla, todos los datos se pierden.

RAID 1 resuelve la redundancia, por lo que si falla una de las unidades, es fácil reemplazarla copiando los datos de las unidades que aún funcionan. Sin embargo, la desventaja de RAID 1 es la velocidad porque no puede aprovechar el paralelismo que ofrece RAID 0.

Ahora que entendemos cómo funcionan RAID 0 y RAID 1, veamos cómo se configura RAID 10.

La configuración RAID 10 es una banda de espejos.

RAID 10, a.k.a. RAID 1 + 0 es una combinación de RAID 1 y RAID 0. Se configura como una banda de espejos. Los discos se dividen en grupos (generalmente dos); Los discos dentro de cada grupo son imágenes reflejadas entre sí, mientras que los datos se distribuyen en todos los grupos. Como necesita al menos dos grupos y cada grupo necesita al menos dos discos, el número mínimo de discos físicos necesarios para una configuración RAID 10 es 4.

Configuración RAID 5

Ahora echemos un vistazo a la configuración de RAID 5.

La configuración de RAID 5 utiliza la creación de bandas con paridad para proporcionar tolerancia a fallos. Los bloques de paridad se distribuyen en todos los discos. En la imagen, los bloques se agrupan por color para que pueda ver qué bloque de paridad está asociado con qué bloques de datos.

RAID 5 utiliza información de paridad, a diferencia de los niveles RAID 0, 1 y 10. Para cada combinación de bloques, que se almacenan en discos diferentes, se calcula y almacena un bloque de paridad. Cada bloque de paridad individual reside en un solo disco; sin embargo, los bloques de paridad se almacenan de forma rotatoria en todos los discos. es decir, no hay una unidad física dedicada solo para bloques de paridad (que es lo que sucede en RAID 4).

Teniendo en cuenta que los bloques de datos se dividen en al menos dos discos y el bloque de paridad se escribe en un disco separado, podemos ver que una configuración RAID 5 requiere al menos 3 unidades físicas.

Redundancia y tolerancia a fallos

Tanto RAID 5 como RAID 10 son tolerantes a fallos, es decir, los datos no se pierden incluso cuando falla uno o, en el caso de RAID 10, más de 1 de los discos físicos. Además, tanto RAID 5 como RAID 10 pueden utilizarse cuando se reemplaza el disco defectuoso. Esto se llama hot-swapping.

RAID 5

RAID 5 puede tolerar la falla de 1 disco. La información de datos y paridad almacenada en el disco fallido se puede recalcular utilizando los datos almacenados en los discos restantes.

De hecho, los datos son accesibles y las lecturas son posibles desde un RAID 5 incluso cuando una de las unidades ha fallado y se está reconstruyendo. Sin embargo, tales lecturas serán lentas porque parte del dato (la parte que estaba en la unidad con falla) se calcula a partir del bloque de paridad en lugar de simplemente leerse desde el disco. La recuperación de datos y la reconstrucción del disco de reemplazo también son lentas debido a la sobrecarga de calcular la paridad.

RAID 10

RAID 10 proporciona una excelente tolerancia a fallos, mucho mejor que RAID 5, debido a la redundancia del 100% incorporada en su diseño. En el ejemplo anterior, tanto el Disco 1 como el Disco 2 pueden fallar y los datos aún serían recuperables. Todos los discos dentro de un grupo RAID 1 de una configuración RAID 10 tendrían que fallar para que haya pérdida de datos. La probabilidad de que 2 discos en el mismo grupo falle es mucho más baja que la probabilidad de que dos discos en el RAID fallen. Es por eso que RAID 10 ofrece una mayor confiabilidad en comparación con RAID 5.

Recuperarse de una falla también es mucho más rápido y más fácil para RAID 10 porque los datos simplemente deben copiarse de los otros discos en el RAID. Los datos son accesibles durante la recuperación.

Actuación

RAID 10 ofrece un rendimiento fantástico para lecturas y escrituras aleatorias porque todas las operaciones se realizan en paralelo en unidades físicas separadas.

RAID 5 también ofrece un gran rendimiento de lectura debido a la creación de bandas. Sin embargo, las escrituras son más lentas debido a la sobrecarga de calcular la paridad.

Pros y contras

Tanto RAID 5 como RAID 10 son intercambiables en caliente, es decir, brindan la capacidad de continuar leyendo desde la matriz incluso cuando se reemplaza un disco defectuoso. Sin embargo, en el caso de RAID 5, tales lecturas son lentas debido a la sobrecarga del cálculo de paridad. Pero para RAID 10, tales lecturas son tan rápidas como lo son durante la operación normal.

Otras ventajas de RAID 10 son:

  • Muy rápido lee y escribe.
  • Recuperación muy rápida del fallo.
  • Más tolerante a fallas que RAID 5 porque RAID 10 puede tolerar fallas de varios discos al mismo tiempo.

Las desventajas de RAID 10 son:

  • Caro debido al almacenamiento ineficiente (50%, debido a la duplicación)

Las ventajas de RAID 5 incluyen:

  • Gran equilibrio de tolerancia a fallos, precio (eficiencia de almacenamiento) y rendimiento
  • Lecturas rápidas

Las desventajas de RAID 5 incluyen:

  • Recuperación lenta del fracaso
  • Solo se puede tolerar el fallo de 1 unidad en la matriz.

Aplicaciones

Teniendo en cuenta los pros y los contras, RAID 10 es útil en aplicaciones donde el rendimiento es importante no solo para las lecturas sino también para las escrituras. RAID 10 también es más adecuado que RAID 5 en aplicaciones donde es fundamental mantener el rendimiento durante la recuperación de errores cuando falla uno de los discos.

RAID 5 proporciona un equilibrio saludable de almacenamiento eficiente, rendimiento decente, resistencia a fallos y buena seguridad. Es la configuración RAID más popular para dispositivos NAS empresariales y servidores empresariales. RAID 5 es ideal para servidores de archivos y aplicaciones que tienen un número limitado de unidades de datos. Si el número de discos físicos en el RAID es muy grande, la probabilidad de que al menos uno de ellos falle es mayor. Así que un RAID 6 puede ser una mejor opción porque usa dos discos para almacenar la paridad.

Referencias

  • Compensaciones entre las configuraciones de almacenamiento RAID 5 y RAID 10 - Dell
  • Niveles de RAID estándar - Wikipedia
  • Niveles RAID anidados - Wikipedia
  • Paridad en computacion - Wikipedia
  • Formato de datos de disco RAID común (DDF) - Asociación de la industria de redes de almacenamiento
  • Resolviendo la pérdida de datos en sistemas de almacenamiento masivo - Asociación de la industria de redes de almacenamiento