Seleccionar página

Según proyecciones de IDC (http://www.datacenterknowledge.com/archives/2010/05/04/digital-universe-nears-a-zettabyte/), para el año 2020 se estima que la cantidad de datos almacenados alcanzará la alucinante cifra de 35000 Exabytes.
El 75% de toda esta información es actualmente generada por personas que escriben texto, y suben fotos y videos.

Según este informe, menos de un tercio de esta información en lo que ellos llaman “el universo digital” tiene al menos una mínima seguridad o protección. Y solo la mitad de la información que debería ser protegida lo está.

Los sistemas actuales de almacenamiento basados en RAID no fueron diseñados para escalar este tipo de crecimiento de datos. Y como resultado el coste de dichos sistemas se incrementa al mismo ritmo que lo hace la cantidad de datos almacenados, mientras que la protección se degrada.

Además, al aumentar la cantidad de datos almacenados,  los sistemas RAID son más propensos a tener errores. Así, al leer 10TB de datos la probabilidad de que aparezca un bit no leíble (con error) es del 56%, y cuando se leen 100TB la probabilidad es del 99,97% (es decir, es un hecho)1.

Para que RAID fuera realmente conveniente, debería cumplir estos tres requisitos:

  1. Dar protección para grandes escalas
  2. Poder manejar varios fallos al mismo tiempo
  3. Buena relación costo-efectividad a gran escala

Para evitar estos problemas, la empresa Cleversafe ha desarrollado una tecnología que llaman “Information Dispersal Basics”.
Básicamente ella permite distribuir la información en trozos en múltiples repositorios junto con unos bytes extras de información que permitirían recuperar todos estos trozos teniendo solo unos pocos de ellos disponibles.
Esto permite también que sucedan múltiples fallos al mismo tiempo, y aún así toda la información podría ser accesible en tiempo real.

En el siguiente gráfico se realiza una comparación entre los requerimientos de storage para RAID5, RAID6, y la tecnología de Cleversafe.
En él se ve que en la medida que aumenta la cantidad de información almacenada el coste en los sistemas RAID se dispara, mientras que con la tecnología de Cleversafe el coste continúa siendo el mismo:

Ellos también dicen que su tecnología puede evitar la pérdida de información durante unos teóricos 79 millones de años. Mientras que los sistemas RAID5 y RAID6 solo pueden hacerlo durante unos pocos años.

Para un informe más completo sobre este tema puedes visitar esta web.

1 Calculado tomando teniendo en cuenta la posibilidad de no encontrar una tasa de error de bit en una serie de bits:

Para 10TB: 1 – ((1 – 10^-14)^(10*(8*10^12)))
Para 100TB: 1 – ((1 – 10^-14)^(100*(8*10^12)))

Share This