Sistemas de almacenamientook(1)

Page 1

SISTEMAS DE ALMACENAMIENTO

Estructura de contenidos

2

CONCEPTOS GENERALES DE SISTEMAS DE ALMACENAMIENTO

3

Definiciones previas

4

CLASIFICACIÓN DE LOS SISTEMAS DE ALMACENAMIENTO POR DISPONIBILIDAD DE DATOS

6

SISTEMAS DE ALMACENAMIENTO BASADOS EN HARDWARE

6

Sistema de almacenamiento RAID

6

Ventajas y desventajas de los RAID’s

7

Clasificación del sistema RAID’s

7

RAID Estándar

8

Ventajas y desventajas de los nivel RAID estándar

13

Cuadro comparativo de parámetros del nivel RAID estándar

14

Sistema de almacenamiento SAN

16

Definición de SAN

16

Ventajas y desventajas de SAN

17

Sistema de almacenamiento NAS

17

Definición de NAS

17

Ventajas y desventajas de NAS

18

SISTEMAS DE ALMACENAMIENTO BASADO EN SOFTWARE

19

BIBLIOGRAFÍA

20

MATERIAL AUDIOVISUAL

22

GLOSARIO

23

SENA - Servicio Nacional de Aprendizaje


MAPA CONCEPTUAL Sistemas de Almacenamiento

2 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

CONCEPTOS GENERALES DE LOS SISTEMAS DE ALMACENAMIENTO INTRODUCCIÓN El especialista en administración de bases de datos, debe tener la percepción del funcionamiento de cada uno de los componentes lógicos y físicos que integran el sistema de base de datos; esto con el fin de que posean los conocimientos suficientes para seleccionar adecuadamente las herramientas que se necesitan para desempeñar el rol de DBA (database administrator) administrador de base de datos. Los entornos de producción que incluyen sistemas de bases de datos para almacenar la información requieren de unos niveles de confiabilidad, rendimiento y disponibilidad que deben ser cumplidos mediante distintas estrategias, una de las que resulta frecuentemente implementada es el uso de arreglos de discos basados en software o en hardware para el almacenamiento redundante de la información. Con el estudio de este contenido se introducirán a los sistemas de almacenamiento, en donde abordaran temas como: conceptos, tipos, ventajas, costos y consideraciones de rendimiento, para la selección adecuada de los dispositivos de almacenamiento, de acuerdo con los requerimientos del sistema.

3 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

DEFINICIONES PREVIAS Fracasos:

Cambios físicos detectables en el hardware del equipo, su solución implica remplazo del componente afectado.

Fallas:

Son contingencias que afectan el funcionamiento normal del sistema, pueden ser:

•Suaves: cuando son fallas raramente repetibles y se deben a causas fortuitas.

•Duras: cuando son fallas repetibles y se deben a fracasos. Errores:

Son la manifestación de las fallas ya sean suaves o duras y estos producen valores incorrectos en el sistema.

Confiabilidad:

Probabilidad de que el sistema no falle en el futuro, se tienen en cuenta los siguientes parámetros:

•MTTF: Mean Time To Failure – Tiempo medio entre fallas: expresa la confiabilidad del sistema, se mide en unidades de tiempo e indica el tiempo que el sistema puede funcionar sin presentar fallas.

•MTTR: Mean Time To Repair – Tiempo medio para reparar: es el tiempo que toma reponer el disco que fallo. Disponibilidad:

Probabilidad de que el sistema se encuentre funcionando en cualquier instante.

Rendimiento:

Tiempo que toma una unidad de disco en responder a una petición completa de entrada - salida de datos, depende de dos aspectos:

•Limitaciones mecánicas y eléctricas de la unidad de disco. •Carga de entrada salida impuesta por el sistema Redundancia:

Almacenamiento de los mismos datos en dos o más unidades de disco.

4 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

Evitación de fallas:

Estrategias que se implementan con el fin de disminuir la probabilidad de fallos en el sistema.

Tolerancia a fallos:

Capacidad del sistema de neutralizar los efectos de una falla en cualquiera de sus módulos, esto se logra con la redundancia de los componentes de un módulo.

Persistencia:

Capacidad de un sistema para mantener en el tiempo los datos en un estado que permita su posterior recuperación.

Códigos de Hamming:Es método utilizado para la detección y corrección de errores en las unidades de discos duros.

5 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

CLASIFICACIÓN DE LOS SISTEMAS DE ALMACENAMIENTO POR DISPONIBILIDAD DE DATOS Los distintos niveles de RAID (Redundant Array of Independent Disks), con su configuración característica responden satisfactoriamente a al menos un nivel de la siguiente clasificación de sistemas de almacenamiento propuesta por RAID Advisory Board en 1996: •

FRDS - Sistema de discos resistente a fallas: Evita la pérdida de los datos almacenados en el arreglo, cuando falla una de sus unidades de disco. FTDS - Sistema de discos tolerante a fallas: Mantiene los datos accesibles cuando falla cuando cualquiera de los componentes del arreglo. DTDS - Sistema de discos tolerante a desastres: Mantiene los datos almacenados en el arreglo de discos disponibles mediante dos o más sistemas de acceso redundantes e independientes.

• •

SISTEMAS DE ALMACENAMIENTO BASADOS EN HARDWARE El comportamiento de las distintas configuraciones de los sistemas de almacenamiento basados en hardware, son evaluados mediante los siguientes parámetros: • • •

Confiabilidad – Integridad y persistencia de la información. Rendimiento (throughput) – Tiempo de respuesta. Disponibilidad – Tolerancia a fallos.

SISTEMA DE ALMACENAMIENTO RAID El sistema de discos independientes en arreglo redundante o RAID por las letras iniciales de las palabras que componen la frase en ingles Redundant Array of Independent Disks; es el término utilizado para referirse a los sistemas de almacenamiento basados en discos duros que tienen la capacidad de actuar colectivamente para replicar los datos en distintas unidades, con el fin de garantizar la disponibilidad y la persistencia de la información almacenada en cada uno de los discos que hacen parte del arreglo.

6 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

VENTAJAS Y DESVENTAJAS DE LOS RAID’S

• Aumentan la tasa de transferencia sostenida cuando hay operaciones de lectura lineales. • Mejora el rendimiento de aplicaciones que trabajan con ficheros grandes (edición de vídeo e imágenes). • La redundancia de datos en múltiples discos proporciona tolerancia a fallos.

• No protege los datos ante un virus, un borrado accidental o un fallo de otro componente del sistema.

• No simplifica la recuperación de los datos cuando sucede un fallo.

• No mejora el rendimiento de todas las aplicaciones.

• El hardware RAID ofrece mejor rendimiento que un solo disco. • Facilita las operaciones de respaldo de datos cuando se realizan de disco a disco.

CLASIFICACIÓN DEL SISTEMA RAID’S • RAID's Estándar (Niveles 0,1, 2, 3, 4, 5 y 6): cada uno de los 7 niveles que componen el estándar RAID proporcionan una configuración distinta para almacenar los datos en más de un disco. • RAID's Anidados (Niveles 0+1, 1+0, 10, 30, 50, 53 y 100): son combinaciones derivadas de los niveles estándar de RAID, que toman los aspectos positivos de cada configuración con el fin obtener un mejor rendimiento en el arreglo de discos. • RAID's Propietarios: son implementaciones de RAID que han sido desarrolladas por las empresas como diseños propietarios.

7 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

RAID Estándar: se compone de 7 niveles en los que cada uno de ellos proporcionan una configuración particular para almacenar los datos en más de un disco.

Raid 0

Segmentación de información a nivel de bloque sin tolerancia al error.

Las unidades de discos utilizadas en RAID 0 son conectados en paralelo con el fin de que el sistema lo detecte como uno de mayor capacidad.

Las unidades de discos están compuestas de múltiples bloques sobre los que se almacena de forma no secuencial los segmentos en que se ha divido la información. De esta forma un archivo guardado con RAID 0 es dividido en bloques y almacenado en diferentes partes del arreglo de discos.

8 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

Raid 1

Conjunto de discos con información en espejo.

El Nivel RAID 1 estándar está compuesto por mínimo dos unidades de disco que contienen en todo momento una copia exacta de los datos almacenados, de esta forma se mejora la tolerancia a fallos mediante la redundancia de hardware y se asegura disponibilidad de los datos.

Raid 2

Segmentación de la información a nivel de bits con código Hamming para la corrección de errores

El nivel RAID 2 estándar, segmenta la información a nivel de bits e implementa el método de códigos de Hamming para la detección y corrección de errores.

Este nivel se considera innecesario y solo se utiliza cuando se tienen discos antiguos que no tienen detección de errores interna, esto lo hace de muy poca utilidad práctica, ya que todas las unidades de disco modernas traen incorporado esta característica.

9 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

Raid 3

Segmentación de información a nivel de bytes con disco de paridad dedicado.

El nivel RAID 3 estándar, segmenta la información a nivel de byte's y luego la distribuye en múltiples unidades de disco; la redundancia de los datos se logra implementando un disco de paridad dedicado, el cual mediante chequeo de paridad se encarga de detectar y corregir errores en los datos cuando falla una unidad de disco. Esta implementación requiere mínimo de tres unidades de discos y en uno de ellos se almacenan exclusivamente los datos paridad, en caso de fallar esta unidad se pierde la redundancia sobre los datos.

10 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

Raid 4

Segmentación de información a nivel de bloque con disco de paridad dedicado

El nivel RAID 4 estándar, segmenta la información a nivel de bloque y luego la distribuye en múltiples discos; la redundancia de los datos se consigue implementando un disco de paridad dedicado, el cual mediante chequeo de paridad se encarga de detectar y corregir errores en los datos cuando falla una unidad de disco. En caso de fallar el disco de paridad se pierde la redundancia sobre los datos.

Raid 5

Segmentación de información a nivel de bloque, con datos de paridad distribuidos.

El nivel RAID 5 estándar, segmenta la información a nivel de bloque y luego la distribuye entre las unidades de discos; cada dato de paridad creado es almacenado de forma que nunca coincida con el disco en el que han sido guardados los segmentos de la información original, de esta forma se consigue redundancia sobre la información sin utilizar un disco de paridad dedicado. Se requiere de mínimo tres discos para realizar una implementación de este tipo.

11 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

Raid 6

Segmentación de información a nivel de bloque, con doble paridad distribuida

El nivel RAID 6 estándar, segmenta la información a nivel de bloques e implementa datos de paridad doble que son distribuidos entre las diferentes unidades que conforman el arreglo de discos. La configuración de RAID 6 permite que dos unidades de disco distintas fallen simultáneamente, pudiéndose aun así recuperar los datos.

12 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

VENTAJAS Y DESVENTAJAS DE LOS NIVELES RAID ESTÁNDAR

Mayor capacidad de almacenamiento, por lo que no duplica los datos.

En caso de que una unidad de disco falle, no es posible recuperar los datos.

Proporciona mayor velocidad de lectura y escritura.

Mejora el rendimiento de transferencia lineal.

No posee tolerancias a fallos si, falla una unidad de disco el sistema queda fuera de servicio.

No posee redundancia de datos.

Se utiliza toda la capacidad del disco.

Las aplicaciones convencionales de escritorio no muestran mejora notable en el rendimiento.

RAID 0

RAID 1

• •

RAID 2

RAID 3

Si una unidad de disco fzalla, es posible recuperar los datos mediante el disco espejo. Es tolerante a fallos, en caso de que una unidad falle el sistema puede seguir en servicio. Mayor rendimiento en la lectura de datos.

Mejora la demanda y la velocidad de transferencia. Realiza detección y correcciones de errores con código de Hamming.

Alto rendimiento para acceso secuencial de grandes archivos.

Si se escriben datos corruptos en una unidad estos son duplicados en la otra. Es una solución costosa por la cantidad de discos que se necesitan para guardar los códigos de error. Tiempo de escritura bastante lento.

No puede usarse con discos SCSI.

No hay implementaciones comerciales de este nivel.

Puede fallar un disco y es posible recuperar la información.

La escritura de los datos es más lenta ya que se debe realizar en dos localizaciones.

Implementa un disco de paridad para corrección de errores.

Es más costoso puesto que se necesita el doble del espacio para almacenar los datos.

Al fallar el disco de paridad se pierde la redundancia de los datos. El disco de paridad puede convertirse en un cuello de botella para el sistema. No puede atender múltiples peticiones de lectura-escritura.

13 SENA - Servicio Nacional de Aprendizaje


Sistemas de Almacenamiento

RAID 4

RAID 5

RAID 6

Puede atender peticiones simultáneas de lectura-escritura. Las operaciones de lectura se realizan más rápido.

Tiene un mejor desempeño al trabajar con múltiples transacciones pequeñas. Ideal para aplicaciones con procesamiento transaccional. Es posible recuperar los datos hasta con dos unidades de disco en falla.

El disco de paridad es un punto único fallo que puede producir la perdida de redundancia sobre los datos. La escritura de datos pequeños resulta más lenta. Si fallan 2 unidades de disco simultáneamente el sistema deja de funcionar. No aumenta el rendimiento de las aplicaciones. Es ineficiente con pocos discos.

14 SENA - Servicio Nacional de Aprendizaje


Issuu converts static files into: digital portfolios, online yearbooks, online catalogs, digital photo albums and more. Sign up and create your flipbook.