Friday, February 1, 2013

Diseño de un DataWareHouse Copo de Nieve y Estrella

Implementación de un DataWareHouse
Debido a las características inherentes de un Data Warehouse como lo son: grandes cantidades de índices, cantidades enormes de datos que provocan consultas de alto volumen, un ambiente desnormalizado y ninguna modificación de los datos ya guardados es de suma importancia planear de forma correcta la implementación de un Datawarehouse.


Los pasos que se pueden seguir para llevarlo a cabo:
Identificación de requerimientos de los usuarios.
Construcción del modelo lógico y físico.
Proceso de extracción, transformación e integración de datos (ETL), el cual servirá para alimentar nuestro Datawarehouse
Desarrollar las interfaces o medios para que aplicaciones puedan extraer la información almacenada
Implementar herramientas de análisis.
Asegurar resultados, hacer un checksum que nos permita estar totalmente seguros de que la información esta completa
Afinación o mejoras (a nivel diseño, estructura o performance)

NOTA: El modelo entidad relacional nos va a servir sólo para expresar el Datawarehouse


 


Modelo de Diseño de Estrella (snowflake)
Uno de los tipos de consultas más usadas en las OLAP es la llamada Estrella. Su nombre lo adquiere debido a que su implementación en un ambiente relacional (Multidimentional) está dado por varias tablas que almacenan las jerarquías dimensionales y una tabla que contiene el hecho con una relación 1:m con estas tablas de dimensiones.

 

Como podemos ver en la figura las tablas de dimensiones están ligadas a la tabla Fact, por relaciones. La integridad referencial es llevada a cabo por la creación de llaves foráneas en la tabla Fact, que a su vez forman parte de la llave principal de esta tabla. Es importante destacar que las jerarquías completas son guardadas en una sola tabla dimensión (que le proporcina la característica de no normalizado)

El detalle importante del diseño de las tablas en el modelo estrella está en los catálogos. Tiene que poner en una sola tabla todo aquello que se pueda deducir del elemento más granular de la tabla y que está más abajo en la jerarquía.
TIP: Si está pensando crear un cubo con los Analysis Services de Microsoft usando esta estrella, el poner la llave en la estrella hace que el cubo se reduzca de tamaño y el tiempo de respuesta se acelere

TIP: Para las llaves tratar de que sean de tipo numérica y de no utilizar llaves compuestas


Para finalizar este tema es necesario hacer alusión a los llamados Cubos de datos: Estos no son más que el conjunto formado por todas las tablas Dimensión y la tabla Fact que al final dan una vista en forma de Cubo cuyas celdas están compuestas por las medidas de la tabla Fact. Esta es la base de las aplicaciones OLAP

 

- - - - - - - - - - - - - - - - - - - - - - - -
~Mario Vargas


"Two Wrongs Doesn't Make One Right"

No comments:

Post a Comment