Thursday, February 7, 2013

Las 12 Reglas Doradas del DataWareHouse


Las 12 Reglas de un Datawarehouse
 

Existen 12 reglas que proponen los grandes expertos en Diseño e Implementaciones de DataWareHouses; William H. Inmon y Chuck Kelley
 
1.       The Data Warehouse and operational environments are separated.
a.        Los Ambientes de OLTP y OLAP deben de estar separados, preferentemente hasta en nivel físico para que no se afecte la Operación al estar procesando el ETL
2.       The Data Warehouse data are integrated.
a.        Toda la diversidad y fuentes de datos, deben de estar homologados al ser almacenados en un DataWarehouse
3.       The Data Warehouse contains historical data over a long time horizon.
a.        Es importante tener en mente que en el DataWarehouse se van a tener una gran cantidad de datos históricos almacenados
4.       The Data Warehouse data are snapshot data captured at a given point in time.
a.        Se generan cortes de información que no cambian
5.       The Data Warehouse data are subject-oriented.
a.        La información almacenada en un DataWarehouse es sobre un tema en específico
6.       The Data Warehouse data are mainly read-only with periodic batch updates from operational data. No online updates are allowed.
a.        El procesamiento de un ETL puede ser muy costoso en cuestión de performance, por ello no debe de nunca ejecutarse en tiempo real y tampoco debe de ser retroactivo
7.       The Data Warehouse development life cycle differs from classical systems development. the Data Warehouse development is data driven; the classical approach is process driven.
a.        El Datawarehouse esta diseñado para que pueda ser explotado por otras aplicaciones convencionales, esta orientado a los procesos
8.       The Data Warehouse contains data with several levels of detail; current detail data, old detail data, lightly summarized, and highly summarized data.
a.        Básicamente en un DataWarehouse se tiene de todo tipo de información, información reciente, histórica, tan general o detallada como se guste
9.       The Data Warehouse environment is characterized by read-only transactions to very large data sets. The operational environment is characterized by numerous update transactions to a few data entities at the time.
a.        Un DataWarehouse debe de ser solo lectura puesto que los datos dentro no deben ser modificados, no es una base de datos transaccional es solo para consulta
10.    The Data Warehouse environment has a system that traces data sources, transformations, and storage.
a.        Siempre debe de haber una forma de rastrear de donde viene la información, una traza que indique ¿Cómo? y de ¿Dónde? se obtiene la información
11.    The Data Warehouse’s metadata are a critical component of this environment. The metadata identify and define all data elements. The metadata provide the source, transformation, integration, storage, usage, relationships, and history of each data element.
a.        Tener datos que describan los datos es escencial, pues de ellos sabremos que información se está almacenando dentro de nuestro DataWarehouse
12.    The Data Warehouse contains a charge-back mechanism for resource usage that enforces optimal use of the data by end users..
a.        Básicamente que la información siempre esté disponible para el usuario final y ésta se encuentre bajo un esquema que le permita ser explotada de forma óptima

- - - - - - - - - - - - - - - - - - - - - - - -
~Mario Vargas


"Two Wrongs Doesn't Make One Right"

No comments:

Post a Comment