viernes, 10 de octubre de 2014

Data Warehouse


Tras las dificultades de los sistemas tradicionales en satisfacer las necesidades informacionales, surge el concepto de Data Warehouse, como solución a las necesidades informacionales globales de la empresa. Este término acuñado por Bill Inmon, se traduce literalmente como Almacén de Datos. No obstante si el Data Warehouse fuese exclusivamente un almacén de datos, los problemas seguirían siendo los mismos que en los Centros de Información. La ventaja principal de este tipo de sistemas se basa en su concepto fundamental, la estructura de la información. Este concepto significa el almacenamiento de información homogénea y fiable, en una estructura basada en la consulta y el tratamiento jerarquizado de la misma, y en un entorno diferenciado de los sistemas operacionales.

Beneficios de un Data Warehouse:
  • Proporciona una herramienta para la toma de decisiones en cualquier área funcional, basándose en información integrada y global del negocio.
  • Facilita la aplicación de técnicas estadísticas de análisis y modelización para encontrar relaciones ocultas entre los datos del almacén; obteniendo un valor añadido para el negocio de dicha información.
  • Proporciona la capacidad de aprender de los datos del pasado y de predecir situaciones futuras en diversos escenarios.
  • Simplifica dentro de la empresa la implantación de sistemas de gestión integral de la relación con el cliente.
  • Supone una optimización tecnológica y económica en entornos de Centro de Información, estadística o de generación de informes con retornos de la inversión espectaculares.
Estructura del Data Warehouse
Hay niveles diferentes de esquematización y detalle que delimitan el data Warehouse, sus componentes son:
  • Detalle de datos actuales. En gran parte, el interés más importante radica en el detalle de los datos actuales, debido a que:  Refleja las ocurrencias más recientes, las cuales son de gran interés, es voluminoso ya que se almacena al más bajo nivel de granularidad y casi siempre se almacena en disco, el cual es de fácil acceso, aunque su administración sea costosa y compleja. 
  • Detalle de datos antiguos. La data antigua es aquella que se almacena sobre alguna forma de almacenamiento masivo. No es frecuentemente accesada y se almacena a un nivel de detalle, consistente con los datos detallados actuales. Mientras no sea prioritario el almacenamiento en un medio de almacenaje alterno, a causa del gran volumen de datos unido al acceso no frecuente de los mismos, es poco usual utilizar el disco como medio de almacenamiento. 
  • Datos ligeramente resumidos. La data ligeramente resumida es aquella que proviene desde un bajo nivel de detalle encontrado al nivel de detalle actual. Este nivel del Data Warehouse casi siempre se almacena en disco. Los puntos en los que se basa el diseñador para construirlo son:   Que la unidad de tiempo se encuentre sobre la esquematización hecha y qué contenidos (atributos) tendrá la data ligeramente resumida. 
  • Datos completamente resumidos. El siguiente nivel de datos encontrado en el Data Warehouse es el de los datos completamente resumidos. Estos datos son compactos y fácilmente accesibles.
  • Metadata. El componente final del Data Warehouse es el de la metadata. De muchas maneras la metadata se sitúa en una dimensión diferente al de otros datos del Data Warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.
Data Warehouse - Ventajas:
  • Datos de toda la compañía, organizados para facilitar las consultas más analíticas que transaccionales.
  • Los procesos de transformación han sido aplicados a los datos para permitir un tiempo de respuesta mínimo a las consultas.
  • Modelo de datos multidimensional para hacer más fácil la navegación y explotación de datos.
  • La administración de la seguridad está centralizada para garantizar la necesidad de información dependiendo del perfil de los usuarios.
Data Warehouse - Desventajas:
  • No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir.
  • Requiere de continua limpieza, transformación e integración de datos.
  • Es un proceso de implantación puede encontrarse dificultades ante los diferentes objetivos que pretende una organización.
  • Una vez implantado puede ser complicado añadir nuevas fuentes de datos.  
  •  
 

No hay comentarios:

Publicar un comentario