DATA WAREHOUSING Integrantes: Jaime Aravena Siqués. Kevin Aravena Vega. Gabriel Herrera Diaz.
Índice Índice…………………………………………………………………………………………… .….2 Abstract……………………………………………………………………………………………...3 Introducción……………………………………………………………………………… .………...3 Introducción a Data Warehous ing……………………………………………………………… .….4 Objetivos
Generales............................................................................................................................4
Conceptos Previos.…………………………………………………………………………… .…….5 Objetivos del Data Warehou se………………………………………………………………… .…...6 Marco
Teorico.....................................................................................................................................6
Conclusión...........................................................................................................................................12 Bibliografía..........................................................................................................................................12
2
Abstract This paper general purpose is, show and explain the Data Warehouse (DW) concept and all its functionality on the business world as clear as possible. To start we are going to make an introduction to the Data Warehouse concept. Then we are going to see an explanation of many concepts that are involved with this topic to understand it in greater details, for example we have the Business Intelligence which is an extremely important concept to have in mind when we talk about DW and not only this but many others like this. In the next place, we show the principal objectives that the Data Warehouse has been made for. In the next section we explain more deeply the Data Warehouse, explaining the progress that has made over the time and its history and then we are going to see the main features presented in the DW like its architecture and how it operates. To finish we show an example of implementation of the Data Warehouse on a business company explaining its functionality. Key Words: Business Intelligence, Data Mart, Data Mining, OLTP, OLAP.
1. Introducción Desde que se inició la era de la computación, los establecimientos han utilizado los datos desde sus sistemas operacionales para atender sus necesidades de información. Algunas proporcionan acceso directo a la información contenida dentro de las aplicaciones operacionales. Otras, han extraído los datos desde sus bases de datos operacionales para combinarlos de varias formas no estructuradas, en su intento por solucionar la necesidad de requerimiento informático. Ambos métodos han mejorado con el paso del tiempo y ahora las organizaciones manejan una data no limpia e inconsistente, sobre las cuales, generalmente, se toman decisiones importantes.
La gestión administrativa admite que una manera en particular de aumentar la eficiencia radica en hacer el mejor uso posible de los recursos de información existentes dentro de la organización. Sin embargo, a pesar de que esto se viene intentando desde hace mucho tiempo, no se tiene todavía un uso mejorado de los mismos. La razón principal es la manera en que han evolucionado las computadoras, basadas en las tecnologías de información y sistemas. La mayoría de las organizaciones hacen lo posible por conseguir buena información, pero el logro de ese objetivo depende fundamentalmente de su arquitectura actual, tanto de hardware como de software. El data warehouse, es actualmente, el centro de atención de las grandes instituciones, porque provee un ambiente para que las organizaciones hagan un mejor uso de la información que está siendo administrada por diversas aplicaciones operacionales. Un data warehouse es una colección de datos en la cual se encuentra integrada toda la información de la Institución y que se usa como soporte elemental para la toma de decisiones gerenciales. Aunque diversas organizaciones y personas individuales logran comprender el enfoque de un Warehouse, la experiencia ha demostrado que existen muchas dificultades potenciales que ya indagaremos. Reunir los elementos de datos apropiados para la búsqueda desde diversas fuentes de aplicación en un ambiente integral centralizado, simplifica de manera cuantiosa el problema de acceso a la información y en consecuencia, acelera de sobremanera el proceso de análisis, consultas y el menor tiempo de uso de la información.
Las aplicaciones para soporte de decisiones basadas en un data warehousing, pueden hacer más práctica y fácil la explotación de datos para una mayor eficacia del negocio, que no se logra cuando se usan sólo los datos que provienen de las aplicaciones operacionales (que ayudan en la operación de la empresa en sus operaciones cotidianas), en los que la información
3
se obtiene realizando procesos independientes y muchas veces complejos.
Un data warehouse se crea al extraer datos desde una o más bases de datos de aplicaciones operacionales. La data extraída es transformada para eliminar inconsistencias (datos inútiles en mi búsqueda) y resumir si es necesario y luego, cargadas en el data warehouse. El proceso de transformar, crear el detalle de tiempo variante, resumir y combinar los extractos de datos, ayudan a crear el ambiente para el acceso a la información Institucional. Este nuevo enfoque ayuda a las personas individuales, en todos los niveles de la empresa, a efectuar su toma de decisiones con más responsabilidad y reducir el porcentaje de error en la decisión tomada. La innovación de la Tecnología de Información dentro de un ambiente data warehousing, puede permitir a cualquier organización hacer un uso más óptimo de los datos, como un ingrediente clave para un proceso de toma de decisiones más efectivo. Las organizaciones tienen que aprovechar sus recursos de información para crear la información de la operación del negocio, pero deben considerarse las estrategias tecnológicas necesarias para la implementación de una arquitectura completa de data warehouse.
integrado, no volátil, de tiempo variante, que se usa para el soporte del proceso de toma de decisiones gerenciales. Se puede caracterizar un data warehouse haciendo un contraste de cómo los datos de un negocio almacenados en un data warehouse, difieren de los datos operacionales usados por las aplicaciones de producción.
3. Objetivos específicos
generales
y
El principal objetivo es introducirnos plenamente en el mundo del Data Warehouse, indagando dentro de internet como equipo de trabajo, ya sea en distintos Papers adentrándonos en los distintos formatos de gente familiarizada con el tema, distintas tesis internacionales, entrando en los distintos sistemas que actualmente utilizan Data Warehouse, concepto que por el momento conocemos de forma muy básica y esperamos profundizarlo y conocerlo en su totalidad. También tenemos por objetivos lograr una metodología de trabajo rápida y eficiente, ya que se nos vienen una gran cantidad de trabajos más durante el semestre que esperamos hacerlos de la mejor forma posible cumpliendo todas las expectativas tanto de profesor, ayudantes y nosotros mismos.
2. Introducción al concepto Data Warehousing Data warehousing es el centro de la arquitectura para los sistemas de información en la década de los '90. Soporta el procesamiento informático al proveer una plataforma sólida, a partir de los datos históricos para hacer el análisis. Facilita la integración de sistemas de aplicación no integrados. Organiza y almacena los datos que se necesitan para el procesamiento analítico, informático sobre una amplia perspectiva de tiempo.
Y para finalizar como objetivo específico queremos adentrarnos en lo que es un Paper, generar una pauta que nos sirva para el futuro, cumplir con todas las especificaciones para este Paper tratando de abarcar la mayor información posible y que el contenido sea sintetizado y preciso.
Un Data Warehouse o Depósito de Datos es una colección de datos orientado a temas, 4
4. Conceptos Previos A continuación serán explicados brevemente algunos conceptos clave para un mejor entendimiento del tema, pues bien el concepto de Data Warehouse está compuesto por muchos términos anidados los cuales son claves para su total comprensión:
4.1 Business Intelligence Es el uso de datos en una empresa para realizar una mejor toma de decisiones, de esta manera los datos son transformados en información y esta información en conocimientos mediante una serie de técnicas que llevan a la optimización en la toma de decisiones.
4.5 OLAP Processing)
(On-Line
Analytical
Estas bases de datos, como su nombre lo indica, están orientadas al procesamiento analítico y es una solución utilizada en el Business Intelligence con la cual se busca agilizar la consulta de grandes cantidades de datos de manera que se extraiga información útil para la empresa. Para llevar a cabo esto se utilizan estructuras multidimensionales las cuales contienen datos resumidos de bases de datos o Sistemas Transaccionales.
4.2 Data Mart Muy parecido al concepto de Data Warehouse, pero su principal fin es contener solo la información de un área específica con el fin de tener una visión más detallada para hallar una solución a un problema en concreto, este puede contener datos de distintas fuentes de información.
4.3 Data Mining El concepto Data Míning es conformado por técnicas y herramientas las cuales son utilizadas para llevar a cabo una búsqueda de manera automática o semiautomática para así poder encontrar datos que ayuden a entender el papel o comportamiento que cumplen algunos datos dentro de un área de búsqueda.
4.4 OLTP (On-Line Transactional Processing) Son bases de datos las cuales están orientadas al tratamiento y procesamiento de transacciones de manera que se analizan los datos en tiempo real, además de esto lleva a cabo tareas como inserción, modificación y borrado de datos los cuales posteriormente van siendo estructurados por niveles.
4.6 MOLAP (Multimedimensional Analytical Processing) Los datos son almacenados en una matriz multidimensional lo cual ayuda a agilizar las búsqueda además de hacerlas más efectivas, el único problema que presenta es que ocupa más espacio en el disco que los demás métodos.
4.7 ROLAP (Relational Analytical Processing) Implementa OLAP de mejor manera puesto que almacena la información en una base de datos relacional. La respuesta a consultas ROLAP suelen ser más lentas que las realizadas con MOLAP. Su uso más común es el acceso a grandes cantidades de datos que se usan con poca frecuencia.
5
4.8 HOLAP Processing)
(Hybrid
Analytical
También encontramos el modelo HOLAP, el cual es una combinación de las técnicas MOLAP y ROLAP. Este método nos presenta una mezcla en la que se tratan los datos de manera multidimensional pero a la vez se mantienen las conexiones relacionales para poder realizar consultas más eficaces y rápidas.
El Data Warehouse debe ser adaptable y resistente a cambios: No se pueden evitar los cambios. Las necesidades de los clientes, las condiciones del negocio, los datos, la tecnología entro otros factores, están sujetos a cambios en el tiempo. Los cambios en el Data Warehouse no deben borrar los datos previos. El Data Warehouse debe ser seguro de tal manera que proteja nuestra información. El Data Warehouse debe controlar efectivamente el acceso a la información confidencial de la organización. El Data Warehouse debe servir como base para tomar una decisión con el menor porcentaje de error.
5. Objetivos del Data Warehouse. Hacer que la información de la empresa sea de un fácil acceso: El contenido del Data Warehouse debe ser comprensible y obvio para el cliente. La comprensibilidad requiere si o si legibilidad, por lo que el contenido necesita ser nombrado de manera significativa y no con un nombre aleatorio. El usuario de negocio debe poder extraer datos del Data Warehouse y mezclar esta información de todas las formas requeridas, utilizando herramientas simples y fáciles de usar, con un tiempo de respuesta mínimo. El Data Warehouse debe presentar la información de la organización consistentemente: La información del Data Warehouse debe ser creíble. Los datos deben ser elegidos de varios sitios en la organización, deben ser escogidos de tal manera que sean útiles en la búsqueda, con calidad asegurada, y liberados cuando no sean necesarios para el usuario. La información de un proceso de negocio debe coincidir con la información de otro proceso. Todos los datos se contabilizan y están completos. La consistencia también requiere que las definiciones comunes del contenido del Data Warehouse estén disponibles para todos los usuarios.
El Data Warehouse debe contener la información correcta para soportar la toma de decisiones
6. Marco Teórico 6.1 Data Warehouse Data Warehouse es un almacén de datos que recoge toda la información que produce una empresa. Sobre la información que hay, de carácter histórico, se genera nueva información en forma de resúmenes, contabilizaciones e incluso se llega a un nivel superior de detalle para poder ofrecer información orientada a la toma de decisiones en cualquier momento, sin necesidad de esperar largos periodos en la realización de informes tediosos que tienen más probabilidad de error y acumulan un nivel muy superior de imprecisiones. Un Data Warehouse puede ser la mejor herramienta para conseguir información de calidad, dónde los datos que se muestren sean válidos, se encuentren correctamente formateados y tengan un propósito bien definido. Es decir, que se sepa para que se vaya a usar dicho dato, como usarlos y que el hecho de hacerlo no traiga errores de la base y en definitiva convertir los repositorios de la información en conocimiento útil a la empresa.
6
6.2 Etapas del Data Warehouse
6.2.2 Análisis
En un principio se creía que el almacenamiento de datos se tenía que centrar en la prestación de capacidad para aquellas decisiones
A continuación presentaremos un tipo de implementación del Data Warehouse planteado y reforzado por el Director de Terada Corporation, empresa estadounidense que profundiza el tema, Stephen Brobst.
En el entorno de análisis, destaca el hecho de que los que toman las decisiones se centran menos en lo que sucedió y más en el por qué sucedió. Las estructuras de consulta pasan a ser no tan predecibles como lo son en el entorno de la primera etapa de informes, lo que en definitiva logra que las preguntas a la base de datos no puedan ser conocidas de antemano. La interacción con la información aumenta mucho en esta etapa, por lo que es importante que una aplicación de almacenamiento de datos tenga un óptimo rendimiento. La primera etapa es programada para ejecutarse ya sea de forma regular siguiendo los calendarios de las organizaciones, por un motor de sincronización y en algunos casos de forma manual. En este caso, el análisis es principalmente una actividad práctica con el refinamiento de las preguntas en un entorno interactivo. Hablamos de una “aplicación” po r la necesidad de que entre el almacén de datos y los usuarios no exista un intermediario del tipo programador. El que una aplicación tenga herramientas gráficas, tipeos de consultas claros, y principalmente un buen rendimiento. Los usuarios suelen ser impacientes, por lo que el proporcionar la información en tiempos de respuestas en segundos se hace vital. Para lograr un buen rendimiento se ocupan técnicas avanzadas de indexación lo que optimiza y genera accesos eficientes y flexibles a la información dentro de los tiempos de respuestas aceptables.
6.2.1 Presentación de informes
6.2.3 Predicción
Es primordial que las organizaciones presenten informes a partir de su propia fuente de verdad. El trabajar duro y dedicarse a proporcionar información lo más integrada posible hace que la toma de decisiones se vea facilitada y prepara la información y la convierte en la base para las siguientes etapas de implementación de almacenamiento de datos. La integración de los datos se hace tediosa y se convierte en el mayor desafío para la primera etapa. El limpiar los datos, construirlos de forma consistente es sumamente importante, sin embargo no tiene que ser algo exagerado. Se trata de evitar el llegar a un único valor estándar para una gran cantidad de fuentes de datos.
Si bien es sumamente importante que las empresas u organizaciones mejoren y ejecuten sus técnicas y experiencias de la toma de decisiones
“estratégicas” que tomaban los trabajadores sobre
el entorno referente a las empresas. Áreas del tipo marketing, planificaciones estratégicas y finanzas entre otras, hicieron aumentar el acceso a la información lo que también hizo aumentar la calidad de tomar decisiones. En estos tiempo, al tener un entorno empresarial altamente competitivo, se hace insuficiente el solo desarrollar una estrategia corporativa. En estos días, una buena estrategia no es nada sin una gran y mejor ejecución. En este margen llegan las nuevas generaciones, que traen consigo nuevas implementaciones de Data Warehouse, las que mejoran la ejecución de las estrategias de negocio, asegurando en cierto porcentaje el desarrollo de las empresas. Para la maduración y el apoyo a las decisiones dentro de las empresas u organizaciones, se plantean cinco etapas donde el almacenamiento de datos va evolucionando junto con las empresas y organizaciones.
con las cuales responden el “qué” y el “por qué”
dentro de sus interacciones laborales y de negocios, es necesario llegar a un nuevo nivel y dar un paso hacia lo que es el aprovechar la información con fines predictivos.
7
El comprender el “qué sucederá” tiene
suma importancia en las gestiones proactivas de las distintas estrategias de las empresas u organizaciones. De esta forma, se plantea el construir herramientas y modelos predictivos con detalles de los datos a través de su historia. El número de usuarios finales que reciben esta información predictiva es bastante reducido a los anteriores, sin embardo este hecho implica una gran carga de trabajo en cuanto a la construcción de modelos los cuales suelen ser muy intensos. Los algoritmos de predicción toman en cuenta una gran cantidad de datos y observaciones para un objetivo muy específico dentro de las organizaciones. Logaritmos, exponenciales y funciones trigonométricas o estadísticas son muy comunes para obtener las características esperadas de predicción. El tener el acceso a la información detallada resulta ser esencial para que los algoritmos puedan hacer predicciones. Es por eso que las dos primeras etapas anteriores están plenamente enfocadas en esos asuntos. A pesar de todos los “costos” de crear algoritmos de
predicción, se hace sumamente necesario para el desarrollo a futuro de todas las organizaciones. “El saber que está pasando con tus producciones
es importante pero lo que pasará en el mañana es lo primordial, sobre todo considerando que lo que
realiza de tal forma que el acceso a la información relativa a las ventas, promociones, inventario o lo que sea relativo al caso, sea con lujos de detalles como ya se mencionó anteriormente. Manejar datos del fabricante, fechas de entrega, vencimiento entre muchos otros, hace que se pueda ejecutar de manera eficiente en base a los requisitos del inventario las distintas decisiones. Para ejemplificar un poco tenemos el caso de los camiones de carga. Existen muchas decisiones sumamente complejas a tomar, tales como qué hacer si se rompe algún paquete, como manejar los cambios de paquetes entre un camión y otro, el qué hacer si un camión llega tarde… En fin una
variada gama de eventos que hacen difícil el tomar una decisión y donde esta etapa de “Puesta en funcionamiento” viene a solucionar de cierta
forma esos inconvenientes al apoyar al usuario con información detallada cosa que pueda tomar la mejor decisión. Muy importante también es que esa información esté puesta al día y que obviamente se actualice a tiempo real. El adquirir continuamente datos y distintas operaciones no debe ser impedimento para tener el almacén de datos actualizado. El tener una actualización de los datos de semanas o en algunos casos de meses resulta insuficiente para apoyar las decisiones tácticas de una forma aceptable.
está pasando hoy ya lo sabía desde ayer”.
6.2.4 Puesta en funcionamiento En una primera instancia, las tres primeras etapas apuntan a lo que es el tomar una decisión estratégica dentro de una organización. Esta cuarta etapa se centrará en el apoyo a las distintas decisiones tomadas con anterioridad. El apoyo irá más por la parte humana, donde valga la redundancia esta etapa apoyará a las personas en el campo en el que se está ejecutando. Esta sección resulta ser vital para aquellas transacciones o movimientos con un registro sumamente rápido y con respuesta inmediata. El apoyar a las personas hace referencia a manejar los datos de tal forma que cada dato que se le proporciona al usuario sea a un nivel detallado. En el caso de minoristas resulta ser muy importante, ya que suelen utilizar un inventario manejado por un vendedor con una cadena de tiendas y donde los costos de inventarios resultan ser elevados. Es por esto que esta sección tiene como objetivo el reducir los costos de inventarios a través de cadenas de suministros mucho más eficientes. Lo
6.2.5 Almacenamiento activo Ya en la etapa anterior uno se acerca al concepto de “Almacenamiento activo”, pero es
acá donde se profundiza en su totalidad. Mientras más enriquecido esté nuestro almacén de datos activos, más jugarán estos datos en aspectos operativos relacionados con el apoyar las decisiones, y habrán más incentivos para que las empresas apuesten por el automatizar los procesos de decisión. Las empresas buscan el automatizar decisiones tanto por razones de eficiencia y por coherencia de la toma de decisiones, pero aún más cuando los seres humanos no tienen un real valor significativo en estas mismas. Por ejemplo, el que un cliente interactúe con una página web o un cajero automático, hace que no exista más remedio que el automatizar la toma de decisiones.
8
La toma de decisiones de estos casos tiene lugar sin seres humanos entre medio y de una forma totalmente automatizada donde los tiempos de respuesta deben ser sumamente ínfimos (entre segundos o milisegundos).
6.3 Características Warehouse
Con el avance de la tecnología, cada vez más las decisiones pasan por un proceso totalmente automatizado. Ya no se requiere mucha mano de obra para actualizar inventarios, precios entre otros. De hecho hasta el sector de comercio minorista en muchos casos ya cuenta con tecnologías electrónicas que hacen no más que un trámite la toma de decisiones. Los trabajos del tipo manual ya en estos tiempos son difíciles de encontrar. Gracias a los avances y la eficacia del proceso y etapa tres de predicción, hasta no hay problemas para las temporadas con mayor demanda, donde los inventarios son más altos de lo que deberían ser, donde ya es posible encontrar sofisticadas estrategias para dar soluciones y tomar decisiones. El tener un almacén de datos activo, nos permite el que estas decisiones se tomen de manera óptima evaluando elemento por elemento, tienda por tienda, con una rigurosidad segundo a segundo con eventos a favor y en contra. Incluso es posible tener las decisiones cliente por cliente en un almacén de datos activo.
Es un depósito de datos. Los datos son independientes de los sistemas operativos o de las aplicaciones existentes, simplemente satisfacen ciertos requerimientos.
del
Data
Las principales características del uso del Data Warehouse son presentadas a continuación:
Es una forma de arquitectura de estructura de datos. Permite atender consultas para la toma de decisiones ya que dota a los sistemas de explotación del DW de agregaciones y desagregación de datos de forma interactiva. Incluye un proceso que integra datos provenientes de diversas fuentes, algunas internas y otras externas. Tiene la capacidad de integrar datos heterogéneos para conformar información homogénea y precisa, dónde el hecho de generar conocimiento sea más sencillo Los datos contenidos en un Data Warehouse constituyen la historia detallada de los negocios de la empresa y su relación con los clientes. Las empresas que sepan
En estos tiempos existe una intensa competencia y variadas innovaciones tecnológicas, las cuales están motivando a estos avances dentro de las distintas empresas y organizaciones. Un almacén de datos activo les ofrece información y permite un óptimo soporte a las decisiones, en lugar de limitarse a los procesos estratégicos de toma de decisiones. Eso sí, el hecho de tener un almacén de datos activo no quiere decir el que éste reemplazará el apoyo de decisiones estratégicas que se evaluaron en las etapas anteriores. De hecho un almacén de datos soporta la coexistencia de ambos tipos de cargas de trabajo.
La construcción y desarrollo de un Data Warehouse exitoso requiere la integración de varios componentes de tecnología y la habilidad para hacerlos funcionar todos juntos. Además debe tenerse muy claro el propósito por el que se creará el Data Warehouse y saber que requerimientos debe cubrir toma un papel crucial en el desarrollo del mismo.
Con esto podemos concluir que el proceso de formar un almacén de datos activo es evolutivo en su totalidad. El tratar de saltar de la fase tres a la cinco no es aconsejable, por lo que se dice que este es un proceso de “iteración”.
La finalidad de un Data Warehouse consiste en ayudar al usuario empresarial a conocer el pasado y poder planear el futuro, ayuda a anticiparse. Permite posicionar la empresa con respecto a los competidores.
Un Data Warehouse es un sistema de aplicación empresarial que contiene su propia base de datos. Es decir, se puede ver como un sistema aparte de los sistemas dónde la empresa mantiene su actividad empresarial primaria.
9
6.4 Funcionamiento Warehouse
de
un
Data
Para comprender íntegramente el concepto de Data Warehouse, es importante entender cuál es el proceso de construcción del mismo, denominado ETL (Extracción, Transformación y Carga), a partir de los sistemas operaciones de una compañía:
4. Metadatos Ofrecen información descriptiva sobre el contexto, la calidad, la condición y las características de los datos. El metadato se sitúa en una dimensión diferente a la de los otros datos en el data warehouse, debido a que su contenido no es tomado directamente desde el ambiente operacional.
Extracción: obtención de información de las distintas fuentes tanto internas como externas. Transformación: filtrado, limpieza, depuración, homogeneización y agrupación de la información. Carga: organización y actualización de los datos y los metadatos en la base de datos.
6.5 Arquitectura Warehouse
de
un
Data
1. Detalle de los datos actuales Reflejan los acontecimientos más recientes, las últimas informaciones generadas por los sistemas de producción de la organización. El nivel de detalle no tiene por qué ser el mismo que el de los sistemas de producción, ya que los datos pueden ser fruto de alguna agregación o de una simplificación de los datos originales.
2. Detalle de datos antiguos Están almacenados en un nivel de detalle consistente con los datos detallados actuales, esto significa que si los datos actuales hacen referencia a ventas diarias en el año actual, los datos historiados contienen las ventas de años anteriores en el nivel de detalle de día también.
3. Datos resumidos Son datos obtenidos como resultado de un proceso de síntesis de los datos actuales. Lo que se tiene entonces son datos agregados o resumidos. Por ejemplo, se entiende mejor la evolución de las ventas si se la presenta resumida por semanas que de manera diaria.
6.6 Ventajas y Desventajas en el uso de un Data Warehouse Ventajas:
Proporciona información clave para la toma de decisiones empresariales. Mejora la calidad de las decisiones tomadas. Especialmente útil para el medio y largo plazo. Son sistemas relativamente sencillos de instalar si las fuentes de datos y los objetivos están claros. Muy útiles para el almacenamiento de análisis y consultas de históricos. Proporciona un gran poder procesamiento de información.
de
10
Permite una mayor flexibilidad y rapidez en el acceso a la información.
Facilita la toma de decisiones en los negocios.
Las empresas obtienen un aumento de la productividad.
Proporciona una comunicación fiable entre todos los departamentos de la empresa.
Mejora las relaciones proveedores y los clientes.
con
los
Tienen un diseño multidisciplinar.
complejo
y
Requieren una reestructuración de los sistemas operacionales. Tienen un alto coste. Requieren sistemas, aplicaciones almacenamiento específico.
y
Permite conocer qué está pasando en el negocio, es decir, estar siempre enterado de los buenos y malos resultados.
6.7 Ejemplo de Empresa
Transforma los datos en información y la información en conocimiento Permite hacer planes de forma más efectiva.
A continuación se expone un fragmento de una noticia la cual muestra el uso de Data Warehousing en una empresa como lo es una cadena de comida rápida:
Reduce los tiempos de respuesta y los costes de operación.
“...la comida rápida constantemente va en aumento, no lo hace así la tecnología que está detrás de esta. Así lo visualiza Exclusive Ore compañía especializada en la distribución y logística de insumos, para la industria de los alimentos rápidos. Esta compañía decidió crear con Microsoft SQL Server 2000 y algunas herramientas de Microsoft Excel, plataformas de tecnología que aporten datos en dos formas: la generación de información diaria de su sistema TACO DePol utility y obtener información contable para los reportes financieros desde Microsoft Dynamics. El Data Warehouse que diseñó Excluise Ore, incluye varios módulos como SalesMix Cube, SalesDayPart Cube, SalesOps Cube y ReportCard Cube. Con la combinación de estos, el usuario podrá medir el desplazamiento de materias primas y productos para controlar mejor las operaciones de los restaurantes .”
Desventajas:
Requieren una revisión del modelo de datos, objetos, transacciones y además del almacenamiento.
No es muy útil para la toma de decisiones en tiempo real debido al largo tiempo de procesamiento que puede requerir. En cualquier caso la tendencia de los productos actuales (junto con los avances del hardware) es la de solventar este problema convirtiendo la desventaja en una ventaja. Requiere de continua limpieza, transformación e integración de datos. Mantenimiento. En un proceso de implantación puede encontrarse dificultades ante los diferentes objetivos que pretende una organización. Una vez implementado puede ser complicado añadir nuevas fuentes de datos.
Como podemos apreciar, el concepto Data Warehouse va más allá de solo empresas bancarias o gestiones, mediante este fragmento expuesto podemos ver como mediante un DW se pueden controlar distintas operaciones como lo son el manejo de una cadena de restaurantes de una manera mucho más detallada, pues de esta forma es mucho más fácil poder detectar un error en algún sector del negocio.
11
7. Conclusión
8. Bibliografía
Al llegar al final del proyecto, podemos decir que el desarrollo de un Sistema de DW es bastante complejo. Abarca gran cantidad de personas, usuarios de los sistemas fuente, desarrolladores, etc. También comprende diferentes componentes, sistemas fuente, herramientas de extracción, herramientas de consulta, redes, aplicaciones de usuario final, bases de datos, etc. Un Sistema de DW debe combinar todos éstos elementos y brindar un producto final consistente, amigable y confiable que a su vez esté preparado para enfrentar los continuos cambios que surjan debido a su tan variada estructura. Un trabajo no trivial.
Database Management Mc Fadden - Benjamin/Cummings Publishing Company/Inc., 4ª Edición, 1994.
Todas nuestras metas contempladas para esta presentación fueron realizadas con éxito, pues a lo largo de este paper se ha expuesto de manera clara el concepto Data Warehouse en su totalidad, pasando por su avance a través del tiempo, explicación estructural y funcional,
http://www.1keydata.com/datawarehousing/conce pts.html http://delfos.bligoo.com/content/view/195902/Dat a-Warehouse-Data-mart-y-DataMining.html#.UlF54dLL2GE http://www.definicionabc.com/tecnologia/datawar ehouse.php http://www.inf.udec.cl/~revista/ediciones/edicion3 /cwolff.PDF http://www.sinnexus.com/business_intelligence/d atawarehouse.aspx http://en.wikipedia.org/wiki/Data_warehouse
Para finalizar, un Data Warehouse tiene como finalidad almacenar y proveer a la organización información relevante y a tiempo para que esta pueda tomar decisiones correctas sin cometer errores que puedan provocar un gran problema tanto para la misma como para sus clientes.
http://www.monografias.com/trabajos17/datawarehouse/data-warehouse.shtml http://oltp.wikispaces.com/Diferencia+entre +OLTP+y+OLAP
12