¿Qué partes incluye un sistema de almacenamiento de datos típico?
* *Fuente de datos:* *Sí Las fuentes de datos de el sistema de almacenamiento de datos generalmente incluye diversa información de la empresa, incluidos diversos datos de procesamiento comercial y diversos datos de documentos almacenados en diversas leyes y regulaciones, información de mercado, información de la competencia, etc.
Breve descripción de las herramientas ETL (informatica, ssis, owb, datastage) y las características de las herramientas.
DataStage es una herramienta integrada que simplifica y automatiza el proceso de extracción, transformación y mantenimiento de datos de diversas fuentes de datos operativos y los ingresa en bases de datos de destino en data marts o almacenes de datos.
Tiene cuatro componentes: Administrador: se utiliza para gestionar proyectos y variables de entorno. Gerente: Se utiliza para obtener definiciones de listas de trabajos. Diseñador: utilizado para trabajos de diseño. Directo: consulte el registro de ejecución de tareas del envío.
Almacenamiento y gestión de datos: El almacenamiento y la gestión de datos son el núcleo y la clave de todo el almacén de datos. El modelo de organización y gestión del data warehouse determina que sea diferente a las bases de datos tradicionales y también determina su forma de expresión de datos externos. Comience analizando las características técnicas del almacén de datos, decida qué productos y tecnologías usar para construir el almacén de datos y luego extraiga, limpie e integre efectivamente los datos de los sistemas comerciales existentes y organícelos según temas. Según la cobertura de datos, los almacenes de datos se pueden dividir en almacenes de datos de nivel empresarial y almacenes de datos de nivel departamental (a menudo llamados data marts).
Servidor OLAP:
Integre eficazmente los datos requeridos y organícelos según modelos multidimensionales para realizar análisis de múltiples ángulos y niveles y descubrir tendencias. Su implementación específica se puede dividir en ROLAP (Procesamiento analítico en línea relacional), MOLAP (Procesamiento analítico en línea multidimensional) y HOLAP (Procesamiento analítico en línea híbrido). Los datos básicos y agregados de ROLAP se almacenan en RDBMS; los datos básicos y agregados de MOLAP se almacenan en bases de datos multidimensionales; los datos básicos de HOLAP se almacenan en RDBMS y los datos agregados se almacenan en bases de datos multidimensionales.
Herramientas front-end: incluyen principalmente varias herramientas de consulta, herramientas de análisis de datos, herramientas de minería de datos, varias herramientas de informes y diversas herramientas de desarrollo de aplicaciones basadas en almacenes de datos o data marts.
Las herramientas de análisis de datos están dirigidas principalmente a servidores OLAP. Las herramientas de generación de informes y de minería de datos están dirigidas principalmente a almacenes de datos.