Investigación sobre métodos de planificación de recursos de datos para la exploración y el desarrollo petrolero
(Instituto de Investigación de Tecnología de la Información del Instituto de Investigación de Exploración y Desarrollo de Petróleo de Sinopec, Beijing 100083)
Actualmente, varios métodos de planificación de TI y métodos de ingeniería de software están guiando la planificación. de las empresas petroleras Al utilizar recursos de datos, es necesario combinar las características de la gestión de recursos de datos de exploración y desarrollo de petróleo. Este artículo analiza la situación actual y las características de la gestión de recursos de datos de exploración y desarrollo petrolero, propone un método de planificación de recursos de datos de exploración y desarrollo petrolero impulsado por el negocio y proporciona un método de construcción para el modelo comercial de exploración y desarrollo, el catálogo de recursos de datos y la estructura general. del centro de datos, proporcionando la base para la exploración y el desarrollo de petróleo, la planificación de recursos de datos proporciona una metodología completa.
Palabras clave recursos de datos centro de datos de modelo de negocio impulsado por el negocio
Investigación sobre métodos de exploración y desarrollo de petróleo
Planificación de recursos de datos impulsado por el negocio
Wen Bilong, Ji
(Departamento de Investigación de Tecnología, Exploración y Producción de la Información
Instituto de Investigación Sinopec, Beijing 100083)
Resumen Para guiar la planificación de recursos de datos , es necesario Características de la gestión de recursos de datos petroleros, aclarar los métodos de planificación de TI y la teoría de la ingeniería de software. Se analizan las características de la gestión de recursos de datos de exploración y desarrollo de petróleo, se propone un método de planificación de recursos de datos impulsado por el negocio y se proporciona el método de construcción del modelo de negocio de exploración y desarrollo de petróleo y el catálogo de recursos de datos, así como la arquitectura de los datos. centro. Estos proporcionan un enfoque completo para la planificación de recursos de datos de exploración y producción de petróleo.
Palabras clave recursos de datos; impulsor de negocios; modelo de negocios; centro de datos
En el proceso de investigación integral sobre exploración y desarrollo de petróleo y gas, es necesario recopilar una gran cantidad de datos. de campos petroleros nacionales y extranjeros, y los resultados de la investigación integral incluyen una gran cantidad de datos, como varios gráficos, informes, etc. Para gestionar y aplicar estos datos, varios departamentos de investigación han llevado a cabo la construcción de sistemas de gestión de datos relacionados con la investigación del proyecto. Sin embargo, debido a la falta de una planificación unificada, existen los siguientes problemas en la construcción y gestión de los recursos de datos: la construcción de la base de datos es "pequeña, dispersa y compleja" y difícil de administrar; los datos se almacenan de manera dispersa, la correlación lógica entre los datos es baja y no se pueden integrar ni compartir; la falta de un mecanismo de servicio de datos especializado; dificulta la aplicación de datos. Por lo tanto, es necesario realizar una planificación unificada de los recursos de datos de exploración y desarrollo para una investigación integral sobre exploración y desarrollo de petróleo y gas, es decir, realizar gestión de datos y análisis de la demanda de aplicaciones, y diseñar un plan general de construcción del centro de datos.
Los métodos de planificación de recursos de datos se basan principalmente en la teoría de la ingeniería de software y diversas metodologías de planificación estratégica de TI. En la actualidad, la mayoría de las empresas de consultoría de TI de renombre internacional han adoptado métodos teóricos avanzados de arquitectura empresarial (EA), como el marco de arquitectura empresarial TOGAF, han formulado sus propias metodologías de planificación de TI y las han aplicado en proyectos de consultoría de planificación empresarial, logrando buenos resultados [ 1]. Para los recursos de datos, Gao Fuxian resumió un conjunto de métodos de planificación de recursos de información (IRP) basados en la metodología de ingeniería de la información [2]. El método IRP se basa en el método de planificación de datos general para bases de datos temáticas. Sigue ciertos pasos del método y utiliza herramientas de soporte de software efectivas para analizar las necesidades de información y los flujos de datos de cada dominio funcional, formular estándares básicos para la gestión de recursos de información y establecer los estándares básicos. dominio completo y cada dominio funcional marco del sistema de información: modelo funcional, modelo de datos y modelo de arquitectura del sistema.
Basado en la teoría EA y el método IRP, combinados con las características de la investigación integral sobre exploración y desarrollo de petróleo y gas, se propone un conjunto de métodos de planificación de recursos de datos de exploración y desarrollo impulsados por el negocio.
1 La idea básica de la planificación de datos
La planificación de recursos de datos adopta métodos científicos y razonables para analizar el contenido, los estándares, la tecnología, el software y el personal relevantes de los datos generados y utilizado en la producción y operación de la empresa, clasificar, optimizar y diseñar de manera integral las condiciones de soporte, y proponer soluciones integrales para la recopilación, transmisión, almacenamiento, aplicación y gestión de recursos de datos, para que las empresas puedan mejorar el disfrute de los datos y reducir el uso. costo de la recopilación, gestión y aplicación de datos, y aprovechar al máximo los recursos de datos con el máximo efecto.
El propósito de la planificación de recursos de datos es optimizar la calidad de la gestión de datos empresariales. Esto incluye mejorar el disfrute de los datos, reducir el costo de la recopilación, gestión y aplicación de datos y aumentar el valor de los recursos de datos. Entre ellos, el primer paso es proporcionar información relevante a empresas de diferentes niveles.
Para los tomadores de decisiones, la información proporcionada incluye: qué activos de datos existen, en qué se invierte, qué tan efectiva es la inversión en datos y si existe duplicación de la construcción para la gestión; la información proporcionada incluye: dónde se almacenan los datos, quién; lo está administrando, quién lo utiliza y cuál es la calidad de los datos. Para la capa de ejecución, la información proporcionada incluye: qué datos están disponibles, dónde están, cómo obtenerlos y cómo enviar los resultados; En el departamento de servicios de información, la información proporcionada incluye: qué datos necesita el departamento comercial y cómo utilizarlos.
El objetivo de la planificación de recursos de datos es proponer soluciones de construcción de recursos de datos. A través del plan de implementación, se puede establecer un centro de datos empresarial y su sistema de gestión y construcción de soporte para lograr el propósito de la planificación de recursos de datos. El contenido de la planificación de recursos de datos incluye la organización de los requisitos de los datos, es decir, el diseño de estándares relacionados con los datos, incluidos estándares de elementos de datos, estándares de recopilación de datos, estándares de gestión de datos, estándares de codificación de datos, etc. Diseño de soluciones técnicas para la construcción y gestión de datos; arquitectura de software para la gestión y servicios de datos; estructura organizacional y sistemas de soporte para la construcción de datos.
El proceso de planificación de recursos de datos se muestra en la Figura 1. Si la construcción de un centro de datos se considera un proyecto completo de ingeniería de software, la planificación de recursos de datos se encuentra en las etapas de análisis de requisitos y diseño del esquema. Durante el proceso de implementación del proyecto, se deben llevar a cabo un diseño más detallado, el desarrollo del sistema, las pruebas del sistema y la operación y mantenimiento de acuerdo con el plan planificado.
En la etapa de análisis de la demanda de recursos de datos, el alcance comercial, las actividades de investigación, las bases de datos establecidas y el contenido de los datos, el software de aplicación, la implementación, etc. de la investigación integral actual de exploración y desarrollo se clasifican a través de la investigación. Según la situación de la convocatoria, establezca un modelo de negocio, estandarice la descripción de las actividades de investigación y los requisitos de datos de cada actividad, analice el flujo de datos y forme un directorio unificado de recursos de datos. El resultado final de la fase de análisis de requisitos es el informe de análisis de requisitos, cuyo contenido principal consta de un conjunto de especificaciones, incluidos modelos de negocio, catálogos de recursos de datos, catálogos de elementos de datos y especificaciones de flujo de datos.
La tarea principal de la fase de diseño del esquema es diseñar el plan en función de los requisitos de datos y formar un plan de construcción de recursos de datos, que incluye: un plan integral de construcción de base de datos, un servicio integral de datos de investigación y un plan de construcción de plataforma de gestión. y un sistema de operación y mantenimiento del centro de datos. Forme un marco general de modelo de datos, función de servicio de datos, función de gestión de datos, proceso de gestión de intercambio de datos, gestión de datos y estructura de organización de servicios, y forme un marco de proyecto para la construcción del centro de datos. A través del plan de construcción de recursos de datos, se aclaran cuestiones como cómo almacenar datos, cómo controlar la calidad de los datos, cómo construir datos, cómo gestionar datos, cómo obtener, enviar y aplicar datos.
Figura 1 Proceso de planificación de recursos de datos
Figura 2 Resultados y relaciones de la planificación de recursos de datos
Durante la etapa de implementación del proyecto, también es necesario planificar de acuerdo con El plan de construcción de recursos de datos. Cada proyecto se diseña y desarrolla en detalle.
Los resultados de la planificación de recursos de datos incluyen informes de análisis de la demanda de recursos de datos y planes de construcción del centro de datos. El informe de análisis de la demanda incluye el modelo de negocio, el directorio de recursos de datos y el directorio de elementos de datos. El plan de construcción del centro de datos incluye el plan de construcción de la base de datos, incluida la base de datos y el modelo de datos, la plataforma de gestión y servicio de datos y el sistema de operación y mantenimiento del centro de datos.
La Figura 2 muestra estos resultados y sus relaciones. Todo tipo de datos utilizados y generados por cada actividad empresarial en el modelo de negocio deben registrarse en el catálogo de recursos de datos, y cada tipo de datos en el catálogo de recursos de datos debe describirse mediante uno o más elementos de datos. Las instancias de datos en la base de datos deben clasificarse en directorios de recursos de datos y deben establecerse relaciones de mapeo entre elementos de datos y modelos de datos. Con base en la relación anterior, el software de aplicación o los usuarios pueden obtener fácilmente los datos requeridos del centro de datos mediante el uso de servicios de datos y plataformas de gestión basadas en actividades comerciales.
2 Modelo de negocio basado en 6W
Un modelo de negocio es un modelo que describe el proceso de negocio de una empresa definiendo las actividades que lo componen y las relaciones lógicas entre ellas. El modelado de negocios de exploración y desarrollo consiste en abstraer los negocios involucrados en el ciclo de vida de exploración y desarrollo de petróleo en una estructura de funciones comerciales completa y establecer un modelo de negocios de exploración y desarrollo. Para establecer este modelo, no sólo debemos comprender la estructura funcional de la exploración y el desarrollo de manera sistemática, esencial y general, sino también establecer modelos de información relacionados con funciones, como modelos de datos, modelos de conocimiento y modelos de software para la industria de exploración y desarrollo.
El proceso de análisis y modelado de negocios se puede dividir en cuatro etapas: primero, división de áreas de negocio; segundo, modelado por áreas de negocio; tercero, integración de modelos de negocio;
El modelo de negocio adopta una estructura de tres capas: "Dominio empresarial-Clasificación empresarial-Actividades empresariales".
Todos los negocios que involucran la exploración y el desarrollo de petróleo se dividen en múltiples dominios comerciales. Cada dominio comercial establece una clasificación comercial de múltiples niveles, y cada clasificación define una o más actividades comerciales básicas.
Un área de negocios es una abstracción de algunas áreas importantes de actividad comercial en una empresa, en lugar de una copia de organizaciones y departamentos existentes. La división de las áreas de negocio de los yacimientos petrolíferos puede basarse en un tema determinado. Los principios para dividir las áreas de negocios son: (1) dividir las áreas de negocios según las especialidades; (2) dividir las áreas de negocios según el ciclo de vida de la exploración y desarrollo de campos de petróleo y gas (3) dividir las áreas de negocios de gestión según las etapas de; Gestión de exploración y desarrollo de campos de petróleo y gas. La división de áreas de negocios debe llevarse a cabo con referencia a los tres principios anteriores, de modo que sea lo más consistente posible con las prácticas de gestión establecidas de exploración y desarrollo de campos de petróleo y gas, para garantizar que no haya duplicación de negocios en diferentes áreas de negocio, y cubrir todos los negocios de exploración y desarrollo. Con base en los principios anteriores, el campo comercial de exploración y desarrollo de petróleo y gas se puede dividir en seis campos comerciales principales: exploración geofísica y geoquímica, ingeniería de pozos, pruebas analíticas, investigación integral, producción de petróleo y gas e ingeniería de superficies.
El negocio consta de una serie de actividades empresariales. La descripción de las actividades empresariales se realiza según el modelo "6W" [3], es decir, quién inicia la actividad, cuándo, dónde y por qué, qué. Los objetos están involucrados en la actividad, y estos objetos ¿Cuáles son las características de? Los elementos básicos que intervienen en las actividades empresariales y las relaciones entre ellas están definidos por unidades de negocio. Una unidad de negocio incluye los siguientes ocho tipos de elementos: 1. actividades de negocio, 1. los objetos de negocio sobre los que actúan las actividades, 1. la organización que implementa las actividades, 1. un grupo de objetos de resultados (salida), 1. un grupo de objetos participantes (entrada), reglas de negocio y objetos relacionados. Propiedades y relaciones entre objetos. La estructura del departamento comercial se muestra en la Figura 3.
En una unidad de negocios, las "características" definen los datos necesarios para las actividades comerciales y el conocimiento relacionado con las actividades comerciales, y son el foco de la planificación de datos; los "participantes" incluyen personal, software, datos, instalaciones, materiales y métodos; los "objetos de acción" incluyen bloques, yacimientos, pozos, capas, campos petroleros, empresas, etc. Los "objetos de resultados" pueden ser objetos físicos en campos petroleros, como pozos petroleros, u objetos técnicos, como documentos, métodos y resultados de investigación.
El modelado de modelos de negocios basado en 6W describe la unidad de negocios de una única actividad comercial bajo un marco de clasificación de dominios de negocios unificado y no requiere una combinación especial de procesos de negocios. Sin embargo, dado que la unidad de negocios describe los objetos participantes y los objetos de resultados de la actividad comercial, es decir, define la entrada y la salida de la actividad, es fácil formar automáticamente varios procesos, como el flujo de negocios, el flujo de datos y el flujo de conocimiento.
La relación entre las actividades empresariales y los datos se puede describir mediante la matriz "CUR". En una matriz, las filas corresponden a actividades comerciales y las columnas corresponden a elementos de datos. Si se crea un determinado dato en una actividad comercial, el valor correspondiente a esta columna se marca como "c" (crear). Si la actividad comercial actualiza los datos, se marca como "u" (actualizar). La actividad empresarial se refiere a un determinado dato marcado como "r" (leído). La matriz CUR se puede utilizar para verificar si determinados datos tienen una fuente de creación única para garantizar la unicidad de la fuente de datos. Según la relación de la curva, el flujo de datos se puede formar automáticamente.
Figura 3 Estructura de las unidades de negocio
3 Catálogo de recursos de datos de exploración y desarrollo
El catálogo de recursos de datos de exploración y desarrollo es para empresas de campos petroleros, investigación de exploración y desarrollo institutos o Sinopec Descripción de los datos existentes y necesarios clasificados y organizados. El catálogo de recursos de datos describe qué datos necesita la empresa, qué datos tiene, dónde están, quién los administra, quién los utiliza y qué software de aplicación los utiliza. El catálogo de recursos de datos es el estándar de clasificación y organización de datos de una unidad de construcción de datos. Son los metadatos centrales de la plataforma de servicios y gestión de datos del centro de datos y también son la base para que los usuarios creen y utilicen datos.
El modelo de clasificación del directorio de recursos de datos es multidimensional y se puede clasificar desde diferentes perspectivas. Los tamaños comúnmente utilizados incluyen:
(1) Organizado por objetos comerciales. Incluyendo bloques, yacimientos, pozos, capas, campos petroleros, empresas, etc. Además de los datos básicos del objeto en sí (como la información básica del pozo), que generalmente se denominan datos estáticos, también incluye varios datos dinámicos del objeto (como los datos diarios del pozo).
(2) Actividades organizadas por las empresas. De acuerdo con la estructura de tres capas "Dominio de Negocio-Clasificación de Negocios-Actividades de Negocio" del modelo de negocio, cada negocio tiene un conjunto de datos identificados con "CUR".
(3) Organizar según características. La clasificación se basa en las características de los datos o del conocimiento en sí, como longitud, densidad, permeabilidad, etc.
(4) Organizado por proyecto.
¿Qué datos utiliza y genera el proyecto?
(5) Organizado por unidad. ¿Qué datos utiliza, genera y gestiona un departamento?
Las dimensiones del directorio de recursos de datos están interrelacionadas. La relación entre objetos, actividades, características, proyectos y unidades se muestra en la Figura 4.
Además de establecer un directorio de clasificación, el directorio de recursos de datos también incluye instancias de datos. Por lo tanto, es necesario asociar la clasificación de datos con las instancias en la base de datos y aclarar qué instancias incluye cada categoría. La relación entre clasificación e instancia está definida principalmente por el conjunto de datos, y las instancias en el conjunto de datos están determinadas por el identificador y las condiciones de identificación de la instancia de datos [4]. La clasificación de los recursos de datos se completa durante la fase de análisis de los requisitos de datos y la asociación entre la clasificación y las instancias de datos se forma durante la operación del centro de datos.
Los datos en el directorio de recursos de datos se dividen en dos niveles: entidades de datos lógicos y atributos. Desde una perspectiva técnica, la esencia de una entidad de datos lógica es una vista de datos. Una vista de datos es una tabla de datos virtual. Cada vista de datos consta de múltiples atributos y contiene al menos una palabra clave. Las propiedades de una entidad se describen mediante elementos de datos. Los elementos de datos son unidades de datos básicas que no requieren subdivisión [5]. Actualmente, puede consultar directamente el diccionario de elementos de datos de exploración y desarrollo petrolero de Sinopec [6].
4 La arquitectura general del centro de datos
La arquitectura de diferentes centros de datos empresariales será diferente [7]. Tomando como ejemplo el centro de datos del Instituto de Investigación para la Exploración y el Desarrollo del Petróleo de China, se explica el plan de construcción del centro de datos. El centro de datos incluye una base de datos integral de investigación, exploración y desarrollo, una plataforma de gestión y servicio de datos y un sistema de operación y mantenimiento del centro de datos, como se muestra en la Figura 5.
Figura 4 Relación entre las dimensiones de clasificación de recursos de datos
Figura 5 Centro de datos integral de investigación, exploración y desarrollo
La base de datos de exploración y desarrollo incluye metadatos y datos profesionales. Los metadatos se basan en el directorio de recursos de datos y describen la clasificación profesional, el directorio, la estructura, la dinámica de uso y otra información. Las bases de datos subcontratadas y las bases de datos de información geográfica provienen del exterior, tienen un software de gestión maduro, son datos públicos y son independientes de la investigación de proyectos específicos. Debido a que los datos sísmicos y los datos de registro de pozos tienen formatos especiales, se manejan con un software especial, pero deben estar relacionados con los datos del proyecto. Los datos y resultados del proyecto se guardan principalmente en forma de archivos. Los datos de alta calidad deben convertirse de archivos semiestructurados a datos estructurados. Los datos están relacionados entre sí para lograr la integración de datos. La Aplicación de Investigación Integrada tiene su propia base de datos interna del proyecto, lo que permite el acceso a datos en línea a través de la tecnología Data Bridge. El canal de datos se utiliza para interconectar el centro de datos del Instituto de Investigación de Exploración y Desarrollo del Petróleo y los centros de datos en todos los niveles de Sinopec Corp.
Las funciones principales del servicio integral de datos de investigación y la plataforma de gestión incluyen: consulta de objetivos de investigación SIG, visualización de perfiles sísmicos, visualización de curvas de registro de pozos, consulta de datos, búsqueda de datos, envío de datos, descarga de datos, gestión del sistema, y espera de publicación de datos.
El sistema de operación y mantenimiento del centro de datos incluye tres partes: organización de gestión de operación y mantenimiento, gestión de envío de datos y gestión de servicios de datos. Las funciones del equipo de gestión de operación y mantenimiento incluyen la gestión del sistema de bases de datos, el soporte del servicio de datos y el control de calidad de los datos. La gestión de envío de datos regula cada enlace de acuerdo con el flujo de datos y el ciclo de vida de los datos, incluyendo: aplicación de datos externos, recopilación de datos, envío de datos originales, gestión de datos personales/del equipo del proyecto, envío de resultados, ajuste del flujo de datos (registro y cancelación del catálogo de datos), Seguridad y permisos, revisión y aceptación, etc. La gestión de servicios de datos estandariza el comportamiento de los servicios de datos a través del sistema de gestión de servicios de datos, establece especificaciones técnicas del servicio de datos y proporciona interfaces de servicio estándar para sistemas de aplicaciones a través de especificaciones de interfaz de servicio de aplicaciones de datos.
5 Conclusión
El método de planificación de recursos de datos propone un conjunto de metodología adecuada para la construcción de recursos de datos en el campo de la exploración y desarrollo petrolero. A partir de las necesidades comerciales de exploración y desarrollo, establecemos un modelo comercial clasificando los procesos comerciales, organizando datos relacionados con el negocio y estableciendo un directorio de recursos de datos. Sobre esta base, se propone un plan completo de construcción del centro de datos, planificando desde los aspectos de organización del personal, construcción de datos, construcción de plataformas de servicios, gestión de operación y mantenimiento, etc. El método de planificación de recursos de datos se aplicó con éxito a la construcción de estándares de modelos de datos de exploración y desarrollo de petróleo y gas de Sinopec, y se desarrolló el Modelo de Negocios de Sinopec (SPBM), que definió seis negocios que incluyen exploración geofísica, ingeniería de pozos, análisis y pruebas, y análisis integral. campos de investigación, desarrollo y producción e ingeniería de superficies, incluidas 65.438+0.237 actividades comerciales, clasificando diversos datos relacionados con las actividades comerciales.
El trabajo de investigación adicional aplicará el método de planificación de recursos de datos a la construcción de recursos de datos del Instituto de Investigación de Exploración y Desarrollo de Petróleo de Sinopec. A través de la investigación sobre los negocios del instituto de investigación y en combinación con la situación de SPBM, se establecerá un directorio integral de recursos de datos de investigación. Se diseñará el plano de construcción del centro de datos. Los resultados de la planificación integral de recursos de datos de investigación del Instituto de Investigación de Exploración y Desarrollo de Petróleo de Sinopec se pueden promover y aplicar aún más a la construcción de recursos de datos de investigación integrales para las compañías petroleras de la industria petrolera.
Referencias
[1] Tao Jin, Zheng Shuquan, Li Mingmin, et al. Investigación sobre métodos de planificación de TI basados en la arquitectura empresarial [J]. 26(12):164~166.
[2]Gao Fuxian. Infraestructura de construcción de planificación de recursos de información-información [M]. Beijing: Prensa de la Universidad de Tsinghua, 2002.
Xiao Bo, Jing Shuai, Wu Jianjun, Ma Chengjie. Investigación sobre la aplicación de tecnología basada en modelos en centros de datos empresariales de yacimientos petrolíferos [J]. Journal of Daqing Petroleum Institute, 2012, 36 (1): 78 ~ 82.
Shi Guiying, Wen Bilong. Investigación sobre tecnología de integración de datos basada en elementos de datos [J] Ciencia, Tecnología e Ingeniería, 2011, 11(18): 4223 ~ 4227.
[5]Wen Bilong, Zhang Li. Utilice un árbol semántico [C] para definir la semántica de los elementos de datos. Actas del Simposio Internacional sobre Ingeniería y Ciencias de la Información de 2008, 2008.12:524~527.
Wen Bilong, Xiao Bo, Chen Xinrong. Tecnología de gestión de metadatos para datos de exploración y desarrollo petrolero [J]. Journal of Daqing Petroleum Institute, 2012, 36 (1): 83 ~ 87.
, párrafo,. Diseño del marco general del centro de datos empresarial de campos petrolíferos de Sinopec [J]. Journal of Daqing Petroleum Institute, 2012, 36 (1): 73 ~ 76.