Red de Respuestas Legales - Derecho de bienes - Un estudio preliminar sobre estándares básicos de metadatos para datos geológicos

Un estudio preliminar sobre estándares básicos de metadatos para datos geológicos

Wu Xiaoping

(Archivos Geológicos Nacionales)

Basado en las características de los datos geológicos y la investigación sobre estándares de metadatos relevantes en el país y en el extranjero, este artículo estudia y define un conjunto de los más comunes. atributos que describen los recursos de datos geológicos Los elementos centrales realizan la descripción de la información básica de los recursos de datos geológicos. Con el fin de fortalecer la descripción, organización, divulgación, expresión y gestión efectiva de datos geológicos, promover la utilización, intercambio, intercambio e integración de recursos de datos geológicos y mejorar el nivel de modernización de la gestión de datos geológicos y las capacidades de servicio de datos geológicos.

Investigación sobre palabras clave estándar de metadatos centrales de datos geológicos

1 Introducción

1.1 Antecedentes

Con el desarrollo de la economía y la sociedad, la geología trabajo En el desarrollo práctico a largo plazo, se ha acumulado una gran cantidad de datos geológicos, formando una gran cantidad de conjuntos de datos profesionales con diferentes tipos de recursos y cubriendo diversas disciplinas geológicas, que involucran geología regional, geología mineral, hidrología-ingeniería-geología ambiental. , geología agrícola, geología marina, geología básica, geoquímica, geofísica, teledetección, investigación en geociencias y otros campos. Grandes cantidades de datos, tipos de datos ricos, sistemas heterogéneos y formatos de datos diversificados son características importantes de los datos geológicos actuales.

Con la profundización de las aplicaciones y el aumento de las necesidades sociales, cada vez más investigaciones requieren el apoyo de datos básicos. Las características multidisciplinarias, multiestándar, multitipo, multiescala y masiva de los datos geológicos dificultan hasta cierto punto su utilización y disfrute en profundidad. Cómo describir, organizar, mostrar, expresar y gestionar eficazmente estos datos, promoviendo así la utilización, el intercambio, el intercambio y la integración de los recursos de datos geológicos y mejorando el nivel de intercambio de datos, es la base para mejorar el nivel de modernización de la gestión de datos geológicos y las capacidades de servicio social de los datos geológicos.

Para resolver este problema, sus predecesores llevaron a cabo un fructífero trabajo de investigación y propusieron el uso de la estandarización de metadatos para administrar de manera uniforme recursos de datos dispersos y realizar el disfrute y los servicios de los datos a través de la Web [1-9]. Los metadatos tienen las funciones de descripción, divulgación, organización, gestión, control, preservación e interoperabilidad [9-11]. Las normas y tecnologías de metadatos son medios importantes para lograr la estandarización, el intercambio y la interoperabilidad de los datos. Utilice estándares de metadatos para mejorar la profundidad de la descripción y expresión de los datos, realizar la descripción, descubrimiento, procesamiento y evaluación de los recursos de datos, y mejorar la gestión de datos y la eficiencia de las consultas de los datos de recuperación del usuario a través de la estandarización de los metadatos, resolviendo gradualmente la independencia semántica y los conflictos; entre recursos de datos Problemas heterogéneos, lograr la interoperabilidad de datos en la mayor medida y sentar las bases para la integración y el intercambio de recursos de datos mediante el establecimiento de registros de metadatos relevantes, el establecimiento de información relacionada con la gestión de recursos de datos, como el mantenimiento y la preservación, fortaleciendo el control del proceso de gestión de datos; , y una mayor gestión y utilización Los datos geológicos juegan un papel importante.

1.2 Situación actual

En la actualidad, en materia de gestión y servicios de datos geológicos, se han conformado un conjunto de normas y especificaciones para el catálogo de datos geológicos, como son las “Reglas de Descripción Detallada de Archivos de Datos Geológicos”, “Resultados “Requisitos Técnicos para la Gestión de Datos Geológicos”, “Tabla de Descripción de la Base de Datos del Catálogo de Datos Geológicos de Resultados y Requisitos de Descripción” y sistemas de software correspondientes para estandarizar la construcción, gestión y servicio de resultados de datos geológicos. En la actualidad, las instituciones de recopilación de datos geológicos de todos los niveles han establecido bases de datos de catálogos de datos geológicos, realizando inicialmente el intercambio de información de datos básicos entre catálogos interbibliotecarios y desempeñando un papel importante en la gestión, el intercambio y el servicio de datos geológicos.

La base de datos del catálogo de datos geológicos describe y organiza la información básica de los archivos de datos geológicos. Es una parte importante del sistema de metadatos de datos geológicos y sienta las bases para el desarrollo sostenible de los datos geológicos y la construcción posterior. aplicaciones ricas de datos geológicos una base sólida.

2 Información básica sobre estándares de metadatos relevantes

2.1 DC (Dublin Core) Conjunto de elementos Dublin Core

El formato de metadatos Dublin Core fue iniciado por OCLC en los Estados Unidos. Estados Diseñado por la Iniciativa de Metadatos Dublin Core y mantenido y modificado por instituciones que participan en proyectos colaborativos. Es adecuado para la descripción de recursos de red. La última versión es la 1.1.1999, que se lanzó e implementó el 2 de julio.

Como nueva herramienta de descripción universal para recursos de información en la era de Internet, los metadatos de DC están siendo aceptados por cada vez más países y regiones en diferentes campos profesionales, diferentes idiomas y diferentes orígenes culturales.

Los estándares de metadatos de DC se refieren principalmente a elementos de metadatos de DC, definiciones de elementos y anotaciones, así como al texto estandarizado o normalizado compuesto de estos contenidos.

El propósito inicial de la aplicación de DC es registrar y extraer recursos de la red. Debido a la facilidad de uso de los elementos DC, la vigorosa promoción de OCLC y la enorme demanda de recursos de red de grabación, DC se adaptó rápidamente a cualquier medio. Se pueden registrar fácilmente definiciones y configuraciones de elementos simples, lo que también es una razón importante por la que DC se usa ampliamente. Pero también trae otro problema, es decir, la profundidad de la descripción del objeto grabado no es suficiente para permitir una recuperación altamente específica [12]. En 2010, se lanzó oficialmente la versión china de los metadatos de DC. El conjunto de elementos de metadatos Dublin Core de información y documentación (GB/T 25100-2010) estandarizó aún más el proceso cultural de DC [13], y se unificaron la descripción semántica y los nombres de los elementos. y estandarizado. Según el conjunto de elementos de metadatos Dublin Core (versión V1.1), DC consta de 15 elementos, cada elemento tiene 10 atributos definidos según ISO/IEC 1179, a saber:

Nombre: el nombre del elemento ;

Identificador: el identificador único del elemento;

Versión: la versión de metadatos del elemento generado;

RegistrationAuthority: la organización que registró el elemento;

Idioma: lenguaje de descripción del elemento;

Definición: explicación del concepto y connotación del elemento;

Opción: indica si el elemento es restringido u opcional;

p>

Tipo de datos: el tipo de datos representado en el valor del elemento;

Frecuencia máxima: la frecuencia máxima de uso de un elemento, es decir, si puede ser reutilizado;

Comentario: el comentario se aplica al elemento.

Los elementos de DC se pueden dividir en tres grupos según la categoría y el alcance del contenido que describen (Tabla 1): ① Descripción del contenido del recurso; ② Descripción de la propiedad intelectual; ③ Creación de instancias de atributos externos.

Tabla 1 Lista de elementos de metadatos de DC

2.2 Estándares de contenido de metadatos geoespaciales digitales

Los estándares de contenido para metadatos geoespaciales digitales están determinados por la Ley Federal de Datos Geoespaciales de EE. UU. y publicado por el comité [4, 9, 11, 14]. La Norma 1992 se redactó en julio y ha sido revisada muchas veces. El 8 de julio de 1994, FGDC confirmó oficialmente el estándar como Estándar Nacional de Metadatos de Datos Geoespaciales de EE. UU. y publicó su versión revisada en abril de 1997 (FGDC1994, FGDC 1997).

El propósito del estándar de contenido de metadatos geográficos digitales del FGDC es determinar los términos que describen los datos geoespaciales digitales y su conjunto de definiciones, incluidos elementos de datos, elementos compuestos (un conjunto de elementos de datos) y sus definiciones y valores de dominio. y Describe el contenido de información de metadatos de un conjunto de datos geoespaciales digitales.

FGDC está organizado según secciones, elementos compuestos y elementos de datos, incluyendo 7 subconjuntos principales y 3 subconjuntos auxiliares (ver Tabla 2). * * * Hay 460 entidades de metadatos (incluidos elementos compuestos) y elementos. FGDC define tres propiedades: subconjunto, elemento compuesto y elemento. Los tres atributos son: necesario, es decir, información que debe proporcionarse bajo ciertas condiciones, es decir, información que debe proporcionarse si los metadatos que se crean contienen características descritas por subconjuntos, entidades o elementos opcionales, es decir, la información es opcional y corresponde al usuario decidir si la incluye en el archivo de metadatos. El estándar de metadatos FGDC no especifica formatos de sintaxis ni reglas de codificación, por lo que es solo un estándar de contenido como DC.

Tabla 2 Lista de elementos fgdc

2.3 Estándar de metadatos ISO TC211

El estándar de metadatos ISO TC211 es estudiado por el Grupo de Trabajo III de la Organización Internacional de Normalización, número de proyecto es 15046-15.

El borrador de la versión 1.0 se adoptó el 9 de febrero de 1996. Después de varias revisiones, la versión estándar de 210 (ISO TC211, 1997) se publicó el 20 de octubre [los elementos de contenido de metadatos de TC211 se dividen en tres tipos: tipo requerido (M), se refiere al contenido que se debe proporcionar. El tipo condicional (C) se refiere a lo que se debe proporcionar bajo ciertas condiciones (C significa opcional). (O) se refiere a contenido opcional (O significa opcional). El contenido de los metadatos se expresa elemento por elemento y línea por línea; el estándar proporciona especificaciones para la producción y gestión de metadatos.

En el estándar de metadatos TC211, el contenido de los metadatos se divide en siete categorías. Cada categoría incluye varias subcategorías o elementos de metadatos específicos, que incluyen principalmente contenido de metadatos, contenido de información de identificación, contenido de información de calidad de datos y expresión de datos espaciales. contenido de información, contenido de información de referencia espacial, contenido de información de características y atributos, contenido de información de publicación de datos, contenido de información de referencia de datos, etc.

3 Metadatos Básicos de Datos Geológicos

3.1 Concepto

La "Especificación de Metadatos Básicos" tiene como objetivo definir un conjunto de datos que describen los atributos más comunes de los datos geológicos. recursos de datos Elemento para realizar la descripción de la situación básica de la información de datos.

3.2 Propósito

Los metadatos centrales de datos geológicos (GDCM) tienen como objetivo proporcionar un conjunto común de descripciones de recursos de datos geológicos mediante el establecimiento de un conjunto de elementos para describir varios conjuntos de datos geológicos. especificaciones para permitir a los administradores y usuarios describir conjuntos de datos con las mismas características o atributos en aplicaciones de dominio general, y para apoyar la recuperación, integración, intercambio, servicio y disfrute de recursos de datos geológicos.

3.3 Alcance

Los metadatos centrales de datos geológicos son la información descriptiva básica sobre los recursos de datos geológicos. Es una colección de metadatos determinada por las similitudes y diferencias de los recursos de datos.

3.4 Principio

3.4.1 Principio de demanda del usuario

Los metadatos centrales, como un conjunto de datos de descripción de datos geológicos básicos y universales, desempeñan un papel importante en el diseño. y selección central Las necesidades de los usuarios deben considerarse plenamente al seleccionar elementos para revelar profundamente la connotación de los recursos de información. En el diseño de estructura y formato, la adición y selección de elementos, la formulación de reglas semánticas, etc. , los canales de interacción entre el sistema y los usuarios deben aumentarse tanto como sea posible desde la perspectiva del usuario (como usar un sistema de diccionario de sinónimos abierto, agregar elementos que brinden comentarios al usuario, etc.) para proporcionar a los usuarios un sistema de recuperación de múltiples niveles [ 9].

3.4.2 Principio de aplicabilidad simple

El principio de aplicabilidad simple requiere que el esquema de metadatos sea simple y fácil de entender, fácil de registrar por computadora y propicio para lograr la interoperabilidad; Al mismo tiempo, se debe tener en cuenta la aplicabilidad y el conjunto de metadatos más capaz que exprese los requisitos para resolver las imprecisiones causadas por muy pocos elementos, mejorar la precisión de la recuperación y hacerla simple y apropiada.

3.4.3 El principio de interoperabilidad y fácil conversión

La interoperabilidad es un principio importante para realizar el intercambio de datos entre diferentes formatos de datos y sistemas heterogéneos. El diseño de soluciones de metadatos debe considerar plenamente la interoperabilidad entre datos y lograr la interoperabilidad mediante el establecimiento de mapeo, mecanismos de intercambio de datos y el intercambio semántico, logrando así el intercambio de datos entre diferentes sistemas y diferentes formatos de datos.

3.4.4 Principios de especificidad y universalidad

Los principios de especificidad y universalidad requieren que el diseño de soluciones de metadatos tenga en cuenta las características de aplicación de varios recursos y coordine la profundidad de la aplicación. de recursos y amplitud.

3.4.5 Principios de escalabilidad y sostenibilidad

La escalabilidad se refiere a la vida útil de la solución de datos. A medida que el contenido, las aplicaciones y las necesidades de los recursos digitales continúan aumentando, las soluciones de metadatos deben poder adaptarse a los cambios en las aplicaciones y necesidades de los recursos, y agregar algunas aplicaciones especiales para adaptarse a las necesidades cambiantes. Algunas aplicaciones específicas pueden requerir descripciones más detalladas y precisas, y se debe permitir a los usuarios ampliar algunos elementos, subelementos o valores de atributos sin romper el contenido estándar especificado (como la definición semántica del elemento) [9]. El principio de sostenibilidad se refiere a considerar plenamente la conexión con los estándares y especificaciones existentes, hacer pleno uso de los resultados de los estándares existentes y garantizar el desarrollo sostenible de soluciones de metadatos.

4 Definición de elementos de metadatos centrales de datos geológicos

4.1 Definiciones básicas

Definir tres términos básicos: metadatos, metadatos centrales y conjunto de datos. Los metadatos son datos sobre datos; los metadatos centrales se refieren a un conjunto de elementos de descripción comunes y las especificaciones correspondientes que pueden describir datos geológicos. Un conjunto de datos es una colección de datos identificables compuesta de objetos de datos relacionados. Trate los datos geológicos descritos como un grupo y un grupo podrá verse como un conjunto de datos. Un conjunto de datos puede ser un conjunto de datos más pequeño que esté ubicado física o lógicamente dentro de un conjunto de datos más grande; por el contrario, un conjunto de datos puede constar de varios conjuntos de datos y ser el conjunto de datos principal de estos conjuntos de datos secundarios; Por ejemplo, dependiendo de la organización de los archivos de datos geológicos, un conjunto de datos puede ser una colección de texto, archivos adjuntos, dibujos, cronogramas, archivos adjuntos y otras clases. Este estudio utiliza conjuntos de datos como objetos de descripción de metadatos y organiza conjuntos de datos clasificando archivos electrónicos de datos geológicos.

Basado en el estándar ISO/IEC 11179-3, este estudio utiliza básicamente un método consistente con Dublin Core para definir los siguientes nueve elementos:

1) Nombre chino: el nombre chino del elemento ;

2) Nombre en inglés: el nombre en inglés del elemento

3) Identificador: el identificador único del elemento

4) Definición: concepto de elemento y explicación de la connotación;

5) Tipo de datos: el tipo de datos en el valor del elemento

6) La restricción indica si un elemento debe usarse o es opcional (obligatorio; );

p>

7) Si el elemento máximo que aparece se puede repetir y el número de veces que se puede repetir

8) Rango de valores: el rango de valores de; elementos de metadatos;

9) Observaciones: Explicaciones adicionales de elementos, sugerencias de formatos de grabación, y otros.

Contenido de 4.2 elementos centrales

Este estudio se refiere al conjunto de elementos de metadatos Dublin Core (versión V1.1) publicado por la iniciativa de metadatos centrales DCMI Dublin y Dublin Core Information and Documentation. Conjunto de elementos de metadatos (GB/t 25100-2010[13]). La traducción al chino del nombre, definición, anotación, restricciones y tipo del elemento se refiere a los Modificadores Dublin Core[17], Terminología de metadatos DCMI [16] Reglas de descripción detallada para geología. Archivos de datos (DA/T 23-2000) [21], Tabla de descripción de datos del estudio geológico de resultados y requisitos de descripción [22], Esquema de metadatos chinos de la Biblioteca Nacional [15], Estándares básicos de metadatos de la base de datos científica de la Academia China de Ciencias [20]. Los elementos centrales y las definiciones del estándar Geological Data Core Metadata (GDCM) se muestran en la Tabla 3.

Tabla 3 Elementos centrales del estándar de metadatos centrales de datos geológicos (borrador)

5 Conclusiones y reflexiones

Como parte de la descripción de los datos geológicos, las necesidades de metadatos centrales A mayor investigación, estandarización gradual y mejora. Dado que los datos geológicos involucran una amplia gama de áreas, formatos y tipos, es necesario desarrollar una serie de estándares de metadatos para describir sistemáticamente los recursos de datos y establecer un intercambio semántico y un mapeo entre múltiples estándares de metadatos diferentes para mejorar la precisión de la descripción de los datos. Profundidad y nivel, optimizar la organización y estructura de los datos y mejorar continuamente el nivel de gestión, servicio e intercambio de datos geológicos.

Haz el examen y contribuye

[1] Oficina del Comité de Coordinación de Información Geográfica Nacional. Investigación sobre la integración y el intercambio de recursos naturales e información geoespacial [M Beijing: Science Press, 2007].

[2]Xu Guanhua. Implementar el intercambio de datos científicos para mejorar la competitividad científica y tecnológica [J Chinese Basic Science, 2003 (1): 5 ~ 9.

[3]Tío Sol. Los datos terrestres son una fuente importante de innovación en las ciencias de la tierra: hablar sobre el disfrute de los datos científicos desde la perspectiva de las ciencias de la tierra [J]. Ciencia básica de China, 2003 (1): 19 ~ 23.

Zhou Chenghu y Li Jun. Un estudio preliminar sobre estándares de metadatos para datos geoespaciales [J Progress in Geographic Sciences, 1998, 17 (4): 55 ~ 63.

Zhang Li, Gong Jianya.

Investigación e implementación de la gestión de metadatos geoespaciales [J]. Revista de ciencia y tecnología de topografía y cartografía de la Universidad de Wuhan, 2000, 25 (5): 127 ~ 131.

Shen Tiyan, Cheng Chengqi. Diseño e implementación de un sistema de tecnología de metadatos geográficos [J]. Revista de ciencia y tecnología de topografía y cartografía de la Universidad de Wuhan, 1999, 24 (4): 34 ~ 37.

Le, tú Songcai, Xie Chuanjie. Análisis y diseño de estructura estándar de metadatos en datos de geociencias * * * [J Geografía y Ciencia de la Información Geográfica, 2005, 21(1): 16 ~ 18.

[8]Liu Wei et al. Descripción semántica y actualización del servicio de bibliotecas digitales [M]. Beijing: National Library Press.

[9] Long Xiao et al., Marco estándar de metadatos chinos y su aplicación [J] Foro de bibliotecas digitales, 2011, 5: 29 ~ 35.

[10]/, Construcción de estándares y especificaciones de bibliotecas digitales: estándares y especificaciones de metadatos básicos, 2005-12.

[11] Feng Xiangyun, Long Xiao, Liao Sansan, et al. Estudio comparativo de estándares extranjeros de metadatos generales [J].

[12] Informe de investigación comparativo sobre estándares de metadatos extranjeros, uno de una serie de informes realizados por el Equipo del Proyecto de Investigación de Estándares de Metadatos de Documentos Chinos, Biblioteca de la Universidad de Pekín (65438, febrero de 2000).

[13]Conjunto de elementos de metadatos básicos de Dublin, GB/t 25100-2010 (ISO 15836:2009, MOD), 2010-09-02.

[14]Xue Ming. Modelo de referencia estándar del Comité Federal de Datos Geográficos de EE. UU. [J]. Estandarización de topografía y cartografía, volumen 20, número 62.

[15]/CMS/Searcher/. Esquema de metadatos chino. Biblioteca Nacional, 2002.03.

[16], Estándar de metadatos básicos de la base de datos científica de la Academia China de Ciencias (1.1), 2003-08.

[21] Reglas de descripción detallada de archivos de datos geológicos. Estándar de la industria de archivos de la República Popular China: DA/T 23—2000.

[22] Tabla de descripción de datos del estudio geológico y requisitos de descripción. Centro de Investigación para el Desarrollo del Servicio Geológico de China, 2004-11-11.