Idioma de búsqueda de características externas de los documentos
El lenguaje de clasificación se refiere a un método de escritura que usa números, letras o una combinación de letras y números como caracteres básicos, usa guiones directos y usa puntos (u otros símbolos) como categorías. son vocabulario básico y un lenguaje de recuperación que expresa conceptos complejos a través de la afiliación a categorías.
El método de procesamiento de la información que utiliza atributos de conocimiento para describir y expresar el contenido de la información se llama clasificación. Las clasificaciones famosas incluyen la Clasificación Decimal Internacional, la Clasificación de Libros de la Biblioteca del Congreso de EE. UU., la Clasificación Internacional de Patentes y la Clasificación de Libros de la Biblioteca China.
2. Idioma del tema
El lenguaje del tema se refiere a un lenguaje de recuperación que utiliza caracteres del lenguaje natural como caracteres, términos sustantivos como vocabulario básico y un grupo de términos sustantivos como marcadores de recuperación. El método de procesamiento de información que utiliza un lenguaje temático para describir y expresar el contenido de la información se denomina método temático. El lenguaje del tema se puede dividir en palabras de título, metapalabras, palabras narrativas y palabras clave.
(1) Palabras de título
Las palabras de título se refieren a palabras, frases o frases que se seleccionan del lenguaje natural y estandarizadas para expresar el concepto de las cosas. Las palabras de título son el tipo más antiguo en el sistema de lenguaje de la materia. Se componen de una combinación fija de sustantivos de tema y palabras de subtítulo. Sólo se pueden utilizar sustantivos de título "estereotipados" para la indexación y recuperación. Esto refleja que el concepto de tema del documento es inevitablemente limitado y no satisface las necesidades del desarrollo del documento. veces. Ya casi no se usa.
(2) Metapalabras
Las metapalabras, también conocidas como palabras unitarias, se refieren a las unidades de vocabulario más pequeñas y básicas que se pueden utilizar para describir los temas cubiertos por el información. Un conjunto de metapalabras estandarizadas que pueden expresar el tema de la información constituye un lenguaje de metapalabras. La metamorfosis es un método para expresar conceptos temáticos complejos mediante la combinación de varias palabras unitarias. El lenguaje de metapalabras se utiliza principalmente para la recuperación mecánica y es adecuado para el reconocimiento de información con métodos de recuperación simples (como tarjetas perforadas).
(3) Discurso narrativo
El texto narrativo se refiere a palabras o frases que se basan en conceptos, estandarizados y optimizados, tienen la función de combinación y pueden expresar la relación semántica dinámica entre palabras. . En términos generales, las palabras elegidas son conceptuales, descriptivas y colocacionales. Después de la estandarización, también es semánticamente relevante, dinámico e intuitivo. La narratología combina los principios y métodos de varios lenguajes de recuperación de información y tiene muchas ventajas. Es un lenguaje ampliamente utilizado adecuado tanto para sistemas de recuperación humanos como informáticos. Herramientas de búsqueda famosas como CA, EI, etc. Todos están ordenados utilizando el método narrativo.
(4) Palabras clave
Las palabras clave se refieren a palabras con significado sustantivo en el título, resumen y texto del documento. Son importantes y clave para revelar y describir el tema del documento. . palabras. El método de palabras clave se utiliza principalmente para el procesamiento e indexación de información informática, por lo que se denomina indexación de palabras clave. La base de datos CMCC es una base de datos de uso común para recuperar literatura médica china y se establece mediante indexación de palabras clave.
3. Lenguaje de código
El lenguaje de código se refiere a un lenguaje de recuperación que utiliza un determinado sistema de código para expresar y organizar los conceptos de las cosas, proporcionando así recuperación. Por ejemplo, basándose en el lenguaje de código de la fórmula molecular de un compuesto, se puede construir un sistema de índice de fórmula molecular para permitir a los usuarios buscar los compuestos correspondientes e información bibliográfica relacionada a partir de la fórmula molecular. 1. Características externas
El idioma de búsqueda que expresa las características externas de un documento se refiere principalmente al título (título del libro), nombre del autor, editorial, número de informe, número de patente, etc. Los diferentes documentos se organizan según el orden de las palabras del título del artículo y el nombre del autor, o según el orden numérico del número de informe y el número de patente. Mediante el método de búsqueda de título del artículo, autor y número, se encuentra un idioma de búsqueda que satisfaga las necesidades del usuario. formado.
El lenguaje de recuperación que describe las características externas del documento se puede resumir brevemente de la siguiente manera:
2. Características del contenido
El lenguaje de recuperación que expresa el contenido. Las características del documento se refieren principalmente a los temas discutidos, ideas, perspectivas y conclusiones.
El lenguaje de búsqueda que describe las características del contenido de los documentos se puede resumir brevemente de la siguiente manera: