Garantía técnica para el funcionamiento del sistema de servicios de información en red en bibliotecas universitarias
La tecnología de recopilación de información incluye la recopilación de datos de objetos y la recopilación de metadatos.
1) La recopilación de datos de objetos incluye principalmente la recopilación de información de texto y la recopilación de información de imágenes. La recopilación de información textual se refiere principalmente a la digitalización de documentos originales en papel. No basta con confiar en la entrada manual y la revisión manual. Para digitalizar grandes cantidades de información de texto se requiere tecnología de escaneo confiable y tecnología de reconocimiento OCR (reconocimiento óptico de caracteres). La adquisición de información de imágenes requiere la aplicación de tecnología de escaneo. Se pueden obtener imágenes importantes en el sitio mediante cámaras digitales, cámaras de video digitales y otras herramientas, y los datos de imágenes originalmente almacenados en medios como cintas de video se pueden digitalizar mediante las tecnologías correspondientes. En la actualidad, los documentos se proporcionan generalmente en versiones digitales, siempre que se procesen, almacenen y organicen de acuerdo con los requisitos de un sistema bibliotecario digital integrado.
2) Los metadatos son datos sobre datos. El objetivo más básico de los metadatos es gestionar los datos para que puedan consultarse, leerse, intercambiarse y disfrutarse. La tecnología de recopilación de metadatos se refiere a la tecnología que recopila metadatos de sistemas de bases de datos, sistemas de archivos y archivos HTML para formar un almacén de metadatos local.
En segundo lugar, la tecnología de procesamiento de información
La tecnología de procesamiento de información incluye la tecnología de procesamiento de datos de objetos y la tecnología de procesamiento de metadatos.
(1) La tecnología de procesamiento de datos de objetos se refiere a indexar y clasificar los datos de objetos recopilados de acuerdo con estándares de metadatos y especificaciones de descripción.
(2) La tecnología de procesamiento de metadatos recopila metadatos y luego convierte y limpia los datos recopilados de acuerdo con los estándares de metadatos y las especificaciones de descripción, es decir, estandariza y estandariza los metadatos y elimina los metadatos no calificados.
(3) La indexación automática y la indexación manual implican principalmente la indexación de temas y la indexación de clasificaciones, que son vínculos importantes en el procesamiento de recursos de información. La tecnología de indexación automática se basa en tesauros y tablas de clasificación para generar automáticamente palabras temáticas y clasificaciones para los indexadores.
En tercer lugar, la tecnología de almacenamiento de información
Actualmente, la información bibliográfica de las bibliotecas se almacena principalmente en bases de datos en diferentes entornos. Debido a la incompatibilidad de bases de datos heterogéneas, a menudo es necesario escribir algunos programas de conversión, lo que reduce en gran medida la eficiencia del intercambio de información. Al mismo tiempo, para proporcionar servicios de consulta rápidos y precisos de información bibliotecaria en Internet, la base de datos de información bibliográfica de la biblioteca existente ya no puede cumplir con este requisito y se debe agregar otra información digital. Dado que la información del directorio no está estructurada, no es adecuada para ser representada por bases de datos existentes. Por lo tanto, parte de la información digital de las bibliotecas se puede representar y almacenar en XML. La solicitud de recuperación del usuario se transmite al servidor interno del sistema correspondiente a través del programa de llamada del servidor web. En el sistema, todo el trabajo de procesamiento de información se realiza en torno al sistema de archivos XML. Por supuesto, la premisa es convertir la información de la base de datos en documentos XML, utilizar las herramientas correspondientes para generar documentos XML a partir de la información del catálogo de libros y transmitirlos al navegador del usuario para su visualización, o a otros servidores web para compartir información.
El almacenamiento, la recuperación y el análisis de información utilizan tecnología de bases de datos. La tecnología de bases de datos tradicional ha pasado por tres etapas: base de datos en red, base de datos jerárquica y base de datos relacional. Los recursos de información proporcionados por las bibliotecas digitales basados en la integración de información incluyen no sólo textos electrónicos estructurados ordinarios, sino también diversos tipos de información como imágenes, audios, vídeos y software. La existencia de esta información multimedia y el desarrollo de la red han impulsado el desarrollo de la tecnología de bases de datos. La tecnología de bases de datos orientada a objetos, la tecnología de bases de datos no estructuradas y la tecnología de bases de datos multimedia son cada vez más maduras. La longitud del registro de esta base de datos es indeterminada y puede almacenar una variedad de información, por lo que la información multimedia se puede procesar fácilmente. La función del sistema de biblioteca digital basada en la integración de información no solo proporciona información primaria, sino que también proporciona información secundaria procesada. También puede procesar y analizar recursos de información y brindar servicios de toma de decisiones. Por lo tanto, la tecnología de almacenamiento de datos orientada a temas, integrada, estable y variable en el tiempo que respalda el proceso de toma de decisiones de gestión es también una de las tecnologías indispensables para crear bibliotecas digitales.
En cuarto lugar, la tecnología de recuperación de información
La tecnología de recuperación de información se está desarrollando muy rápidamente, especialmente los métodos de recuperación basados en la web se están convirtiendo en un método de recuperación común y forman la base del método básico de recuperación de información actual. . Combina tecnología de hipertexto, tecnología de red y tecnología multimedia. El modelo de navegador/servidor de la World Wide Web tiene una estructura optimizada y funciones potentes, y el modelo de búsqueda basado en la Web se refleja en las aplicaciones de varios motores de búsqueda. Motor de búsqueda es el término general para designar páginas web con funciones de consulta en Internet, y actualmente existen cientos de ellas. Incluye WebSearChEngine (motor de búsqueda en la World Wide Web), motor de búsqueda FTP (motor de búsqueda de archivos), motor de búsqueda de correo electrónico/página blanca (motor de búsqueda de correo electrónico/página blanca), YellwPageSearehEngine (motor de búsqueda de páginas amarillas), UsenetsearehEngine (motor de búsqueda de foros de noticias), Meta -motor de búsqueda, etc. La World Wide Web es el sistema de recuperación de información en red más avanzado de Internet y uno de los sistemas de recuperación de información más populares entre los buscadores.
La aplicación de la tecnología de agentes en el campo de la inteligencia artificial a la recuperación inteligente de información de Internet proporciona una nueva tecnología de recuperación inteligente de Internet. Los agentes de software inteligentes son programas de software que son capaces de realizar tareas específicas para el usuario, con un nivel de inteligencia que le permite realizar determinadas tareas de forma autónoma e interactuar con el entorno de manera adecuada. La tecnología de agentes es proactiva, inteligente, colaborativa y móvil. Al establecer relaciones difusas, aprende el pensamiento personalizado de los usuarios y realiza un razonamiento difuso para brindarles servicios de información completos y eficientes. La combinación de la tecnología de agentes con el procesamiento de información difusa puede proporcionar una forma más eficaz de resolver problemas de recuperación de información.
Tecnología de servicios de información del verbo (abreviatura de verbo)
1) Tecnología de índice: generalmente, hay índice de contenido, índice de estructura e índice de cadena. El establecimiento de estos índices implica cuestiones técnicas como la estructura del índice, la escalabilidad del índice y las características de distribución, y la paralelización de la generación del índice.
2) Sistema de conexión URL abierto: dado que un sistema de conexión necesita comunicarse con múltiples bases de datos de origen, es necesario planificar el método de comunicación entre el sistema de conexión y la base de datos de origen. El estándar propuesto, llamado Open URL, es para transmitir metadatos en URL. Un sistema de conexión compatible con URL abierta se denomina sistema de conexión de URL abierta. La conectividad abierta proporciona un sistema independiente para el enlazador. Después de recibir los metadatos desde el punto de origen, el sistema de conexión determina los datos de destino que se entregarán al usuario en función de los datos de su propia base de datos.
3) Tecnología de minería de datos: la tecnología de minería de información en red, también conocida como descubrimiento de conocimiento en bases de datos, extrae información previamente desconocida, completa, creíble, novedosa y efectiva de una gran cantidad de datos de procesamiento avanzado. Se basa en muestras de datos conocidos, obtiene las características internas de los objetos de datos mediante aprendizaje inductivo, aprendizaje automático y análisis estadístico, y utiliza tecnología de filtrado de información para extraer información de interés para los usuarios de la red o conocimientos y reglas de nivel superior. La minería de información incluye la minería de datos y la minería de textos. Utiliza tecnología avanzada para analizar recursos de información.
4) Tecnología de envío de información: la tecnología de envío de información se refiere a una tecnología de publicación de datos informáticos que envía automáticamente datos seleccionados por el usuario a los usuarios en intervalos de tiempo especificados por el usuario o en función de eventos. La dirección de desarrollo de la tecnología push será la multidifusión y la entrega de contenido de multidifusión. La tecnología RSS es una de las tecnologías de impulso de información. RSS es un formato XML (lenguaje de marcado extensible) que se utiliza para proporcionar contenido web selectivo y resumido a clientes de integración de contenido. Más precisamente, es un conjunto de metadatos extensible y portátil que describe una colección de recursos (especialmente recursos web) basados en XML y RDF. Como formato para describir y sincronizar el contenido de un sitio web, RSS es actualmente la aplicación XML más utilizada.
5) Tecnología multilingüe: Podemos proporcionar a los usuarios diversos servicios a través de funciones de navegación multilingüe y funciones de traducción automática.
6) Tecnología de reproducción de audio y vídeo: utilice Internet para reproducir archivos de audio de alta calidad como MPEG, MP3, WAVE y archivos de vídeo como AVI.