En la era de la información actual, con el rápido desarrollo de las computadoras y las redes, ¿todavía tienen valor las instituciones tradicionales de recuperación de documentos (como las bibliotecas)? ¿Por qué?
El servicio de indexación es la principal vía para que China Indexing Society ingrese a la sociedad.
El departamento editorial de "China Index"
La nueva reunión de trabajo de liderazgo del instituto decidió fortalecer los servicios de indexación a partir de 2004 y esforzarse por lograr el Índice de China.
Contribuir más al desarrollo profesional.
El propósito de nuestra asociación y los principios de las actividades de los miembros son: sinceridad, búsqueda de la verdad, pionero y dedicación. El desarrollo de servicios de indexación es la principal forma para que la sociedad ingrese a la sociedad, se integre en la industria de servicios de información y promueva el progreso de la industria de indexación de mi país.
Desde el establecimiento de 12 Society, también hemos trabajado en servicios de indexación, principalmente realizando más de diez cursos de capacitación empresarial en indexación. A un pequeño número de miembros se les ha confiado la tarea de compilar múltiples índices para algunas unidades, brindar servicios de consultoría de diseño y indexación para algunas bases de datos y promover y popularizar algunos conocimientos sobre indexación y bases de datos mediante la redacción de artículos, intercambios de conferencias, etc. Pero, en general, el trabajo de servicios en esta área es fragmentario, extremadamente limitado y no a gran escala.
En términos de documentos históricos y libros y publicaciones periódicas contemporáneas, y en términos de número de variedades, nuestro país puede considerarse un "país de la literatura". Sin embargo, la escala de la industria de indexación de China está muy por detrás de la de los países desarrollados. Promover el rápido desarrollo de la indexación es responsabilidad ineludible de nuestra comunidad académica profesional y de todos sus miembros. Se puede decir que es urgente fortalecer los servicios de indexación.
Llevar a cabo diversas formas de servicios de indexación no sólo puede hacer cosas más prácticas para promover el desarrollo del trabajo de indexación en mi país, sino también promover la investigación académica y las actividades de intercambio de la sociedad y mejorar el nivel profesional de los miembros. .
El alcance y los métodos de los servicios de indexación son extensos y diversos, y se pueden resumir en los siguientes aspectos:
(1) Publicidad y popularización de la indexación y el conocimiento de las bases de datos;
(2) Capacitación profesional para el personal de indexación y bases de datos;
(3) Organizar a miembros aficionados para compilar varios índices y bases de datos;
(4) Desarrollar y proporcionar herramientas para compilar diversos índices y bases de datos Software especial para indexación y bases de datos, y promover la comercialización de dicho software;
(5) Consultoría en diseño y compilación de índices y bases de datos;
(6) Técnico indicadores del nivel de membresía Evaluación y certificación;
(7) Actividades intermediarias del servicio de indexación;
(8) Sociedad de forma independiente o en cooperación con unidades relevantes (como bibliotecas y agencias de información, editoriales organizaciones, sitios web, empresas de bases de datos, etc.) cofundó una empresa de indexación y bases de datos. ).
Para organizar los servicios de indexación, actualmente deberían realizarse dos encuestas: una encuesta sobre los objetos de los servicios de indexación y una encuesta entre los miembros que están dispuestos a participar en los servicios de indexación.
La investigación de los objetos del servicio de indexación incluye principalmente: el tipo y forma portadora de los recursos documentales (manuscritos, recursos impresos o digitales), disciplinas o especialidades, caracteres (documentos clásicos o vernáculos), etc. ), año y cantidad; tipo de índice o base de datos a compilar, desempeño de la búsqueda y requisitos de calidad; estándares de pago aceptables, etc.
La encuesta sobre los miembros que están dispuestos a participar en los servicios de indexación incluye principalmente: experiencia en indexación o compilación de bases de datos o capacitación profesional en indexación o bases de datos; tiempo en que se pueden realizar los servicios de indexación; ¿Entiendes chino clásico? Si se puede utilizar la computadora; estándares de compensación aceptables, etc.
Para realizar un buen trabajo en la formación, es necesario formular un plan de estudios didáctico, preparar los materiales didácticos correspondientes y preparar materiales de referencia didácticos.
Es necesario desarrollar varios programas de indexación y compilación de bases de datos para determinar qué índices y bases de datos son dignos de promoción.
Para promover sin problemas los servicios de indexación, los diversos comités profesionales del instituto y las diversas publicaciones y sitios web del instituto deben cooperar estrechamente y dividir responsabilidades.
También debemos buscar ayuda de las unidades didácticas de la biblioteca y la información y otras unidades relevantes.
& lt& ltVolver al directorio
Foro de índices y bases de datos
Directorio de índice de archivos
Zhang Qiyu
( Departamento de Gestión de la Información, Universidad de Ciencias Políticas de Nanjing, sucursal de Shanghai 200433)
Determinar con precisión el contenido indexable de los documentos es un paso importante para controlar la calidad de la indexación de documentos.
Estándares para determinar el contenido indexable de los documentos; el contenido indexable de los documentos es jerárquico, inclusivo, implícito y adaptable a una variedad de necesidades; Ejemplos de características de los directorios de documentos indexables; escribir documentos para determinar el contenido indexable.
Palabras clave: contenido del documento indexable, análisis del tema del documento
1 Determinar con precisión el contenido indexable de un documento es el primer paso para controlar la calidad de la indexación del documento.
La indexación de documentos se refiere a averiguar qué disciplinas, especialidades y lectores (usuarios) tienen valor de referencia para todos o parte de los documentos indexados, y utilizar etiquetas de búsqueda (términos de búsqueda, números de clasificación, títulos de índice, etc. ) representa el proceso. ) proporciona un método de búsqueda preciso y eficaz.
La determinación del contenido indexable de un documento generalmente se denomina análisis de temas, que es el proceso de descubrir qué disciplinas, especialidades y lectores (usuarios) tienen valor de referencia para la investigación sobre el contenido del documento indexado. Esto está marcado además por el requisito previo de búsqueda para expresar contenido con precisión para proporcionar rutas de búsqueda precisas y efectivas. La determinación precisa del contenido indexable de los documentos y la expresión precisa del contenido indexable de los documentos con marcas de búsqueda son requisitos previos para garantizar que el sistema de recuperación tenga una alta eficiencia de recuperación (principalmente tasa de recuperación y tasa de precisión). Por lo tanto, determinar con precisión el contenido indexable de un documento es el primer paso para controlar la calidad de la indexación de documentos.
2. Estándares para determinar el contenido indexable de los documentos
2.1 Estándares de valor de referencia
Este es el estándar más importante para determinar el contenido indexable de los documentos. El contenido indexable del documento debe ser: ① una discusión más específica en el documento; ② tener un cierto valor de referencia (3) puede ser objeto de recuperación;
Si el contenido del documento no tiene valor de referencia, no se puede indexar. Porque buscar documentos que no tengan valor de referencia sólo hará perder al lector un valioso tiempo e incluso gastos, y no le reportará nada.
Para las herramientas de búsqueda en papel, el contenido que no tiene valor de referencia incluye:
(1) Contenido que no se menciona explícitamente ni se implica en el documento, o que solo se menciona sin detalles específicos. contenido de la discusión;
(2) Aunque hay discusiones específicas en la literatura, hay contenido sin valor de referencia, como contenido conocido, contenido retrospectivo, etc.;
③Introducción y argumento, argumentos, razonamientos, materiales, equipos, métodos, medios, experimentos, conclusiones (4) contenido de la hipótesis;
⑤Elementos o contenido a comparar;
⑥Citas; , metáforas y contenido metafórico;
⑦Trabajo no realizado;
⑧Para equipos y métodos especiales, solo se puede extraer uno de ellos de acuerdo con la situación específica. Si se extraen ambos, se extraerá. ser redundante
⑨Funciones de búsqueda innecesarias, como: equipo de carga superior de alto horno de alta presión, si se determina que el contenido indexable es "alto horno + parte superior del horno + equipo de carga", "parte superior del horno" es redundante;
⑩ Contenido que tiene valor de referencia pero que no cumple con el alcance temático de una herramienta o sistema de búsqueda específico.
Para la indexación de monografías (libros), los estándares para el contenido indexable se pueden relajar ligeramente. Específicamente, los nombres de varios elementos que no se tratan específicamente pero que tienen importancia para la recuperación también pueden clasificarse como contenido indexable.
El llamado estándar de valor de referencia debe ajustarse según la autoridad del documento, la cantidad de información y las necesidades de los lectores.
2.2 Criterios de selección de prioridad para contenidos clave y contenidos novedosos
Es decir, cuando la profundidad de indexación de la herramienta de búsqueda es limitada, se debe dar prioridad a la selección de contenidos clave y contenidos novedosos en el documento como contenido indexable.
2.3 Criterios de selección adecuados
El contenido indexable de un documento a menudo se denomina asunto del documento. No hay límite para la cantidad de temas que se pueden analizar en un documento. Pero, de hecho, hay muchos factores que afectan la cantidad de contenido indexable:
①La cantidad de información en un documento específico no es infinita. Para un documento específico, al determinar el contenido indexable, si es más pequeño que el contenido indexable que realmente tiene, eventualmente conducirá a una detección perdida; si es más grande que el contenido indexable que realmente tiene, eventualmente conducirá a una detección; detección falsa;
(2) Restricciones sobre el tipo de lenguaje de recuperación de información utilizado;
(3) Restricciones sobre el alcance profesional de las herramientas de recuperación compiladas;
(4) Requisitos para los lectores (usuarios, como lectores integrales, lectores de investigación pura, etc.);
⑤Posibilidad de mano de obra y tiempo.
2.4 Resumir con precisión los estándares de contenido indexable
Una vez determinado el contenido indexable del documento, si se va a resumir en conceptos temáticos, el proceso de resumen debe ser preciso.
3. El contenido de los documentos indexables es jerárquico, inclusivo, implícito y adaptable.
3.1 Estructura jerárquica del contenido del documento indexable
Independientemente de si un documento tiene una estructura de capítulos o no, su contenido indexable generalmente se puede dividir en los siguientes tres niveles:
El nivel más alto incluye todo el contenido de la literatura, es decir, el tema general
El nivel intermedio incluye solo una parte del contenido de la literatura, es decir, los temas locales
<; p>El nivel más bajo es el contenido que no puede formar un tema, es decir, el tema Los Factores se refieren a los nombres de regiones, personas, instituciones, eventos, organismos, minerales, productos, equipos, métodos, procesos, fórmulas, datos, obras y otros asuntos involucrados en la literatura. Aunque estos nombres no se analizan específicamente en la literatura, pueden generar conocimiento e información relevantes y tienen cierta importancia para la recuperación.Los tres niveles anteriores son consistentes con la descripción de un determinado contenido de conocimiento en la literatura. En términos de importancia, el tema general es mayor que el tema local, y el tema local es mayor que los factores temáticos.
Los tres niveles anteriores tienen diferentes compensaciones entre las herramientas de búsqueda de títulos y la indexación de monografías al determinar el contenido indexable:
3.2 Los documentos contienen contenido indexable
Puede ser De la relación ilustrada en la Sección 3.1 se desprende que el tema local es un refinamiento del tema general, por lo que el tema general contiene el contenido del tema local; los factores del tema son un refinamiento del tema local, por lo que el tema local contiene el tema; factores. En la indexación de documentos, además del tema general, también es necesario subdividir temas y factores temáticos locales, porque esto puede proporcionar más canales de recuperación, permitir que los documentos se ajusten a más necesidades de recuperación y permitir a los lectores que buscan contenido especializado acceder directamente a ellos. y encuentre contenido específico fácilmente.
Cuando la profundidad de indexación es limitada, algunos o todos los temas locales se pueden omitir para las herramientas de búsqueda de títulos, y algunos factores de tema se pueden omitir para los índices de monografías.
3.3 El significado del directorio indexable de un solo documento
El significado del contenido indexable de un documento significa que algunos documentos tienen contenido indexable que consiste directamente en palabras no utilizadas, discuta claramente y directamente. Por ejemplo, en el artículo "Variedades ideales para reemplazar fungicidas con alto contenido de residuos", el contenido indexable parece ser "fungicidas, (nuevas) variedades", lo que no se expresa directamente con el término "pesticidas de alta eficiencia y baja toxicidad". , pero en realidad implica "pesticidas de alta eficiencia y baja toxicidad". Contenido indexable para "Pesticidas de baja toxicidad".
3.4 El contenido de un mismo archivo puede satisfacer diversas necesidades.
Un mismo documento puede utilizarse como referencia para diversos temas de investigación y puede satisfacer diversas necesidades. Por lo tanto, el mismo contenido del documento se puede utilizar como contenido indexable múltiple. Por ejemplo, los artículos que conmemoran el 50º aniversario de la Guerra Antijaponesa pueden indexarse como la Guerra Antijaponesa (1937-1945) y el Incidente del 7 de julio (1937). El artículo "La vasopresina trata la enfermedad coronaria causada por el shock" se puede indexar en shock, tratamiento farmacológico, vasopresina, aplicación clínica, enfermedad coronaria, inducción química, vasopresina, efectos secundarios, etc.
4 Relevancia del contenido indexable del documento
(1) El contenido expresado por un determinado identificador de búsqueda puede ser un tema general en este documento y puede ser un tema general en ese documento. Un tema local sólo puede ser un factor de tema en un tercer documento. Por lo tanto, la cantidad de información suele ser muy diferente entre los mismos logotipos que resumen el contenido indexable del documento;
(2) Cierto contenido de conocimiento es contenido indexable en esta herramienta de recuperación, pero en esa herramienta de recuperación no No pertenece.
5 Introducción a directorios indexables de diversos documentos temáticos
Varios documentos temáticos tienen un contenido indexable único, como:
Documentos históricos—— Países, regiones, dinastías (épocas históricas), naciones, personajes, instituciones y grupos, acontecimientos (como revoluciones, levantamientos, guerras), sistemas políticos, económicos, militares, culturales y educativos, políticas, medidas de reforma, reuniones, reglamentos, obras, etc. ;
Documentos locales: cambios históricos, condiciones económicas (industriales), naturaleza, clima, recursos minerales, productos, origen étnico, costumbres, idioma, cultura, educación, personas, administración, instituciones y grupos, eventos, montañas. y ríos Ríos, transporte, lugares de interés, etc.;
Literatura médica: enfermedades, diagnóstico, tratamiento, atención, prevención, patología, etiología, métodos y equipos de diagnóstico y tratamiento, medicamentos, etc.;
Literatura agrícola: cultivos, variedades, mejoramiento genético, técnicas de cultivo, manejo de campo, plagas y enfermedades, meteorología agrícola, suelos, fertilizantes, pesticidas, etc.
;
Documentos técnicos industriales: variedades de productos industriales, estructuras y piezas, diseño, materiales de fabricación, equipos de fabricación, tecnología de fabricación, etc. ;
Literatura educativa: teorías educativas, ideas educativas, sistemas educativos, instituciones educativas, figuras educativas, gestión escolar, métodos de enseñanza, diversos tipos de educación en todos los niveles, etc.;
Varios El contenido indexable del documento temático es la base principal para seleccionar las partes del discurso en la tabla de clasificación del tesauro.
6 Las características de los distintos tipos de documentos determinan el contenido indexable
Monografías académicas: todo el contenido indexable debe ser al menos equivalente al esquema detallado de la monografía, y se requiere que no se omitirá ningún contenido individual con valor de recuperación (conceptos con importancia de recuperación, especialmente conceptos nuevos: todas sus entradas deben ser indexables y el contenido especial de ciertas entradas también puede usarse como indexable); contenido;
Diccionario: un diccionario profesional y definiciones. Cada entrada se puede utilizar como contenido indexable. Cada palabra de un diccionario profesional bilingüe generalmente se puede utilizar como contenido indexable (como el índice chino-inglés adjunto al diccionario inglés-chino).
Anuario: además de todos los capítulos, también se deben indexar los temas locales incluidos en los capítulos y los factores temáticos (conceptos) con importancia para la recuperación.
Libros de texto: asegúrese de que sean indexables; el contenido debe ser amplio y los términos profesionales deben considerarse contenido indexable en la medida de lo posible para facilitar que los estudiantes lo encuentren;
Artículos de revistas: el tema general debe ser contenido indexable y si su tema local es contenido indexable depende de los requisitos específicos de las herramientas de búsqueda. Para la literatura sobre especialidades adyacentes, solo se pueden seleccionar como contenido indexable temas locales útiles para la especialidad. Los factores temáticos generalmente no sirven como contenido indexable.
Referencia
1 Zhang Qiyu. en el elemento del índice. Diario de la biblioteca, 1994(5)
2 Qian Qilin. Manual de indexación de encabezamientos de materias chinos. Prensa de literatura científica y tecnológica, 1985: 296.
Zhang Qiyu es profesor en el Departamento de Gestión de la Información de la sucursal de Shanghai del Instituto de Ciencias Políticas de Nanjing y vicepresidente de la Sociedad Index de China.
Recopilación de información para conferencias y artículos internacionales
1. Conferencia de celebración del décimo aniversario de la Asociación de Indexólogos y Bibliógrafos de África Meridional.
La celebración del décimo aniversario de la Asociación Bibliográfica y de Indización de Sudáfrica se llevará a cabo en Johannesburgo del 6 al 7 de septiembre de 2004. El tema de la conferencia es "Indización de libros y más allá". La conferencia da una calurosa bienvenida a indexadores, bibliotecarios, editores, investigadores y archiveros de todo el mundo para participar y discutir el futuro de la indexación. La información de contacto es la siguiente:
Marlene Burger (para artículos) de burgem@unisa.ac.za
Tel +2712 4296585
Fax +2712 4293221
p>2.2005 Conferencia anual de la Asociación Australiana de Índices.
La próxima conferencia anual de la Australian Index Association se celebrará en Melbourne del 6 al 9 de marzo de 2005. El tema de la conferencia es "Índice: involucrar, inspirar, enriquecer". El contenido de la conferencia no se limita a los índices tradicionales al final de los libros, sino que discutirá la preparación de varios índices en diversas disciplinas. La información de contacto es la siguiente:
Comité de la Conferencia de la Asociación Australiana de Índices
PO Box 1251
Mel 3001
Tel/Fax: +613 9500 8715
correo electrónico:mindexer@optusnet.com.au
& lt& ltVolver al índice
Teoría y aplicación del índice de citas (Parte 2)
Revisión de Eugene Garfield de la traducción de Hou Hanqing de "Liu Yu"
Capítulo 10 Análisis de citas de científicos (continuación)
Ventajas y desventajas
Cualquier evaluación justa que utilice el análisis de citas como herramienta para evaluar a los científicos debe admitir que todavía existen muchas ambigüedades sobre el significado de la frecuencia de las citas. Todavía no sabemos exactamente qué tan bueno o malo es su desempeño en la investigación científica en su evaluación. Sabemos poco sobre los factores sociológicos que influyen en la frecuencia de las citas. Las razones de la baja frecuencia de citas no se comprenden bien. Todavía hay mucho que vale la pena aprender sobre los cambios en los patrones de citación en diferentes campos, y este es un aspecto.
Por otro lado, sabemos que la frecuencia de citas muestra el aporte del trabajo científico de alguien, al menos en términos de eficacia e interés encontrado por colegas de la comunidad científica.
Ahora sabemos que la alta frecuencia de citas está asociada con comentarios de pares expertos sobre la progresividad y la importancia de las contribuciones a la investigación científica. Y ahora que hemos identificado los patrones generales de citas y las variables que influyen en ellos, pretendemos diseñar un modelo estadístico útil para predecir la frecuencia de citas de un científico a lo largo de su vida (calculada en base a la frecuencia promedio de citas de un científico por artículo).
Este modelo fue desarrollado y probado por N.L. Geller, J.S. de Cani y R.E. Davies, y se basa en nuestra comprensión de los modelos generales de citas y el crecimiento anual de la literatura científica. La entrada al modelo es el historial de citas (al menos 4 años) de los artículos existentes de un científico. A partir de estos, el modelo calcula el número total de citas de cada artículo durante un período de 40 años (en términos generales, la vida útil de un artículo es de 40 años). El número promedio de citas por artículo a lo largo de toda la vida se puede calcular a partir del número total de citas durante 40 años. El modelo también desarrolla una técnica de validación para identificar artículos que merecen atención especial porque su historial de citas muestra que sus patrones de citas son significativamente diferentes de los artículos ordinarios.
Desarrollar un modelo de este tipo es un paso importante hacia el uso sistemático de las estadísticas de citas y la reducción del impacto de los errores metodológicos. Pero aún debemos ser cautelosos y comprender las limitaciones de las estadísticas de citas como evaluación relativa del desempeño de la investigación científica. Como ocurre con cualquier método, la eficacia de los resultados del análisis de citas está estrechamente relacionada con la habilidad del análisis de citas. La simplicidad del recuento de citas oculta muchas cuestiones delicadas relacionadas con las estadísticas de citas. Las citas superficiales de investigaciones que ignoran estos temas delicados a menudo pueden inducir a error a otros. Una investigación de citas adecuada requiere una comprensión completa de las complejidades que implica comparar recuentos de citas, especialmente cuando se trata de recuentos bajos de citas.
Las razones y objeciones al uso de la frecuencia de citas como herramienta de evaluación se han discutido anteriormente. Hay dos hechos básicos en este debate. En primer lugar, a medida que las instituciones de investigación científica se vuelven cada vez más grandes y su papel en la sociedad se vuelve cada vez más importante, se vuelve cada vez más difícil, costoso y cada vez más difícil evaluar y confirmar a las personas y grupos que han hecho las mayores contribuciones en la institución. siendo cada vez más necesario. En segundo lugar, la medición de citas ha demostrado ser una forma eficaz de realizar evaluaciones por pares expertos, introduciendo algunos factores objetivos y útiles en el proceso de evaluación e implicando sólo un pequeño gasto en el uso de técnicas de encuesta. El análisis de citas a veces requiere más tiempo y esfuerzo que el juicio intuitivo. Pero la evaluación profesional es definitivamente importante para demostrar que esta inversión es correcta.
Conclusión: El futuro de la indexación de citas
El contenido principal de este libro es el pasado y el presente de la indexación de citas. ¿Cuál es el futuro de la indexación de citas?
El índice de citas muestra que su futuro será tan sólido como lo es ahora. Como herramienta para la recuperación retrospectiva de literatura científica y técnica, los índices de citas seguirán ganando popularidad y pueden acelerar su popularidad.
La promoción acelerada del método de índice de citas dependerá de los siguientes factores:
La popularidad global de la recuperación en línea hará que la mayoría de los científicos y académicos dominen el sistema de recuperación SCI. Las mejoras en el software de recuperación en línea permitirán a las personas familiarizadas con SCI hacer un mayor uso de este sistema de recuperación.
Cada vez más personas se dan cuenta de que el índice de citas es una parte integral de la evaluación de la investigación, lo que llevará a más científicos a aprender a utilizar el SCI. Es de esperar que los buenos “árbitros” impidan prácticas que parecen justas y legales pero que en realidad son comprometedoras.
Cada vez será más conveniente buscar en SCI, SSCI y otras bases de datos. La tecnología de microalmacenamiento o las microcomputadoras eventualmente harán que sea económicamente viable para científicos individuales o instituciones y grupos de investigación científica tener sus propias bases de datos. Al mismo tiempo, la continua reducción del costo de la recuperación en línea y la conexión remota a bases de datos almacenadas en computadoras centrales aumentará la comodidad de la recuperación.
Además, ISI está considerando seriamente la idea de desarrollar índices de citas profesionales basados en la literatura de revistas de una determinada disciplina. Sin embargo, citar documentos y documentos citados reflejará la amplitud y dispersión de esta disciplina. Este índice de citas profesionales incluirá todas las citas de autores en la disciplina y las citas dirigidas a no autores en la disciplina.