Red de Respuestas Legales - Información empresarial - ¿Qué significa ponderación de palabras por tema?

¿Qué significa ponderación de palabras por tema?

Pregunta 1: ¿Qué significa la recuperación ponderada en la recuperación de literatura? ¿Existe alguna configuración? A cada identificador que participa en la búsqueda combinada se le asigna un valor numérico que representa diferentes grados de importancia según los requisitos de la búsqueda. Es un método de recuperación de información computarizada. El llamado "derecho" se refiere al valor numérico que indica el grado de importancia. La llamada "ponderación" es una medida de recuperación cuantitativa de documentos. Se pueden poner en cola diferentes combinaciones de logotipos según el tamaño del peso, lo que constituye un método eficaz para controlar la calidad de la recuperación.

Pregunta 2: Cómo realizar una búsqueda ponderada por ruta temática en pubmed IM EM CA índice de patentes BA SCI documento especial tipo de patente búsqueda automática 4 etapas subtema palabra clave tipo de estructura de base de datos CBM búsqueda ponderada PUBMED clave de texto completo EBM 1. Explicación de los nombres: 1. Literatura:

Pregunta 3: ¿Cuáles son las diferencias entre términos de búsqueda, términos de tema y términos de subtema en la base de datos MeSH? Por favor, ayúdenme. Términos de búsqueda, como sugiere el nombre. , son las palabras que ingresas en el cuadro de búsqueda, una gran parte es una búsqueda de palabras gratuita. Las palabras de tema son palabras estandarizadas que permiten que enfermedades con diferentes nombres sean denominadas con un nombre "oficial". Las palabras de tema se pueden combinar con palabras de subtema para mejorar la precisión de la recuperación. Diferentes palabras de tema tienen diferentes combinaciones de palabras de subtema. . También está la cuestión de la ponderación, dependiendo de sus necesidades de búsqueda.

Pregunta 4: Existen varias formas de determinar los coeficientes de ponderación en la metodología del diseño. ¿Cuáles son y cuáles son sus características? Preguntas y Respuestas 1. Describa brevemente los conceptos de información, conocimiento, documentos y la relación entre ellos. a ellos. . 1. Respuesta: Información: Es un reflejo de la forma en que existen las cosas, su estado de movimiento y sus características, y es la señal y mensaje que envían las cosas. Conocimiento: Es el resultado del análisis, procesamiento y refinamiento del pensamiento de los seres humanos, la sistematización y teorización de los reflejos de la información de diversos fenómenos y leyes de la naturaleza y la sociedad humana. Documentos: todos los soportes que registran el conocimiento. Desde el ámbito conceptual de los tres, la información es mayor que el conocimiento que los documentos. El conocimiento es una parte de la información, que es la información teórica y sistemática. 2. En qué tipos de documentos se dividen según los diferentes formularios de soporte y dé ejemplos. 2. Respuesta: Los documentos se dividen en diferentes soportes: documentos escritos a mano, como huesos de oráculo e inscripciones en bronce, documentos impresos, como libros, publicaciones periódicas, documentos microfilmados, como microfilmes, microfichas, documentos audiovisuales, como cintas de vídeo. , cintas de audio, ciencia y tecnología Documentos cinematográficos electrónicos, como documentos de bases de datos y documentos de red 3. Los niveles de documentos y sus interrelaciones. 3. Respuesta: Los documentos se dividen en cuatro tipos según el grado de procesamiento: documentos de tiempo cero, primarios, secundarios y terciarios. Entre ellos, los documentos de tiempo cero se refieren a registros experimentales inéditos, grabaciones originales (imágenes), cartas, manuscritos, información de comunicación oral u objetos físicos, etc., los documentos de tiempo cero se convierten en documentos primarios después de que el autor los procesa y los publica públicamente; y ingresar al campo de la circulación social; organizar, procesar y condensar documentos primarios de acuerdo con ciertas reglas y métodos de acuerdo con diversas características, y los documentos resultantes son documentos secundarios que utilizan pistas de documentos secundarios para sintetizar, analizar y procesar una gran cantidad; Del contenido del documento primario, el documento formado después del refinamiento es el tercer documento. 4. ¿Cómo limitar el alcance de la búsqueda en la búsqueda por computadora? 4. Respuesta: En la búsqueda por computadora, los métodos para limitar el alcance de la búsqueda incluyen: (1) Agregar términos de búsqueda conectados por y, o usar "búsqueda secundaria" (2) Usar palabras de subtemas específicos para limitar (3) Usar campos Búsqueda limitada, como como búsqueda de palabras por título, búsqueda de palabras por tema, búsqueda ponderada, etc. (4) Realizar búsqueda limitada de tipos de documentos, idiomas, revistas importantes, revistas clínicas principales, años, etc. (5) Ingresar búsqueda de palabras dentro de un rango de clasificación más específico 5 ¿Cuáles son los métodos para obtener el texto completo de la literatura? 5. Respuesta: Los métodos para obtener el texto completo incluyen: (1) Buscar bases de datos de texto completo en línea (2) Usar editoriales y revistas en línea (3) Usar catálogos de colecciones de bibliotecas (catálogos de colecciones conjuntas) (4) Usar "entrega de texto completo en línea" servicio" (5) Pregúntele al autor 6. ¿Cuáles son los métodos de búsqueda más utilizados? 6. Respuesta: Los métodos de búsqueda comúnmente utilizados incluyen: búsqueda de palabras gratuita, búsqueda de palabras por temas, búsqueda de clasificación, búsqueda de autores, búsqueda de instituciones, búsqueda de citas, búsqueda limitada, etc. 7. Describa brevemente el principio de recuperación de información 7. Respuesta: El principio La forma de recuperación de información es: comparar las características de la pregunta que describen la información requerida por un usuario específico con el identificador de recuperación del almacenamiento de información y descubrir la información que es consistente o básicamente consistente con las características de la pregunta. La esencia es comparar y seleccionar las necesidades de información del usuario con la información almacenada en el *** de información, es decir, el proceso de comparación. 8. ¿Qué pasos suelen implicar las búsquedas informáticas? 8. Respuesta: Los pasos de la recuperación de información incluyen: (1) Analizar el tema de recuperación y aclarar el propósito y los requisitos (2) Seleccionar las herramientas de recuperación adecuadas (3) Seleccionar el método de recuperación y determinar el identificador de recuperación. (4) Busque pistas en la literatura. (5) Explore los resultados de la búsqueda y obtenga documentos originales. 9. Describa brevemente las reglas de organización del índice de temas de mensajería instantánea.

9. Respuesta: Las reglas de disposición del índice de materias son las siguientes (1) Todo el índice está ordenado por palabras temáticas (2) El mismo título de materia está ordenado por palabras de subtema (3) Las referencias bibliográficas con contenido relacionado se incluyen en el correspondiente encabezamientos de materia. O bajo encabezamientos de materia/encabezados de subtemas generales, los documentos generales se colocan directamente debajo de los encabezamientos de materias, y los documentos específicos se colocan en los encabezamientos de subtemas correspondientes; la misma entrada de documento se puede colocar debajo de múltiples encabezamientos de materia (4) para el mismo tema; referencias bibliográficas bajo palabras o subtemas, los documentos en inglés se ordenan primero, seguidos de los documentos que no están en inglés. Los títulos de traducción al inglés de los documentos que no están en inglés se incluyen entre [ ] para mostrar la distinción (5) los documentos en inglés se ordenan según la abreviatura de. el título de la revista. (6) La literatura no inglesa debe ordenarse primero por la abreviatura del género y, en el mismo género, por la abreviatura del título de la revista. 10. ¿Cuáles son los sistemas de referencia para la lista de orden de palabras de los "Encabezamientos de temas médicos" (MeSH)? Dé ejemplos para ilustrar su significado. 10. Respuesta: El primer grupo: referencia sustituta, utilizada para tratar la relación equivalente entre palabras. En la lista de vocabulario MeSH, para múltiples sinónimos, solo una de las palabras más científicas y comunes se usa como encabezado de materia estandarizado, y las otras...>>

Pregunta 5: ¿Qué significa?

Explicación básica

Palabra interrogativa para un sustantivo, que generalmente expresa una pregunta sobre algo.

1. Cosas desconocidas.

2. Todo.

3. Tiene el mismo significado que qué.

4. Expresar dudas.

Explicación detallada

1. Significa preguntarle a alguien, algo o la naturaleza o naturaleza de algo, y qué información obtuviste de allí.

2. Indica preguntar sobre algo o algo. Dime qué estás buscando.

3. Un dedo virtual indica algo incierto y huele una fragancia floral.

4. Para expresar negación

¿Quién es? En realidad lo extrañas

5. Para expresar culpa

Por qué te ríes

p>

6. Indica preguntar por posibilidades no incluidas en la palabra o serie de palabras anterior

¿Es este un reptil, un anfibio o algo más?

7 Expresa sorpresa o emoción

¡Qué, sin desayuno!

8. Todo

Independientemente de la tierra, ¡da a luz a todo! La madre: lo que dio a luz

9. Se usa antes de "ye" para indicar que no hay excepciones dentro del rango establecido

No le tiene miedo a nada

10 Usado antes de "都", significa que no hay excepciones dentro del alcance mencionado

Mientras estudies mucho, puedes aprender cualquier cosa

11. Usado. como pronombres: todos, todos, todo; por ejemplo: mientras estés de acuerdo, te lo daré todo. ....No tengo miedo de nada.

Pregunta 6: Puntos clave de la recuperación de información Preguntas y Respuestas

1. Describe brevemente los conceptos de información, conocimiento, documentos y la relación entre ellos.

1. Respuesta: Información: Es un reflejo de la forma en que existen las cosas, su estado de movimiento y sus características, y es la señal y mensaje que envían las cosas.

Conocimiento: Es el resultado del análisis, procesamiento y refinamiento del pensamiento de los seres humanos, la sistematización y teorización de los reflejos de la información de diversos fenómenos y leyes de la naturaleza y la sociedad humana.

Documentos: todos los soportes que registran el conocimiento

Desde la perspectiva conceptual de los tres, la información es mayor que el conocimiento que los documentos. El conocimiento es parte de la información y es información teórica y sistemática. Los documentos son la parte registrada del conocimiento.

2. En qué tipos de documentos se dividen según los diferentes formularios de soporte y dé ejemplos.

2. Respuesta: Los documentos se dividen en diferentes formas de soporte:

Documentos escritos a mano, como inscripciones en huesos de oráculo e inscripciones en bronce

Documentos impresos, como libros , Revistas

Documentos en microfilm, como microfilm y microfilm

Documentos audiovisuales, como cintas de video, cintas de audio y películas científicas

Documentos electrónicos, como documentos de bases de datos y literatura en red

3. Los niveles de literatura y sus interrelaciones.

3. Respuesta: Los documentos se dividen en cuatro tipos según el grado de procesamiento: documentos de tiempo cero, primarios, secundarios y terciarios.

Entre ellos, los documentos de tiempo cero se refieren a registros experimentales no publicados, grabaciones originales (imágenes), cartas, manuscritos, información de comunicación oral u objetos físicos, etc., que se publican públicamente después de su procesamiento; el autor.El campo de la circulación social se convierte en documentos primarios según las diversas características de los documentos primarios, se clasifican, procesan y condensan de acuerdo con ciertas reglas y métodos, y los documentos resultantes son documentos secundarios. analizar una gran cantidad de documentos primarios El documento formado después de sintetizar, analizar, procesar y refinar el contenido es el tercer documento.

4. ¿Cómo limitar el alcance de la búsqueda en la búsqueda por computadora?

4. Respuesta: En la búsqueda por computadora, los métodos para limitar el alcance de la búsqueda incluyen:

(1) Agregar términos de búsqueda relacionados con y, o usar "búsqueda secundaria"

p>

(2) Utilice palabras de subtema específicas para calificar

(3) Utilice campos para limitar la búsqueda, como búsqueda de palabras de título, búsqueda de palabras de asunto, búsqueda ponderada, etc.

(4) Realice una búsqueda limitada de tipos de documentos, idiomas, revistas importantes, revistas clínicas principales, años, etc.

(5) Ingrese una búsqueda de palabras dentro de un rango de clasificación más específico

5.¿Cuáles son los métodos para obtener el texto completo de la literatura?

5. Respuesta: Los métodos para obtener el texto completo incluyen:

(1) Buscar bases de datos de texto completo en línea

(2) Usar editoriales y revistas en línea

(3) Utilice el catálogo de colecciones de la biblioteca (Union Collection Catalog)

(4) Utilice el "servicio de entrega de texto completo en línea"

(5) Solicitud del autor

6. ¿Cuáles son los métodos de búsqueda más utilizados?

6. Respuesta: Los métodos de búsqueda más utilizados incluyen:

Búsqueda de palabras gratuita, búsqueda de palabras por temas, búsqueda de clasificación, búsqueda de autores, búsqueda de instituciones, búsqueda de citas, búsqueda limitada, etc.< /p >

7. Describa brevemente el principio de recuperación de información

7. Respuesta: El principio de recuperación de información es comparar las similitudes y diferencias entre las características de las preguntas que describen la información requerida por una pregunta específica. usuario y la identificación de recuperación del almacenamiento de información, para encontrar información que sea consistente o básicamente consistente con las características de la pregunta. La esencia es comparar y seleccionar las necesidades de información del usuario con la información almacenada en el *** de información, es decir, el proceso de comparación.

8. ¿Cuáles son los pasos que suelen seguirse en la recuperación de un ordenador?

8. Respuesta: Los pasos de la recuperación de información incluyen:

(1) Analizar el tema de recuperación y aclarar el propósito y los requisitos

(2) Elegir lo apropiado herramientas de recuperación

(3) Seleccione el método de búsqueda y determine el identificador de búsqueda.

(4) Búsqueda de pistas bibliográficas.

(5) Explore los resultados de la búsqueda y obtenga documentos originales.

9. Describa brevemente las reglas de organización del índice de temas de mensajería instantánea.

9. Respuesta: Las reglas de disposición del índice de materias son las siguientes

(1) Todo el índice está ordenado por palabras de tema en orden alfabético

( 2) Bajo el mismo término temático, presione Los títulos de los subtemas se organizan en orden alfabético

(3) Las referencias bibliográficas con contenido relevante se incluyen bajo los títulos de temas correspondientes o se colocan títulos de temas/encabezados de subtemas generales; directamente debajo de los títulos de materia, y los documentos especializados se colocan directamente debajo de los títulos de materia. Los documentos de referencia deben colocarse bajo los títulos de subtema correspondientes; la misma referencia de documento se puede colocar bajo múltiples títulos de materia.

(4) Para documento. referencias bajo el mismo título de materia o subtema, los documentos en inglés deben ordenarse primero, luego organizar la literatura no inglesa y los títulos de traducción al inglés de la literatura no inglesa se deben encerrar entre [ ] para mostrar la diferencia

(5) La literatura inglesa está ordenada por la abreviatura del título de la revista

(6) La literatura no inglesa debe ordenarse primero por la abreviatura del género y, en el mismo género, por la abreviatura del título de la revista.

10. ¿Cuáles son los sistemas de referencia para la lista de orden de palabras de los "Encabezamientos de temas médicos" (MeSH)? Dé ejemplos para ilustrar su significado.

10. Respuesta: El primer grupo: referencia sustituta, utilizada para tratar la relación equivalente entre palabras. En la lista de vocabulario MeSH, para múltiples sinónimos, solo una de las palabras más científicas y comunes se usa como encabezado de materia estandarizado, y las demás...>>

Pregunta 7: Solo las palabras principales en la base de datos PUBMED son ¿Cuál es la diferencia entre la búsqueda de encabezamientos de materia y la no expansión de encabezamientos de materia inferiores? Usando la versión china de pubmed, las diferencias entre todas las operaciones son claras de un vistazo.

Pregunta 8: ¿Por qué debería ponderarse antes del análisis de tablas de contingencia en la minería de datos? Hay una gran cantidad de conocimiento oculto en almacenes de datos, bases de datos u otras bases de información que pueden proporcionar el conocimiento necesario para la toma de decisiones en los negocios, la investigación científica y otras actividades. La clasificación y la predicción son dos formas de análisis de datos que se pueden utilizar para extraer modelos que describen datos importantes*** o predicen tendencias futuras de datos. El método de clasificación (Clasificación) se utiliza para predecir la categoría discreta (Etiqueta categórica) del objeto de datos; el método de predicción (Predicción) se utiliza para predecir el valor continuo del objeto de datos.

La tecnología de clasificación se utiliza en muchos campos. Por ejemplo, se puede construir un modelo de clasificación a través de la clasificación de clientes para realizar una evaluación de riesgos en préstamos bancarios; una característica muy importante en el marketing actual es el énfasis en la segmentación de clientes.

La función del análisis de categorías de clientes también está aquí. Al utilizar la tecnología de clasificación en la minería de datos, los clientes se pueden dividir en diferentes categorías. Por ejemplo, al diseñar un centro de llamadas, se puede dividir en: clientes que llaman con frecuencia y clientes que llaman ocasionalmente. números grandes, clientes que llaman constantemente. Además, ayuda a los centros de llamadas a encontrar las características entre estos diferentes tipos de clientes. Dicho modelo de clasificación permite a los usuarios comprender las características de distribución de los clientes de diferentes categorías de comportamiento, como el texto automático; tecnología de clasificación en el campo de seguridad y recuperación de documentos. Hay detección de intrusiones basada en tecnología de clasificación, etc. Investigadores en campos como el aprendizaje automático, los sistemas expertos, la estadística y las redes neuronales han propuesto muchos métodos de predicción de clasificación específicos. La siguiente es una breve descripción del proceso de clasificación:

Entrenamiento: Conjunto de entrenamiento-->Selección de características-->Entrenamiento-->Clasificador

Clasificación: Nueva muestra-->Características Selección-->Clasificación->Juicio

La mayoría de las aplicaciones iniciales de clasificación de minería de datos se basaron en estos métodos y algoritmos construidos en base a la memoria. Los métodos actuales de minería de datos requieren la capacidad de procesar datos a gran escala basados ​​en memoria externa y tener escalabilidad. La siguiente es una breve introducción a varios métodos de clasificación principales:

(1) Árbol de decisión

La inducción del árbol de decisión es un algoritmo de clasificación clásico. Construye un árbol de decisiones utilizando métodos innovadores recursivos de arriba hacia abajo. La métrica de ganancia de información se utiliza para seleccionar atributos de prueba en cada nodo del árbol. Las reglas se pueden extraer del árbol de decisión generado.

(2) Método KNN (K-Vecino más cercano)

El método KNN es el método K del vecino más cercano. Fue propuesto originalmente por Cover y Hart en 1968. Es relativamente. método maduro en teoría. La idea de este método es muy simple e intuitiva: si la mayoría de las k muestras más similares (es decir, las más cercanas en el espacio de características) de una muestra pertenecen a una determinada categoría, entonces la muestra también pertenece a esta categoría. . Este método solo determina la categoría de la muestra a clasificar en función de la categoría de la muestra más cercana o varias en la toma de decisiones de clasificación.

Aunque el método KNN también se basa en principio en el teorema del límite, solo se relaciona con un número muy pequeño de muestras adyacentes al tomar decisiones de categoría. Por lo tanto, este método puede evitar mejor el problema del desequilibrio de la muestra. Además, dado que el método KNN se basa principalmente en muestras circundantes limitadas, en lugar de depender del método de discriminar el dominio de clase para determinar la categoría, el método KNN es mejor que otros métodos para dividir conjuntos de muestras que tienen más intersecciones o Las superposiciones en el dominio de clase son más adecuadas.

La desventaja de este método es que requiere una gran cantidad de cálculos, ya que para cada texto a clasificar, se debe calcular la distancia a todas las muestras conocidas para obtener sus K puntos vecinos más cercanos. La solución comúnmente utilizada en la actualidad es editar los puntos de muestra conocidos de antemano y eliminar las muestras que tienen poco efecto en la clasificación. También existe un método KNN inverso, que puede reducir la complejidad computacional del algoritmo KNN y mejorar la eficiencia de la clasificación.

Este algoritmo es más adecuado para la clasificación automática de dominios de categorías con tamaños de muestra relativamente grandes, mientras que es más fácil para la clasificación errónea utilizar este algoritmo para dominios de categorías con tamaños de muestra más pequeños.

(3) Método SVM

El método SVM es el método Support Vector Machine (Máquina de vectores de soporte), propuesto por Vapnik et al en 1995 y tiene indicadores de rendimiento relativamente excelentes. . Este método es un método de aprendizaje automático basado en la teoría del aprendizaje estadístico. A través del algoritmo de aprendizaje, SVM puede encontrar automáticamente aquellos vectores de soporte que tienen una mejor capacidad de discriminación para la clasificación. El clasificador así construido puede maximizar la distancia entre clases, por lo que tiene una mejor adaptabilidad y una mayor precisión de clasificación. Este método solo necesita las categorías de muestras de límites en varios dominios para determinar el resultado final de la clasificación.

Apoyo a...>>

Pregunta 9: La pregunta de búsqueda de literatura es de 20 puntos. La primera búsqueda básica es suficiente. La segunda es una búsqueda avanzada. Para los principiantes que ingresan el período de tiempo del autor y luego buscan dos veces al segundo autor de revistas principales limitadas, estas son muy básicas y compruébelo usted mismo