Cómo detectar la tasa de duplicación de un artículo
Alcance de detección de HowNet:
Base de datos de publicaciones en línea de revistas académicas de China
Base de datos de texto completo de tesis doctorales de China
Excelente tesis de maestría de China.
Base de datos de texto completo de artículos de conferencias importantes de China
Base de datos de texto completo de periódicos importantes de China Base de datos de texto completo de patentes de China
Base de datos de recursos de Internet en inglés (incluido el inglés para revistas, programas de doctorado y conferencias de información, así como la base de datos de revistas Springer, Taylor & Francis de Alemania, etc.) dan prioridad a las bibliotecas de literatura editorial, las bibliotecas de literatura académica de Hong Kong, Macao y Taiwán y los recursos literarios de Internet.
Descripción detallada de los estándares de cálculo del sistema CNKI:
1. Después de leer la introducción de este sistema, tengo una pregunta. Este sistema es excelente para el reconocimiento de copias de texto, pero ¿qué pasa con otros contenidos, como datos y gráficos? Si no se puede detectar, ¿no seguirá siendo inútil?
Entre las diversas faltas académicas, el plagio es la más común y grave. En la actualidad, el sistema de detección ha alcanzado un nivel muy alto. La detección de plagio y falsificación de gráficos, fórmulas y datos está actualmente en desarrollo y está logrando grandes avances. Todos son bienvenidos a seguir prestando atención al progreso de este sistema de detección y brindar comentarios y sugerencias más críticos y constructivos.
2. Según este sistema, menos del 39% se muestran en amarillo, ¿significa que está dentro del límite tolerable? Recientemente vi la noticia de que un profesor del proyecto del Fondo Nacional de Ciencias Sociales de la Universidad de Shanghai fue cancelado porque dos artículos que publicó fueron plagiados, lo que representa el 25% y el 30% respectivamente. Por favor, especifique cuál es la línea de advertencia.
El porcentaje solo describe la proporción de palabras superpuestas en los documentos detectados, y no hace referencia al plagio de los documentos. Sólo se puede decir que cuanto mayor sea el porcentaje y más palabras superpuestas, mayor será la posibilidad de plagio. Si se trata de plagio y la gravedad del plagio deben determinarse después de una revisión de expertos.
3. ¿Cómo evitar que el sistema de detección de mala conducta académica de tesis se convierta en una plataforma para venganzas personales?
Esto es algo que estamos considerando seriamente. Actualmente este sistema de detección sólo está disponible para usuarios del nivel institucional. Hemos establecido estrictos procesos de gestión. Al mismo tiempo, técnicamente, también hemos tomado varias medidas para prevenir comportamientos maliciosos tanto como sea posible, incluida una serie de estrictas autenticación de identidad, inicio de sesión, etc.
4. La unidad mínima de detección es una oración, por lo que no puedes detectarla incluso si cambias una o dos palabras en cada oración.
También procesamos oraciones en consecuencia y tenemos un algoritmo de similitud de oraciones. Lo que se considera igual no es la misma sentencia. Hay un algoritmo de similitud a nivel de oración para oraciones y un algoritmo de similitud a nivel de párrafo para párrafos. En base a esto se calcula si un documento o párrafo es similar a otros documentos.
5. Si la palabra original está tomada de un libro relacionado, pero la palabra ha sido copiada de un documento relacionado en la base de datos, es decir, el artículo anterior también tomó la misma palabra de un libro relacionado, Pero las palabras marcadas en mi artículo provienen de libros relacionados. ¿Es esto plagio académico?
El sistema de detección no puede sacar una conclusión sobre si está plagiado o no, y finalmente existe la revisión manual. Entonces, si es la situación que usted describe, los expertos emitirán los juicios correspondientes. Nuestro sistema solo proporciona varias pistas y bases para permitir que las personas comprendan rápidamente la información de la literatura de prueba.
6. ¿Qué autoridad tiene el sistema de detección CNKI?
El sistema de detección de documentos de mala conducta académica no saca ninguna conclusión, es decir, el sistema de detección no caracteriza los documentos de detección, solo muestra las similitudes entre los documentos de detección y otros documentos publicados y enumera hechos objetivos. Si este tipo de detección de documentos constituye una mala conducta académica requiere una revisión final y confirmación por parte de expertos.
Regulaciones de inspección aleatoria relevantes en CNKI:
Si existen regulaciones, se pueden modificar primero. Puede responder después de la modificación. Si no apruebas la segunda revisión, se acabó. Tendrás que enviar un trabajo o diseño dentro de los próximos 4 meses. Esto se basa en un 30% de plagio. Si plagias más del 50%, tendrás que entregar tu trabajo o diseño dentro de los próximos 4 meses. 1. El proyecto de graduación (tesis) de pregrado identificado como plagiado, incluido el número total de palabras que se superponen con los trabajos y trabajos existentes de otras personas, está entre el 30% y el 50% (inclusive) y debo revisarlo yo mismo. Después de la modificación, solo podrás participar en la defensa universitaria después de aprobar el examen nuevamente. Aquellos que aun así no aprueben el reexamen se considerarán graduados. Debes presentar un proyecto de graduación (tesis) reescrito después de 3 meses y luego participar en la defensa después de aprobarlo. En China, estos tres sistemas son CNKI/VIP/Wanfang y los recursos que contienen se actualizan constantemente. Además de los requisitos de confidencialidad cada año, estos tres sistemas recopilan básicamente los trabajos de los graduados como una biblioteca de recursos de comparación. No puede ser descuidado. CNKI/VIP/Wanfang CNKI no está abierto a particulares, pero Weifang está abierto a particulares. Wanfang no realiza el examen de Internet e inglés, pero CNKI y VIP realizan el examen de Internet e inglés. Actualmente, todas las escuelas deben aprobar exámenes de tesis de maestría y doctorado para calificar. Los graduados universitarios, la mayoría de los cuales provienen de 211 universidades clave de ingeniería, adoptan un método de verificación aleatoria para comprobar la duplicación de las tesis de graduación de pregrado.
Si la tasa de plagio o citación es demasiado alta, una vez que supere el 30%, las consecuencias serán muy graves. Para menos del 50% de los estudiantes, se pospondrá la graduación y para más del 50%, se cancelarán sus títulos. Gasté decenas de miles de dólares estudiando mucho en la universidad y, después de unos años más, no pude encontrar un trabajo ni obtener un título. Fue muy triste. Sin embargo, todos los sistemas de detección son máquinas y tienen principios de detección inherentes. Siempre que comprenda los principios de inspección internos, los algoritmos y las reglas del sistema, y mediante revisiones repetidas del informe de inspección, aún podrá pasar la inspección sin problemas y graduarse fácilmente.
Cuestiones que requieren especial atención:
Resumen de varios problemas comunes:
Primero, algunos libros son muy antiguos y estos materiales no se encuentran en sistemas de detección como como CNKI. ¿Es seguro copiar secciones grandes? Algunos estudiantes también creen que la mayor parte de la base de datos contiene artículos de trabajos y revistas de estudiantes anteriores, y que los libros y los informes de trabajos gubernamentales aún no se han incluido en la base de datos. Generalmente, no tendrá "éxito" si copia libros directamente.
Respuesta: Estos comportamientos son riesgosos. En primer lugar, aunque CNKI no incluye libros, puede haber algún compañero o profesor que haya plagiado el mismo contenido y haya publicado su trabajo plagiado. CNKI puede incluir el texto completo del artículo de A en la base de datos, por lo que si copia el mismo contenido nuevamente, es probable que apunte al artículo de A durante la prueba en papel y se considerará plagio.
“Pero si alguien plagia un libro de hace unos años, aún así será detectado, por lo que todos elegirán libros nuevos publicados en los últimos dos años para plagiar. Pero los libros nuevos pueden ser plagiados o plagiados”. por otros. Además, al revisar manuscritos, los expertos tienen una gran experiencia y niveles teóricos. Estos expertos experimentados pueden descubrir su extenso artículo, ¡y el resultado será muy triste!
En segundo lugar, ahora hay una gran cantidad de información relevante en algunas páginas web. ¿Puedo copiar el contenido anterior al escribir un artículo? ¿Como Baidu Wenku y Docin? ".
Respuesta: También es muy peligroso. En gran medida, las páginas web provienen de sitios web de revistas. Muchos artículos se extraen de sitios web de revistas y se copian pegando N artículos. Además, algunas bases de datos han considerado páginas web como uno de los componentes de la base de datos
Si 13 palabras consecutivas son iguales, se puede detectar que se pueden utilizar nuevas palabras para expresar el contenido del texto original, y el significado es similar. Lo mejor es usar el método de asociación, es decir, leerlo nuevamente y usar Háblalo en tu propio idioma, pero sé profesional, es decir, usa términos profesionales en lugar de sinónimos tanto como sea posible, usa diferentes palabras para lograr lo mismo. es decir, por ejemplo, cambie la oración activa a una oración pasiva, cambie la estructura de la oración y reemplácela con palabras acordadas o términos profesionales.
Métodos para reducir. la tasa de plagio:
1. Divida en muchos párrafos pequeños para reducir la tasa de plagio
2. En la base de datos de prueba, como los trabajos. 3. La conversión de capítulos no puede reducir la tasa de copia.
4. Referencias en el artículo, pero en software de detección de plagio, como Un artículo tiene 5000 palabras y el 1% de los artículos tiene más de 50 palabras. Se plagian 50 palabras, aunque se incluyan referencias, se considerará plagio siempre que coincidan más de 20 unidades de palabras.
Métodos de revisión:
En primer lugar, el. se puede conservar el vocabulario profesional del artículo y se pueden cambiar los sinónimos tanto como sea posible; en segundo lugar, se puede cambiar la descripción del artículo, como oraciones invertidas, oraciones pasivas, oraciones activas; párrafos al copiar el texto original y reorganizarlo.
La verificación de duplicados de HowNet se basa en oraciones y luego la compara con la base de datos CNKI oración por oración. Si el contenido principal es el mismo (es decir, sustantivos, verbos, vocabulario profesional, etc.), se marcará en rojo. Si hay una gran cantidad de oraciones en rojo en un párrafo, se contará en la tasa de repetición del trabajo. Según mi propia experiencia, la mejor manera de hacerlo. Evitar la repetición es escribir párrafos relevantes en los artículos de otras personas en mi propio idioma, por ejemplo, cambiar el orden entre las oraciones y, lo que es más importante, cambiar la estructura sujeto-verbo-objeto de la oración. %, no hay problema. ¡Espero que pueda ayudarte! Esto se debe a que se basa básicamente en la oración, pero a partir de la situación actual, en realidad se basa en el contenido de cada párrafo y compara. ellos frase por frase Por ejemplo, un párrafo de su artículo contiene cuatro frases A, B, C y D, y un párrafo de un artículo de la base de datos contiene E, F, G y H. Cuatro frases, luego A, B, C y D deben compararse en E, F, G y H respectivamente. En este caso, no es útil simplemente cambiar el orden de la oración.
1. y selección de sistemas de detección de artículos en diferentes bases de datos
Como todos sabemos, existen tres bases de datos principales: China National Knowledge Infrastructure (cnki), Wanfang y VIP. El sistema de detección de tesis para tesis de maestría y doctorado en; Las universidades generales son CNKI (no estoy seguro de las tesis de pregrado, pero el 80% de ellas también deberían tener un sistema de verificación de plagio), porque CNKI es la base de datos para disertaciones y artículos de revistas más completa y poderosa del país, seguida de las VIP. , no vale la pena mencionarlo. El proceso general de recopilación de bases de datos es así. Para cada base de datos, vaya a cada universidad para comunicarse con los recursos de tesis de graduación de la escuela. Básicamente, unas pocas bases de datos tienen el monopolio. Si se entrega a CNKI, no se entregará a CNKI. Debido a que CNKI tiene funciones poderosas y ofrece muchos descuentos, la mayoría de las universidades envían recursos a CNKI. ¿Por qué digo esto? Muchos estudiantes no saben si elegir CNKI, Wanfang o VIP al detectar plagio.
CNKI tiene absoluta autoridad y monopolio, y es consistente con los resultados de las pruebas de la escuela, por lo que se atreve a ser tan increíble y pedir un precio tan alto. Sin embargo, también escuché que el precio es alto porque CNKI solo puede probar 5000 palabras a la vez, por lo que hay de 20 000 a 30 000 palabras para una maestría y es necesario enviar varias veces para realizar el examen. No tengo confirmación si este es el caso.
2. Principios de funcionamiento y contramedidas del sistema de detección de CNKI.
Primero, la detección en papel de CNKI consiste en cargar el artículo completo. Después de cargar el artículo, el sistema detectará automáticamente la información del capítulo del artículo. Si hay información de tabla de contenido generada automáticamente, el sistema detectará el artículo capítulo por capítulo; de lo contrario, lo detectará automáticamente una vez cada 10.000 palabras aproximadamente.
En segundo lugar, algunos estudiantes informaron que citaron o plagiaron claramente párrafos u oraciones de otros documentos en sus propios párrafos, pero esto no fue detectado. CNKI ha fijado un umbral para la sensibilidad de este sistema de detección, que es de aproximadamente el 3%. En términos de párrafos, no se puede detectar plagio o citas inferiores al 3%, lo cual es común en oraciones pequeñas o conceptos pequeños en párrafos grandes. Por ejemplo, si el párrafo 1 tiene 10.000 palabras, no se detectarán los documentos individuales que hagan referencia a menos de 100 palabras. De hecho, aquí también se les dice a los estudiantes un método de modificación, que consiste en nunca elegir un artículo para citar de los párrafos plagiados. Intente elegir tantos documentos como sea posible e interceptar algunas palabras de un artículo, para que no sea detectado. .
En tercer lugar, además del segundo punto, existen otras formas de modificar el texto marcado en rojo, como cambiar palabras, cambiar oraciones y cambiar el método de descripción (cambiar la oración original a una oración invertida). , oraciones pasivas, oraciones activas, etc.), alterar el orden de los párrafos, reemplazar palabras clave, oraciones clave, etc. La práctica ha demostrado que la combinación de los métodos anteriores puede reducir eficazmente la tasa de copia y garantizar una transferencia fluida.
El principio del sistema de detección de papel CNKI es que 13 palabras consecutivas similares o plagiadas se marcarán en rojo, pero deben cumplir los requisitos previos en 3: es decir, el documento A que usted citó o plagió en cada detección. El total en el párrafo debe alcanzar el 5%. Si la mitad de las palabras en 13 son similares y se sospecha que la otra mitad son similares, entonces debe cambiar el patrón de la oración, cambiar a términos profesionales y cambiarlo con cuidado y a fondo.
Alcance de detección de HowNet:
Base de datos de publicaciones en línea de revistas académicas de China
Base de datos de texto completo de tesis doctorales de China
Excelente tesis de maestría de China.
Base de datos de texto completo de artículos de conferencias importantes de China
Base de datos de texto completo de periódicos importantes de China Base de datos de texto completo de patentes de China
Base de datos de recursos de Internet en inglés (incluido el inglés para revistas, programas de doctorado y conferencias de información, así como la base de datos de revistas Springer, Taylor & Francis de Alemania, etc.) dan prioridad a las bibliotecas de literatura editorial, las bibliotecas de literatura académica de Hong Kong, Macao y Taiwán y los recursos literarios de Internet.