Red de Respuestas Legales - Consulta de información - Ayude a encontrar información sobre el historial de desarrollo de Word, sus funciones, consejos de uso y más.

Ayude a encontrar información sobre el historial de desarrollo de Word, sus funciones, consejos de uso y más.

Panorama del desarrollo mundial

Las ideas inmaduras sobre WordNet se remontan a hace más de 20 años. Después de 1985, las ideas comenzaron a volverse concretas y claras gradualmente. Desde 1985, WordNet ha estado en pleno apogeo como proyecto de conocimiento. Sin embargo, WordNet en ese momento es muy diferente del WordNet actual, más de 10 años después.

Una de las premisas originales de este proyecto fue la "hipótesis de la divisibilidad", la idea de que el componente léxico de una lengua se puede aislar y estudiar específicamente. La historia de la lexicografía nos muestra claramente que se pueden obtener resultados de investigación útiles a nivel léxico. Por supuesto, el vocabulario no es completamente independiente de otros componentes del lenguaje, pero puede separarse de otros componentes. Por ejemplo, aunque el conocimiento fonológico y gramatical se forma en los primeros años de vida, el vocabulario puede aumentar con la acumulación de actividad intelectual. Esto sugiere que diferentes componentes del lenguaje implican diferentes procesos cognitivos.

Otra premisa es la "hipótesis del patrón": una persona no puede dominar todas las palabras necesarias para utilizar un idioma a menos que pueda explotar patrones sistemáticos y relaciones entre significados. Este modelo mental sistemático ha sido una forma de conocimiento especulativo desde al menos la época de Platón, y la investigación lingüística moderna ha comenzado a identificar dicho modelo en la estructura semántica de las lenguas naturales. Sin embargo, muchos excelentes esfuerzos de investigación en esta línea han encontrado dificultades en este tema. Un autor podría proponer una teoría semántica y demostrar su teoría utilizando de 20 a 50 palabras en inglés como ejemplos, dejando los otros 654,38+ millones de palabras para que el lector practique.

La tercera premisa es la llamada "hipótesis integral": si la lingüística computacional quiere procesar el lenguaje natural como los humanos, necesita almacenar la mayor cantidad de conocimiento léxico posible.

Uno de los métodos para establecer tesauros a gran escala que contengan descripciones del significado de palabras es el método de semántica léxica de componentes basado en el análisis de componentes semánticos (que también puede traducirse como análisis de sememas). De esta manera, el significado de una palabra se analiza en una combinación de átomos conceptuales más pequeños. Sin embargo, definir un conjunto de átomos conceptuales no es fácil. De hecho, Jorge. A. Miller, el entrenador en jefe de WordNet, también analizó el método de descripción semántica del análisis de sememas en su libro de 1976 "Language and Perception", en coautoría con Philip N. Johnson-Laird. Sin embargo, hasta 1985, todavía no logró obtener el método. Método de descripción semántica. Hacer una lista completa y bien definida de todos los átomos conceptuales.

En 1985, muchos psicólogos cognitivos y lingüistas computacionales comenzaron a utilizar la forma "red" para describir el significado de las palabras. Por ejemplo, "mesa" y "muebles" representan dos nodos. Hay un dardo entre estos dos nodos para expresar la proposición de que la mesa es un tipo de mueble, es decir, la relación semántica de "es un tipo de". Con el aumento de la investigación en esta área, cada vez más personas se dan cuenta conscientemente de que, además de los componentes semánticos (análisis semema), las relaciones también se pueden utilizar para expresar semántica (semántica léxica relacional), y esta última puede reemplazar a la primera.

En los primeros días de WordNet, los investigadores consideraron principalmente si la semántica relacional podría usarse ampliamente a gran escala, en lugar de quedarse simplemente en el nivel de demostraciones de juguetes. Cuando los investigadores estuvieron convencidos de que era posible, escribieron un software de aplicación para convertir la idea en realidad. De hecho, al principio, Miller no tenía una idea completa de cómo desarrollar un vocabulario amplio. La idea inicial es identificar los nodos de palabras más importantes compuestos por cadenas y explorar el modelo de relación semántica entre ellos. La idea era que si se obtuviera el modelo correcto de relaciones semánticas, a partir de él se podrían inferir definiciones de palabras. Por lo tanto, para una red relacional sobre el significado de las palabras, la definición del significado de las palabras es redundante.

En 1978, Miller describió la idea de un "diccionario automatizado". Pero en ese momento no tenía idea de cómo implementar la idea. Gracias al apoyo de la Fundación Sloan, la Fundación Spencer y el Centro de Investigación Watson de IBM, Miller pudo seguir adelante con su idea sin darse por vencido a mitad de camino. En 1984, Miller incluso construyó una pequeña red semántica de 45 sustantivos en una PC IBM, a la que llamó "Word Web". Miller demostró este resultado en IBM y Bellcore. Sus amigos de Bellcore, Lance Miller, Roy Byrd, Michael Lesk, Donald Walker, Robert Amsler y Stephen Hanson lo animaron a continuar y le brindaron mucha orientación técnica práctica.

Lesk invitó a Miller a asistir a la primera reunión del New Oxford English Dictionary Center en la Universidad de Waterloo en Canadá en junio de 1985 11. Miller presentó un artículo. En ese artículo, Miller explicó la idea de que podemos usar un conjunto de sinónimos para representar conceptos de vocabulario y describir la matriz de vocabulario, es decir, para establecer una relación de mapeo entre la forma y el significado de una palabra. De hecho, esta es la idea principal que guía el trabajo de investigación en el desarrollo de WordNet.

Sin embargo, tal vez las opiniones presentadas en el informe de Miller en esa reunión eran secundarias y el título del informe era más significativo. El título fue propuesto por Lesk y se llama: WordNet: A Dictionary Browser. WordNet: navegador de diccionarios.

Aquí, WordNet se considera un navegador de diccionarios, una herramienta auxiliar para diccionarios legibles por máquina. Sin embargo, estos diccionarios automáticos tradicionalmente no se ordenan alfabéticamente sino por significado.

Cuando WordNet comenzaba a tomar forma, Miller y algunos colegas con ideas afines lanzaron conjuntamente un proyecto de investigación cognitiva en Princeton. Richard Carlingford visitó Princeton de 1983 a 1985. Él, Gilbert Herman y Miller persuadieron al rector Neil Rudenstine para que les proporcionara una microcomputadora. Esta computadora se convirtió en el núcleo del laboratorio de ciencias cognitivas de Princeton. Con estos dispositivos en mano, Miller convenció a Susan Chipman de la Oficina de Investigación Naval para que los contratara para desarrollar WordNet. Colinford y Miller recibieron un contrato del Instituto de Investigación del Ejército para desarrollar una teoría computacional de la semántica léxica. En marzo de 1986, la Fundación James S. MacDonald hizo una generosa donación a la Universidad de Princeton para apoyar la investigación en ciencia cognitiva. Marie Bienkowski (estudiante de posgrado en Cullingford) y experta en informática que había estado con nosotros desde 1985 rápidamente ideó el software que necesitábamos. Como resultado, WordNet se convirtió verdaderamente en uno de varios proyectos de investigación en el recién creado Laboratorio de Ciencias Cognitivas de Princeton y comenzó a operar en la práctica.

El programa más importante utilizado para crear WordNet es el llamado programa Grinder. Bienkowski escribió la primera versión de Grinder en LISP en 1986. Dan Taber reescribió este programa en C en 1987. Antonio Romero lo reescribió en 1989. Randee Tengi ha sido responsable de gestionar todas estas versiones del programa desde 1991.

Las palabras en WordNet provienen de diferentes lugares. Corpus de Brown, Pequeño diccionario de sinónimos y antónimos de Laurence Urdan (1978), Tesauro Rodale revisado de Urdan (1978), Tesauro Rogers de Robert Chapman, cuarta edición (1977), espere. A finales de 1986, Miller obtuvo un glosario de Fred Chang del Centro de Investigación y Desarrollo Naval. Miller comparó el vocabulario de Chang con el vocabulario existente de WordNet. El resultado frustrante fue que solo había un 15% de palabras superpuestas, por lo que Miller agregó el vocabulario de Chang a WordNet. En 1993, Miller obtuvo una lista de vocabulario de 39.143 palabras de Ralph Grishman y sus colegas de la Universidad de Nueva York, que de hecho se incluyó en el famoso diccionario COMLEX. El resultado de esta comparación es que WordNet sólo contiene el 74% de las palabras en COMLEX. Entonces Miller agregó el vocabulario a WordNet.

A medida que aumenta el vocabulario, la presión del trabajo organizativo comienza a aumentar. El primer paso es diferenciar por categorías sintácticas. Creamos diferentes archivos para almacenar sustantivos, verbos y adjetivos (los adverbios se agregaron después de 1992). Sin embargo, todavía hay demasiadas palabras en cada categoría sintáctica, lo que dificulta su dominio sin una mayor clasificación. Los sustantivos son el problema más grave porque son una parte abierta del discurso.

En la primavera de 1987, Philip N. Johnson-Laird visitó la Universidad de Princeton desde el Instituto de Psicología Aplicada de Cambridge, Inglaterra. Encontró que WordNet carecía de los medios para distinguir los cambios en el significado de las palabras cuando los adjetivos modifican diferentes sustantivos. Usó 266 pares de adjetivos-antónimos (luego incluidos en WordNet) para clasificar los sustantivos según su idoneidad para modificarlos. Como resultado, se obtuvieron un total de 25 subcategorías nominales. Estas subcategorías constituyen la clasificación básica de los sustantivos. Además, estos sustantivos de diferentes subcategorías se dividen en diferentes archivos individuales y se entregan a diferentes investigadores para su procesamiento respectivamente, promoviendo así el progreso de WordNet en ingeniería.

En el verano de 1987, Christiane Fellbaum se unió al equipo de investigación y asumió la tarea de subclasificar los verbos.

Adjetivos descriptivos, Kitty Miller es el único, ha sido una categoría principal desde el principio, sin subcategorías, y todos estos adjetivos también se guardan en un archivo enorme.

El desarrollo de Wordnet desde un simple navegador de diccionarios hasta una base de datos de vocabulario independiente comenzó en 1989. En ese momento, Susan Chipman no estaba satisfecha con WordNet como un simple navegador de vocabulario y pidió al equipo de investigación que desarrollara una herramienta. Esta herramienta puede leer texto basado en WordNet e informar diversa información sobre las palabras del texto. Esta herramienta se llama "Filtro de palabras". Puede filtrar palabras poco comunes o no deseadas de sus documentos nuevos y reemplazarlas con palabras más comunes. Este trabajo nos hace darnos cuenta rápidamente de que tenemos que lidiar con los giros y vueltas de las formas de las palabras. Esto nos lleva a abordar algunas preguntas sobre la forma de las palabras. WordNet contiene sólo las formas básicas de las palabras. Si aparece "barcos" en el texto, WordNet no lo reconoce. Richard Beckwith y Miceael Colon escribieron un programa llamado Morphy que podía reconocer la palabra "barcos" en el texto.

En septiembre de 1989, WordNet podía procesar cambios léxicos en el texto y encontrar la forma básica correspondiente de la palabra en el léxico.

El trabajo anterior condujo a otro desarrollo importante en la asociación de palabras en un texto con sus significados correspondientes en WordNet. Claudia Leack (noviembre de 1991) y Brian Gustafson desarrollaron una interfaz, ConText, que puede preprocesar texto (creación de instancias, lexicalización, anotación de sintaxis automática, etc.) y mostrar las palabras objetivo junto con WordNet (es decir, palabra objetivo de anotación semántica). En junio de 1993, Shari Landes fue responsable de escribir un conjunto de herramientas de anotación (incluido un conjunto de etiquetas). Con una herramienta de este tipo, es posible generar un texto lo más inequívoco posible. La anotación semántica de texto mejora significativamente la cobertura de WordNet, incluida la cobertura de vocabulario y la cobertura del significado de las palabras.

Otro cambio importante en WordNet se produjo en la primavera de 1989. Antonio Romero modificó el programa Grinder para que pudiera aceptar definiciones entre corchetes (o "comentarios", como se entiende) como parte de un conjunto de sinónimos. A medida que aumenta el número de palabras en WordNet, resulta cada vez más difícil distinguir el significado de las palabras con la mayor claridad posible manteniendo al mismo tiempo la pureza del conjunto de sinónimos. En otras palabras, no basta con utilizar sinónimos para definir el significado de una palabra. Inicialmente, WordNet intentó que los comentarios fueran breves. Pero un año después, los comentarios empezaron a ser cada vez más largos. El número de anotaciones también comenzó a aumentar de manera constante. En abril de 1989, WordNet tenía 37.409 sinónimos y ninguna anotación; en julio de 1991, WordNet contenía 44.983 sinónimos y 13.688 anotaciones (30%). En junio de 1992 1, WordNet contenía 49.771 conjuntos de sinónimos y 19.382 anotaciones (39%). En junio de 1993, WordNet contenía 61.023 conjuntos de sinónimos y 36.880 anotaciones (60%). Al 1 de junio de 1994, WordNet contenía 79.542 conjuntos de sinónimos y 58.705 anotaciones (74%). En junio de 1995, 65438+10 meses, WordNet incluía 91050 conjuntos de sinónimos y 75389 anotaciones (83% de los conjuntos de sinónimos).

Los investigadores de WordNet siempre han visto WordNet como un experimento, no como un producto. Entonces, cuando hubo suficientes palabras en WordNet, abrieron WordNet al mundo académico de forma gratuita. Randee Tengi ha supervisado una serie de lanzamientos de WordNet. La versión 1.0 de Wordnet se publicó en julio de 1991; la versión 1.1 se publicó en agosto de 1991; la versión 1.2 se publicó en abril de 1992; la versión 1.3 se publicó en marzo de 1995; Actualmente, más de 1000 personas y organizaciones se han unido a la lista de correo de WordNet. Muchos investigadores descargaron WordNet y lo utilizaron de diferentes maneras.

WordNet ha sido financiado por la Oficina de Investigación Naval, la Agencia de Proyectos de Investigación Avanzada, la Fundación James S. McDonnell y, más recientemente, el Language Data Consortium.

Las principales funciones y características de Word

Las principales funciones y características de Word == >; iniciar y salir de Word

-

Las principales funciones y características de Word se pueden resumir de la siguiente manera:

(1) Lo que ves es lo que obtienes. Los usuarios utilizan el software Word para organizar los documentos de modo que el efecto de impresión sea claramente visible en la pantalla.

(2) Interfaz de operación intuitiva El software Word tiene una interfaz amigable y proporciona una variedad de herramientas. Puede utilizar el ratón para completar operaciones como la selección y el diseño.

(3) La composición tipográfica mixta multimedia puede utilizar el software Word para editar texto, gráficos, imágenes, sonidos y animaciones, y también puede insertar información producida por otro software. También puede utilizar las herramientas de dibujo proporcionadas por el software Word para crear gráficos y editar texto artístico y fórmulas matemáticas, que pueden satisfacer las diversas necesidades de procesamiento de documentos de los usuarios.

(4) Potente función de tabulación El software Word proporciona una poderosa función de tabulación, no solo tabulación automática, sino también tabulación manual. Las filas de la tabla de Word están protegidas automáticamente, los datos de la tabla se pueden calcular automáticamente y la tabla se puede modificar de varias maneras. En el software Word, también puedes insertar hojas de cálculo directamente. Usar el software Word para crear formularios es simple, hermoso, rápido y conveniente.

(5) El software de función automática de palabras proporciona funciones de revisión ortográfica y gramatical, lo que mejora la precisión de la edición de artículos en inglés. Si encuentra errores gramaticales o ortográficos, el software Word también le proporcionará sugerencias de modificación. Después de editar un documento con el software Word, Word puede ayudar a los usuarios a escribir automáticamente un resumen, ahorrándoles mucho tiempo. La función de autocorrección brinda gran ayuda a los usuarios al escribir los mismos caracteres. Los usuarios pueden definir la entrada de caracteres ellos mismos. Cuando el usuario desea ingresar el mismo carácter, se puede definir una letra, especialmente al ingresar caracteres chinos. Esta característica mejora enormemente la velocidad de entrada del usuario.

(6) Funciones de plantilla y asistente El software Word proporciona una gran cantidad de plantillas enriquecidas, lo que permite a los usuarios crear rápidamente los formatos correspondientes al editar un determinado tipo de documento. Además, el software Word permite a los usuarios personalizar plantillas, proporcionando un método eficiente y rápido para que los usuarios creen documentos con necesidades especiales.

(7) Funciones de ayuda enriquecidas Las funciones de ayuda del software Word son detalladas y ricas. La imagen y la ayuda conveniente proporcionada por el software Word permiten a los usuarios encontrar soluciones cuando encuentran problemas. Proporciona comodidad para que los usuarios estudien por su cuenta.

(8) Las herramientas de red habilitadas para Internet son uno de los aspectos más utilizados y populares de las computadoras en la actualidad. El software Word proporciona soporte de red. Los usuarios pueden crear rápida y fácilmente páginas web (comúnmente denominadas páginas web) según el asistente de páginas web, o pueden utilizar la barra de herramientas web del software Word para abrir, buscar o explorar rápidamente varios documentos, incluidas páginas web y documentos web.

(9) Súper compatibilidad El software Word puede admitir una variedad de documentos y también puede guardar documentos editados por Word en otros formatos, lo que proporciona una gran comodidad para el intercambio de información entre el software Word y otro software. Puede editar correos electrónicos, sobres, notas, informes, páginas web y más. Fraseología.

(10) Potente función de impresión El software Word proporciona una función de vista previa de impresión y tiene un fuerte soporte y configuración para los parámetros de la impresora.