Red de Respuestas Legales - Derecho empresarial - Patente ODP de EE. UU.

Patente ODP de EE. UU.

La historia del desarrollo de los motores de búsqueda

En los primeros días del desarrollo de Internet, las consultas de directorios de categorías de sitios web representadas por Yahoo eran muy populares. Las categorías del sitio web se organizan y mantienen manualmente. Se seleccionan y describen brevemente excelentes sitios web en Internet y se clasifican en diferentes categorías. Cuando los usuarios realizan consultas, pueden encontrar el sitio web que desean haciendo clic en las capas. Algunas personas llaman a este sitio web de servicio de recuperación basado en directorio motor de búsqueda, pero estrictamente hablando, no es un motor de búsqueda.

Achie fue desarrollado en 1990 por profesores y estudiantes de la Facultad de Ciencias de la Computación de la Universidad McGill en Canadá. En ese momento, la World Wide Web aún no había aparecido y la gente usaba FTP para disfrutar de los recursos de comunicación. Archie puede recopilar y analizar periódicamente información de nombres de archivos en servidores FTP y realizar búsquedas de archivos en cada host FTP. Los usuarios deben ingresar el nombre exacto del archivo para buscar y Archie le dice al usuario qué servidor FTP puede descargar el archivo. Aunque los recursos de información recopilados por Archie no son páginas web (archivos HTML), su principio de funcionamiento es el mismo que el de los motores de búsqueda: recopilar automáticamente recursos de información, establecer índices y proporcionar servicios de recuperación. Por eso se reconoce a Archie como el creador de los motores de búsqueda modernos.

El origen de los motores de búsqueda

Los antepasados ​​de todos los motores de búsqueda fueron tres estudiantes de la Universidad McGill de Montreal (Alan Entachi, Peter Deutsch y Bill Whelan) que inventaron las preguntas frecuentes de Archie en 1990. Alan Emtage y otros pensaron en desarrollar un sistema que pudiera encontrar archivos por nombre, así nació Archie. Archie es el primer programa que indexa automáticamente archivos de sitios web FTP anónimos en Internet, pero no es un verdadero motor de búsqueda. Archie es una lista de búsqueda de nombres de archivos FTP. El usuario debe ingresar el nombre exacto del archivo que desea buscar y Archie le indicará desde qué dirección FTP se puede descargar el archivo. Inspirados por la popularidad de Archie, los Servicios de Computación del Sistema de la Universidad de Nevada desarrollaron Veronica (Veronica FAQ), una herramienta de búsqueda de Gopher (Gopher FAQ) en 1993. Jughead es otra herramienta de búsqueda de tuzas posterior.

El desarrollo de los motores de búsqueda

Desarrollo (1)

La historia de Excite se remonta a febrero de 1993. La idea de seis estudiantes de la Universidad de Stanford era analizar las relaciones entre palabras para poder buscar de forma más eficiente en las grandes cantidades de información de Internet. A mediados de 1993, el proyecto estaba completamente comprometido y lanzaron una versión del software de búsqueda para que los webmasters lo usaran en sus propios sitios, que se conoció como Excite for Web Servers.

Nota: Excite posteriormente se hizo famoso por la búsqueda de conceptos. En mayo de 2002, Excite, adquirida por Infospace, detuvo su propio motor de búsqueda y cambió al metabuscador Dogpile.

Desarrollo (2)

En abril de 1994, dos estudiantes de doctorado chino-estadounidenses de la Universidad de Stanford, Jerry Yang y David Ferro***, cofundaron Yahoo! . A medida que aumentó el número de visitas y enlaces, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Porque Yahoo! Los datos se introducen manualmente, por lo que realmente no se pueden clasificar como motor de búsqueda. De hecho, es sólo un directorio de búsqueda. Yahoo! Dado que todos los sitios web incluidos en el sitio web van acompañados de información breve, la eficiencia de la búsqueda mejora significativamente.

Nota: Después de Yahoo, Altavista, Inktomi y Google prestarán sucesivamente servicios de buscadores.

Yahoo! ——Casi se convirtió en sinónimo de Internet en la década de 1990.

Desarrollo (3)

En 1995, apareció una nueva forma de motor de búsqueda: el metabuscador. Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable de la conversión y el procesamiento antes de enviarla a múltiples motores de búsqueda independientes preseleccionados. Todos los resultados de las consultas devueltos por los motores de búsqueda independientes se recopilan y procesan antes de devolverlos al sitio. usuario.

El primer metabuscador fue Metacrawler, de Eric Selberg y Liu Wenhuan Etzioni, estudiantes de maestría de la Universidad de Washington. Los metabuscadores parecen buenos en concepto, pero los resultados de búsqueda siempre son insatisfactorios, por lo que ningún metabuscador ha tenido nunca una posición fuerte.

Desarrollo (4)

La aparición de la recuperación inteligente: el uso de diccionarios de segmentación de palabras, diccionarios de sinónimos y diccionarios homófonos para mejorar los resultados de la recuperación, lo que puede ayudar aún más a las consultas a nivel de conocimiento o nivel conceptual. Mediante el procesamiento de recuperación de diccionarios temáticos, diccionarios superiores y diccionarios relacionados del mismo nivel, se forma un sistema de conocimiento o red de conceptos, que brinda a los usuarios consejos de conocimiento inteligentes y, en última instancia, los ayuda a obtener los mejores resultados de recuperación.

Ejemplo:

(1) Consulta "computadora" y también puedes recuperar información relacionada con "computadora";

(2) El alcance de la consulta puede ser Además, se limita a "microcomputadora", "servidor" o se amplía a "tecnología de la información" o "tecnología electrónica", "software", "aplicación informática" relacionada;

(3) También incluye información y recuperación ambiguas para Por ejemplo, ya sea que "Apple" se refiera a una fruta o a una marca de computadora, la distinción entre "chino" y "chino * * * y China" se combinará con tecnologías como la base de datos de descripción de conocimiento ambiguo, el índice de texto completo, el análisis del contexto de búsqueda del usuario, y la retroalimentación relacionada con el usuario se lleva a cabo para retroalimentar de manera eficiente y precisa la información que los usuarios más necesitan.

Desarrollo (5)

La tendencia de personalización es una de las características importantes y tendencias inevitables del desarrollo futuro de los motores de búsqueda. Una forma es organizar la información personal a través de los productos comunitarios del motor de búsqueda (es decir, proporcionar servicios a usuarios registrados) y luego introducir factores personales en la recuperación de la base de datos de información básica del motor de búsqueda para su análisis, obteniendo así diferentes resultados de búsqueda para individuos. Desde el lanzamiento de la versión beta de myweb por parte de Yahoo en junio de 2004 hasta el lanzamiento de la función de personalización en junio de 2005, el historial de búsqueda de Google básicamente siguió el mismo camino, analizando el alcance limitado de las necesidades de búsqueda específicas de los usuarios y luego expandiéndose a otros sitios web similares. en Internet para brindar los resultados más relevantes según el alcance de las necesidades del usuario. El otro es para el popular motor de búsqueda personalizado Google, o yahooMindSet, o vivisimo, que todos sabemos es la agrupación de prospectos. Pero no importa qué método de implementación se utilice, es decir, Google elige activamente el alcance de la búsqueda o Yahoo, vivisimo reorganiza la información que necesitan en los resultados, es un experimento o una idea, y no se convertirá en una aplicación de motor de búsqueda convencional en un corto tiempo.

Desarrollo (6)

Gran tecnología de red global: dado que no existe un estándar unificado de organización de la información para procesar los recursos de información de la red, los recursos de información de la red desordenados son difíciles de buscar, transferir y disfrutar. Incluso el desarrollo profundo crea islas de información. La tecnología Grid tiene como objetivo eliminar las islas de información y lograr una conexión integral de todos los recursos en Internet.

China Global Information Grid (Global Information Grid)

La palabra robot tiene un significado especial para los programadores. Un robot informático es un programa automatizado que puede realizar una tarea repetidamente a una velocidad que los humanos no pueden alcanzar. Debido a que los programas robóticos diseñados para recuperar información se arrastran por la web como arañas, los programas robóticos de los motores de búsqueda se denominan programas araña.

Matthew Gray desarrolló Web Wanderer en 1993, el primer programa "robot" que utiliza las relaciones de enlace entre páginas HTML para explorar el tamaño de la World Wide Web. Al principio solo se usaba para contar el número de servidores en Internet, pero luego también pudo capturar direcciones web (URL).

En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, Jerry Yang (Yang Zhiyuan) y David Ferro***, cofundaron Yahoo. A medida que aumentó el número de visitas y enlaces, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Porque Yahoo! Los datos se introducen manualmente, por lo que realmente no se pueden clasificar como motor de búsqueda. De hecho, es sólo un directorio de búsqueda. Yahoo adquirió inktomi el 23 de febrero de 2002, Overture, incluidos Fast y Altavista, el 23 de julio de 2003, y adquirió por completo 3721 el 23 de junio de 2003.

A principios de 1994, Brian Pinkerton, un estudiante de la Universidad de Washington, inició su pequeño proyecto WebCrawler. El 20 de abril de 1994, WebCrawler contenía contenido de sólo 6.000 servidores. WebCrawler es el primer motor de búsqueda de texto completo en Internet que admite la búsqueda de todas las palabras de un documento. Antes, los usuarios sólo podían buscar por URL y resumen, a menudo a partir de anotaciones humanas o programas que extraían automáticamente las primeras 100 palabras de texto.

En julio de 1994, Michael Mauldin de la Universidad Carnegie Mellon conectó el programa araña de John Leavitt a su programa de indexación y creó Lycos. Además de la clasificación por relevancia, Lycos también proporciona coincidencias de prefijos y restricciones de similitud de caracteres. Lycos fue el primero en utilizar el resumen automático de páginas web en los resultados de búsqueda. Su mayor ventaja es que la cantidad de datos supera con creces la de otros motores de búsqueda.

A finales de 1994 aparece oficialmente Infoseek. Su amigable interfaz y su gran cantidad de características adicionales lo convierten en un importante representante de motores de búsqueda como Lycos.

En 1995, apareció una nueva forma de motor de búsqueda: una revisión de los metabuscadores. Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable del procesamiento de la conversión y la envía a múltiples motores de búsqueda independientes preseleccionados. Los resultados de la consulta devueltos por cada motor de búsqueda independiente se recopilan y procesan antes de regresar a ellos. el usuario. El primer metabuscador fue Metacrawler de Eric Selberg y Liu Wenhuan Etzioni, estudiantes de maestría de la Universidad de Washington.

1995 65438+2 meses, DEC lanzó oficialmente AltaVista. AltaVista es el primer motor de búsqueda que admite búsquedas en lenguaje natural y el primero en implementar una sintaxis de búsqueda avanzada (como AND, OR, NOT, etc.). ).Los usuarios pueden utilizar AltaVista para buscar grupos de noticias y recuperar artículos de Internet. También pueden buscar palabras en nombres de imágenes, títulos, subprogramas Java y objetos ActiveX. AltaVista también afirma ser el primer motor de búsqueda que permite a los usuarios enviar o eliminar URL a una base de datos de índice web, y puede iniciarse en 24 horas. Una de las novedades más interesantes de AltaVista es la búsqueda de todos los sitios web con enlaces URL. AltaVista también ha realizado muchas innovaciones en la interfaz orientada al usuario. Coloca "sugerencias" en el área del cuadro de búsqueda para ayudar a los usuarios a expresar mejor su estilo de búsqueda. Estos consejos se actualizan con tanta frecuencia que después de algunas búsquedas, los usuarios verán muchas características interesantes que tal vez nunca supieron que existían. Esta serie de características han sido gradualmente adoptadas ampliamente por otros motores de búsqueda. En 1997, AltaVista lanzó LiveTopics, un sistema de presentación gráfica para ayudar a los usuarios a encontrar lo que buscan entre miles de resultados de búsqueda.

Inktomi fue fundada el 26 de septiembre de 1995 por Eric Brewer, profesor asistente de la Universidad de California, Berkeley, y Paul Gauthier, estudiante de doctorado. El 20 de mayo de 1996 se fundó la empresa Inktomi y apareció ante el mundo un potente HotBot. Afirma ser capaz de rastrear más de 65438+100 millones de páginas de índice cada día, por lo que hay mucho más contenido nuevo que otros motores de búsqueda. HotBot también utiliza cookies para almacenar las preferencias de búsqueda personales de los usuarios.

En agosto de 1997 apareció oficialmente el buscador de auroras boreales. Solía ​​ser uno de los motores de búsqueda más grandes en términos de base de datos. No tiene palabras vacías. Tiene excelentes noticias de actualidad, una colección especial de más de 7100 publicaciones y una buena sintaxis de búsqueda avanzada. Es el primero en admitir la clasificación automática simple de los resultados de búsqueda.

Antes de 1998, Google era sólo un pequeño proyecto de la Universidad de Stanford, BackRub. En 1995, el estudiante de doctorado Larry Page comenzó a estudiar diseño de motores de búsqueda y registró el nombre de dominio el 15 de septiembre de 1997. A finales de 1997, con la ayuda de Sergey Brin, Scott Hassan y Alan S. Con la participación de Tremberg, comenzó BachRub. para proporcionar demostraciones. En febrero de 1999, Google completó la transición de la versión Alpha a la versión Beta. Google considera el 27 de septiembre de 1998 como su cumpleaños. Google determina la importancia de las páginas web basándose en Pagerank, lo que mejora enormemente la relevancia de los resultados de búsqueda. La cultura geek de Google y el no hacer el mal le han valido a Google una gran reputación y reputación de marca. En abril de 2006, Google anunció su nombre chino "Google", que fue el primer nombre dado por Google en un país de habla no inglesa.

Fast (Alltheweb) se fundó en 1997 como resultado de una investigación académica en la Universidad Noruega de Ciencia y Tecnología (NTNU). En mayo de 1999, lanzó su propio motor de búsqueda AllTheWeb. El objetivo de Fast es ser el motor de búsqueda más grande y rápido del mundo, y ha estado cerca en los últimos años. Fast (Alltheweb) puede clasificar automáticamente páginas web según ODP, admite búsquedas en Flash y PDF, admite búsquedas en varios idiomas y también proporciona búsqueda de noticias, búsqueda de imágenes, videos, MP3 y FTP, y tiene funciones de búsqueda avanzadas extremadamente poderosas. (El 25 de febrero de 2003, Overture adquirió el departamento de búsqueda en Internet de Fast).

En agosto de 1996, Sohu se creó para crear un directorio clasificado de sitios web chinos. Alguna vez tuvo la reputación de "buscar mapas cuando salías y buscar Sohu en línea". Con el rápido aumento de los sitios web en Internet, este tipo de directorio de clasificación editado manualmente ya no es adecuado. En agosto de 2004, Sohu se convirtió en el sitio web independiente de búsqueda de nombres de dominio "Sogou", llamándose a sí mismo el "motor de búsqueda de tercera generación".

Openfind se estableció en 1998, 65438+Octubre. Su tecnología se originó en el laboratorio GAIS dirigido por el profesor Wu Sheng de la Universidad Nacional Chung Cheng en Taiwán. Al principio, Openfind era sólo un motor de búsqueda chino. En su apogeo, proporcionó motores de búsqueda chinos para tres portales muy conocidos: Sina, Qimo y Yahoo. Pero después del año 2000, el mercado se dividió gradualmente entre Baidu y Google. En junio de 2002, Openfind relanzó la versión beta del motor de búsqueda Openfind basado en el proyecto GAIS30, lanzó PolyRankTM y anunció que había acumulado 3.500 millones de páginas web y había comenzado a ingresar al campo de la búsqueda en inglés.

En junio de 5438 + octubre de 2000, dos ex alumnos de la Universidad de Pekín, Robin Li, el inventor de la patente del análisis de hipervínculos y ex ingeniero senior de Infoseek, y su amigo Xu Yong (becario postdoctoral en Berkeley, California) estaban en Zhongguancun, Beijing Funda Baidu.

La versión beta del motor de búsqueda Baidu se lanzó en agosto de 2001 (Baidu solo proporciona motores de búsqueda para otros portales como Sohu, Sina, Tom, etc. El motor de búsqueda Baidu se lanzó oficialmente el 22 de octubre de 2001 y se centra en la búsqueda en chino).

Otras funciones del motor de búsqueda de Baidu incluyen: instantánea de Baidu, vista previa de la página web/vista previa de todas las páginas web, términos de búsqueda relacionados, consejos para corregir errores tipográficos, búsqueda de mp3 y búsqueda en Flash. Después del lanzamiento del proyecto Blitzen en marzo de 2002, las actualizaciones tecnológicas se aceleraron significativamente. Posteriormente lanzó una serie de productos como Tieba, Zhizhi, mapas, estudios chinos, enciclopedias, documentos, videos, blogs, etc., que fueron bien recibidos por los internautas. El 5 de agosto de 2005 cotizó en Nasdaq con un precio de emisión de 27,00 dólares estadounidenses y el código BIDU. El precio de apertura fue de 66,00 dólares y cerró en 122,54 dólares, un aumento del 353,85%, estableciendo un récord para el mayor aumento de acciones nuevas cotizadas en el mercado de valores estadounidense en los últimos cinco años.

El 23 de febrero de 2003, 65438, la Búsqueda HC original operó oficialmente de forma independiente y se estableció la Búsqueda en China. En febrero de 2004, China lanzó el motor de búsqueda de escritorio Internet Pig 1.0. En marzo de 2006, Zhongsou cambió su nombre a Internet Pig ig (Internet Gateway).

En junio de 2005, Sina lanzó oficialmente su motor de búsqueda desarrollado de forma independiente "Aiwen". Desde 2007, a Sina le encanta utilizar el motor de búsqueda Google.

El 1 de julio de 2007, NetEase desarrolló de forma independiente la tecnología de búsqueda Youdao, fusionando la búsqueda integral original y la búsqueda web. Existen búsquedas web, búsquedas de imágenes y búsquedas de blogs que brindan servicios para la búsqueda NetEase. Entre ellos, la búsqueda web utiliza su propia tecnología de procesamiento de lenguaje natural, almacenamiento distribuido y computación de imágenes, que es la primera función de búsqueda avanzada basada en la marca, el modelo e incluso la temporada de la cámara; en comparación con productos similares, la búsqueda de blogs tiene capacidades completas y actualizadas; Ventajas oportunas y proporciona funciones innovadoras como "vista previa del artículo" y "archivos de blog".