Red de Respuestas Legales - Asesoría legal - El desarrollo de los motores de búsqueda

El desarrollo de los motores de búsqueda

La historia de Excite se remonta a febrero de 1993. La idea de seis estudiantes de la Universidad de Stanford era analizar las relaciones entre palabras para poder buscar de forma más eficiente en las grandes cantidades de información de Internet. A mediados de 1993, el proyecto estaba completamente comprometido y lanzaron una versión del software de búsqueda para que los webmasters lo usaran en sus propios sitios, que se conoció como Excite for Web Servers.

Nota: Excite posteriormente se hizo famoso por la búsqueda de conceptos. En mayo de 2002, Excite, adquirida por Infospace, detuvo su propio motor de búsqueda y cambió al metabuscador Dogpile.

2. En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, los estadounidenses de origen chino Jerry Yang y David Ferro***, cofundaron Yahoo! A medida que aumentó el número de visitas y enlaces, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Porque Yahoo! Los datos se introducen manualmente, por lo que realmente no se pueden clasificar como motor de búsqueda. De hecho, es sólo un directorio de búsqueda. Yahoo! Dado que todos los sitios web incluidos en el sitio web van acompañados de información breve, la eficiencia de la búsqueda mejora significativamente.

Atención: Yahoo! En el futuro, Altavista, Inktomi y Google proporcionarán servicios de motores de búsqueda.

Yahoo! ——Casi se convirtió en sinónimo de Internet en la década de 1990.

En 3.1995, apareció una nueva forma de motor de búsqueda: el metabuscador. Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable de la conversión y el procesamiento antes de enviarla a múltiples motores de búsqueda independientes preseleccionados. Todos los resultados de las consultas devueltos por los motores de búsqueda independientes se recopilan y procesan antes de devolverlos al sitio web. usuario.

El primer metabuscador fue Metacrawler, de Eric Selberg y Liu Wenhuan Etzioni, estudiantes de maestría de la Universidad de Washington. Los metabuscadores lucen muy bien en concepto, pero los resultados de búsqueda siempre son insatisfactorios, por lo que ningún metabuscador ha tenido nunca una posición fuerte.

4. Generación de recuperación inteligente: utilice diccionarios de segmentación de palabras, diccionarios de sinónimos y diccionarios homófonos para mejorar los resultados de la recuperación y ayudar aún más en las consultas a nivel de conocimiento o concepto a través de diccionarios de materias, diccionarios de contexto y pares. -Diccionarios relacionados El procesamiento de recuperación forma un sistema de conocimiento o red de conceptos, brindando a los usuarios consejos de conocimiento inteligentes y, en última instancia, ayudándolos a obtener los mejores resultados de recuperación.

Ejemplo:

(1) Al consultar "computadora" también se puede recuperar información relacionada con "computadora";

⑵El alcance de la consulta se puede limitar aún más a "Microcomputadora". ", "servidor" o ampliado a "tecnología de la información" o "tecnología electrónica", "software", "aplicación informática" relacionados.

(3) También incluye información ambigua y procesamiento de recuperación. Por ejemplo, ¿"Apple" se refiere a una marca de fruta o de computadora? La distinción entre "chino" y "chino * * * y China" será. combinado con la base de datos de descripción de conocimientos ambiguos, la indexación de texto completo, el análisis del contexto de búsqueda del usuario, los comentarios relacionados con los usuarios y otras tecnologías se procesan para retroalimentar de manera eficiente y precisa la información que los usuarios más necesitan.

5. La tendencia a la personalización es una de las características importantes y tendencias inevitables del desarrollo futuro de los motores de búsqueda. Una forma es organizar la información personal a través de los productos comunitarios del motor de búsqueda (es decir, proporcionar servicios a usuarios registrados) y luego introducir factores personales en la recuperación de la base de datos de información básica del motor de búsqueda para su análisis, obteniendo así diferentes resultados de búsqueda para individuos. Desde el lanzamiento de la versión beta de myweb por parte de Yahoo en junio de 2004 hasta el lanzamiento de la función de personalización en junio de 2005, el historial de búsqueda de Google básicamente siguió el mismo camino, analizando el alcance limitado de las necesidades de búsqueda específicas de los usuarios y luego expandiéndose a otros sitios web similares. en Internet para brindar los resultados más relevantes según el alcance de las necesidades del usuario. El otro es para el popular motor de búsqueda personalizado Google, o yahooMindSet, o vivisimo, que todos sabemos es la agrupación de prospectos. Pero no importa qué método de implementación se utilice, es decir, Google elige activamente el alcance de la búsqueda o Yahoo, vivisimo reorganiza la información que necesitan en los resultados, es un experimento o una idea, y no se convertirá en una aplicación de motor de búsqueda convencional en un corto tiempo.

6. Gran red global: dado que no existe un estándar unificado de organización de la información para procesar los recursos de información de la red, los recursos de información de la red desordenada son difíciles de buscar, transferir, disfrutar e incluso desarrollar en profundidad, formando islas de información. La tecnología Grid tiene como objetivo eliminar las islas de información y lograr una conexión integral de todos los recursos en Internet.

Global Information Grid (Global Information Grid)

La palabra robot tiene un significado especial para los programadores. Un robot informático es un programa automatizado que puede realizar una tarea repetidamente a una velocidad que los humanos no pueden alcanzar. Debido a que los programas robóticos diseñados para recuperar información se arrastran por la web como arañas, los programas robóticos de los motores de búsqueda se denominan programas araña.

Matthew Gray desarrolló Web Wanderer en 1993, el primer programa "robot" que utiliza las relaciones de enlace entre páginas HTML para explorar el tamaño de la World Wide Web. Al principio solo se usaba para contar el número de servidores en Internet, pero luego también pudo capturar direcciones web (URL).

En abril de 1994, dos estudiantes de doctorado de la Universidad de Stanford, Jerry Yang (Yang Zhiyuan) y David Ferro***, cofundaron Yahoo. A medida que aumentó el número de visitas y enlaces, el Directorio de Yahoo comenzó a admitir búsquedas simples en bases de datos. Porque Yahoo! Los datos se introducen manualmente, por lo que realmente no se pueden clasificar como motor de búsqueda. De hecho, es sólo un directorio de búsqueda. Yahoo adquirió inktomi el 23 de febrero de 2002, Overture, incluidos Fast y Altavista, el 23 de julio de 2003, y adquirió por completo 3721 el 23 de junio de 2003.

A principios de 1994, Brian Pinkerton, un estudiante de la Universidad de Washington, inició su pequeño proyecto WebCrawler. El 20 de abril de 1994, WebCrawler contenía contenido de sólo 6.000 servidores. WebCrawler es el primer motor de búsqueda de texto completo en Internet que admite la búsqueda de todas las palabras de un documento. Antes, los usuarios sólo podían buscar por URL y resumen, a menudo a partir de anotaciones humanas o programas que extraían automáticamente las primeras 100 palabras de texto.

En julio de 1994, Michael Mauldin de la Universidad Carnegie Mellon conectó el programa araña de John Leavitt a su programa de indexación y creó Lycos. Además de la clasificación por relevancia, Lycos también proporciona coincidencias de prefijos y restricciones de similitud de caracteres. Lycos es el primero en utilizar el resumen automático de páginas web en los resultados de búsqueda. Su mayor ventaja es que la cantidad de datos supera con creces la de otros motores de búsqueda.

A finales de 1994 aparece oficialmente Infoseek. Su amigable interfaz y su gran cantidad de características adicionales lo convierten en un importante representante de motores de búsqueda como Lycos.

En 1995, apareció una nueva forma de motor de búsqueda: una revisión de los metabuscadores. Los usuarios solo necesitan enviar una solicitud de búsqueda una vez, y el metabuscador es responsable del procesamiento de la conversión y la envía a múltiples motores de búsqueda independientes preseleccionados. Los resultados de la consulta devueltos por cada motor de búsqueda independiente se recopilan y procesan antes de regresar a ellos. el usuario. El primer metabuscador fue Metacrawler de Eric Selberg y Liu Wenhuan Etzioni, estudiantes de maestría de la Universidad de Washington.

Inktomi fue fundada el 26 de septiembre de 1995 por Eric Brewer, profesor asistente de la Universidad de California, Berkeley, y Paul Gauthier, estudiante de doctorado. El 20 de mayo de 1996 se fundó la empresa Inktomi y apareció ante el mundo un potente HotBot. Afirma ser capaz de rastrear más de 65438+100 millones de páginas de índice cada día, por lo que hay mucho más contenido nuevo que otros motores de búsqueda. HotBot también utiliza cookies para almacenar las preferencias de búsqueda personales de los usuarios.

1995 65438+2 meses, DEC lanzó oficialmente AltaVista. AltaVista es el primer motor de búsqueda que admite búsquedas en lenguaje natural y el primero en implementar una sintaxis de búsqueda avanzada (como AND, OR, NOT, etc.). ).Los usuarios pueden utilizar AltaVista para buscar el contenido de grupos de noticias y recuperar artículos de Internet. También pueden buscar palabras en nombres de imágenes, títulos, subprogramas Java y objetos ActiveX. AltaVista también afirma ser el primer motor de búsqueda que permite a los usuarios enviar o eliminar URL a una base de datos de índice web, y puede iniciarse en 24 horas. Una de las novedades más interesantes de AltaVista es la búsqueda de todos los sitios web con enlaces URL. AltaVista también ha realizado muchas innovaciones en la interfaz orientada al usuario. Coloca "sugerencias" en el área del cuadro de búsqueda para ayudar a los usuarios a expresar mejor su estilo de búsqueda. Estos consejos se actualizan con tanta frecuencia que después de algunas búsquedas, los usuarios verán muchas características interesantes que tal vez nunca supieron que existían. Esta serie de características han sido gradualmente adoptadas ampliamente por otros motores de búsqueda. En 1997, AltaVista lanzó LiveTopics, un sistema de presentación gráfica para ayudar a los usuarios a encontrar lo que buscan entre miles de resultados de búsqueda.

En agosto de 1997 apareció oficialmente el buscador de auroras boreales. Solía ​​ser uno de los motores de búsqueda más grandes en términos de base de datos. No tiene palabras vacías. Tiene excelentes noticias de actualidad, una colección especial de más de 7100 publicaciones y una buena sintaxis de búsqueda avanzada. Es el primero en admitir la clasificación automática simple de los resultados de búsqueda.

Antes de 1998, Google era sólo un pequeño proyecto de la Universidad de Stanford, BackRub. En 1995, el estudiante de doctorado Larry Page comenzó a estudiar diseño de motores de búsqueda y registró el nombre de dominio el 15 de septiembre de 1997. A finales de 1997, con la ayuda de Sergey Brin, Scott Hassan y Alan S. Con la participación de Tremberg, comenzó BachRub. para proporcionar demostraciones. En febrero de 1999, Google completó la transición de la versión Alpha a la versión Beta. Google considera el 27 de septiembre de 1998 como su cumpleaños. Google determina la importancia de las páginas web basándose en Pagerank, lo que mejora enormemente la relevancia de los resultados de búsqueda. La cultura geek de Google y el no hacer el mal le han valido a Google una gran reputación y reputación de marca.

En abril de 2006, Google anunció su nombre chino "Google", que fue el primer nombre dado por Google en un país de habla no inglesa.

Fast (Alltheweb) se fundó en 1997 como resultado de una investigación académica en la Universidad Noruega de Ciencia y Tecnología (NTNU). En mayo de 1999, lanzó su propio motor de búsqueda AllTheWeb. El objetivo de Fast es ser el motor de búsqueda más grande y rápido del mundo, y ha estado cerca en los últimos años. Fast (Alltheweb) puede clasificar automáticamente páginas web según ODP, admite búsquedas en Flash y PDF, admite búsquedas en varios idiomas y también proporciona búsqueda de noticias, búsqueda de imágenes, videos, MP3 y FTP, y tiene funciones de búsqueda avanzadas extremadamente poderosas. (El 25 de febrero de 2003, Overture adquirió el departamento de búsqueda en Internet de Fast).

En agosto de 1996, Sohu se creó para crear un directorio clasificado de sitios web chinos. Alguna vez tuvo la reputación de "buscar mapas cuando salías y buscar Sohu en línea". Con el rápido aumento de los sitios web en Internet, este tipo de directorio de clasificación editado manualmente ya no es adecuado. En agosto de 2004, Sohu fundó Sogou, un sitio web independiente de búsqueda de nombres de dominio, que se autodenomina "motor de búsqueda de tercera generación". Openfind se estableció en octubre de 1998. Su tecnología proviene del laboratorio GAIS dirigido por el profesor Wu Sheng de la Universidad Nacional Chung Cheng en Taiwán. Al principio, Openfind era sólo un motor de búsqueda chino. En su apogeo, proporcionó motores de búsqueda chinos para tres portales muy conocidos: Sina, Qimo y Yahoo. Sin embargo, después del año 2000, el mercado se dividió gradualmente entre Baidu y Google. En junio de 2002, Openfind relanzó la versión beta del motor de búsqueda Openfind basado en el proyecto GAIS30, lanzó PolyRankTM y anunció que había acumulado 3.500 millones de páginas web y había comenzado a ingresar al campo de la búsqueda en inglés.

En junio de 5438 + octubre de 2000, dos ex alumnos de la Universidad de Pekín, Robin Li, el inventor de la patente del análisis de hipervínculos y ex ingeniero senior de Infoseek, y su amigo Xu Yong (becario postdoctoral en Berkeley, California) estaban en Zhongguancun, Beijing Funda Baidu. La versión beta del motor de búsqueda Baidu se lanzó en agosto de 2001 (Baidu solo proporciona motores de búsqueda para otros sitios web de portales como Sohu, Sina, Tom, etc. El motor de búsqueda Baidu se lanzó oficialmente el 22 de octubre de 2001 y se centra en la búsqueda en chino). .

Otras funciones del motor de búsqueda de Baidu incluyen: instantánea de Baidu, vista previa de la página web/vista previa de todas las páginas web, términos de búsqueda relacionados, consejos para corregir errores tipográficos, búsqueda de mp3 y búsqueda en Flash. Después del lanzamiento del proyecto Blitzen en marzo de 2002, las actualizaciones tecnológicas se aceleraron significativamente. Posteriormente lanzó una serie de productos como Tieba, Zhibao, Mapas, Estudios Chinos, Enciclopedias, Documentos, Videos, Blogs, etc., que fueron bien recibidos por los internautas. El 5 de agosto de 2005 cotizó en Nasdaq con un precio de emisión de 27,00 dólares estadounidenses y el código BIDU. El precio de apertura fue de 66,00 dólares y cerró en 122,54 dólares, un aumento del 353,85%, estableciendo un récord para el mayor aumento de acciones nuevas cotizadas en el mercado de valores estadounidense en los últimos cinco años.

El 23 de febrero de 2003, 65438, la Búsqueda HC original operó oficialmente de forma independiente y se estableció la Búsqueda en China. En febrero de 2004, China lanzó el motor de búsqueda de escritorio Internet Pig 1.0. En marzo de 2006, Zhongsou cambió su nombre a Internet Pig ig (Internet Gateway).

En junio de 2005, Sina lanzó oficialmente su motor de búsqueda desarrollado de forma independiente "Aiwen". Desde 2007, a Sina le encanta utilizar el motor de búsqueda Google.

1 de julio de 2007; adoptó por completo la tecnología de búsqueda Youdao desarrollada independientemente por NetEase, fusionando la búsqueda integral original y la búsqueda web. Existen búsquedas web, búsquedas de imágenes y búsquedas de blogs que brindan servicios para la búsqueda NetEase. Entre ellos, la búsqueda web utiliza su propia tecnología de procesamiento de lenguaje natural, almacenamiento distribuido y computación de imágenes, que es la primera función de búsqueda avanzada basada en la marca, el modelo e incluso la temporada de la cámara; en comparación con productos similares, la búsqueda de blogs tiene capacidades completas y actualizadas; Ventajas oportunas y proporciona funciones innovadoras como "vista previa del artículo" y "archivos de blog".