¿Qué significa SP3?
PageRank determina el nivel de una página a través de la enorme red de relaciones de hipervínculos. Google interpreta el enlace de la página A a la página B como la página A votando por la página B. Google determina el nuevo nivel basándose en la fuente de la votación (incluso la fuente de la fuente, es decir, la página que enlaza con la página A) y el nivel del objeto de votación. En pocas palabras, una página de alto nivel puede elevar otras páginas de bajo nivel.
El PageRank requiere "votos" del enlace
Los "votos" de una página están determinados por la importancia de todas las páginas que enlazan con ella. Un hipervínculo a una página equivale a votar por esa página. El PageRank de una página se deriva mediante un algoritmo recursivo de la importancia de todas las páginas que enlazan con ella ("páginas enlazadas"). Las páginas con más enlaces tendrán una clasificación más alta. Por el contrario, si una página no tiene ningún enlace, no clasificará.
A principios de 2005, Google introdujo un nuevo atributo nofollow para los enlaces web, permitiendo a los webmasters y bloggers crear enlaces que Google no cuenta como votos, lo que significa que estos enlaces no cuentan como "votos". La configuración Nofollow puede evitar el spam de comentarios.
La métrica PageRank de la barra Google va de 0 a 10. Parece ser un algoritmo de escala logarítmico; se desconocen los detalles. PageRank es una marca registrada de Google y su tecnología está patentada.
El algoritmo de clics en el algoritmo PageRank fue propuesto por Jon Kleinberg.
Algoritmo PageRank
Simple
Supongamos que hay un pequeño conjunto de cuatro páginas: A, B, C y D. Si todas las páginas enlazan con A, entonces el valor PR (PageRank) de A será la suma de B, C y D.
PR(A) = PR(B) + PR(C) + PR (D)
Continúe asumiendo que B también enlaza con C, y D también enlaza con 3 páginas, incluida A. No puede votar dos veces en una página. Entonces b da medio boleto a cada página. Utilizando la misma lógica, sólo un tercio de los votos emitidos por D se cuentan en el PageRank de A.
PR(A)= \ frac { PR(B)} { 2 }+\ frac { PR(C)} { 1 }+\ frac { PR(D)} { 3 }
En otras palabras, el valor PR de una página se divide equitativamente según el número total de enlaces.
PR(A)= \ frac { PR(B)} { L(B)}+\ frac { PR(C)} { L(C)}+\ frac { PR(D)} { L(D)}
Finalmente, conviértalos en porcentajes y multiplíquelos por un coeficiente q. Debido al siguiente algoritmo, el PageRank de ninguna página será 0. Entonces, ¿Google utiliza un sistema matemático para darle a cada página un valor mínimo de 1? Pregunta.
PR(A)= \ left(\ frac { PR(B)} { L(B)}+\ frac { PR(C)} { L(C)}+\ frac { PR(D)} { L(D)}+\,\cdots \right) q + 1 - q
Entonces el PageRank de una página se calcula a partir del PageRank de otras páginas. Google calcula repetidamente el PageRank para cada página. Si le da a cada página un valor de PageRank aleatorio (distinto de cero), luego de cálculos repetidos, los valores de PR de estas páginas tenderán a ser normales y estables. Por eso los motores de búsqueda lo utilizan.
Completo
Esta ecuación introduce el concepto de navegación aleatoria, que es cuando una persona está aburrida en línea, abre algunas páginas al azar y hace clic en algunos enlaces. El valor de PageRank de una página también afecta su probabilidad de ser vista aleatoriamente. Para que sea más fácil de entender, supongamos que un internauta sigue haciendo clic en los enlaces de una página web y finalmente llega a una página web que no tiene ninguna página enlazada. En este momento, el navegante irá aleatoriamente a otra página web y comenzará a navegar.
Para ser justos con aquellas páginas que tienen enlaces, se aplica un algoritmo con Q = 0,15 (consulte el significado de Q más arriba) a todas las páginas para estimar la probabilidad de que la página pueda ser marcada como favorita por un usuario de Internet.
Entonces, la ecuación es la siguiente:
{ \RM pagerank }(p _ I)= \frac { q } { N }+(1-q)\ sum _ { p _ j } \frac { { \RM page rank }(p _ j)} { L(p _ j)}
P1, p2,..., pN son las páginas aprendidas, M (pi) es el número de páginas que enlazan con pi, L(pj) es el número de páginas que enlazan con pj y N es el número de todas las páginas.
El valor de PageRank es un vector propio en una matriz especial. Este vector propio es
\mathbf{R} = \begin{bmatrix}
r es la respuesta a la ecuación
\mathbf { R } = \begin { matriz b } { q/N } \ \ { q/N } \ \ \ v puntos \ \ { q/N } \ end { matriz b }+(1-q)\ begin { matriz b } \ ell(p _ 1, p _ 1)&\ell(p_1,p_2)&\cdots &\ell(p_1,p_N)\\ell(p_2,p_1)& \ ddots & amp& amp\ \ \ vdots & amp& ampell (p_i,p_j)&\\ \ell(p_N,p_1)&& amp& amp\ell(p_N,p_N) \end{bmatrix } \mathbf{R}
\ell(p_i, p_j) es igual a 0 si pj no está vinculado a pi, y es cierto para cada j.
\sum_{i = 1}^N \ell(p_i, p_j) = 1,
La principal desventaja de esta técnica es que el nivel de página antiguo será mayor que el nueva pagina. Porque incluso una página nueva muy buena no tendrá muchos enlaces ascendentes a menos que sea un subsitio de un sitio.
Esta es la razón por la que PageRank requiere una combinación de múltiples algoritmos. PageRank parece favorecer las páginas de Wikipedia, siempre por delante de la mayoría o de todas las demás páginas en los resultados de búsqueda del nombre de la entrada. La razón principal es que existen muchos vínculos entre Wikipedia y muchos sitios.
Google a menudo castiga el comportamiento malicioso para mejorar el PageRank, pero cómo distinguir los intercambios de enlaces normales de la acumulación anormal de enlaces sigue siendo un secreto comercial.