Red de Respuestas Legales - Asesoría legal - Resumen del sistema de recomendación: ¿qué es una etiqueta?

Resumen del sistema de recomendación: ¿qué es una etiqueta?

Las etiquetas son palabras clave que se utilizan para describir información. Las etiquetas se pueden utilizar para describir los atributos objetivos de un artículo, así como los intereses y preferencias del usuario para el artículo. En el sistema de recomendación, el modelo de interés del usuario se puede calcular a través de las etiquetas de los productos de consumo para hacer recomendaciones mejores y más precisas.

Fuente de las etiquetas

Desde la perspectiva del origen de las etiquetas, generalmente se pueden dividir en tres tipos:

(1) El propietario etiqueta los artículos .

②Los expertos marcan los artículos.

③Los usuarios comunes marcan elementos.

Los propietarios generalmente marcan los elementos cuando se publican. El marcado experto generalmente lo inicia la plataforma y lo completan organizaciones humanas. Estos dos métodos son adecuados para etiquetar etiquetas que distinguen atributos objetivos de artículos. Por ejemplo, los editores de contenido de PGC pueden elegir si su contenido pertenece al entretenimiento o al ejército; al cargar productos en la plataforma de comercio electrónico, se seleccionarán atributos como el color y la talla de la ropa; la plataforma de música tendrá personal dedicado para anotar; la música, como el autor y la hora de lanzamiento, el estilo y otra información.

Las etiquetas de usuario son generalmente etiquetas que describen los sentimientos subjetivos y la cognición del usuario actual después de consumir artículos, por ejemplo, después de que un usuario lee un artículo en una plataforma de información, puede marcar si el artículo es bueno; mirando después de una canción, puedes pensar en la canción como triste o tranquila.

Método de recomendación basado en etiquetas

Como se mencionó anteriormente, las etiquetas pueden ayudarnos a hacer recomendaciones mejores y más precisas, que es esencialmente un método de recomendación colaborativo de etiquetas. La idea general es la siguiente:

① Al usuario le gusta la etiqueta A y recomienda productos con etiqueta B que son similares a la etiqueta A.

② El usuario A y el usuario B tienen modelos de interés similares. Recomienda elementos con la etiqueta A que le gusten al usuario B.

③Los elementos que le gustan al usuario A contienen la etiqueta A, y se recomiendan otros elementos que contengan la etiqueta A.

④ El producto que le gusta al usuario A contiene la etiqueta A, y se recomiendan productos con etiqueta B similar a A.

⑤ ¿Combinar los métodos anteriores como recomendación y otorgar diferentes pesos a cada método?

Los diferentes escenarios de usuario tendrán diferentes preferencias. En primer lugar, debería definirse de otra manera. Por ejemplo, en las plataformas de contenidos informativos, las noticias no implican ordenar, pero sí la lectura, y los usuarios de contenidos informativos necesitan un cierto grado de diversidad. Si adopta directamente el tercer método de recomendación, inevitablemente conducirá a un solo contenido y los usuarios pronto se aburrirán, pero en otros escenarios, como etiquetas para ciertos grupos, como etiquetas de "mujeres", se puede utilizar este método; al determinar recomendaciones Al formular estrategias, se deben considerar los grupos de usuarios y los escenarios de uso recomendados actualmente, pero el efecto específico es un proceso de optimización a largo plazo. Generalmente, después de ajustar el algoritmo, habrá un período de fluctuación de datos de aproximadamente 7 días. Siguiendo el principio de las pruebas AB (construcción de un entorno de variable única), se puede obtener una evaluación del efecto relativamente precisa observando los datos después de 7 días. .

Optimización de etiquetas

Además de ajustar la estrategia de recomendación de etiquetas, la optimización de etiquetas también es una forma importante de optimizar el efecto de la recomendación de etiquetas. Podemos mejorar la precisión de las etiquetas y la claridad de las preferencias de las siguientes maneras:

① Intentar proporcionar etiquetas que reflejen las opiniones y preferencias del usuario sobre elementos para que los usuarios elijan, como una canción, un cantante o un año; de lanzamiento, la etiqueta del álbum es objetiva, con una etiqueta tranquila y triste que refleja la opinión del usuario sobre el proyecto. Esta colección de etiquetas de supervisor nos ayuda a crear un modelo de interés del usuario con mayor precisión.

② Mejore la precisión de los intereses de las etiquetas; el uso de etiquetas para modelar dará un gran peso a las etiquetas populares y la precisión del modelo de intereses del usuario puede disminuir en el estado de cola larga. TF-IDF se puede utilizar para reducir el peso de etiquetas populares.

(3) Según la similitud de etiquetas y la expansión de etiquetas asociadas con la etiqueta, cuando no hay similitud de etiquetas, todas las etiquetas relacionadas con el usuario A son solo etiquetas de colección directa de A. Una vez marcada la similitud, ¿las especies etiquetadas que le gustan al usuario A también pueden hacer referencia a la etiqueta de similitud?

(4) Limpiar etiquetas inútiles. Para algunas palabras vacías con alta frecuencia de palabras, la precisión del etiquetado se mejora fusionando sinónimos que representan diferencias.

Nota: TF-IDF: si una palabra o frase aparece con frecuencia en un artículo pero rara vez en otros artículos, se considera que la palabra o frase tiene buena capacidad de clasificación y es adecuada para la clasificación. TFIDF es en realidad: TF * IDF, frecuencia de plazo de TF ($Frecuencia de plazo) y frecuencia de documento inversa de IDF. Las palabras de alta frecuencia en un documento específico y las palabras de baja frecuencia en todo el conjunto de documentos pueden producir TF-IDF con ponderación alta. Por lo tanto, TF-IDF tiende a filtrar palabras comunes y retener palabras importantes.

Enlace:/p/43a76f1784da