2010-01-02 37 views
5

Tengo curiosidad por saber cuáles son los métodos y enfoques para superar el problema del "arranque en frío" cuando un nuevo usuario o un elemento ingresa al sistema, debido a la falta de información sobre esta nueva entidad, hacer recomendaciones es un problema.¿Cómo puedo adaptar mi motor de recomendaciones a arranques en frío?

Puedo pensar en hacer una recomendación basada en la predicción (como sexo, nacionalidad, etc.).

Respuesta

6

¿Tal vez hay veces en que no debes hacer una recomendación? La "información insuficiente" debería calificar como una de esas veces.

Simplemente no veo cómo las recomendaciones de predicción basadas en "sexo, nacionalidad, etc." serán más que estereotipos.

IIRC, lugares como Amazon construyeron sus bases de datos por un tiempo antes de implementar recomendaciones. No es el tipo de cosa que quieres equivocarte; hay muchas historias sobre recomendaciones inapropiadas basadas en datos insuficientes.

1

Esto se ha preguntado varias veces antes (naturalmente, no puedo encontrar esas preguntas ahora: /, pero la conclusión general fue que es mejor evitar tales recomendaciones. En varias partes del mundo, los mismos nombres pertenecen a sexos diferentes, y así en ...

0

Recomendaciones basadas en "usuarios similares le gusta ..." claramente debe esperar. se puede dar cupones u otros incentivos a los entrevistados si está absolutamente comprometido a hacer predicciones basándose en la similitud de usuario.

Hay otras dos maneras de arrancar en frío un motor de recomendación.

  1. Crea un modelo tú mismo.
  2. Obtenga sus proveedores para completar la información clave de un modelo de esqueleto. (También puede requerir $ incentives.)

Hay muchas trampas potenciales en todo esto, que son de demasiado sentido común mencionar.

Como era de esperar, no hay almuerzo gratis aquí. Pero piénselo de esta manera: los motores de recomendación no son un plan de negocios. Simplemente mejoran el plan de negocios.

22

Puede iniciar en frío un sistema de recomendación.

Hay dos tipos de sistemas de recomendación; filtrado colaborativo y basado en contenido. Los sistemas basados ​​en contenido usan metadatos sobre las cosas que estás recomendando. La pregunta es, entonces, ¿qué metadatos es importante? El segundo enfoque es el filtrado colaborativo que no se preocupa por los metadatos, simplemente usa lo que las personas hicieron o dijeron sobre un elemento para hacer una recomendación. Con el filtrado colaborativo no tiene que preocuparse por qué términos en los metadatos son importantes. De hecho, no necesita metadatos para hacer la recomendación. El problema con el filtrado colaborativo es que necesita datos. Antes de tener suficientes datos, puede usar recomendaciones basadas en el contenido. Puede proporcionar recomendaciones que se basan en ambos métodos, y al principio tienen un contenido 100%, a medida que obtiene más datos comienzan a mezclarse en el filtrado colaborativo. Ese es el método que he usado en el pasado.

Otra técnica común es tratar la porción basada en el contenido como un simple problema de búsqueda. Simplemente coloque metadatos como el texto o el cuerpo de su documento y luego indexe sus documentos. Puede hacerlo con Lucene & Solr sin escribir ningún código.

Si usted quiere saber como trabaja básicamente de filtrado colaborativo, revise el Capítulo 2 de "Programación de la inteligencia colectiva", de Toby Segaran

+2

Esta es la mejor respuesta y realmente merece la marca de verificación. Yo agregaría que los algoritmos de bandido podrían tener un papel en el descubrimiento de las tasas de referencia para nuevos productos o en la determinación de la compensación entre los enfoques basados ​​en el contenido y la colaboración. – SetJmp

0

Hay tres cosas que se necesitan para abordar el problema de arranque en frío:

  1. los datos deben haber sido perfiladas de tal manera que usted tiene muchas características diferentes (con los datos del producto th El término usado para 'característica' es a menudo 'facetas de clasificación'). Si no perfila adecuadamente los datos a medida que entran en la puerta, su motor de recomendación se mantendrá "frío" ya que no tiene nada con que clasificar las recomendaciones.

  2. MÁS IMPORTANTE: Necesita un bucle de retroalimentación del usuario con el que los usuarios puedan revisar las recomendaciones de las sugerencias del motor de personalización. Por ejemplo, el botón Sí/No para '¿Fue útil esta sugerencia?' debe poner en cola una revisión de los participantes en un conjunto de datos de capacitación (es decir, el conjunto de datos de capacitación 'Recomendar') a otro conjunto de datos de capacitación (es decir, NO recomendar el conjunto de datos de capacitación).

  3. El modelo utilizado para las sugerencias (Recomendar/NO recomendar) nunca debe considerarse como una recomendación única para todos. Además de clasificar el producto o servicio para sugerir a un cliente, también importa la forma en que la empresa clasifique a cada cliente específico. Si funciona correctamente, uno debe esperar que los clientes con diferentes características reciban diferentes sugerencias para (Recomendar/NO recomendar) en una situación dada. Esa sería la parte de 'personalización' de los motores de personalización.

Cuestiones relacionadas