Tesis:
Sistema recomendador híbrido basado en modelos probabilísticos
- Autor: VALDIVIEZO DIAZ, Priscila Marisela
- Título: Sistema recomendador híbrido basado en modelos probabilísticos
- Fecha: 2019
- Materia: Sin materia definida
- Escuela: E.T.S.I. DE SISTEMAS INFORMÁTICOS
- Departamentos: SISTEMAS INFORMATICOS
- Acceso electrónico: http://oa.upm.es/57250/
- Director/a 1º: BOBADILLA SANCHO, Jesus
- Director/a 2º: HERNANDO ESTEBAN, Antonio
- Resumen: Los sistemas de recomendación están diseñados para proporcionar recomendaciones a los usuarios registrados por medio de un análisis de preferencias pasadas. Para lograr esto, los sistemas de recomendación utilizan técnicas de filtrado de información, las más conocidas son: filtrado colaborativo, filtrado basado en contenido, filtrado demográfico e híbrido. El filtrado colaborativo calcula las recomendaciones en función de las votaciones que la comunidad de usuarios ha realizado sobre un conjunto de ítems. Hay dos enfoques de filtrado colaborativo: basados en la memoria, que generalmente proporciona recomendaciones inexactas pero explicables; y basado en modelos, cuyas recomendaciones son más precisas pero difíciles de entender. En la actualidad, se ha incrementado el desarrollo de sofisticados algoritmos de aprendizaje automático que se pueden usar en el contexto de los sistemas de recomendación. En esta tesis doctoral se presenta una revisión comprensiva sobre enfoques basados en modelos para sistemas de recomendación de filtrado colaborativo. Como resultado, derivamos una clasificación exhaustiva de estos modelos, algunos algoritmos que forman parte de ellos, así como las fortalezas y debilidades que estos tipos de modelos brindan. Basado en la revisión de la literatura y en las debilidades que presentan los modelos basados en factorización matricial para interpretar los resultados y explicar las recomendaciones, se propone un modelo bayesiano que no solo proporcione recomendaciones tan buenas como los modelos de factorización matricial, sino que estas predicciones también se pueden explicar. El modelo se basa en enfoques de filtrado colaborativo tanto basados en el usuario como basados en ítems, y predice los nuevos votos de un usuario en función de los votos existentes en el conjunto de datos. Los experimentos se realizaron con cuatro conjuntos de datos: MovieLens, FilmTrust, Yahoo, BookCrossing; los resultados obtenidos son comparados con varios modelos de línea base, utilizando varias métricas para evaluar la calidad de las predicciones y recomendaciones, éstas son: Error medio absoluto (MAE), Precisión, Recall y la ganancia acumulada descontada normalizada (nDCG). Los resultados de los experimentos presentaron un mejor rendimiento con el enfoque propuesto utilizando nDCG en comparación con los métodos de líneas base, también se mejora la precisión de la predicción en algunos conjuntos de datos. ----------ABSTRACT---------- Recommender systems are designed to provide recommendations to registered users by means of an analysis of past preferences. To achieve this, recommender systems use information filtering techniques, these can be: Collaborative Filtering, Content-based Filtering, Demographic Filtering, and Hybrid. Collaborative Filtering computes the recommendations based on the ratings that the community of users have made over a set of items. There are two collaborative filtering approaches: memory-based, which usually provides inaccurate but explainable recommendations; and model-based, whose recommendations are more precise but hard to understand. Today’s has increased the development of sophisticated machine learning algorithms which can be used in recommendation systems context. In this doctoral thesis is presented a comprehensive review the literature on model-based approaches for recommender systems based of collaborative filtering. As a result, we derive an exhaustive classification of these models, some algorithms that are part of them, and strengths and weaknesses they provide. Based on the literature review and in weaknesses of matrix factorization models to interpret the results and explain the recommendations, in this thesis a Bayesian model is proposed, which not only provides us with recommendations as good as matrix factorization models, but these predictions can also be explained. The model is based on both user-based and item-based collaborative filtering approaches, and it predicts new ratings of a user based on the existing ratings in the dataset. The experiments carried out using four datasets: MovieLens, FilmTrust, Yahoo, BookCrossing; the results are compared to several state-of-the-art baselines, using some metrics to evaluate the quality of predictions and recommendations, these are: Mean absolute error (MAE), Precision, Recall and the Normalized Discounted Cumulative Gain (nDCG), achieving the best performance in the quality measure nDCG compared to baselines. Also the prediction accuracy in some datasets is improved.