Tesis:
Recomendación a grupos de usuarios usando el concepto de singularidades
- Autor: HURTADO ORTIZ, Remigio Ismael
- Título: Recomendación a grupos de usuarios usando el concepto de singularidades
- Fecha: 2020
- Materia: Sin materia definida
- Escuela: E.T.S.I. DE SISTEMAS INFORMÁTICOS
- Departamentos: SISTEMAS INFORMATICOS
- Acceso electrónico: http://oa.upm.es/58148/
- Director/a 1º: BOBADILLA SANCHO, Jesus
- Director/a 2º: ORTEGA REQUENA, Fernando
- Resumen: Los sistemas de recomendación son sistemas inteligentes que brindan recomendaciones personalizadas a sus usuarios. Estos sistemas ayudan a mitigar parte del problema de sobrecarga de información. El éxito de un sistema de recomendación depende de su algoritmo de filtrado, puesto que este bloquea la información que resulta irrelevante para el usuario. El filtrado colaborativo es un algoritmo que emite recomendaciones a los usuarios mediante la recopilación de las preferencias de una enorme comunidad de usuarios. Este tipo de filtrado ha demostrado proporcionar recomendaciones más precisas que otros métodos. Las técnicas de filtrado colaborativo más populares son: el algoritmo de los K Nearest Neighbors (KNN) y el modelo Matrix Factorization. Las principales ventajas del filtrado colaborativo son su capacidad para generar recomendaciones novedosas y no requerir información personal de los usuarios. Esta tesis se centra en el gran desafío de extender el diseño de un sistema de recomendación basado en filtrado colaborativo que proporciona recomendaciones a grupos de usuarios sobre productos o servicios que satisfagan a todo el grupo. Los sistemas de recomendación a grupos de usuarios se enfrentan a desafíos como: diversidad de grupos (homogéneos y heterogéneos), negociación entre miembros para la decisión final (decision-making), la explicación de las recomendaciones grupales y la estandarización de su evaluación. Los métodos con los que se miden los resultados no son universales debido a varios factores como: políticas de recomendación, tamaños y distribuciones de los grupos, etc. Actualmente, la tendencia en sistemas de recomendación para grupos de usuarios es desarrollar nuevos enfoques basados en KNN o modelos basados en Matrix Factorization. Existen cuatro tipos de enfoques KNN reconocidos en el estado del arte de acuerdo con su enfoque de agregación: fusión de recomendaciones, agregación de predicciones individuales, intersección de vecindarios y agregación de preferencias de usuarios. Los enfoques de agregación de preferencias son los que mejores resultados actualmente ofrecen en accuracy y en tiempos de ejecución, debido a que se ha demostrado que cuanto antes se unifique la información de los usuarios del grupo, más eficiente será el cálculo de las recomendaciones sin que la calidad de estas se vea afectada. En esta tesis se propone un método de recomendación a grupos de usuarios mediante filtrado colaborativo basado en KNN, utilizando un enfoque de agregación de preferencias (related users) que se apoya en la generalización del concepto de singularidad. La idea subyacente es la siguiente: dos usuarios son similares si presentan votos singulares en común; por ejemplo, ambos usuarios generalmente escuchan una canción impopular y ambos otorgan un voto bajo. Usando el mismo razonamiento: si un grupo de usuarios comparte votos singulares con otro usuario, es muy probable que sea un vecino adecuado. La condición de singularidad es menos probable que ocurra en la recomendación a grupos (por ejemplo, un grupo de amigos a los que les gusta una película muy poco popular). Esta menor probabilidad nos ayuda a elegir vecinos que se ajusten a las preferencias del grupo. Bajo esta premisa, proponemos la medida de similaridad para grupos de usuarios SMGU. Esta medida de similaridad combina información numérica y no numérica. La información numérica se pondera atendiendo a la singularidad de los votos de los miembros del grupo. La información no numérica puede considerarse valiosa para hacer coincidir las preferencias del grupo con las preferencias de los vecinos. Los experimentos se han ejecutado usando conjuntos de datos públicos de sistemas de recomendación. En comparación con los baselines representativos de sistemas de recomendación a grupos de usuarios, los resultados muestran mejoras de calidad de predicción y recomendación cuando se utiliza el método propuesto. Se proporciona una sección dedicada a la cuestión de la reproducibilidad de los experimentos. ----------ABSTRACT---------- Recommender systems are intelligent systems that provide personalized recommendations to users. These systems help mitigate the information overload problem. The success of a recommender system depends on its filtering algorithm since it blocks information that is irrelevant to the user. Collaborative filtering is an algorithm that issues recommendations to users by collecting the preferences of a huge community of users. This type of filtering has proven to provide more precise recommendations than other methods. The most popular collaborative filtering techniques are: the K Nearest Neighbors (KNN) algorithm and the Matrix Factorization model. Collaborative filtering has two main advantages: it is able to generate novel recommendations and it not require personal information from users. This thesis focuses on the great challenge of extending the design of a recommender system based on collaborative filtering to provide recommendations to groups of users about products or services that satisfy the entire group. The recommender systems to groups of users face challenges such as: diversity of groups (homogeneous and heterogeneous), negotiation among group members for the final decision (decision-making), explanation of group recommendations, and evaluation standardization. The methods with which the results are measured are not universal due to several factors such as: recommendation policies, sizes, and distributions of the groups, etc. Currently, the trend in recommendation systems for user groups is to develop new approaches based on KNN or Matrix Factorization models. There are four types of KNN approaches recognized in the state of the art according to their aggregation approach: merging recommendations, aggregation of individual predictions, neighborhood intersection, and aggregation of user preferences. Preference aggregation approaches are the ones that currently offer the best results in accuracy and execution times since it has been shown that while the earlier the information of the group’s users is unified, the calculation of the recommendations will be more efficient without affecting your quality. This thesis proposes a method of recommendation to groups of users through collaborative filtering based on KNN, using an approach of aggregation of preferences (related users) that is based on the generalization of the concept of singularity. The underlying idea is the following: two users are similar if they present singular votes in common. For example, both users generally listen to an unpopular song and both give a low vote. Using the same reasoning: if a group of users shares singular votes with another user, it is very likely that it is an adequate neighbor. The uniqueness condition is less likely to occur in the group recommendation (for example, a group of friends who like a very unpopular movie). This lower probability helps us choose neighbors that fit the preferences of the group. Under this premise, we propose the measure of similarity for user groups SMGU. This measure of similarity combines numerical and non-numerical information. The numerical information is weighted according to the singularity of the votes of the members of the group. Non-numeric information can be considered valuable to match group preferences with neighbors’ preferences. The experiments have been executed using public data sets of recommendation systems. Compared with representative baselines of recommender systems to user groups, the results show improvements in prediction and recommendation quality when the proposed method is used. A section dedicated to the question of reproducibility of experiments is provided.