Tesis Doctorales UPM: Consulta online

Autor: DEEDAR, Mohammad Halim

Título: Improvements of Data Management Through Fuzzy Logic

Fecha: 2021

Materia: Sin materia definida

Escuela: E.T.S DE INGENIEROS INFORMÁTICOS

Departamento: LENGUAJES Y SISTEMAS INFORMATICOS E INGENIERIA DE SOFTWARE

Acceso electrónico: https://oa.upm.es/68812/

Director/a(s):

Director/a: MUÑOZ-HERNÁNDEZ, Susana

Resumen: In this work, we have tried to improve the data management simplifying the procedures of making queries to aim that searches be closer to human beings’ natural way to search over data. We use for that fuzzy logic. We present a technical basis (syntax and semantics) and practical implementation of a tool (UFleSe: Usable Flexible Searches over Databases) to allow fuzzy searches over crisp data with an easy interface for regular users. The interest for this work comes from the idea of providing a tool intelligent enough to answer expressive and flexible (fuzzy) queries constructively over modern and conventional data formats such as JSON, SQL, Prolog, CSV, XLS, and XLSX. Moreover, to remove the gap between the expert users and the regular users (without having knowledge about the low-level data representation) to use all the novel features of the system without being concern about the low-level syntax and semantics of the framework. This leads us to have more intelligent and humanized search engines. The framework we proposed is based on the RFuzzy library, which enables us to encode the fuzzy search criteria and queries in a syntax similar to the natural language used by human beings. UFleSe allows users to define fuzzy search criteria devoted to fuzzy concepts, fuzzy search rules criteria, similarity relations between values, synonyms, and antonyms through a user-friendly interface without being concerned about the encoding of fuzzy search criteria and the fuzzification of crisp concepts. Moreover, it allows users to define default values (which helps in providing results less adequate but still valid when there is a missing value in the database) and similarity relations between attributes (to provide constructive answers with characteristics similar to the ones the user is looking for). It also allows searches based on the definition of synonyms and antonyms, which helps in having vast vocabulary without having them defined. The personalization of the fuzzy search criteria for expressive searches is another facility included through which the users can personalize a criterion based on their preferences (beneficial for dealing with the subjective character of fuzziness. We present a method for clustering users and place them in an appropriate clusters devoted to their characteristics and a sub-algorithm which is responsible for defining a specific default searching criteria for each cluster so that users without having personalized searching criteria get results based on the general definition of criteria of the cluster in which he/she belongs. Our algorithm can be used in any searching system/applications for improving their user’s searches and providing more accurate and precise results instead of providing a large number of result sets that are not useful to the users. We have presented the algorithms. As proof of concept, we have developed a prototype for the implementation of our algorithms, and we provide experiments to illustrate the performance of the algorithms. ----------ABSTRACT---------- En este trabajo hemos buscado mejorar la gestión de datos simplificando los procedimientos de realización de consultas con el objetivo de que las búsquedas se acerquen a la forma natural de búsqueda de datos del ser humano. Usamos para ello la lógica difusa. Presentamos una base técnica (sintaxis y semántica) y la implementación práctica de una herramienta (UFleSe: Usable Flexible Searches over Databases) para permitir búsquedas difusas sobre datos nítidos con una interfaz sencillo para cualquier usuario. El interés de este trabajo proviene de la idea de proporcionar una herramienta lo suficientemente inteligente como para responder consultas difusas y expresivas (lo que denominamos flexibles) de manera constructiva sobre formatos de datos convencionales actualmente como son JSON, SQL, Prolog, CSV, XLS y XLSX. Además, se trata de eliminar la brecha entre usuarios expertos y usuarios normales (sin conocimientos sobre la representación de datos a bajo nivel) para utilizar todas estas nuevas funcionalidades del sistema sin que la sintaxis o la semántica del interfaz supongan un problema para ello. Esto nos lleva a avanzar en el estudio de motores de búsqueda más inteligentes y a la vez más humanizados. El marco que hemos propuesto utiliza la biblioteca RFuzzy, que nos permite codificar los criterios de búsqueda difusa y las consultas con una sintaxis similar al lenguaje natural utilizado por los seres humanos en el sentido de que utiliza reglas lógicas para definir conceptos difusos y razonar con ellos. UFleSe permite a los usuarios definir criterios de búsqueda difusos, reglas de búsqueda difusas, relaciones de similitud entre valores, sinónimos y antónimos a través de un interfaz fácil de usar sin preocuparse por la codificación a bajo nivel de estos conceptos. Además, permite a los usuarios definir valores predeterminados por defecto (lo que ayuda a proporcionar resultados menos precisos pero válidos cuando no se dispone de algún dato) y relaciones de similitud entre atributos (para proporcionar respuestas constructivas con características similares a las que busca el usuario). También permite búsquedas basadas en la definición de sinónimos y antónimos, lo que permite tener un vocabulario amplio sin tener que repetir su definición. La personalización de los criterios difusos para búsquedas expresivas es otra funcionalidad que se incluye en este trabajo. A través de esta utilidad los usuarios pueden personalizar un criterio de búsqueda en función de sus preferencias (muy beneficioso para el carácter subjetivo de los conceptos difusos). Por último presentamos un método de agrupamiento de usuarios que los clasifica de acuerdo a sus características. Se incluye, asimismo, un algoritmo que se encarga de definir un criterio de búsqueda predeterminado específico para cada grupo. Cuando un usuario de un grupo no ha definido criterios de búsqueda personalizados, se utilizan en sus búsquedas los criterios específicos de su grupo en vez de los criterios generales. De esta manera se mejora la calidad de los resultados. Nuestro algoritmo se puede utilizar en cualquier sistema o aplicación de búsqueda para mejorar las búsquedas de sus usuarios y proporcionar resultados más precisos en lugar de proporcionar una gran cantidad de resultados que no son útiles para los usuarios. Hemos presentado varios algoritmos para la generación de agrupamientos y la gestión de criterios a usar en cada consulta. Como prueba de concepto, liemos desarrollado un prototipo para la implementación de nuestros algoritmos y proporcionamos experimentos para ilustrar el rendimiento de los mismos.