Knowledge Graph Construction and Evolution using Declarative Mapping Languages

<< Volver atrás

Tesis:

Knowledge Graph Construction and Evolution using Declarative Mapping Languages

Autor: IGLESIAS MOLINA, Ana

Título: Knowledge Graph Construction and Evolution using Declarative Mapping Languages

Fecha: 2024

Materia:

Escuela: E.T.S DE INGENIEROS INFORMÁTICOS

Departamentos: INTELIGENCIA ARTIFICIAL

Acceso electrónico: https://oa.upm.es/83228/

Director/a 1º: CORCHO GARCÍA, Óscar

Resumen: Knowledge graphs have gained momentum in the past few decades, becoming evermore essential for data interoperability, management, analysis and exploitation. An aspect that plays an essential role in their uptake and use is the ease of their construction. There are several ways in which knowledge graphs can be constructed from heterogeneous data, ranging from ad hoc scripting to declaratively defining the mapping transformation rules. The use of declarative approaches enables a reusable, maintainable and understandable manner for a seamless knowledge graph construction process. They rely on mapping languages to express how to transform the source data into the desired graph structure. Although these approaches are progressively used and adopted, they still lack some expressiveness for the increasing complexity of available data. Therefore, this thesis analyses the expressiveness of these languages, and extracts and defines the requirements for constructing knowledge graphs with the current needs. In addition, it extends the RDF Mapping Language (RML) with features to generate knowledge graphs enriched with annotations, following the latest developments in the area. In order to facilitate the creation of the transformation rules for users with different backgrounds and expertise, this thesis proposes a spreadsheet-based approach to write them, providing a familiar environment and suppressing the need of learning the syntax of the language. It also updates a user-friendly serialization with the latest additions from its target language, suitable for users with more technical profiles. Both approaches are supported by implementations that can interoperate with different languages. Finally, this thesis evaluates the role that these declarative approaches can play in different tasks involved in the knowledge graph life cycle. More specifically, it assesses how they can be beneficial when refactoring the schema of knowledge graphs. Overall, this thesis contributes to the understanding of the capabilities that declarative languages have for knowledge graph construction and refactoring, while providing extended support for their creation and interoperability. RESUMEN Los grafos de conocimiento han ganado impulso en las últimas décadas, posicionándose como un recurso clave para potenciar la interoperabilidad entre datos, su gestión, análisis y explotación. Un aspecto esencial para incrementar su acogida y uso es asegurar que se pueden construir fácilmente. Hay muchas maneras en las que los grafos de conocimiento se pueden construir, desde usando scripts ad hoc hasta definiendo reglas de transformación declarativas. El uso de los métodos declarativos posibilitan la construcción de grafos de conocimiento de manera reusable, mantenible y comprensible. Estos métodos se basan en lenguajes que permiten expresar las reglas de transformación. Aunque se usan de manera cada vez más extendida, hay casos para los que su expresividad no es suficiente para lidiar con la complejidad de los datos. Por ello, esta tesis analiza la expresividad de estos lenguajes, extrae y define los requisitos para construir grafos de conocimiento acorde a las necesidades actuales. Además, extiende un conocido lenguaje para posibilitar la creación de grafos enriquecidos con anotaciones, siguiendo los últimos avances en el área. Para facilitar la creación de las reglas de transformación con estos lenguajes para usuarios con distintos perfiles y experiencia, esta tesis propone un método basado en hojas de cálculo para escribir las reglas. Este método provee de un entorno familiar para su escritura, al tiempo que evita que los usuarios tengan que aprender la sintaxis de los lenguajes. Además, esta tesis propone una actualización de una serialización amigable acorde a los últimos avances en los lenguages. Ambas propuestas se proponen junto con un servicio que permite respectivamente la generación de reglas en varios lenguajes, facilitando asímismo la interoperabilidad entre ellos. Finalmente, esta tesis evalúa el rol que los métodos declarativos pueden jugar en fases distintas del ciclo de vida de los grafos de conocimiento. Más específicamente, se valora cómo pueden beneficiar al proceso de cambio de estructura de los grafos. En general, esta tesis contribuye al mejor entendimiento de las capacidades de los lenguajes declarativos para la construcción y evolución de grafos de conocimiento, al tiempo que propone un soporte extendido para facilitar su creación e interoperabilidad.