Tesis:
Propuesta metodológica para conectar dos universos de interoperabilidad : infraestructuras de Datos Espaciales y grafos de conocimiento
- Autor: Saavedra Velásquez, Jhonny Alexis
- Título: Propuesta metodológica para conectar dos universos de interoperabilidad : infraestructuras de Datos Espaciales y grafos de conocimiento
- Fecha: 2023
- Materia:
- Escuela: E.T.S.I. EN TOPOGRAFIA, GEODESIA Y CARTOGRAFIA
- Departamentos: INGENIERIA TOPOGRAFICA Y CARTOGRAFIA
- Acceso electrónico: https://oa.upm.es/73748/
- Director/a 1º: VILCHES BLÁZQUEZ, Luis Manuel
- Resumen: A pesar de que las Infraestructuras de Datos Espaciales (IDE) y los Sistemas de Información Geográfica (SIG) son tecnologías maduras y ampliamente desarrolladas, en la práctica tareas relativamente simples como encontrar, acceder y utilizar datos aún son difíciles de ejecutar para usuarios no expertos. En el contexto de una red global de datos y grandes volúmenes de información en lo geoespacial siguen persistiendo los silos aislados de información que limitan la posibilidad de explotar todo el potencial de los datos que contienen.
La Web Semántica y los grafos de conocimiento proveen una solución a estas restricciones al dotar de semántica a los datos para disponerlos en la Web como grafos que se pueden conectar con otros datos como una red. Esto permite el entendimiento por parte de aplicaciones informáticas que puedan, de manera autónoma, ejecutar tareas que faciliten la integración y potencialicen la explotación de los datos teniendo en cuenta sus relaciones con otros datos. Al mismo tiempo, desde la otra orilla traer el mundo de las IDE —y, en general, de lo geoespacial— a los grafos de conocimiento permite incorporar a estos una de las dimensiones fundamentales a todo tipo de datos: el espacio. Este atributo es trasversal a todo tipo de información y esto lo convierte en una dimensión fundamental con potencial para la integración y la vinculación de datos de diferentes fuentes y temáticas.
Las fortalezas que puede brindar una tecnología a la otra hacen que, a pesar de que los grafos de conocimiento y las IDE son bastante diferentes con respecto a sus arquitecturas, flujos de trabajo y estándares, puedan considerarse como tecnologías complementarias. Además, considerando su evolución durante los últimos años, no se vislumbra que en un futuro cercano una tecnología reemplace a la otra. Por el contrario, la tendencia parece ser que las dos tecnologías convivan y evolucionen de manera conjunta. Con esto presente, esta tesis plantea una estrategia para conectar estos dos universos de interoperabilidad usando como base la generación, vinculación y enriquecimiento de grafos de conocimiento geoespaciales a partir de datos SIG y Web Feature Services (WFS).
Una necesidad primaria para poder implementar esta estrategia es construir una metodología que permita la publicación de datos geoespaciales como grafos de conocimiento garantizando tres aspectos claves: i) integración, vinculación y enriquecimiento de datos y servicios geoespaciales entre ellos y con otro tipo de datos; ii) conservación de las características de localización de los datos con miras a su explotación y iii) cumplimiento de los preceptos básicos de la Web Semántica para potenciar sus capacidades de integración y reaprovechamiento por parte de sistemas autónomos.
Para comprobar la aplicabilidad de la metodología formulada, ésta se implementó en dos casos de uso. El primero se enfoca en la integración y vinculación de datos catastrales de diferentes productores y el segundo en la vinculación de datos de registros de biodiversidad con información medioambiental complementaria.
ABSTRACT
Although Spatial Data Infrastructures (SDIs) and Geospatial Information Systems (GIS) are mature and widely developed technologies, in practice, relatively simple tasks like finding, accessing, and using data are still difficult for non-expert users to perform. In the context of a global data network and large volumes of geospatial information, isolated information silos persist, limiting the possibility of exploiting the full potential of the data they contain.
The Semantic Web and knowledge graphs provide a solution to these restrictions by endowing data with semantics to arrange them on the Web as graphs that can relate to other data as a network. This allows its understanding by computer applications that can autonomously execute tasks that facilitate the integration and potentiate the exploitation of the data, considering its relationships with other data. At the same time, bringing the world of SDIs —and, in general, geospatial— to knowledge graphs allows them to incorporate one of the fundamental dimensions of all types of data: space. This attribute is transversal to all kinds of information, making it a critical dimension with the potential for integrating and linking data from different sources and themes.
The strengths that each technology can provide to the other mean that, even though knowledge graphs and SDIs are quite different with respect to their architectures, workflows, and standards, they can be thinkable as complementary technologies. In addition, considering its evolution in recent years, it is not foreseeable that one technology will replace the other anytime soon. On the contrary, the trend seems to be for the two technologies to coexist and evolve. This thesis proposes a strategy to connect these two universes of interoperability using as a base the generation, linking, and enrichment of geospatial knowledge graphs from GIS data and Web Feature Services (WFS).
A primary need to be able to implement this strategy is to build a methodology that allows the publication of geospatial data as knowledge graphs, guaranteeing three key aspects: i) integration, linking, and enrichment of geospatial data and services among themselves and with other types of data; ii) preservation of data location characteristics with a view to its exploitation and iii) compliance with the basic precepts of the Semantic Web to enhance its integration and reuse capabilities by autonomous systems.
We implemented two use cases to verify the applicability of the formulated methodology. The first focuses on integrating and linking cadastral data from different producers, and the second set connects data from biodiversity registries with complementary environmental information.