Tesis:

Técnicas de particionamiento multidimensional basadas en la utilización de índices multi-atributo en bases de datos paralelas


  • Autor: BARRENA GARCIA, Manuel

  • Título: Técnicas de particionamiento multidimensional basadas en la utilización de índices multi-atributo en bases de datos paralelas

  • Fecha: 1996

  • Materia: MATEMÁTICAS. Teseo;CIENCIAS DE LA COMPUTACIÓN. Teseo;BASES DE DATOS. Teseo;CIENCIAS TECNOLÓGICAS. Teseo;TECNOLOGÍA DE ORDENADORES. Teseo;ARQUITECTURA DE ORDENADORES. Teseo

  • Escuela: FACULTAD DE INFORMATICA

  • Departamentos: ARQUITECTURA Y TECNOLOGIA DE SISTEMAS INFORMATICOS

  • Acceso electrónico: http://oa.upm.es/4016/

  • Director/a 1º: MIGUEL ANASAGASTI, Pedro de

  • Resumen: Los requerimientos cada día más exigentes de modernas aplicaciones de bases de datos, tales como GIS, CAD, CASE y otras, imponen la necesidad de encontrar nuevas vías de solución al problema del tratamiento de grandes volúmenes de información, la potencia de procesamiento de computadores paralelos económicamente abordables, ha atraído la atención de una gran comunidad de investigadores y técnicos que encuentran en los sistemas paralelos de bases de datos la respuesta eficiente a las exigencias de nuevas aplicaciones específicamente, la tecnología del paralelismo resulta una atractiva vía de solución a la problemática tradicional del cuello de botella que representan las operaciones de entrada/salida. Con objeto de minimizar el tiempo de respuesta a una consulta, los sistemas de bases de datos paralelos particionan los datos entre un conjunto de dispositivos de almacenamiento, favoreciendo el acceso en paralelo a los mismos y permitiendo, en definitiva la participación concurrente de varios procesadores en la ejecución de una consulta. Habitualmente, el particionamiento de las relaciones se efectúa por un solo atributo, enviando las tuplas a distintos dispositivos dependiendo del valor de dicha tupla sobre el atributo de particionamiento. Esta forma de fragmentar los datos resulta adecuada cuando el predicado de la consulta incluye el atributo de particionamiento. Sin embargo, en aquellos casos en que esto no sea así, la consulta debe ser dirigida hacia todos los nodos de procesamiento encargados de gestionar algún fragmento de la relación o relaciones implicadas en la consulta. Este modo de proceder afecta negativamente no solo al tiempo de ejecución de la consulta, sino también al throughput del sistema. En la tesis que se presenta, se proponen modelos de particionamiento multidimensional, basados en la consideración de múltiples atributos. Básicamente, la técnica propuesta consiste en realizar un particionamiento por múltiples dimensiones del espacio de tuplas, enviando posteriormente los diferentes fragmentos en que queda dividido este espacio a un determinado número de discos del sistema. Por su parte, la fragmentación del espacio de tuplas se realiza equilibradamente por medio de un nuevo mecanismo de indexación multi-atributo, conocido bajo el nombre de árbol Q. En el desarrollo de esta memoria de tesis, se exponen las ideas que han conducido al establecimiento del árbol Q, se definen con detalle las estructuras y algorítmos de manipulación del árbol Q, se presentan diversas estrategias de particionamiento basadas en esta estructura y se exhiben los resultados de rendimiento de las diferentes propuestas, basados en los trabajos de implementación realizados durante la fase de ejecución de esta tesis