Tesis:

High performance and high available database replication.


  • Autor: SERRANO GARCIA, Damián

  • Título: High performance and high available database replication.

  • Fecha: 2010

  • Materia: Sin materia definida

  • Escuela: FACULTAD DE INFORMATICA

  • Departamentos: LENGUAJES Y SISTEMAS INFORMATICOS E INGENIERIA DE SOFTWARE

  • Acceso electrónico:

  • Director/a 1º: PATIÑO MARTINEZ, Marta

  • Resumen: Los actuales sistemas de información han evolucionado desde pequeños servidores individuales hasta arquitecturas más complejas destinadas a que dichos sistemas operen la mayor parte del tiempo posible (alta disponibilidad) y proporcionen servicio a un número de clientes en constante aumento (escalabilidad) Esto se traduce en un servicio 24x7 (24 horas al día los 7 días de la semana) Las bases de datos es una solución eficaz y muy extendida para el almacenamiento permanente de los datos de las aplicaciones Sin embargo una base de datos por si misma no proporciona alta disponibilidad al tratarse de un punto único de fallo. La replicación de bases de datos permite con- seguir alta disponibilidad. Al tener más de una copia (réplica) de los datos en nodos distintos, si uno o más nodos fallan, el resto pueden continuar ofreciendo el servicio. Por otra parte, la base de datos replicada puede ofrecer escalabilidad si consigue ejecutar más consultas explotando la capacidad de procesamiento de todos los nodos. El trabajo de esta tesis se enmarca dentro del campo de bases de datos replicadas. Las soluciones tradicionales de replicación se han centrado en replicación total, donde cada nodo almacena una copia de todos los datos La replicación total proporciona incluso teóricamente, una escalabilidad limitada [JPAKO3] debido al mantenimiento de la coherencia entre replica Esto es, cuando un dato se modifica, la modificación debe realizarse en todas las réplicas de ese dato. La presente tesis ha realizado un estudio teórico de la escalabilidad potencial que pueden ofrecer las bases de datos replicadas parcialmente, es decir, donde cada nodo de la base de datos replicada almacena sólo un subconjunto de los datos. Además, se han propuesto, implementado y evaluado empíricamente distintos protocolos de replicación parcial. Con replicación parcial podría ocurrir que ningún nodo pudiera ejecutar una consulta, puesto que ésta accede a un subconjunto de los datos que no se encuentran almacenados todos juntos en el mismo nodo. Cuando esto ocurre, la consulta debe ejecutarse en varios nodos y su tiempo de ejecución se incrementa por el intercambio de mensajes entre nodos. Esta tesis propone el uso de técnicas de optimización para reducir este intercambio de mensajes. En concreto, se presenta, implementa y evalúa un mecanismo de reconfiguración autonómico que determina una distribución de los datos que minimiza la ejecución de consultas en varios nodos. Por último, en esta tesis se ha propuesto y evaluado un protocolo de recuperación [BHG87] de bases de datos replicadas parcialmente. Con la recuperación se permite la reincorporación de nodos fallidos o la adición de nuevos nodos a la base de datos replicada. Tradicionalmente, la recuperación implicaba parar la base de datos replicada para transferir los datos al nodo a reincorporar. Este periodo de inactividad es compatible con alta disponibilidad, por lo que, esta tesis se ha propuesto un protocolo de recuperación online para bases de datos replicadas parcialmente, esto es, sin necesidad de parar el funcionamiento de la base de datos replicada.