Tesis:
Autonomic high performance storage for grid environments based on long term prediction
- Autor: SANCHEZ CAMPOS, Alberto
- Título: Autonomic high performance storage for grid environments based on long term prediction
- Fecha: 2008
- Materia: Ciencias de la computación y tecnología informática
- Escuela: FACULTAD DE INFORMATICA
- Departamentos: ARQUITECTURA Y TECNOLOGIA DE SISTEMAS INFORMATICOS
- Acceso electrónico: http://oa.upm.es/1051
- Director/a 1º: PEREZ HERNANDEZ, María de Los Santos
- Director/a 2º: CORTES ROSSELLÓ, Antonio
- Resumen: El desequilibrio existente entre el tiempo de cómputo y el tiempo de E/S origina lo que se ha dado a conocer como crisis de la E/S. Mientras este salto no se acorte, la E/S continuará siendo uno de los principales cuellos de botella de las aplicaciones. Los sistemas de ficheros paralelos constituyen una solución a este problema, pudiéndose utilizar una gran variedad de este tipo de sistemas en diferentes entornos. A pesar de la proliferación de entornos de tipo cluster, existen nuevos y numerosos problemas a los que está haciendo frente la comunidad científica que no pueden ser abordados, debido a la gran necesidad de computación y el enorme conjunto de datos que utilizan. En este sentido es interesante extrapolar el concepto de paralelismo a nuevas tecnologías capaces de abordar los problemas indicados. La tecnología grid, mediante la utilización de un gran número de elementos heterogéneos distribuidos geográficamente, posibilita una gran capacidad de cómputo y de almacenamiento que permite solventar problemas que anteriormente eran inabordables. Pero su enfoque está principalmente dirigido a aumentar la disponibilidad en vez de incrementar el rendimiento. La adopción del paralelismo a este nivel podría optimizar el acceso a datos en este tipo de entornos, y en consecuencia, mejorar el rendimiento de las aplicaciones que ejecutan sobre esta plataforma. La problemática que se desprende de esta propuesta es que la complejidad y el dinamismo del entorno dificultad enormemente su gestión. Como solución se plantea que sea el sistema el que analice su propio comportamiento y actúe en consonancia buscando en todo momento la mejora del rendimiento de las operaciones de E/S. Pero frente a las necesidades de cómputo que se plantean en un momento dado, los datos no se consumen en el mismo momento en que son producidos. Por ello, no sólo se deben mejorar las operaciones de E/S actuales sino que se debe tratar de optimizar los accesos posteriores (tanto a corto como a largo plazo) sobre los datos almacenados en un momento determinado. En conclusión, este trabajo propone el análisis, diseño y validación de una arquitectura que permita resolver el problema de la E/S de forma eficiente en entornos heterogéneos, tratando la problemática relativa a la gestión de la complejidad de dicho entorno.