Nuevas Contribuciones en Fusión y Compresión de Imágenes Basadas en Representaciones Espacio-Frecuenciales.

<< Volver atrás

Tesis:

Nuevas Contribuciones en Fusión y Compresión de Imágenes Basadas en Representaciones Espacio-Frecuenciales.

Autor: REDONDO TEJEDOR, Rafael

Título: Nuevas Contribuciones en Fusión y Compresión de Imágenes Basadas en Representaciones Espacio-Frecuenciales.

Fecha: 2007

Materia: Sin materia definida

Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

Departamentos: INGENIERIA ELECTRONICA

Acceso electrónico:

Director/a 1º: CRISTOBAL PEREZ, Gabriel
Director/a 2º: LEDESMA CARBALLO, María Jesús

Resumen: Las representaciones conjuntas han experimentado un notable apogeo durante las últimas décadas, hasta tal punto que no hay campo en el procesamiento de señales en el que no hayan sido utilizadas. Dentro del mar de representaciones existentes en la literatura, una de ellas concierne el presente trabajo: la implementación log-Gabor propuesta en [70, 68]. Su bajo solapamiento, alta sensibilidad en orientación y escalabilidad, invarianza a traslación, auto-invertibilidad y la definición compleja confieren eficiencia, versatilidad y robustez contra el ruido y la aparición de artefactos. Más allá, el estrecho parecido de los filtros sobrecompletos log-Gabor con el área cortical V1 junto con el modelado de comportamientos neuronales de inhibición/facilitación y codificación escasa permiten conseguir una aproximación de la imagen basada en la extracción de los rasgos más salientes normalmente coindidentes con los contornos. Este tipo de representación, basada en contornos multiescala, traza una nueva ruta para resolver tareas de procesamiento de imágenes, en concreto, compresión y fusión de imágenes. Un nuevo paradigma de compresión postula una alta eficiencia si los rasgos característicos de las imágenes son codificados separadamente, tales como luminancia, contornos o textura [19, 145, 240]. Siguiendo ese paradigma, en esta tesis doctoral se ha propuesto un nuevo método de compresión basado en codificar dichos contornos multiescala extraídos de la transformación escasa log-Gabor. Teniendo en cuenta la naturaleza de tales rasgos, un algoritmo de codificación de cadenas ha sido especialmente diseñado según las peculiaridades estocásticas y morfológicas de dichos contornos. Para ello, diferentes técnicas predictivas así como códigos prefijos y aritméticos han sido combinados de acuerdo con cada alfabeto. Además, el algoritmo propuesto ofrece un completo esquema de compresión incluyendo la codificación del residuo paso-bajo y la colocación de cabezeras de la trama. Tal codificación se fundamenta en modelos del cortex visual primario para mitigar distorsiones de compresión típicamente producidas por los estandars de compresión JPEG ó JPEG2000. Las descomposiciones multiresolución han demostrado su superioridad contra otras técnicas tradicionales de fusión de imágenes. Sin embargo, no existe ninguna evidencia de hegemonía, a menudo debido a la falta de una imagen de referencia. En esta tesis, varios tipos de wavelets son comparadas con log-Gabor filters exitosamente, los cuales nunca habían sido utilizados anteriormente debido a su tradicional falta de reconstrucción exacta. Además, un algoritmo general para esquemas multiresolución llamado ventanas multitamaño ha sido propuesto, el cual adapta el tamaño de ventana a los rasgos locales en la imagen explotando las ventajas de ambas ventanas, pequeña o precisa y grande o robusta, reduciendo notablemente los errores en los mapas de decisión en contra de las tradicionales técnicas de tamaño fijo de ventana. Finalmente, un nuevo método orientado a contornos ha sido también propuesto incorporando los contornos multiescala al esquema de fusión multiresolución. Este algoritmo basado en rasgos reduce la sensibilidad al ruido, efectos de emborronamiento y artefactos de alineamiento.