Tesis:
Automatización de procedimientos en esteganografía y estegoanálisis linguístico utilizando la lengua española.
- Autor: MUÑOZ MUÑOZ, Alfonso
- Título: Automatización de procedimientos en esteganografía y estegoanálisis linguístico utilizando la lengua española.
- Fecha: 2010
- Materia: Sin materia definida
- Escuela: E.U.I.T. TELECOMUNICACION
- Departamentos: INGENIERIA Y ARQUITECTURAS TELEMATICAS
- Acceso electrónico:
- Director/a 1º: CARRACEDO GALLARDO, Justo
- Resumen: La protección de las comunicaciones digitales es un área de investigación y desarrollo que ha avanzado notoriamente en las últimas décadas para evitar, o minimizar, ataques de revelación, supresión o alteración de la información intercambiada entre diferentes actores. Un pilar fundamental en este proceso ha consistido en apoyar la seguridad de multitud de protocolos telemáticos mediante el uso de la criptografía. Esta ciencia tiene entre sus virtudes garantizar la provisión de servicios de seguridad que permiten proteger a las comunicaciones de diversos ataques. Su problema fundamental recae en la visibilidad de su uso, es decir, las comunicaciones cifradas pueden ser fácilmente detectadas, aunque no por ello revelada la información que se protege, lo que puede permitir a un atacante, estado censor o similar, actuar en consecuencia; por ejemplo, impidiendo la comunicación entre entidades que se comuniquen mediante estos procedimientos. De la necesidad de desarrollar nuevos mecanismos para complementar a esta ciencia en entornos hostiles surge el interés de uso de la esteganografía. Esta ciencia se encargará de ocultar la existencia misma de una comunicación y además la información a ocultar puede ir previamente cifrada, consiguiendo así una mayor seguridad. En el avance de nuevos procedimientos esteganográficos surge el interés de utilizar mensajes en lenguaje natural para ocultar datos. Esta ciencia se conoce como esteganografía lingüística y hace uso, especialmente en la presente década, de los avances en esteganografía y en lingüística computacional. En la presente tesis se aborda esta línea de investigación aplicándola al caso concreto de la lengua española. Este análisis resulta de un interés especial debido a que no son conocidos otros trabajos similares en su aplicación a esta lengua. A lo largo de la memoria, se pretende demostrar la utilidad de esta línea de investigación para la creación de canales ocultos de información y para el posible desarrollo de sistemas de marcado digital de textos con utilidad en la identificación y rastreo de documentos. En la tesis se presentan algoritmos de generación automática de estegotextos (textos con información oculta) en lengua española, se implementan herramientas que demuestran la viabilidad de esta idea y se realizan diversas medidas cuantitativas. Por otro lado, se profundiza en un estudio lingüístico sobre la posibilidad de utilizar modificaciones sintáctico-semánticas de texto en lenguaje natural con utilidad en el marcado digital de textos. Por último, se expone una propuesta de algoritmo de sustitución léxico- semántica de palabras por sus sinónimos, demostrando su interés en la creación de canales ocultos de información y su potencial en el desarrollo de sistemas de marcado en lengua española. Asimismo, se presenta una implementación de este algoritmo y se valida su seguridad confrontándolo con los ataques públicos más actuales. De los resultados obtenidos en este trabajo cabe concluir que la esteganografía lingüística en español tiene utilidad en el desarrollo de sistemas de marcado digital de textos y en la creación de canales ocultos. Es posible ocultar centenas de bits en estegotextos de tamaño medio (centenares de palabras) con utilidad en el intercambio de mensajes breves, direcciones de Internet (urls, IPs, puertos, etc.), el envío de coordenadas GPS, intercambio de claves criptográficas, etc.