Logotipo de la Universidad Politécnica de Madrid

Learning Techniques for Optimization in Engineering : Data-Driven Tools for Mechanical and Biomedical Settings

Autor: IRASTORZA VALERA, Luis

Título: Learning Techniques for Optimization in Engineering : Data-Driven Tools for Mechanical and Biomedical Settings

Fecha: 2025

Materia: ---

Escuela: E.T.S.I. AERONÁUTICA Y DEL ESPACIO

Departamento: AERONAVES Y VEHICULOS ESPACIALES

Acceso electrónico: https://oa.upm.es/91308/

Director/a(s):

  • Director/a: SAUCEDO MORA, Luis
  • Director/a: CHINESTA SORIA, Francisco

Resumen: En las industrias automovilística y aeronáutica, las estructuras deben adaptarse a las necesidades más exigentes. Al mismo tiempo, razones mecánicas y económicas favorecen las opciones más ligeras. En algunos casos, el comportamiento de los materiales estructurales debe ser gradual, como en los materiales compuestos o los llamados metamateriales. Las geometrías de estos diseños a escala microscópica ofrecen propiedades macroscópicas que no se encuentran en medios continuos, en un volumen más pequeño. En contrapartida, su versatilidad plantea problemas para su modelización (problema directo) y diseño (problema inverso). El problema directo, es decir, la descripción de las prestaciones de un metamaterial de geometría predefinida, se vuelve a veces difícil de resolver por los métodos tradicionales de cálculo estructural debido a la complejidad general y la no linealidad de su comportamiento. Por ello, la definición de un modelo puramente analítico (como la ley de Hooke para los materiales isotrópicos) es impracticable, ya que las variables necesarias son demasiado numerosas y/o parcialmente desconocidas (internas o no observables). En ocasiones, la única solución es crear modelos substitutivos (subrogados) que puedan capturar las características clave de la respuesta mecánica de la estructura, reduciendo así el costo del cálculo, mediante reducción de orden de modelos (MOR) o aprendizaje automático (ML). El modelo reducido obtenido mediante MOR tiene una resolución ligeramente inferior, pero es más rápido. Se utilizan métodos como la descomposición en valores propios ortogonal o la general (POD/PGD). El ML se basa en regresiones estadísticas de grandes bases de datos etiquetadas, donde el comportamiento subyacente se ajusta durante una fase de entrenamiento y se valida con nuevos datos. Esta metodología utiliza redes neuronales inspiradas en el cerebro. Existen diferentes arquitecturas: perceptrón multicapa (MLP) para vectores y matrices, redes convolucionales para imágenes y texto (CNN), recurrente (RNN) para secuencias temporales - con memoria a corto plazo extendida (LSTM), si es necesario -, o basado en grafos (GNN). Las redes informadas por la física (PINN) permiten introducir directamente la ecuación diferencial que describe el comportamiento a predecir en la función de pérdida. El problema inverso se ocupa de una tarea mucho más difícil: encontrar la estructura (geometría, material, etc.) que proporcione las propiedades deseadas. Esto es un desafío, al no haber una solución única y estar la formulación matemática del problema mal planteada (no convexidad). Se utilizan métodos de optimización topológica, p. ej., penalizando los sólidos isotrópicos (SIMP) mediante la eliminación del material al mínimo necesario para soportar la carga aplicada con la menor energía de deformación. Asimismo, deben considerarse las propiedades reales del material (anisotropía, fatiga) y las condiciones prácticas de fabricación y uso; introducidas como penalización adicional, filtros de imagen o incluso nuevos algoritmos. Todo ello permite construir un modelo de aprendizaje automático para simplificar y, por tanto, acelerar el proceso de optimización. Como objeto matemático, los grafos ofrecen múltiples posibilidades para la representación compacta de datos con estados como vértices y sus relaciones como segmentos. Esta analogía se aplica directamente a los dos principales estudios de campo en este trabajo, a saber, las estructuras mecánicas (centradas en metamateriales) y las redes neuronales biológicas, asimilando nodos/neuronas a vértices y barras/axones a los segmentos de un grafo. Así, se aprovechan las metodologías desarrolladas para crear un gemelo digital básico del cerebro humano para mejorar los diagnósticos médicos. ABSTRACT The present doctoral thesis encompasses a series of case studies in various fields of Engineering and Medicine, whose common points are their conceptual and computational complexity and thus compromise the availability and reliability of experimental data supporting their corresponding constituent models, if existent at all. Often times, such models based on analytic expressions suffer from computationally unreachable complexity ("curse of dimensionality") and/or are burdened by biases and vagueness induced in their definition (e.g. non-observable internal variables).There are various proven and widely used methodological solutions allowing the avoidance or reduction of the effect of such problems by building models based mostly on observed data, as opposed to preconceived expressions, yielding the so-called surrogate models. These techniques include Model Order Reduction (MOR) and Artificial Intelligence (AI), or more specifically Machine Learning (ML). The latter consists in redefining the complete model as a version with somewhat lower resolution but reduced computational cost, for which methods such as Proper Orthognal/Generalized Decomposition (POD/PGD) are used. Machine Learning, on the other hand, is based on statistical regressions built upon large databases labeled as "inputs" and "outputs", whose underlying behavior is adjusted in a phase of "training" and evaluated in a subsequent "essay" with new data - i.e. not previously processed. This methodology is commonly enforced by means of neural networks, based (with limitations) on the biological ones in the brain and offering different architectures according to the type of data to be processed: multi-layer perceptron (MLP) for vectors and matrices - locally condensed by convolutions if the database is very large - convolutional networks for images and text (CNN), recurrent (RNN) for time sequences - with long short-term memory (LSTM) if there is historical dependency, or based on graphs (GNN).Graphs as mathematical objects offer many possibilities for the compact representation of data with states as vertices and their relationships as segments. This analogy is directly applicable to the two main case studies tackled in this work, namely mechanical structures (focusing on metamaterials) and biological neuronal networks, being possible in both cases to assimilate nodes/neurons as vertices and bars/axons as segments of a graph. Bearing this in mind, the various needs and challenges of these research fields (complexity, non-linearity, reduced observability, multi-scale and multi-objective optimization, etc.) will be studied using the tools described above, and making new contributions should the current state of the art be limited. To this end, a number of case studies have been devised for various industrial and/or medical applications, and the results of the proposed methodologies upon which have been successfully compared with similar work. Finally, the limitations of the proposed surrogate models have been analysed and some improvements and extensions have been suggested for future developments, with a view to create accurate and efficient replicas for the modelled phenomena (Digital Twins).