New Advances in Estimation of Distribution Algorithms for Quantum Machine Learning and Industrial Scenarios

<< Volver atrás

Tesis:

New Advances in Estimation of Distribution Algorithms for Quantum Machine Learning and Industrial Scenarios

Autor: PÉREZ SOLOVIEV, Vicente

Título: New Advances in Estimation of Distribution Algorithms for Quantum Machine Learning and Industrial Scenarios

Fecha: 2025

Materia:

Escuela: E.T.S DE INGENIEROS INFORMÁTICOS

Departamentos: INTELIGENCIA ARTIFICIAL

Acceso electrónico: https://oa.upm.es/87747/

Director/a 1º: BIELZA LOZOYA, María Concepción
Director/a 2º: LARRAÑAGA MÚGICA, Pedro María

Resumen: Evolutionary algorithms span a wide range of domains, including Industry 4.0, machine learning, and quantum machine learning (QML) due to their ease of implementation, scalability and interpretability. This PhD dissertation focuses on estimation of distribution algorithms (EDAs), which use probabilistic models (PMs) to sample new solutions. Bayesian networks (BNs) graphically represent conditional dependencies between variables, and their embedding into EDAs can reveal patterns and enhance solution quality. In this PhD thesis we first focus on the application of these approaches in industrial problems. First, we extend an EDA with Gaussian BNs to optimize solvent mixtures for cost-effective dissolution in a laboratory. The EDA explores an initial search space provided by the experts in which several constraints are required (expert knowledge) and includes a parameter to balance exploration. Results indicate that maximizing exploration replicates expert proposals, while decreasing leads to more cost-effective solutions. This methodology was later extended to a multi-objective (MO) problem in designing experiments for fuel fabrication in a laboratory. To reduce resource use, we developed a framework based on EDAs to propose experimental formulas, where some objectives cannot be evaluated analytically and are predicted with surrogate models. A posteriori analysis revealed previously unknown dependencies between fuel components. Traditional EDAs for continuous domains usually involve assuming Gaussians. Moreover, the EDA baseline updates a PM based on the top individuals from the previous iteration, risking local optima convergence. We introduce a semiparametric EDA, relaxing the Gaussianity assumption by using semiparametric BNs, where kernel estimated and Gaussian nodes coexist, determined dynamically by the algorithm. Our approach incorporates information from multiple past iterations to learn the PM. Empirical results show statistically significant improvements over other methods. EDAs share similarities with some QML algorithms. This dissertation secondly combines EDAs with quantum computing (QC) for various optimization tasks. On the one hand, quantum-inspired methods lead to classical algorithms assisted by QC. We introduce a quantum-inspired EDA replacing the PM with a quantum circuit. Results indicate that quantum noise improves the results. We also compare computational costs across different topologies and identify the ideal one for our EDA. On the other hand, variational quantum algorithms (VQAs) are QC methodologies assisted by classical optimizers. VQAs aim to minimize a given energy function by optimizing the parameters of the quantum parametric circuit (ansatz). Our first contribution in this field applies VQAs for BN structure learning. We analyze the algorithm's noise resilience across different types of noises, showing competitive results. Due to current quantum device limitations, we employed the Digital Annealer for larger BNs. We propose the use of EDAs for the parameter optimization of the ansatz by benchmarking different EDAs in different scenarios. Our results show that EDAs offer competitive results compared to other gradient-based / -free approaches in terms of CPU time and accuracy, with and without quantum noise simulation. Quantum architecture search involves optimizing not only the parameters but also the architecture of the ansatz. To manage this complex multi-level optimization, we use an EDA assisted by a surrogate model to rank solutions by expected energy. We also address both accuracy and barren plateau occurrence by framing it as a MO problem. Results show that our approach effectively enhances the trainability of known architectures while maintaining strong performance. Finally, we introduce EDAspy, a Python open-source library designed to advance EDA research. Noting the lack of EDA implementations, we offer over ten variants and supports creating custom EDAs with various components. RESUMEN Los algoritmos evolutivos abarcan muchos dominios, como la Industria 4.0, aprendizaje automático y automático cuántico (QML) debido a su fácil implementación, escalabilidad e interpretabilidad. Esta tesis se centra en los algoritmos de estimación de distribución (EDA), que usan modelos probabilísticos (PM) para generar nuevas soluciones. Las redes bayesianas (BN) representan dependencias condicionales entre variables y su integración en los EDA puede revelar patrones y mejorar las soluciones. En esta tesis nos centramos en la aplicación de los EDAs a problemas industriales. Primero, extendemos un EDA con BNs Gaussianas para optimizar mezclas de disolventes en una disolución en laboratorio. El EDA explora un espacio de búsqueda inicial con restricciones (conocimiento experto) proporcionado por los expertos, e incluye un parámetro que equilibra la exploración. Los resultados indican que maximizar la exploración imita a los expertos, y reducirla conduce a mayor rentabilidad. Esta metodología se amplió después para abordar un problema multiobjetivo (MO) en el diseño de experimentos para la fabricación de combustible. Para reducir el uso de recursos desarrollamos una herramienta basada en EDAs para proponer fórmulas experimentales en las que algunos objetivos no pueden evaluarse analíticamente y se predicen con modelos subrogados. El análisis a posteriori reveló patrones desconocidos anteriormente entre los componentes del combustible. Los EDAs tradicionales para dominios continuos asumen una distribución paramétrica. Además, el EDA canónico actualiza un PM basándose en los mejores individuos de la iteración anterior, con riesgo de convergencia prematura. Introducimos un EDA semiparamétrico, relajando la asunción de gaussianidad usando BNs semiparamétricas, donde nodos estimados por kernels coexisten con nodos gaussianos, determinados dinámicamente por el EDA. Nuestra propuesta incorpora información de múltiples iteraciones pasadas para aprender el PM. Se muestran mejoras estadísticamente significativas respecto a otros métodos. El EDA se asemeja a algunos algoritmos de QML. Esta tesis combina EDAs con computación cuántica (QC) para optimización. Por un lado, los métodos cuántico-inspirados son algoritmos clásicos asistidos por QC. Introducimos un EDA cuántico-inspirado, sustituyendo el PM por un circuito cuántico. Los resultados indican que el ruido cuántico mejora los resultados. También comparamos el coste computacional de distintas topologías e identificamos la ideal para nuestro EDA. Por otro lado, los algoritmos cuánticos variacionales (VQA) son metodologías asistidas por optimizadores clásicos. Los VQAs minimizan una función de energía tuneando los parámetros del circuito paramétrico (ansatz). Nuestra primera contribución al campo aplica VQAs para aprender BNs. Analizamos la resiliencia al ruido para diferentes tipos, encontrado resultados competitivos. El Digital Annealer es usado para BNs grandes por las limitaciones actuales de hardware. Proponemos el uso de EDAs para la optimización de parámetros del ansatz comparando diferentes EDAs y escenarios. Los resultados muestran que los EDAs son competitivos comparado con otras metodologías, basadas o no en gradientes, en términos de CPU y calidad de soluciones con/sin ruido cuántico. Buscar la arquitectura cuántica implica optimizar la arquitectura y parámetros del ansatz. Para gestionar esta optimización multinivel, utilizamos un EDA asistido por un modelo subrogado que ordena las soluciones por energía esperada. También abordamos la calidad de la solución y aparición de la meseta barren como un problema MO. Mostramos que nuestro EDA mejora la capacidad de entrenamiento de arquitecturas manteniendo alto rendimiento. Por último, se presenta EDAspy, una librería en Python, gratuita y de código abierto, diseñada para avanzar en la investigación de EDAs. Dada la falta de implementaciones se ofrecen más de diez variantes y permiten crear EDAs personalizados por componentes.