Tesis:

Emotion-Aware Cyber-Physical Systems


  • Autor: CORREDERA ARBIDE, Alberto

  • Título: Emotion-Aware Cyber-Physical Systems

  • Fecha: 2019

  • Materia: Sin materia definida

  • Escuela: E.T.S. DE INGENIEROS DE TELECOMUNICACION

  • Departamentos: INGENIERIA ELECTRONICA

  • Acceso electrónico: http://oa.upm.es/62775/

  • Director/a 1º: MOYA FERNÁNDEZ, José Manuel

  • Resumen: Los actuales gestores de infraestructuras complejas no son capaces de optimizar con éxito la resolución de los problemas causados por la excesiva cantidad de datos a gestionar, entre otras cosas, debido a la monotonía que ello produce en el personal de operación o la falta de priorización en las tareas a realizar ante una posible incidencia. Esto produce efectos negativos como caídas de los sistemas o cortes de suministro del servicio que proporcionan dichas infraestructuras a otras organizaciones o clientes. Esta tesis aborda este problema de la gestión óptima de infraestructuras complejas desde un enfoque nuevo, que considera estas infraestructuras como sistemas ciberfísicos con conciencia emocional. La introducción del uso de esos factores emocionales como una variable más de monitorización y gestión aporta una visión más avanzada, realista y completa de los entornos de producción. Para poder realizar estas tareas necesitamos apoyarnos en los últimos avances en cuanto a Inteligencia Artificial, creando nuevos métodos para la extracción y la toma de decisiones que nos ayuden a conseguir nuestros objetivos en un entorno con información heterogénea. Nos centraremos en un caso particular de estos sistemas debido a su especial relevancia: los grandes centros de datos. Este es un hecho muy relevante a nivel global, puesto que el coste medio de una caída de un centro de datos está aumentando desde $0.5M en 2010 a $0.75M en 2016, según el Ponemon Institute[63]. Además, la duración de las caídas de la mayoría de los negocios basados en el procesado de datos (Industria 4.0) está aumentando muy por encima de la media de otros negocios. Es un problema que requiere de acción inmediata, puesto que el 50% de los centros de datos no están preparados para los equipos de alta densidad actuales, y los ataques cibernéticos están aumentando espectacularmente (de ser la causa de un 0.2% de las caídas de centros de datos en 2010 a un 22% en 2016). Ya en la actualidad, en media, cada centro de datos tiene unas pérdidas anuales de más de 2M$ por caídas totales o parciales. Además, los sistemas de gestión actuales son claramente insuficientes. Según el estudio citado[63], más de la mitad de las caídas de centros de datos podían haberse evitado y el 22% se debieron precisamente a errores humanos de operación y otro 22% a ciberataques, causa que involucra también a tareas preventivas realizadas por el personal. La problemática puede complicarse con la introducción, o mejor dicho la proliferación y estandarización de los llamados Big Data, la Internet of Things y las ciudades inteligentes (Smart Cities), ya que aumentan exponencialmente las necesidades de procesamiento de datos. A lo largo del texto de esta tesis introduciremos estos conceptos y sus implicaciones cruzadas. Tanto los ataques como los errores humanos involucran a personas, estas personas a su vez toman decisiones en un entorno de elevada complejidad y con alto grado de incertidumbre. El mercado de fabricantes de software que se dedica a la gestión de centros de datos, como el DCIM (Data Center Infrastructure Management) está en plena expansión, se espera que supere los USD 4,5 billions en 2026[84]. Sin embargo, las soluciones actuales están enfocadas en el registro de la información y la disponibilidad de herramientas de análisis de dicha información. La información está disponible, pero las decisiones quedan en manos del personal de operaciones. Y muchas veces estas decisiones son complejas y la información disponible es demasiado amplia y de muy bajo nivel. Algunos ejemplos notables son las decisiones para: - Optimizar el consumo energético del centro de datos. - Minimizar los riesgos de ciberataques. - Optimizar el mantenimiento preventivo. - Maximizar el beneficio, teniendo en cuenta aspectos del negocio, los recursos y el estado. - Aprovechar al máximo las capacidades de generación de energías renovables. La gestión eficiente y eficaz de los centros de datos actuales requiere herramientas más potentes, conscientes de que hay personas tomando decisiones, capaces de realizar de forma automática los análisis necesarios, capaces de ofrecer al personal de operaciones toda la información necesaria, nada más que la necesaria, y al nivel adecuado y de la forma adecuada, capaces de automatizar la toma de decisiones total o parcialmente. Por otro lado, hasta ahora se han optimizado las distintas variables de forma independiente. De hecho, en muchos centros de datos la gestión de la infraestructura y de los servidores la llevan empresas diferentes y con escasa comunicación. Sin embargo, las distintas variables del centro de datos suelen estar relacionadas entre sí, con relaciones complejas de modelar y que cambian con el tiempo. Por tanto, se hace imprescindible un enfoque holístico a la gestión de recursos, donde otros sistemas de gestión de centros de datos no solo agregan información de todos los elementos del centro de datos, sino que realmente aporte: - Conciencia de lo que está ocurriendo en el centro de datos, de la demanda de servicios, de los recursos necesarios, del consumo, de la evolución térmica, de los posibles ciberataques, etc; - El contexto en el equipo de operaciones, su estado de ánimo, sus objetivos, las incertidumbres que acontecen. Es un problema que tiene en cuenta el sistema de infraestructura computacional pero que es gestionada por operadores humanos que supervisan y gestionan las operaciones siguiendo unas directrices de negocio. A lo largo de esta tesis se han recogido algunas iniciativas para acotar y controlar las posibles causas de problemas resaltando la siguientes aportaciones: - El análisis de las distintas formas de comunicación multimodal (texto, audio o video) y de las variables involucradas de forma directa o indirecta en un sistema ciberfísico donde se realiza la captura de las emociones con el objetivo de poder usarlas como una fuente más de información. - Estudiar las tendencias, teniendo en cuenta otras disciplinas de ciencias de la salud, como la Psicología, que puedan afectar a la toma de decisiones y por lo tanto a la productividad, de forma directa o indirecta. - La construcción de un prototipo de control de un sistema ciberfísico que involucra a datos procedentes de la monitorización de la infraestructura, y a datos de otras fuentes como medidas emocionales o biométricas, procedentes del personal que se ocupa de gestionar las operaciones. Estas son algunas de las contribuciones originales de esta Tesis: - La realización de un modelo de extracción de información emocional mediante sensores biométricos y audiovisuales en el entorno de operación de centros de datos y validación en entorno real. - Implementación de método de extracción y análisis para asociar las variables medidas con valores de excitación y valencia de las emociones en el entorno de operación de centros de datos y validación en entorno real. - Construcción de un algoritmo para determinar una acción correctiva en función del estado de funcionamiento actual y la emoción predominante del operador en el entorno de operación de centros de datos y validación en entorno real. - Diseño de un módulo de visualización configurado para proporcionar la acción correctiva al operador en el entorno de operación de centros de datos y validación en entorno real. - La propuesta de algoritmo predicción de sesgo en toma de decisiones en Centro de Operaciones de Sistemas Ciber-físicos. - El desarrollo de un sistema de gestión de personal de operaciones basado en el uso combinado de información ambiental, telemétrica, biométrica, audiovisual y emocional. La contribución clave de esta tesis doctoral se centra en abordar la problemática de la gestión de infraestructuras complejas desde un enfoque de optimización del sistema ciberfísico, donde el comportamiento y gestión de máquina y humano son alineados y optimizados usando la conciencia emocional como herramienta unificada. ----------ABSTRACT---------- The current complex infrastructure managers are not able to successfully optimize the resolution of problems caused by the excessive amount of data to be managed, among other things, due to the monotony that this produces in the operating personnel or the lack of prioritization in the tasks to be handled in the event of a possible system crash. This produces negative effects such as system outages or service supply disconnections that may affect to other organizations or clients. This thesis addresses this problem of optimal management of complex infrastructures from a new approach, which considers these infrastructures as emotionally conscious cyber-physical systems. Introducing the use of these emotional factors as yet another monitoring and management variable provides a more advanced, realistic, and comprehensive view of production environments. In order to manage these tasks, we need to rely on the latest advances in Artificial Intelligence, creating new methods for extraction and decision-making that lead us to achieve our objectives in an environment with heterogeneous information. We will focus on a particular case of these systems due to their special relevance: large data centers. Despite the focus, this problem is a very relevant fact at a global level, since the average cost of an outage in a data center is increasing from $0.5M in 2010 to $0.75M in 2016, as suggested in the Ponemon institute study[63]. In addition, the duration of the outages in most businesses based on data processing (Industry 4.0) is increasing well above the average of other businesses. It is a problem that requires immediate action, since 50% of the data centers are not prepared for the current high-density equipment, and cyber-attacks are increasing dramatically (being the cause of 0.2% of the outages in data centers in 2010 to 22% in 2016). Nowadays, on average, each data center has annual losses of more than $2M due those total or partial outages. In addition, current management systems are clearly insufficient. According to the aforementioned study, more than half of data center crashes could have been avoided and 22% were due to human errors of operation and another 22 % more due to cyber attacks, a cause that also involves preventive tasks carried out by staff. The problem can be complicated by the introduction, or rather the proliferation and standardization of the so-called Big Data, the Internet of Things and Smart Cities, since they increase exponentially the data processing needs. (Smart Cities), as data processing needs increase exponentially. Throughout the text of this dissertation we will introduce these concepts and their crossed implications. Both attacks and human errors involve people, these people in turn make decisions in an environment of high complexity and with a high degree of uncertainty. The market of software manufacturers dedicated to the management of data centers, such as the DCIM (Data Center Infrastructure Management) is in full expansion, is expected to exceed USD 4.5 billion by 2026[84]. However, current solutions are focused on gathering the logs and the availability of tools to analyze such information. The information could be available, but decisions are left to the operations personnel. And many times, these decisions are complex and the information available is too broad and very low level to facilitate the decision making. Some notable examples are the decisions to: - Optimize the energy consumption of the data center. - Minimize the risks of attacks. - Optimize preventive maintenance. - Maximize the benefit, taking into account aspects of the business, resources and status. - Make the most of renewable energy generation capacities. The efficient and eéctive management of current data centers requires more powerful tools, aware that there are people making decisions, capable of automatically carrying out the necessary analysis, capable of oéring operations personnel all the information needed, and at the appropriate abstraction level and in the appropriate format, capable of automating decision making totally or partially. On the other hand, until now the diérent variables have been optimized independently. In fact, in many data centers, the management of the infrastructure and the servers is carried out by diérent companies and with scarce communication. However, the diérent data center variables are often related to each other, with complex modeling relationships that may change over time. Therefore, a holistic approach to resource management is essential, where other data center management systems not only aggregate information from all elements of the data center, but are also aware of: - What is happening in the data center, of the services demand, of the appropriated resources, of consumption, of thermal evolution, of possible attacks; - The circumstances of the context in the operations team, their state of mind, their objectives, the uncertainties that may occur. This is a problem that takes into account the computational infrastructure system but is managed by human operators who supervise and manage the operations following business guidelines. Throughout this thesis, some initiatives have been collected to limit and control the possible causes of problems, highlighting the following contributions: - The analysis of the diérent procedures of multimodal communication (text, audio or video) and of the variables involved directly or indirectly in a cyber-physical system where the emotions of the workforce are captured of in order to be able to use them as another source of information. - To study the trends, taking into account other disciplines of health sciences, such as Psychology, that may aéct decision-making and therefore productivity, directly or indirectly. - The construction of a prototype for the control of a cyber-physical system that involves data from infrastructure monitoring, and data from other sources such as emotional or biometric measures, from the personnel responsible for managing operations. These are some of the original contributions of this Ph.D. Thesis: - A model for the extraction of emotional information through biometric and audiovisual sensors in the operating environment of data centers and validation in a real environment. - The design and implementation of a method of extraction and analysis to associate the measured variables with values of excitation and valence of emotions in the operating environment of data centers and validation in real environment. - The development of an algorithm to determine a corrective action based on the current operating status and the predominant emotion of the operator in the data center operation environment and validation in real environment. - The analysis, design and implementation of a display module configured to provide corrective action to the operator in the operating environment of data centers and validation in real environment. - The development of an algorithm for predicting bias in decision making in the Cyber-Physical Systems Operations Center. - The development of a management system for operations personnel based on the combined use of environmental, telemetric, biometric, audiovisual and emotional information. The key contribution of this PhD thesis is to address the situation of managing complex infrastructures from an optimization approach of the Cyber-Physical System, where the behavior and management of machine and human are aligned and optimized using emotional awareness as a driver.