Clustering based on Bayesian networks with Gaussian and angular predictors : applications in Neuroscience

<< Volver atrás

Tesis:

Clustering based on Bayesian networks with Gaussian and angular predictors : applications in Neuroscience

Autor: LUENGO-SÁNCHEZ, Sergio

Título: Clustering based on Bayesian networks with Gaussian and angular predictors : applications in Neuroscience

Fecha: 2019

Materia: Sin materia definida

Escuela: E.T.S DE INGENIEROS INFORMÁTICOS

Departamentos: INTELIGENCIA ARTIFICIAL

Acceso electrónico: http://oa.upm.es/56989/

Director/a 1º: BIELZA LOZOYA, Concha
Director/a 2º: LARRAÑAGA MUGICA, Pedro

Resumen: Uno de los mayores desafíos a los que se enfrenta la ciencia actual es el de desentrañar el funcionamiento del cerebro, siendo la simulación de los circuitos neuronales del cerebro humano a diferentes escalas un área de estudio que ha despertado muchas expectativas e interés. Dada la increíble complejidad de este objetivo, los modelos matemáticos asistidos por ordenador son una herramienta imprescindible para poder razonar, hacer predicciones y sugerir nuevas hipótesis acerca del funcionamiento y organización de las neuronas. En esta tesis nos centramos en el estudio de la morfología de las espinas dendríticas y de somas de neuronas piramidales humanas desde el punto de vista de la neuroanatomía computacional. Las espinas dendríticas son pequeñas profusiones membranosas situadas en la superficie de las dendritas, siendo las encargadas de recibir las sinapsis excitatorias. Su morfología ha sido asociada con funciones cognitivas tales como el aprendizaje o la memoria, y no es de extrañar que una gran variedad de enfermedades mentales se hayan relacionado con alteraciones en su morfología o densidad. Por ello resulta de interés identificar las clases de espinas. La categorización más aceptada es la de Kaiserman-Abramof que propone cuatro grupos de espinas, aunque se discute si la diversidad de morfologías refleja más un continuo que la existencia de grupos concretos. Por su parte, los somas contienen el núcleo de la neurona y son los encargados de generar los neurotransmisores, elementos básicos de las sinapsis y por lo tanto de la actividad cerebral. Su morfología ha sido identificada como una de las propiedades fundamentales para distinguir entre tipos de neuronas. Para el desarrollo de esta disertación utilizamos reconstrucciones individuales 3D de espinas dendríticas y somas. La aplicación de una novedosa técnica de extracción de atributos nos permite caracterizar unívocamente la geometría de estos cuerpos 3D de acuerdo a varias magnitudes y direcciones. Mediante un análisis separamos de manera automática y objetiva las observaciones en categorías homogéneas. Concretamente, aplicamos el clustering basado en modelos, un enfoque probabilístico que asume que los datos fueron generados por un modelo estadístico de mixturas y cuyo objetivo es ajustar dicho modelo a partir de los datos observados. En este marco de trabajo cada grupo se representa con una distribución de probabilidad multidimensional. En el caso que nos ocupa, el aprendizaje de estos modelos de acuerdo a la estadística clásica presenta serios problemas debido a su incapacidad para manejar la periodicidad de los datos direccionales. En la literatura sobre estadística direccional se han propuesto algunas distribuciones enfocadas a modelar los datos direccionales-lineales, pero todas ellas exhiben importantes limitaciones para llevar a cabo clustering basado en modelos. La mayoría de las distribuciones direccionales-lineales se basan en cópulas para construir distribuciones bivariantes. Las distribuciones basadas en cópulas presentan resultados teóricos complejos, lo que dificulta extenderlas a más dimensiones. Además, la estimación de parámetros de estas distribuciones requiere de algoritmos de optimización, cuya inclusión al proceso de clustering puede ser prohibitivamente costosa desde una perspectiva computacional. El clustering de datos multivariantes direccionales-lineales es aún más desafiante y prácticamente se limita a modelos que asumen independencia entre variables direccionales y lineales, lo que reduce gravemente la expresividad del modelo e introduce un número innecesario de grupos. Los modelos gráficos probabilísticos, y más concretamente las redes bayesianas, son representaciones gráficas de distribuciones de probabilidad que pueden ser utilizadas para diseñar modelos generativos o comprender las relaciones entre variables aleatorias. Además, son una herramienta muy útil para realizar razonamiento probabilístico en presencia de información incompleta. Las interacciones entre multitud de variables puede ser una consecuencia de una variable oculta, esto es, una variable que no puede ser medida ni observada. Por lo tanto, las redes bayesianas proporcionan un marco de trabajo para descubrir las variables ocultas y llevar a cabo clustering basado en modelos. En esta tesis explotamos las propiedades de las redes bayesianas para definir por vez primera el modelo de mixtura de Mardia-Sutton Extendido. Para ello, derivamos una nueva función de densidad multivariante que captura las correlaciones direccionales-lineales y cuyos parámetros se pueden calcular de acuerdo a expresiones cerradas relajando las limitaciones de distribuciones de probabilidad previas. Con el fin de comprender e interpretar los grupos resultantes de aplicar el clustering basado en modelos, identificamos los atributos más representativos de cada grupo utilizando test de hipótesis y reglas generadas mediante un algoritmo de inducción de reglas. Finalmente, a partir de la combinación de los modelos generativos implementados en este estudio y de la definición unívoca de la morfología de los componentes neuronales, creamos una metodología para la simulación de somas y espinas dendríticas virtuales tridimensionales. A nuestro saber, este es el primer intento de caracterizar por completo, modelar y simular espinas dendríticas y somas 3D. ----------ABSTRACT---------- One of the greatest challenges facing science today is to disentangle the functioning of the brain, with the simulation of the neuronal circuits of the human brain at different scales being an area of study that has awakened many expectations and interests. Given the incredible complexity of this goal, computer-assisted mathematical models are a fundamental tool for reasoning, making predictions and suggesting new hypotheses about the functioning and organization of neurons. In this thesis we focus on the study of the morphology of dendritic spines and somas of human pyramidal neurons from the point of view of the computational neuroanatomy. Dendritic spines are small membranous protrusions located on the surface of the dendrites, which are in charge of receiving excitatory synapses. Their morphology has been associated with cognitive functions such as learning or memory, and it is not surprising that a wide variety of mental illnesses have been related with alterations in their morphology or density. I t is therefore interesting to identify the types of dendritic spines. Kaiserman-Abramof’s categorisation, which proposes four groups of dendritic spines, is the most accepted although it is discussed whether the diversity of morphologies reflects more a continuum than the existence of particular groups. For their part, somas contain the nucleus of the neuron and are responsible for generating neurotransmitters, the basic elements of synapses and therefore of brain activity. Their morphology has been identified as one of the fundamental properties for distinguishing between types of neurons. For the development of this dissertation we used individual 3D reconstructions of dendritic spines and somas. The application of a novel feature extraction technique allowed us to univocally characterise the geometry of these 3D bodies according to several magnitudes and directions. Through cluster analysis, we automatically and objectively separated the observations into homogeneous categories. Specifically, we applied model-based clustering, a probabilistic approach that assumes that the data were generated by a statistical mixture model and whose goal is to fit it from the observed data. According to this framework, each cluster is represented by a multidimensional probability distribution. In this case, learning these models according to classical statistics presents serious problems due to their inability to handle the periodicity of directional data. Some distributions focused on modeling directional-linear data has been proposed on the directional statistics literature, but all of them exhibit important limitations for performing model-based clustering. Most of the directional-linear distributions are based on copulas to construct bivariate distributions, which present complicated theoretical results, making them difficult to extend to higher dimensions. Additionally, they require from optimisation algorithms for the estimation of the parameters, that can be prohibitive during the clustering process from a computational perspective. Multivariate directional-linear data clustering is even more challenging and it is almost limited to models that assume independence among directional and linear variables, severely reducing the expressiveness of the model and introducing an unnecessary number of clusters. Probabilistic graphical models, and more specifically Bayesian networks, are diagram matic representations of probability distributions that can be used to design generative models or understand the underlying relationships between random variables. In addition, they are a very useful tool for probabilistic reasoning in the presence of incomplete information. Interactions among several variables may be a consequence of a hidden variable, i.e., a variable that could not be measure or observed. Therefore, BNs provides a framework for discovering hidden variables and performing model-based clustering. In this thesis we exploit the properties of Bayesian networks to introduce for the first time the Extended Mardia-Sutton mixture model. To achieve this, we derive a new multivariate density function that captures directional-linear correlations and whose parameters can be calculated according to closed-form expressions, relaxing the limitations of previous probability distributions. In order to understand and interpret the groups resulting from applying model-based clustering, we identify the most representative features of each cluster using hypothesis tests and rules generated by a rule induction algorithm. Finally, from the combination of the generative models implemented in this study and the univocal definition of the morphology of the neuronal components, we create a methodology for the simulation of 3D virtual somas and dendritic spines. To the best of our knowledge, this is the first attempt to fully characterise, model and simulate 3D dendritic spines and somas.