Tesis:
Directional-linear Bayesian networks and applications in neuroscience
- Autor: LEGUEY VITORIANO, Ignacio
- Título: Directional-linear Bayesian networks and applications in neuroscience
- Fecha: 2018
- Materia: Sin materia definida
- Escuela: E.T.S DE INGENIEROS INFORMÁTICOS
- Departamentos: INTELIGENCIA ARTIFICIAL
- Acceso electrónico: http://oa.upm.es/51432/
- Director/a 1º: LARRAÑAGA MÚGICA, Pedro
- Director/a 2º: BIELZA LOZOYA, Concha
- Resumen: Debido a la naturaleza direccional de ciertos datos presentes en múltiples areas para los que la estadística tradicional es ineficaz, la estadística direccional ha ido ganando relevancia en las últimas décadas, cobrando especial importancia en campos como meteorología, geología, biología o neurociencia. Esta importancia viene ligada al desarrollo de nuevas tecnologías que permiten la obtención y proceso de una elevada cantidad de datos. Uno de los problemas más recurrentes cuando se trabaja con todo tipo de datos es la incertidumbre. Para trabajar bajo condiciones de incertidumbre, los modelos gráficos probabilísticos son un recurso muy útil. En concreto, las redes Bayesianas combinan teoría de la probabilidad con teoría de gratos para proporcionar una potente herramienta en minería de datos. En esta tesis, aplicamos técnicas de estadística direccional en redes Bayesianas. Desarrollamos modelos de redes Bayesianas capaces de trabajar con datos de naturaleza direccional, que posteriormente adaptamos para aplicar a problemas de clasificación supervisada donde las variables predictoras son todas de dicha naturaleza. Generalmente, estos datos de naturaleza direccional se encuentran junto a datos de naturaleza lineal. Ya se han desarrollados métodos para trabajar conjuntamente con datos direccionales y lineales, pero nunca en redes Bayesianas. Por lo tanto, también se aborda este problema en esta tesis, donde proponemos un modelo de red Bayesiana que permite tratar variables tanto de naturaleza direccional como lineal. Para ello, proponemos una medida de dependencia entre las variables de diferente naturaleza contenidas en el modelo, basada en la similitud entre su función de densidad conjunta y sus funciones de densidad marginales. De este modo, utilizamos esta medida para capturar la dependencia entre las variables direccionales y lineales para desarrollar un modelo de red Bayesiana con estructura de árbol. La neurociencia es otro de los campos que ha experimentado un fuerte progreso en los últimos tiempos. El desarrollo de nuevas técnicas de estudio y avances en microscopía están impulsando significativamente el avance de esta ciencia. Estos avances demandan la incorporación de nuevas técnicas estadísticas y computacionales que permitan el manejo y análisis de los datos y resultados obtenidos por los experimentos neurocientíficos. En esta tesis se trabaja en la morfología neuronal, ya que pese a los numerosos avances y la inversión científica que se está realizando en este área, la estructura de las neuronas no se conoce aún con precisión. Además, la morfología neuronal desempeña un importante papel dentro de las características funcionales y computacionales del cerebro, de forma que los avances en este campo de estudio pueden aportar valiosa información sobre el cerebro y el sistema nervioso. Dentro de la morfología de la neurona, las dendritas son las que se encargan de la recepción sináptica y la propagación de la neurona por el cerebro. En el estudio de las dendritas se encuentran medidas de tipo discreto, continuo y direccional. El ajuste de distribuciones de probabilidad a estas medidas puede ser complejo e incluso inexistente, por lo que este tipo de problemas representa un reto en su modelización. Esta tesis aborda el estudio de la estructura dendrítica basal en neuronas piramidales. Se propone un método para estudiar y modelizar árboles dendríticos básales a partir de los ángulos de bifurcación producidos por la división de las dendritas partiendo desde el soma. Para ello, se usan técnicas de estadística direccional que permiten el manejo de los datos direccionales (es decir, de los ángulos de bifurcación) adecuadamente. Posteriormente, se estudia el comportamiento de dichos ángulos en función del tipo de dendrita del que provienen y la capa cerebral en la que esta localizada su neurona (su soma). Ahondando en el estudio de la morfología neuronal, también se estudia el problema de la clasificación de las neuronas piramidales entre las capas de la corteza cerebral con respecto a los ángulos de bifurcación de sus dendritas básales. Para ello, se usan los modelos de redes Bayesianas desarrollados para clasificación supervisada con variables predictoras direccionales desarrollados en esta tesis. Posteriormente, se compara la precisión de clasificación entre estos modelos de clasificación direccional para evaluar su eficiencia. También se compara con la clasificación aleatoria. ----------ABSTRACT---------- Since the directional nature of certain data present in multiple areas makes traditional statistics ineffective, directional statistics has gained relevancy in the last decades, having special importance in fields such as meteorology, geology, biology or neuroscience. This importance is connected to the development of new technologies that allow obtaining and processing huge amounts of data. One of the most frequent problems when dealing with any data is uncertainty. In order to work under uncertainty conditions, probabilistic graphical models are a very useful resource. In particular, Bayesian networks combine probability theory with graph theory to provide a powerful data mining tool. In this dissertation, we apply directional statistics techniques in Bayesian networks. We develop Bayesian network models able to deal with data of a directional nature, which we later adapt to address supervised classification problems where the predictor variables are all directional. Usually, this directional nature data is jointly observed with linear nature data. Several methods have already been used to deal with data from directional and linear nature together. Nevertheless, never in Bayesian networks. Therefore, this problem is also addressed in this dissertation, where we propose a Bayesian network model that allows the use of variables from either directional or linear nature. To do this, we introduce a dependence measure between variables from different nature. This dependence measure is based on the similarity between the joint density function and the product of its marginal density functions. Thus, we use this measure to capture the dependence between directional and linear variables to develop a Bayesian network model with tree-structure. Neuroscience is another research field that has experimented a great impulse in recent times. The development of new study techniques and advances in microscopy are driving significant advances in this science. These advances require the use of new statistical and computational techniques that allow the data management and data analysis of the results obtained by neuroscientific experiments. In this dissertation we work on the study of neuronal morphology. Despite the numerous advances and scientific investment being made in this area, the structure of the neurons is not known with precision yet. Furthermore, neuronal morphology plays an important role within the functional and computational characteristics of the brain. Hence, making further advances in this field of study can provide relevant information about the brain and the nervous system. Within the morphology of the neuron, dendrites are responsible for the synaptic reception and the spread of the neuron through the brain. In the study of the dendrites there are measures of discrete, continuous and directional type. Fitting probability distributions to these measures can be complex or even non-existent, so this type of problem represents a modelling challenge. This dissertation addresses the study of basal dendritic structure in pyramidal neurons. We propose a method to study and model basal dendritic arbors from the branching angles produced by the dendritic split starting from the soma. To do this, we use directional statistics techniques that allow the proper management of directional data (i.e., the bifurcation angles). Afterwards, we study the behaviour of these angles depending on the type of dendrite from which it originates and the brain layer in which its neuron (its soma) is located. Going further on neuronal morphology, we also study the pyramidal neuron classification problem into cerebral cortex layers based on their basal dendrites bifurcation angles. To do this, we use the supervised classification Bayesian network models for directional variables developed in this dissertation. Later, we compare the classification accuracy among these directional classification models to evaluate their efficiency. We also compare with random classification.