Tesis:

Key performance indicators and network analysis on ball possession in Chinese Football Association Super League


  • Autor: GONG, Bingnan

  • Título: Key performance indicators and network analysis on ball possession in Chinese Football Association Super League

  • Fecha: 2023

  • Materia:

  • Escuela: FACULTAD DE CIENCIAS DE LA ACTIVIDAD FÍSICA Y DEL DEPORTE – INEF

  • Departamentos: CIENCIAS SOCIALES DE LA ACTIVIDAD FISICA DEL DEPORTE Y DEL OCIO

  • Acceso electrónico: https://oa.upm.es/73167/

  • Director/a 1º: GÓMEZ RUANO, Miguel Ángel

  • Resumen: Purpose: Ball possession has been demonstrated to be closely associated with team’s playing style and further linked to team’s success. The main aim of the PhD. thesis is to explore the match performance demands of football teams on ball possession. Specifically, the investigations mainly focus on investigating the key performance indicators and collective playing style on ball possession in Chinese Football Association Super League (CSL). The effect of contextual variables (match location, team quality, and opponent quality) was also taken into consideration in the analysis. To implement our purpose, the thesis was driven by the following three research aims. Firstly, investigating the validity of match variables and the reliability of match analysis system in live association football match (Aim 1); secondly, examining the relationship between key performance indicators (KPIs) and ball possession in elite men’s soccer, and identifying the suitable analysis method to model this relationship in the CSL (Aim 2). Thirdly, quantifying the consistency and identifiability of team performance in CSL, exploring the collective playing style of how a team moves the ball in possession (Aim 3). Methods: Our analyses used multiple sources of data, including the technical and physical performance records from 237 matches during the 2019 competitive season in the CSL, whilst the passing statistics from 1,200 matches during 5 consecutive seasons (2014-2018) in the CSL. The methodology was split into 3 main sections focused in each aim, respectively. As a prerequisite for sports performance analysis, the first section tries to examine the accuracy and reliability of the measures. Match variables included in the match analysis system were evaluated by professional coaches. The reliability of data collection was determined using weighted Kappa statistic, mean, change in the mean, standardized typical error, and intra-class correlation (Aim 1). Secondly, the analysis of KPIs and ball possession according to situational variables requires a depth understanding of the specific variables and models used with a sample of matches from 2019 CSL. We analyzed the effects of physical and technical parameters of elite men’s soccer on ball possession using multiple linear regression (MLR) and quantile regression (QR) using the 10th, 25th, 50th, 75th, and 90th quantiles (Aim 2). Lastly, to explain the identifiability and consistency of team’s networks, the specificities of the network science model and statistical analysis were defined and justified using a sample of 5 consecutive seasons from the CSL. We constructed the pitch passing networks of each team for each match, to evaluate the organization of a team, comparing how these particular networks change from match to match (Aim 3). Results: The results of the PhD thesis were described for each specific aim. Aim 1: The results showed that the Champdas Master system can be used validly and reliably to gather live football match statistics by well-trained operators. The Aiken’s V averaged at 0.84±0.03 and 0.85±0.03 for the validation of indicators. The high Kappa values (Operator 1: 0.92, 0.90; Operator 2: 0.91, 0.88), high intra-class correlation coefficients (varied from 0.93 to 1.00) and low typical errors (varied from 0.01 to 0.34) between the first and second data collection represented a high level of intra-operator reliability. The Kappa values for the inter-operator reliability ranged between 0.97 and 0.89. The intra-class correlation coefficients and typical errors ranged from 0.90 to 1.00 and ranged from 0.01 to 0.24 for two independent operators within two data collections. Aim 2: The results found that several technical (foul, pass, air duel, tackle, shot, and corner kick) and physical (sprint and high-speed running distance) KPIs were associated with ball possession. Compared to the MLR model, the QR model identified additional physical KPIs, which are sprint, high-speed running, and high-intensity running efforts, that influenced ball possession. For the situational variables, the quality of the opposition affects the ball possession from the 25th to 75th quantiles. Aim 3: In terms of identifiability of Football Teams, the results demonstrated that Beijing Gouan was the team with the highest global identifiability, followed by GZFC and Gangzhou R&F FC during the season 2018. Respectively, Chongqing Lifan, Henan Jianye and Guizhou Hengfeng were at the lowest positions. Concerning the impact of the match location effects on identifiability, we can observe how 10 teams out of 16 have higher values at home. This is somehow expected since playing at home gives teams certain advantage, which could be translated into playing with a more similar style. With regard to consistency across seasons, we can see how GZFC and Beijing Guoan are the teams leading the ranking, indicating that they are prone to maintain their playing style along seasons. Additionally, Changchun Yatai and Henan Jianye were the most inconsistent teams and ranked as the last ones across the seasons. Conclusions: Initially, to ensure the quality of the data, we evaluated and further demonstrated that the match analysis system is capable of measuring football match events reliably and providing more technical-tactical performance details than its peer systems. The data samples included in the study, can be used by coaches, managers, researchers, and performance analysts as valid match statistics from players and teams during their professional tasks and investigations (Aim 1). Furthermore, we found that several technical (foul, pass, air duel, tackle, shot, and corner) and physical (sprint distance and high-speed running distance) KPIs were closely associated with ball possession during the 2019 competitive season in the CSL. The QR model at the 75th quantile identified additional physical KPIs, which are sprint effort, high-speed running effort, and high-intensity running effort, that influenced ball possession compared to the MLR model. For the situational variables, the quality of the opposition affects the ball possession from the 25th to 75th quantiles. The QR model provides more specific performance information for coaches and analysts to optimise training preparation and playing styles (Aim 2). Finally, we propose the use of Network Science as a complementary tool to analyze how specific and unique the playing style of Chinese football teams is. Most well-ranked teams have higher identifiability values, which can embody the team's advantage in controlling the game. In contrast to that, there are lower identifiability values toward the bottom-ranked teams, which do not have a particular signature at their pitch passing networks. Results revealed that 10 teams out of 16 teams are more identifiable at home but others away. The top six teams with higher consistency all have qualified for the Champions League with stable passing patterns. While the two most inconsistent teams struggled in the relegation zone for years. Complex network analysis may help teams in developing a consistent and identifiable playing style, and also be helpful for coaches in match preparations and performance evaluations (Aim 3). RESUMEN Objetivo: Se ha demostrado que la posesión del balón está estrechamente relacionada con el estilo de juego de un equipo y, además, con el éxito del mismo. El objetivo principal de la tesis doctoral consistió en explorar las exigencias de rendimiento de los equipos de fútbol en su uso de la posesión del balón. En concreto, las investigaciones se centran principalmente en investigar los indicadores clave de rendimiento (KPI) y el estilo de juego colectivo sobre la posesión del balón en la Superliga de la Asociación China de Fútbol (Chinese Super League, CSL). También se tuvo en cuenta en el análisis el efecto de las variables contextuales (localización del partido, calidad del equipo y calidad del oponente). Para llevar a cabo su desarrollo, la tesis se estableció en tres objetivos de investigación. En primer lugar, investigar la validez de las variables del partido y la fiabilidad del sistema de análisis del partido en vivo del fútbol de la CSL (Objetivo 1); en segundo lugar, examinar la relación entre los KPI del partido y la posesión del balón e identificar el modelo estadístico más adecuado para modelar esta relación en la CSL (Objetivo 2). Por último, el tercer objetivo se centró en cuantificar la consistencia e identificabilidad del rendimiento del equipo en la CSL, así como explorar el estilo de juego colectivo de cómo un equipo mueve el balón en la posesión (Objetivo 3). Métodos: Los análisis utilizaron múltiples fuentes de datos, incluyendo los registros de rendimiento técnico y físico de 237 partidos durante la temporada competitiva 2019 en la CSL, mientras que las estadísticas de pases de 1200 partidos durante 5 temporadas consecutivas (2014-2018) en la CSL. La metodología se dividió en 3 secciones centradas en cada objetivo respectivamente. Como requisito previo para el análisis del rendimiento deportivo, la primera sección trata de examinar la precisión y fiabilidad de las mediciones del sistema de registro Champdas Master System. Las variables del partido incluidas en el sistema de análisis del partido fueron evaluadas por entrenadores profesionales. La fiabilidad de la recogida de datos se determinó mediante el estadístico Kappa ponderado (Weighted Kappa), la media, el cambio de la media, el error típico estandarizado y la correlación intraclase (Objetivo 1). En segundo lugar, el análisis de los KPI y de la posesión del balón en función de las variables situacionales requiere un conocimiento profundo de las variables específicas y de los modelos utilizados con una muestra de partidos de la CSL de 2019. De este modo se analizaron los efectos de los parámetros físicos y técnicos sobre la posesión del balón en la CSL, utilizando la regresión lineal múltiple (MLR) y la regresión por cuantiles (QR) utilizando los cuantiles 10º, 25º, 50º, 75º y 90º (Objetivo 2). Por último, para explicar la identificabilidad y la consistencia de las redes de los equipos, se definieron y justificaron las especificidades del modelo de ciencia de redes y del análisis estadístico de identificabilidad utilizando una muestra de 5 temporadas consecutivas de la CSL. Se construyeron las redes de paso de cada equipo para cada partido, para evaluar la organización de un equipo, comparando cómo estas redes particulares cambian de un partido a otro (Objetivo 3). Resultados: Objetivo 1: Los resultados mostraron que el sistema Champdas Master System puede utilizarse de forma válida y fiable para recopilar estadísticas de partidos de fútbol en directo por parte de operadores bien formados. La V de Aiken se situó en una media de 0,84±0,03 y 0,85±0,03 para la validación de los indicadores. Los elevados valores del coeficiente Kappa (Operador 1: 0,92, 0,90; Operador 2: 0,91, 0,88), los elevados coeficientes de correlación intraclase, CCI (variaron de 0,93 a 1,00) y los bajos errores típicos (variaron de 0,01 a 0,34) entre la primera y la segunda recogida de datos representaron un alto nivel de fiabilidad intra-operador. Los valores Kappa para la fiabilidad inter-operador fueron de 0,97 y 0,89. Los coeficientes de correlación intraclase y los errores típicos oscilaron entre 0,90 y 1,00 y entre 0,01 y 0,24, respectivamente para dos operadores independientes dentro de las dos recopilaciones de datos realizadas. Objetivo 2: Los resultados encontraron que varios KPI de nivel técnicos (falta, pase, duelo aéreo, entrada, disparo y saque de esquina) y físico (sprint y distancia de carrera de alta velocidad) estaban asociados a la posesión del balón. En comparación con el modelo MLR, el modelo QR identificó KPI físicos adicionales, que son el sprint, la carrera de alta velocidad y los esfuerzos de carrera de alta intensidad, que influyeron en la posesión del balón. En cuanto a las variables situacionales, la calidad de la oposición afecta a la posesión del balón entre los cuantiles 25 y 75. Objetivo 3: En cuanto a la identificabilidad de los equipos de fútbol, los resultados demostraron que el Beijing Gouan fue el equipo con mayor identificabilidad global, seguido por el GZFC y el Gangzhou R&F FC durante la temporada 2018. Respectivamente, el Chongqing Lifan, el Henan Jianye y el Guizhou Hengfeng ocuparon las posiciones más bajas. En cuanto al impacto de los efectos de la ubicación del partido en la identificabilidad, se pudo observar cómo 10 de los 16 equipos tienen valores más altos en casa. Estos resultado en cierto modo eran esperables, ya que jugar en casa da a los equipos cierta ventaja, que podría traducirse en jugar con un estilo más similar/ identificable. En cuanto a la consistencia a lo largo de las temporadas, podemos ver cómo el GZFC y el Beijing Guoan son los equipos que lideran la clasificación, lo que indica que son propensos a mantener su estilo de juego a lo largo de las temporadas. Además, el Changchun Yatai y el Henan Jianye fueron los equipos más inconsistentes y se clasificaron como los últimos a lo largo de las temporadas. Conclusiones: Inicialmente, para asegurar la calidad de los datos, se evaluó y demostró que el sistema de análisis de partidos es capaz de medir eventos de partidos de fútbol de forma fiable y proporcionar detalles de rendimiento técnico-táctico similares que sus sistemas homólogos como Opta Sport. Las muestras de datos incluidas en el estudio, pueden ser utilizadas por entrenadores, directivos, investigadores y analistas de rendimiento como estadísticas válidas de partidos de jugadores y equipos durante sus tareas profesionales e investigaciones académicas (Objetivo 1). Asimismo, se identificó que varios KPI técnicos (falta, pase, duelo aéreo, entrada, disparo y córner) y físicos (distancia de sprint y distancia de carrera de alta velocidad) estaban estrechamente asociados con la posesión del balón durante la temporada competitiva 2019 en la CSL. El modelo QR en el cuantil 75 identificó KPI físicos adicionales, que son el esfuerzo de sprint, el esfuerzo de carrera de alta velocidad y el esfuerzo de carrera de alta intensidad, que influyeron en la posesión del balón en comparación con el modelo MLR. En cuanto a las variables situacionales, la calidad de la oposición afecta a la posesión del balón entre los cuantiles 25 y 75. El modelo QR proporciona información más específica sobre el rendimiento para que los entrenadores y analistas puedan optimizar la preparación del entrenamiento y los estilos de juego (Objetivo 2). Por último, se propuso el uso de la Ciencia de Redes como herramienta complementaria para analizar cuán específico y único es el estilo de juego de los equipos de fútbol chinos. La mayoría de los equipos bien clasificados tienen valores de identificabilidad más altos, lo que puede explicar o justificar la ventaja del equipo en el control del juego. En cambio, los valores de identificabilidad son más bajos en los equipos peor clasificados, que no tienen una huella particular en sus redes de pase en el campo. Los resultados revelan que 10 de los 16 equipos son más identificables en casa, pero otros fuera. Los seis primeros equipos con mayor consistencia se han clasificado para la Liga de Campeones con patrones de pase estables. Mientras que los dos equipos más inconsistentes lucharon en la zona de descenso durante años. El análisis de redes complejas puede ayudar a los equipos a desarrollar un estilo de juego consistente e identificable, y también ser útil para los entrenadores en la preparación de los partidos y la evaluación del rendimiento (Objetivo 3).