Autor: WANG, Xing
Título: From statistical modeling to machine learning: advancing basketball performance analysis
Fecha: 2025
Materia: ---
Escuela: FACULTAD DE CIENCIAS DE LA ACTIVIDAD FÍSICA Y DEL DEPORTE – INEF
Departamento: CIENCIAS SOCIALES DE LA ACTIVIDAD FISICA DEL DEPORTE Y DEL OCIO
Acceso electrónico: https://oa.upm.es/92222/
Director/a(s):
- Director/a: GÓMEZ RUANO, Miguel Ángel
Resumen: Motivation: Basketball performance analysis underpins both sports science research and practical decision-making in professional basketball. Traditional statistical methods provided interpretable insights into player box-score metrics and team tactics, but the rapid growth of high-resolution tracking data and advances in computation have opened new opportunities. By integrating structured classical approaches with modern machine learning techniques, this thesis addresses to the evolving demands of data-driven coaching and performance optimization specifically in the domains of athlete recruitment, load management, tactical scouting, and strategic analysis within elite-level competition. Objective: This paper comprehensively examines basketball performance analysis through four research objectives in different data dimensions and systematically constructs different chapters: Study 1 Athlete Recruitment: seeks to rigorously apply classical statistical methodologies-namely clustering techniques and classification trees-to critically address the classification and characterization of player roles for optimal roster assembly and talent acquisition strategies within professional basketball leagues. Study 2 Load Management: employs hierarchical Bayesian Poisson regression modeling to quantitatively assess the influence of schedule congestion on home-court advantage, critically informing strategic scheduling practices and competitive balance considerations. Study 3 Tactical Scouting: endeavors to design and implement HoopTransformer, an innovative spatiotemporal transformer architecture tailored specifically for the autonomous recognition of tactical play patterns from high-resolution tracking datasets, thereby enhancing the predictive accuracy of tactical analyses. Study 4 Player Evaluation: introduces HoopEval, an innovative reinforcement learning framework tailored specifically to estimate action-value contributions of individual player decisions, quantifying the impact of both on-ball and off-ball actions through high-resolution tracking datasets, thus enhancing the interpretability and strategic value of tactical analyses. Methods and Findings: Study 1: Through macro-scale analyses, clustering and classification tree techniques effectively identified distinct player archetypes among domestic and international athletes, delineating significant variations in shooting accuracy, playmaking proficiency, and defensive competencies. These insights facilitate informed decisions regarding player selection and team construction. Study 2: The hierarchical Bayesian Poisson regression model uncovered a nuanced, nonlinear relationship between rest intervals and home advantage in the schedule congestion cycle. Too much rest time might be detrimental to the team performance, especially for the away team. This findings provide evidence-based recommendations for optimal scheduling practices in professional basketball leagues. Study 3: HoopTransformer demonstrated exceptional proficiency in recognizing complex tactical patterns directly from tracking data without manual annotation. Comparative evaluations affirmed its substantial superiority over conventional tactical recognition methodologies in predictive accuracy and practical operability. Study 4: At the micro-scale, HoopEval demonstrated significant proficiency in quantifying the expected reward values associated with discrete player actions. Empirical evaluations confirmed its substantial advantage over baseline methodologies, enhancing strategic interpretability and offering actionable insights into individual contributions to game dynamics. Conclusions: The results show that aligning analytical methods with data scale yields the best insights. Traditional statistical methods retain considerable utility for macro-scale, aggregated analyses, whereas advanced machine learning techniques demonstrate superior efficacy in analyzing detailed, high-frequency spatiotemporal datasets. RESUMEN Motivación: El análisis del rendimiento en baloncesto constituye una base fundamental tanto para la investigación en ciencias del deporte como para la toma de decisiones prácticas en el baloncesto profesional. Los métodos estadísticos tradicionales han proporcionado durante mucho tiempo interpretaciones comprensibles sobre métricas de jugadores basadas en box-score y tácticas de equipo, pero el rápido crecimiento de los datos de rastreo de alta resolución y los avances en computación han abierto nuevas oportunidades. Al integrar enfoques clásicos estructurados con técnicas modernas de aprendizaje automático, esta tesis responde a las crecientes demandas del entrenamiento basado en datos y la optimización del rendimiento, en particular en los ámbitos de la captación de talento, la gestión de cargas, el scouting táctico y el análisis estratégico en competiciones de alto nivel. Objetivo: Estudio 1 captación de talento: Busca aplicar rigurosamente metodologías estadísticas clásicas específicamente técnicas de agrupamiento y árboles de clasificación para abordar de forma crítica la clasificación y caracterización de los roles de los jugadores, con el fin de optimizar la composición de plantillas y las estrategias de adquisición de talento en ligas profesionales de baloncesto. Estudio 2 gestión de cargas: Emplea un modelo de regresión de Poisson jerárquico bayesiano para evaluar cuantitativamente la influencia de la congestión del calendario en la ventaja de jugar en casa, proporcionando información crítica para la planificación estratégica del calendario y la búsqueda de un equilibrio competitivo. Estudio 3 scouting táctico: Se propone diseñar e implementar HoopTransformer, una innovadora arquitectura de transformer espaciotemporal diseñada específicamente para el reconocimiento automático de patrones tácticos ofensivos a partir de datos de rastreo de alta resolución, mejorando así la precisión predictiva del análisis táctico. Estudio 4: evaluación de jugadores: Introduce HoopEval, un marco innovador basado en aprendizaje por refuerzo, diseñado para estimar las contribuciones de valor de cada acción en las decisiones individuales de los jugadores. Mediante el uso de datos de rastreo de alta resolución, cuantifica el impacto tanto de las acciones con balón como sin balón, mejorando la interpretabilidad y el valor estratégico del análisis táctico. Métodos y hallazgos: Estudio 1: A través de análisis a gran escala, las técnicas de agrupamiento y árboles de clasificación identificaron eficazmente arquetipos de jugadores diferenciados entre atletas nacionales e internacionales, revelando variaciones significativas en precisión de tiro, capacidad de creación de juego y competencias defensivas. Estudio 2: El modelo jerárquico bayesiano de regresión de Poisson reveló una relación matizada y no lineal entre los intervalos de descanso y la ventaja de jugar en casa dentro del ciclo de congestión del calendario. Un exceso de tiempo de descanso puede ser perjudicial para el rendimiento del equipo, especialmente para el equipo visitante. Estudio 3: HoopTransformer demostró una notable capacidad para reconocer patrones tácticos complejos directamente a partir de datos de rastreo, sin necesidad de anotaciones manuales. Estudio 4: A nivel micro, HoopEval mostró una capacidad significativa para cuantificar los valores esperados de recompensa asociados con acciones discretas de los jugadores. Conclusiones: El análisis del rendimiento en baloncesto constituye una base fundamental tanto para la investigación en ciencias del deporte como para la toma de decisiones prácticas en el baloncesto profesional. Los métodos estadísticos tradicionales han proporcionado durante mucho tiempo interpretaciones comprensibles sobre métricas de jugadores basadas en box-score y tácticas de equipo, pero el rápido crecimiento de los datos de rastreo de alta resolución y los avances en computación han abierto nuevas oportunidades.