Ni el más entusiasta de los analistas de datos deportivos cree que puede explicar el fútbol solo a partir de los números, sin embargo, para Jorge Valdano la acusación de totalitarismo contra las estadísticas sigue vigente. Es llamativo que, pese a la larga historia de uso de datos del fútbol, de tener a tipos respetados como Ársene Wenger encabezando el movimiento, la creación de nuevas métricas y las mejoras en la contextualización de la información en las últimas décadas, ciertos sectores de la industria, especialmente en el periodismo deportivo, aún sigan viendo a las estadísticas de reojo o incluso, como un potencial enemigo.
Lo hacen arquetipando un enemigo imaginario, un sujeto con pretensiones de explicar todo con números, que pretende saber más de fútbol que los protagonistas directos y que, a la manera de un conspiracionista, explica todo a partir de los mismos principios. Lo único que ha cambiado para este sector es que lo que antes descartaban de plano, beneficiándose de su posición central en el campo de discusión, ahora lo plantean de manera más indirecta, porque es un apartado en el que saben que han perdido terreno.
Recientemente, en su columna habitual en el diario español El País, Valdano descalifica (una oración después que advierte que no va a hacerlo) el uso de estadísticas en el fútbol y lo hace con una selección trivial y forzada de indicadores relacionados con la Copa Mundial de la FIFA. En el fondo, su posición sigue siendo la misma.
Primero, descontextualiza una idea del propio Wenger sobre qué equipo tenía más chances de ganar el Mundial («el que tenga los mejores extremos») y la refuta utilizando los mismos datos que genera Wenger y de los que Valdano, a priori, invalida. Para hacerlo más confuso, añade una reflexión extra concediendo que, efectivamente, fue clave el ingreso de Di María como extremo para que Argentina fuera campeona. Enojarse con los datos por las interpretaciones descontextualizadas es una trampa en la cual se cae con recurrencia, cuando no se tiene el detalle de la información disponible.
Segundo, apela a una discusión que ya fue largamente superada: todos los que seguimos el fútbol de élite sabemos de la irrelevancia de los kilómetros recorridos como indicador en solitario o como métrica asociada a una buena performance. En todo caso, más que beneficiarse con estos datos, Rodrigo De Paul (el ejemplo que elige Valdano) sufrió en el Mundial las malas interpretaciones de los mismos, especialmente en el primer partido de Argentina.
Al volante del Atlético Madrid le cayeron de manera apresurada por la imprecisión de sus pases, lo cual era linealmente cierto: fue uno de sus partidos menos precisos en la selección (junto con la final de la Copa América en la que fue figura) pero un doble click en la información mostró que tenía que ver con la búsqueda Argentina y la necesidad de arriesgar, son los mismos datos los que ofrecen respuestas a las interpretaciones apresuradas. Además, si se hizo foco en los indicadores físicos, fue por dos motivos que sirven para cuidar al jugador ante juicios apurados: a) los rumores que daban como lesionado y lo ubicaban fuera del equipo; b) la intención de instalar que el futbolista se «borraba» o no asumía su compromiso en la Selección porque tiene una novia famosa. Todo lo contrario a la postura antigua que supone que la utilización de datos siempre tiene un tinte sombrío y su utilización trae consecuencias negativas.
Por último, Valdano arremete precisamente contra la estadística de efectividad de pases, otra discusión largamente saldada en el mundo del análisis de datos deportivos. Se sabe que los que menos arriesgan son los más efectivos, por eso se relativiza el porcentual en función de la posición en el campo del futbolista, la idea de juego del equipo e incluso la situación de partido. De hecho, las estadísticas más nuevas en el fútbol, como el valor de posesión, xT o VAEP, apuntan justamente a ponderar a los jugadores que más arriesgan y más aportan para que su equipo genere peligro.
En el único lugar donde la efectividad de pases se toma a rajatabla o la posesión no se contextualiza, es en ciertas cuentas de Twitter, donde los datos se presentan como contenido intercambiable con videos virales o contenido de color sobre cumpleaños de futbolistas o camisetas nuevas, y en algunas notas apresuradas de portales informativos, cuya necesidad de clicks e inmediatez atenta contra la elaboración de artículos más detallados.
El punto pareciera ser tratar de entender por qué Valdano prefiere resumir el uso de estadísticas a ese tipo de expresiones y no a los esfuerzos hechos por investigadores, clubes y federaciones (FIFA incluida) para que todos los actores de la industria del fútbol dispongan de más y mejores datos año tras año. Una posibilidad, aunque algo difícil de creer dada su trayectoria, es que Valdano no conozca la profundidad de análisis disponible en el fútbol actual, lo cual sería una lastima porque, entre muchas otras cosas, podría descubrir que el uso de datos ha aportado para que la idea de fútbol más asociado, cercana a su ideología futbolista, se profundizara en los últimos años. Por ejemplo, sin negar el impacto de Guardiola, las mejoras en los campos y la ampliación presupuestaria, en la Premier League la distancia promedio y la cantidad de remates ha disminuido desde la incorporación de los goles esperados, lo cual indica que los equipos están apostando a un juego más elaborado, todo esto sin afectar el promedio de goles por partido de la competencia.
Hay más buenas noticias en esta línea: los propios goles esperados e incluso indicadores más nuevos como el Match Momentum han hecho mucho para separar el resultado de la actuación, y aunque el fútbol siempre se gana con goles, los datos bien utilizados pueden ser un aliado para bancar ideas de juego más allá de imponderables y marcadores injustos.
Podríamos ir más lejos, y pensar en ellos como una de las llaves para devolver el foco de la discusión futbolística al juego en sí y dejar de lado la parafernalia insoportable que lo rodea. Para esto, el punto es entender que mayormente los datos son útiles para abrir debates y no para cerrarlos. Un buen ejemplo de esto es la histórica acusación de que Messi caminaba en los partidos de la selección, idea que llevó a cientos de debates inconducentes con cortes de video de una u otra índole. Los datos de FIFA durante el Mundial mostraron con exactitud que Messi «camina» cerca del 50% del tiempo, dando un plafón a una discusión mucho más interesante: ¿cómo genera espacios a partir de ese tipo de desplazamientos? Un apartado donde el gol ante México fue solo una muestra de las ventajas que saca el rosarino en esos desplazamientos. Los datos también mostraron que Messi se involucra más en la defensa que otras superestrellas, y que las declaraciones de Van Gaal lo hicieron presionar particularmente más en ese juego, entre otro muchos emergentes que dan pie a nuevas valorizaciones del astro argentino.
Cuando los datos aportan su mayor valor es cuando permiten que no perdamos tiempo en capturas de información tediosas o discusiones menores y podamos concentrarnos en análisis mucho más interesantes sobre el juego y más justos con el aporte de cada futbolista. Para eso, es importante que se deje de lado ese constructo que supone que el analista de datos es un actor que busca explicar todo a partir de las estadísticas. Eso, es tan ilógico como suponer que un preparador físico cree que el rendimiento del equipo depende pura y exclusivamente de su trabajo, que el planteo táctico es una variable que pesa en un partido o que la técnica individual es lo único que importa.
Excelente Matias! Suscribo a todo lo que decís, y sin dudas lo de Valdano es la fiel muestra de gran parte del periodismo futbolero, solo que su voz es un poco más resonante que la de otros
“ Una posibilidad, aunque algo difícil de creer dada su trayectoria, es que Valdano no conozca la profundidad de análisis disponible en el fútbol actual, lo cual sería una lastima”. Difícil de creer, sí. Aunque no encuentro en tu artículo posteriormente otras posibilidades. Tal vez sea así, Valdano no debe tener idea del fútbol actual y está bien que le rebatas, Matías. Es absurdo entrar a comparar trayectorias y es cierto que el fútbol hoy ha cambiado tantísimo que es mejor que te lo explique un Senior Data Analyst. El fútbol que nos está quedando de mapas de calor y expected goals…
Desde Argentina. El aporte del análisis de datos, no solo en el futbol en el deporte todo, es irrefutable y fundamental para apuntar a la excelencia. Si el periodismo utilizara el mismo habría menos tiempo de pantalla y lo de Tini Stoessel -novia de R. de Paul- no tendría relevancia. Como decimos aquí: «Dato mata relato».
¡Saludos!
Valdano!! Agarramela con la mano!!!
Tras leer el artículo de Valdano, pienso que el mensaje que lanza es que los datos hay que tamizarlos, no son una verdad absoluta sin interpretación.
Y lo cierto es que aún estoy esperando un buen razonamiento estadístico por parte de cualquier periodista deportivo, en lugar de vomitar 4 números que supuestamente corroboran sus tesis.
En futbol, hay cosas que se explican con números, y cosas que no se pueden explicar,afortunadamente.
Estoy deseando ver como acaba el tema en el Castellón, por ejemplo.
Muy interesante análisis Matías. Muchas gracias por el artículo. Es uno de los problemas de los datos en la mayoría de los deportes, sobre todo en américa latina, se los menosprecia.
Pingback: Datos detrás del Dato, capítulo 3 – Cómo interpretar correctamente los rankings de los jugadores por partido y competición – Big Data Sports
Pingback: Y DAZN creó al futbolista periodista...