Análisis de Datos en el Fútbol
“Todo este análisis de datos en el fútbol es una tontería, ¿no?”
Ian Graham había sido contratado para ayudar al equipo de reclutamiento del Tottenham Hotspur, pero su primera reunión con Michael Edwards, su jefe y futuro director deportivo del Liverpool, no iba bien. “Fue larga y agresiva”, explica Graham. “Llamé a mi jefe (en Decision Technology, una empresa de análisis) después de la reunión y le dije que pensaba que Spurs nos iban a dejar caer, porque claramente piensan que somos idiotas. Pero él quería averiguar la respuesta. La forma en que les preguntó, pensé que estaba tratando de hacerme quedar mal, pero honestamente estaba tratando de evaluar la calidad de lo que estábamos haciendo.”
Trabajando bajo Edwards y Jürgen Klopp en Liverpool, el trabajo de Graham ayudó a convertir al club en campeón de la Premier League y de Europa, transformando al equipo en el proceso. Sin embargo, su primera experiencia fue típica de muchos de los pioneros del análisis de datos en el fútbol inglés. Ahora han logrado abrirse paso: su trabajo se ha vuelto común en el reclutamiento, la metodología de entrenamiento e incluso en el lenguaje del deporte.
El Nacimiento de la Revolución de Datos
“Cuando empecé, realísticamente el encargo era: ‘Tenemos muchos datos, creemos que hay algún valor en ello, ¿puedes encontrar algo?’”, dice Sam Green, un exanalista de datos en Opta que luego trabajó en Aston Villa. “Eso era todo. No era como si quisiéramos cambiar el fútbol.”
“Estás viendo a los aficionados tener discusiones en línea sobre goles esperados (xG) y la edad de los jugadores”, añade Graham. “Pero al menos son discusiones sobre cosas que tienen sentido — cosas que realmente preocupan a los clubes, en lugar de lo viejo, ‘¿Quién es el mejor en el vestuario?’”
Generalmente, el nacimiento de la revolución de datos en el fútbol se remonta a mediados de la década de 2000, aunque empresas como Opta y Prozone habían estado recopilando datos desde finales de la década de 1990. En ese entonces, incluso si las ideas eran sólidas, la batalla que enfrentaban sus defensores era que la gente creyera en ello. Parte del problema eran las limitaciones de los datos existentes.
Desafíos en el Análisis de Datos
El béisbol, modelo a seguir del movimiento de análisis, tenía un conjunto de datos que se remontaba a décadas; en contraste, cuando Graham comenzó en Spurs, solo tenía dos temporadas con las que trabajar, con muchas ligas extranjeras completamente inaccesibles. Mientras que en el béisbol, las estadísticas que registran el resultado de cada lanzamiento le decían a los analistas lo que realmente sucedió — alto por dentro, bajo por fuera, dónde se golpeó, cómo se salió — los datos existentes del fútbol no necesariamente hacían lo mismo. ¿Qué valor inherente había en saber que un jugador completó 19 pases?
“El fútbol es uno de los deportes más complejos de analizar, solo por la gran cantidad de personas involucradas”, explica Green, uno de los jugadores clave en la invención de xG. “Necesitas preocuparte por la dinámica de cómo esos 22 jugadores están interactuando, y eso lo hace mucho más difícil.”
“¿Qué es un pase, qué es un desafío aéreo, qué es una salida?” pregunta Sarah Rudd, una de las primeras analistas de datos a tiempo completo en Arsenal. “Es realmente bastante difícil. ¿Ese jugador estaba tratando de centrar o disparar? Hay mucha ambigüedad en torno a estas cosas, así que llegar a un acuerdo entre los recolectores de datos es complicado.”
La Evolución del Análisis en el Fútbol
Muchos analistas en la década de 2000 se encontraron marcados por la reputación de Charles Reep, un visionario en muchos sentidos con su meticuloso análisis manuscrito de patrones de juego en la década de 1950, pero que fue ampliamente criticado por sus conclusiones. Sus ideas fueron propagadas más tarde por personas como Charles Hughes en la década de 1980, lo que posiblemente retrasó estilísticamente al fútbol inglés por décadas.
“Parte de la razón por la que Michael era inicialmente escéptico era que comenzó como analista de Prozone, donde fue empleado para producir informes estadísticos para los entrenadores de Portsmouth”, explica Graham. “Pero sabía que Harry Redknapp y sus asistentes lo habrían echado de la sala, porque el informe era un poco inútil — mostrando el número de sprints y la distancia total.”
“Así que parte de su escepticismo era porque había visto que se hacía mal antes. Teníamos una versión muy temprana de la amenaza esperada y comenzó a desmantelar todas las suposiciones en ella.”
La Importancia de la Comunicación
A pesar de ser encasillados como ‘personas de números’, a veces, su habilidad más importante era una habilidad social: poseer la capacidad de comunicar su trabajo dentro de un club para mostrar su valor. “Las habilidades sociales pueden ser un poco exageradas; todos somos introvertidos”, dice Graham. “Pero tienes que comunicarte.”
En Arsenal, Rudd trabajó para una empresa de análisis temprana llamada StatDNA, que fue adquirida por el club de la Premier League en 2012 para mejorar su reclutamiento de jugadores. “Siempre dependíamos del video como herramienta de comunicación”, explica. “No es que todo tuviera que pasar la prueba visual, pero si intentas afirmar que algo fue una buena acción, y no se veía como tal, la gente se va a oponer.”
Desafíos y Oportunidades en el Futuro
La revolución de datos no fue una progresión lineal, ni siquiera limitada a solo un puñado de pioneros. Desde mediados de la década de 2000, hubo numerosos trenes de desarrollo funcionando simultáneamente: la investigación de apuestas de Tony Bloom y Matthew Benham, propietarios de Brighton & Hove Albion y Brentford respectivamente, equipos de investigación internos en Arsenal y Liverpool, además de consultores externos como Opta y Statsbomb.
“Una de las razones por las que es tan difícil es que hay múltiples formas de ganar — no es como el béisbol donde hay una manera ideal y finita de mover a los jugadores alrededor de las bases”, explica Rudd. “Puedes realmente optimizar eso de una manera que no puedes reflejar en el fútbol.”
Graham está de acuerdo. “No creo que los datos hayan hecho mucho en términos de tácticas todavía, es la respuesta simple. Necesitas un buen modelo de seguimiento para decir algo sobre tácticas, y la mayoría de los equipos no tienen eso.”
En cambio, algunos ven la próxima frontera como teniendo lugar en el entrenamiento. “Los datos de entrenamiento y la mejora de las habilidades de los jugadores van a ser una gran cosa en el futuro”, dice Ted Knutson. “Usar equipos como cámaras de alta velocidad y radar LiDAR puede ayudar a mejorar el golpeo del balón.”
Los analistas de datos han tenido que luchar para defender su papel en el fútbol. A veces los números no hablan por sí mismos, sino que necesitan que alguien hable por ellos. “El sesgo que es útil tener es el contrarianismo”, argumenta Graham. “El fútbol es demasiado reacio al riesgo cuando se trata de cualquier cosa.”
“Encuentra los sesgos, sé sesgado en la otra dirección, y aunque estés equivocado, porque todos los demás están equivocados en la otra dirección, eso te dará una ventaja.”