Usualmente se utiliza(ba?) la cantidad de remates total y la cantidad de remates al arco como medida de creación de chances de gol, pero en realidad es un indicador limitado para evaluar la performance de un equipo o jugador.
Como forma de resolverlo es que se define xG (expected Goals, en inglés), o goles esperados, una métrica que se ha vuelto popular en el último tiempo.
Definición
Se habla de gol esperado en el sentido del concepto estadístico “valor esperado”, que mide la probabilidad de que un determinado hecho ocurra. Para calcularlo es necesario considerar una gran cantidad de remates (cientos de miles), identificar las características de cada uno y entrenar un modelo matemático basado en esas variables que nos devuelva el valor de xG para una instancia de remate específica.
En pocas palabras, dado un remate al arco, se calcula la probabilidad de que éste sea gol basándose en un histórico de (muchos) remates anteriores. Para ello se tienen en cuenta múltiples factores, tales como1:
- la posición desde la que se patea
- la distancia y el ángulo de visión respecto del arco
- la parte del cuerpo con la que se efectúa el tiro
- cómo le llegó la pelota al jugador en cuestión (pelota parada, cruce, contraataque, etc)
Con esa información se evalúa la calidad de una ocasión de gol y se estima una probabilidad (es decir, un número entre 0 y 1), siendo 0 un intento imposible de convertir y 1 un remate que siempre termina en gol. Como es de esperar, una situación dentro del área chica tiene mayor chance que una fuera del área grande.

Un posible modelo de xG, del libro Soccermatics
Entonces, si a una ocasión dada se le asigna un xG de 0.2 significa que se espera que un jugador promedio la termine en gol en 1 de cada 5 remates de iguales características (o lo que es lo mismo, un 20% de las veces).
En el caso de los penales se define un modelo específico, y en general se distingue entre xG y npxG (non-penalty expected goals) para explicitar si se incluyen o no los penales en el cálculo. En la práctica, a los tiros desde el punto del penal se les otorga un valor constante de xG: 0.79, que es el promedio de veces que un penal se convierte. Asimismo se suelen modelar por separado los tiros libres directos.
Cómo se usa
Esta métrica sirve como una herramienta para medir la performance de un equipo o un jugador, comparando la suma de xG para las ocasiones generadas contra los goles efectivamente convertidos en un período dado (un partido, un torneo, varios, etc).
Si la diferencia entre goles convertidos y el valor de la suma de xG es menor que cero (goles < sum(xG)), el equipo o jugador han rendido por debajo de lo esperado; si se da la relación inversa (goles > sum(xG)), la performance habrá estado por encima (ya sea por pericia al definir, o suerte). Un valor consistentemente mayor indicaría habilidad por sobre el promedio.
Por citar un ejemplo, el valor de xG de Lionel Messi en su última temporada en Barcelona fue 23.6 y convirtió 30 goles. Por otro, Nicolás González, un jugador que suele tener situaciones favorables pero no siempre las concreta (aunque no necesariamente es su rol tampoco), en la misma temporada en el Stuttgart tuvo xG 8.1 pero convirtió 6 goles2.
Para un equipo también tiene sentido considerar el xG en contra (xGA, expected goals against), esto es, la calidad de las situaciones que le generan, y obtener una medida de la solidez defensiva.
Tomando en cuenta ambos valores (xG y xGA) se puede obtener una referencia de cuál sería la performance esperada/ideal de un equipo en una competencia particular. Un equipo con un xG consistentemente mayor que su xGA es esperable que ocupe una mejor posición en la tabla que otros que no. De manera similar se podría identificar la habilidad para defender o generar situaciones de gol en determinadas circunstancias (corners, tiros libres, etc).
Finalmente, vale notar que se trata de un valor calculado a posteriori, no sirve para predecir un resultado. Tampoco ayuda a determinar si un resultado fue justo o no. Si un equipo termina con un xG mayor que su rival en un partido, no necesariamente implica que haya ganado el encuentro. Esta métrica refleja la calidad de las situaciones de gol producidas, pero al final gana el que hace más goles.
Algunos ejemplos de cómo se refleja esta métrica en distintas visualizaciones:
Se viene la esperada final de la #CopaAmerica entre Argentina 🇦🇷 - 🇧🇷 Brasil, y hay un duelo que sobresale: Messi vs Neymar. pic.twitter.com/wrYXSuTqa8
— Matías Bordese (@mbordese) July 9, 2021
The blame in Spain falls mainly on the main (strikers)
— The Analyst (@OptaAnalyst) June 19, 2021
For Poland meanwhile it was job done and back to defending after Lewandowski headed them level#Euro2020 #SPAPOL pic.twitter.com/NR2coU4vGu
Lionel Messi's Goalscoring Performance in La Liga:
— Anmol Durgapal (@slothfulwave612) May 18, 2021
1) He has outperformed his xG in every season.
2) He has scored more than 20 goals in each season since 2008-09. That's 13 consecutive seasons.
3) He has scored >= 30 goals in nine seasons.
4) Best Season - 2011/12 - 50 goals.🐐 pic.twitter.com/ui03JZxLTE
Algunas métricas derivadas
xA (expected assistances, asistencias esperadas)
Para contemplar también a los jugadores que dan el pase previo a un remate, se calcula como el valor de xG del remate resultante del pase.
Post-shot xG
La mayoría de los modelos no consideran dónde termina el disparo (afuera, o en qué coordenadas del arco). En este caso, sí, lo cual es útil para evaluar la performance de un arquero por ejemplo.
Mejoran los resultados si se cuenta con más data (e.g. tracking data): cantidad de defensores entre la pelota y el arco, posición del arquero, presión sobre el jugador, altura de la pelota, pierna hábil, etc. Distintos proveedores de datos tienen sus diferentes modelos basados en su respectiva disponibilidad de información. ↩︎