BIG DATA en el Fútbol

En un partido de fútbol se capturan alrededor de ocho millones de datos, sincronizados con el tiempo de partido, que registran la información generada por los jugadores y el balón, en el espacio de juego. Esta información, que no se ve a simple vista, ya que el ojo humano solo es capaz de retener el 30% de lo que pasa durante el juego, es almacenada y tratada a través de las herramientas de Big Data para ser utilizada y consultada para tomar decisiones económicas, tácticas, físicas, etc.


El Big Data y la Inteligencia Artificial en el fútbol ha crecido mucho en los últimos años y se están convirtiendo en herramientas fundamentales para obtener mejores resultados y optimizar el rendimiento de los deportistas profesionales. Por eso, los clubes usan estas tecnologías para mejorar la toma de decisiones en la industria del deporte. Mucho más en el futbol profesional al disponer de mayores recursos para poder acceder a este tipo de herramientas y la contratación de personal que sepa utilizarlas y aprovecharlas de una manera más eficiente.


Herramientas más utilizadas en el Fútbol

Las herramientas más utilizadas se podrían agrupar dentro de las siguientes categorías de herramientas:

  • Proveedor de datos deportivos
  • Software de video análisis.
  • Software de rendimiento físico.
  • Herramientas de análisis y visualización.
  • Herramientas de pizarra virtual.

El Big Data en el fútbol en España empieza a nivel muy general en el fútbol base, poniendo algunos ejemplos podrían ser: una base de datos de Excel con los partidos jugados, minutos, goles, tarjetas; partidos grabados, informes escritos sobre un jugador o equipo. Algunas canteras profesionales y clubes más poderosos a nivel base si realizan seguimientos más específicos, tanto a nivel preparación física y equipo propio, como de equipo rival y posibles incorporaciones.

En el fútbol regional o amateur algunos equipos si tienen más instaurados el video análisis, incluso alguna herramienta de visualización o pizarra, pero la gran mayoría se sigue basando en ir a ver rivales, jugadores que vienen a probar o representantes.


A nivel tercera división la aplicación del Big data ha mejorado en los últimos años con la entrada de ProLiga y Fotters, aunque sigue siendo precaria. En su mayoría utilizan video análisis, nube para compartir partidos entre cuerpos técnicos de cada club; si tienen mayores recursos si acceden a herramientas de pago. Sigue siendo muy importante el ir a ver partidos en directo ya que esto te aporta más información ya sea a nivel de seguimiento de rivales o captación de jugadores, aunque se sigue utilizando la vía representante.


Proveedores de datos

En general son herramientas de análisis de video que permite al analista, cuerpo técnico, dirección deportiva… acceder a la información del encuentro en tiempo real, antes y después. El software de los programas utiliza una serie de cámaras distribuidas alrededor del estadio apuntando al campo, consiguiendo seguir los movimientos de los jugadores en tiempo real, contabilizando datos o métricas de lo que realizan los jugadores sobre el terreno de juego.
En segunda B ya entra una plataforma llamada Wyscout que facilita mucho el trabajo de los cuerpos técnicos, con informes estadísticos detallados y completos, análisis de jugadores, rankings de más de 200 competiciones, datos para integrar fácilmente con herramientas BI y software de videoanálisis.

A nivel profesional Mediacoach es una herramienta que nace en 2011 fruto de la colaboración entre LaLiga de Fútbol profesional y el grupo audiovisual Mediapro; a la que popularmente se le conoce como “La herramienta secreta de los entrenadores de la Liga”.


Para la recopilación y procesamiento de la información se han instalado 6 cámaras de alta definición y velocidad, capaces de identificar con precisión la posición de los 22 jugadores, medir cuanta distancia recorren, a que velocidad se mueven, en tiempo real. Estas imágenes se cruzan con la base de datos que contabiliza cada acción técnico-táctica que llevan a cabo los jugadores, teniendo en cuenta la zona del terreno donde ocurra. Compara los perfiles almacenados de cada jugador e indica si sus métricas están por encima o por debajo de la media de su equipo, equipo rival o su perfil específico.
Mediante la tecnología player tracking, el sistema reconoce todos los jugadores del campo y sus dorsales así como el balón en movimiento.

La marca Opta pertenece al grupo Perform, un grupo líder dedicado a contenido y medios deportivos digitales. Esta empresa se dedica a la recopilación, recepción y almacenamiento de datos para distribuir esta información a los clubes que trabajan con ellos. Aunque también funcionan con otras vías de negocio.
En cuanto al fútbol cada partido es analizado por dos analistas, que se encargan de captar y almacenar todos los eventos con balón de cada uno de los dos equipos por partido y posteriormente los datos son revisados por otro analista. Cada analista va registrando los eventos, que se basan en 4 variables:

  1. De que acción se trata (asistencia, gol, falta)
  2. Zona del terreno de juego donde ha sucedido.
  3. Tiempo.
  4. Jugador.
    En cada partido se general alrededor de 2000 eventos.

Instat es una empresa rusa líder en el campo de las estadísticas y el análisis deportivo a nivel mundial. En cuanto a fútbol, InStat Scout incluye videos y datos de más de 400.000 jugadores con más de 6.000 partidos analizados mensualmente. Hay jugadores como Antoine Griezmann y Casemiro que reconocen utilizar esta herramienta para visualizar videos propios y del rival.


Software de Video análisis

El videoanálisis es el estudio de las acciones de juego que ocurren a lo largo de un partido o un entrenamiento. Se realiza a través de una cámara de video, grabando entrenamientos o partidos, y de una herramienta donde introduces este partido; mediante esta herramienta puedes cortar las tomas según fases del juego, zonas, balón parado o lo que necesite el cuerpo técnico para realizar

informes individuales, grupales o de equipo rival. Lo que se pretende es encontrar patrones de juego en las diferentes fases, fortalezas y debilidades.
Alguna de las diferencias entre los software más famosos del mercado son las funcionalidades que pueden disponer.

Nacsport es una empresa canaria que desarrolla programas informáticos de videoanálisis destinados a facilitar el estudio de cualquier disciplina deportiva a través de la observación de registro de acciones en video. Su producto estrella tiene su mismo nombre y es uno de los programas más utilizados por analistas de los equipos en 1ª y 2ª División en España; sin duda una de las empresas lideres en este sector. La Federación Española de Baloncesto ha reconocido públicamente que la utiliza y equipos como el Atlético de Madrid, Sevilla también.

Eric Sport es una herramienta de videoanálisis creada por una empresa con sede en Barcelona. La filosofía de esta herramienta es similar a NacSport.

Longomatch es un producto de la empresa Fluendo, es cierto que da menos posibilidades que las herramientas competidoras, pero con una ventaja interesante al poder disponer de una versión gratuita y así comprobar que es la herramienta que precisas para tus informes. Una variante muy utilizada en el deporte semiprofesional y amateur o incluso en el profesional de deportes menos valorados económica y socialmente.


Todas ellas cuentan con diferentes productos, que varían en el número de funcionalidades que puedes acceder y del precio que estemos dispuestos a pagar. Están disponibles para las diferentes disciplinas deportivas (fútbol, baloncesto, balonmano, hockey, rubgy, beisbol…etc.).


SportsCode es un software de videoanalisis perteneciente a la empresa Hudl. Tiene la limitación de estar únicamente disponible para MAC OS. La diferencia que presenta este software con respecto a las demás es que dispone con una herramienta match traker que funciona en vivo con datos proporcionados por Opta. Aunque también permite realizar análisis prepartido, crear gráficos y campo gramas.


Mediacoach además de ser proveedor de datos también cuenta con un apartado de video análisis con datos de Opta y Traking con datos de las cámaras de Tracab ChryronHego.


Herramientas de Análisis y Visualización

Herramientas de procesamiento y análisis de información. Además de las que nombramos aquí, también hay que citar otras como SAS, SAP PREDICTIVE ANALYTICS.


Su uso dependerá de las necesidades del analista al realizar su análisis. Por ejemplo en caso de IBM Watson Analytics es un sistema cognitivo creado por IBM, capaz de entender el lenguaje humano y responder a preguntas concretas. Esta función facilita la exploración y análisis de datos mediante un sistema de visualización y analítica predictiva. Lo mejor que dispone esta herramienta es su capacidad de interactuar con el usuario.


Tableau es una herramienta de Business Intelligence, es intuitivo y tiene gran capacidad visual de análisis. Permite conectarse a una amplia variedad de tipos de archivo.


Power BI es la principal herramienta de visualización de Microsoft. Destaca por su sencillo manejo y bajo coste. Dispone de versión gratuita el cual puedes cargar una base de datos propia o exporta e interactuar con diferentes tipos de graficas, mapas de dispersión…etc. Por lo que se puede realizar cuadros de mando interactivos de forma muy ágil. La versión de escritorio solo está disponible para Windows pero tienen una app online algo limitada que también se puede utilizar en el resto de sistemas operativos.

Qlik Sense es de las herramientas más sencillas a la hora de adaptar las medidas al desarrollador. Para realizar estas medidas se utiliza una función llamada Set Análisis. También los usuarios opinan que es la más moldeable y personalizable al desarrollador y a los gustos del usuario final.


Software de Rendimiento Físico

También existen herramientas para la obtención de datos a nivel físico como son Catapult o Statsports, a través de un sistema GPS Player Tracking (seguimiento de jugadores a través de dispositivos GPS).

un ejemplo de una visualización en Power Bi con datos Catapult

Este tipo de herramienta ayuda a los entrenadores, preparadores físicos y analistas a saber el estado en que se encuentran sus jugadores y facilita la contabilización de carga. Hay ciertos datos que pueden facilitar la lectura de estos datos como distancias recorridas a alta demanda metabolica (HMLD), medición de las acciones cinemáticas de alta densidad (KHIA), potencia metabólica, distancia recorrida a alta velocidad (HSR), distancia recorrida de alta intensidad (HIBD), aceleraciones/desaceleraciones de alta y media intensidad, distancia explosiva, …