Basta con entrar a la sede tucumana de la Universidad Tecnológica Nacional (Rivadavia 1.050 de la capital) para percibir que se viven días especiales. En conmemoración a los 70 años de vida de la institución, desde el 6 al 28 de junio se celebra el Mes (ya no la Semana) de la Ingeniería. Las instalaciones ya lucen decoradas para la ocasión: la mesa de entrada muestra un recorrido histórico de la Tecnológica (o UTN). Los alumnos, por su parte, se apresuran por guardar lugares para las diferentes actividades del Mes de la Ingeniería previstas para la jornada. Entre ellas, este lunes 10 de junio hubo dos charlas que llamaron la atención de los estudiantes: "Data engineering: preparando y analizando la Copa América 2024” y "Predicción de resultados de partidos de la Copa América con IA (inteligencia artificial)”. "Spoiler": los datos y el corazón están alineados para una posible victoria del equipo de Lionel Scaloni en su debut contra el seleccionado canadiense.

La primera de ellas ocurrió de 18 a 19 en el Aula Magna y estuvo dirigida por el ingeniero en Sistemas de Información egresado de la UTN, Aldo Escobar. Este profesional se especializó en la ingeniería de datos, y realizó una maestría en Management y Analytics en la Universidad Di Tella. A lo largo de la charla, brindó algunos conceptos introductorios sobre el procesamiento de datos informáticos y realizó un repaso sobre las distintas herramientas que dispone el mercado para convertir un dato “crudo” en uno útil.

Es decir, el foco de la primera charla estuvo en mostrar cómo a través de la extracción, la recolección y el "mapeo" (integración) de los datos se puede obtener información valiosa y contextualizada, que puede ser de utilidad para tomar decisiones a futuro. De esa manera, se plantea la posibilidad de extraer datos no estructurados de sitios web, tabularlos (clasificarlos) y apropiárselos para luego realizar determinadas actividades con ellos. En este caso, Escobar realizó una demostración práctica en la que extrajo información de la página web de fútbol Promiedos (resultados, partidos, goles y horarios); utilizó una herramienta para ordenar ese contenido y, de esa manera, la información estadística quedó a disposición del usuario para, por ejemplo, construir un modelo predictivo basado en esos datos. Así, con la información recolectada y analizada del rendimiento de los distintos equipos en el pasado, es posible elaborar un modelo capaz de predecir comportamientos futuros (resultados de partidos).

En la segunda charla, "Predicción de resultados de partidos de la Copa América con IA”, Franco Tralice mostró cómo utilizar esos datos útiles (ya no crudos) y explicó cómo funcionan los modelos de predicción de partidos de fútbol. Tralice es cofundador de Wais (una empresa especializada en la ciencia de datos), es fanático del fútbol, y es hincha y socio de Atlético Tucumán. Junto a su hermano, también admirador del deporte, realizaban apuestas en el Prode (juego de pronósticos deportivos, donde se compite con otros usuarios). Debido a su interés por los números, Franco se preguntó si existía alguna manera de precisar aún más sus predicciones a partir de las estadísticas. Así, empezó a descargar “a mano” información de los partidos de los sitios web de fútbol y armó su propia base de datos con el historial de cientos de partidos. Con el tiempo, cuando empezó a conocer las herramientas de procesamiento, logró automatizar esa tarea y elaboró los primeros modelos predictivos de resultados.

EL CREADOR. Franco Tralice elaboró un modelo de predicciones de resultados de partidos de fútbol.

Las claves de los modelos predictivos

A lo largo de la charla, Tralice brindó algunas nociones clave para comprender mejor el sistema de predicciones.

1. Están basados en información previa. Los modelos tienen en cuenta datos de todo tipo, que le son útiles para conocer mejor a los equipos y les permiten realizar predicciones más exactas. El historial entre ambos equipos; los valores de mercado de los jugadores; los goles esperados (parámetro que evalúa la posibilidad de que un tiro sea gol); las cotizaciones de casas de apuestas y las encuestas de resultados son sólo algunas variables que tiene en cuenta el sistema para arrojar sus resultados.

2. No son exactos. Hay un límite en la predicción de resultados y un posible margen de error. El objetivo de Tralice es que los modelos sean capaces de predecir mejor que un humano.

3. No es lo mismo elaborar un modelo predictivo para un casino que para un prode. En los casinos, "la casa" es quien establece las cotizaciones. Además, en el prode se compite contra otros personas, lo que cambia la lógica de predicciones y el sistema de recompensas.

4. Se utilizan distintos métodos. Uno de ellos es el modelo basado en Poisson, que expresa la posibilidad de que ocurra un suceso (goles) en un determinado lapso de tiempo (partido). Por otro lado, se utiliza la "Simulación de Montecarlo", que emula en reiteradas ocasiones un evento para calcular su probabilidad, basándose en determinados parámetros previamente establecidos. Por último, el método conocido como “Sabiduría de masas” consiste en una serie de predicciones colectivas de un grupo diverso de personas, que tienden a ser más precisas que las de un sólo experto. Un modelo predictivo puede combinar varias de estas metodologías.

Los posibles resultados de Argentina-Canadá según el modelo

A modo de demostración final, Tralice presentó las predicciones de un modelo elaborado por él mismo, basándose en el debut de la Selección Argentina en la Copa América frente a Canadá este 20 de junio. Luego de 100.000 simulaciones, los resultados más frecuentes del experimento favorecieron a la “albiceleste”.

- Argentina 1-0 Canadá: 14,3% de probabilidades.

- Argentina 2-0 Canadá: 11,5% de probabilidades

- Argentina 1-1 Canadá: 10,9% de probabilidades.

- Argentina 0-0 Canadá: 9,8% de probabilidades.

- Argentina 2-1 Canadá: 8,9% de probabilidades.

- Argentina 3-0 Canadá: 7,6% de probabilidades

- Argentina 0-1 Canadá: 5,8% de probabilidades.

- Argentina 3-1 Canadá: 5,5% de probabilidades.

El resto de los resultados posibles se dieron con una frecuencia menor a 5 puntos.

***

Suscribite al newsletter de LA GACETA  “Completa con picante” y recibí semanalmente una selección de noticias para jóvenes con hambre de futuro. ¡Es gratuito!