🇧🇷 🇧🇷 🇧🇷 Provavelmente não seremos HEXA!! 😅
Ehh amigos acho que não vai ser dessa vez que o hexa virá! Pelo menos de acordo com o modelo que desenvolvi.
Nesses últimos dias trabalhei em um projeto para tentar prever o resultado da Copa do Mundo 2026 usando Machine Learning.
A ideia principal do projeto é a seguinte:
-
Treinar um modelo classificador para predizer as probabilidades de partidas da copa do mundo, por exemplo:
Brasil vs França
Brasil vence 40%
França vence 30%
Empate 30% -
Depois de uma série de validações dos modelos, selecionar o que apresentar melhor performance e fazer uma simulação Monte Carlo da Copa do Mundo de 2026 com 1.000.000 de iterações com base nas probabilidades geradas;
-
A partir do resultado da simulação, calcular as probabilidades de cada seleção de chegar ao título.
Utilizei como features:
- Rating das seleções dos games EA Sports FIFA;
- Ranking da FIFA;
- Número de títulos das seleções, para representar a tradição;
- Elo rating, que é um sistema de ranking mais elaborado que o ranking da FIFA, que leva em consideração o contexto das partidas.
O dataset foi construído utilizando partidas das Copas do Mundo entre 2006 e 2022.
O Resultado
| Team | Title Probability | |
|---|---|---|
| 🇪🇸 | Espanha | 24.82% |
| 🇫🇷 | França | 19.67% |
| 🏴 | Inglaterra | 14.13% |
| 🇵🇹 | Portugal | 12.07% |
| 🇦🇷 | Argentina | 10.00% |
| 🇧🇷 | Brazil | 04.90% |
| 🇩🇪 | Alemanha | 02.44% |
O Brasil aparece na sexta posição com apenas 4.90% de chance de ser campeão 😭😭😭.
Outros números da seleção brasileira:
| Fase | Probabilidade de alcançar |
|---|---|
| Top 32 | 96.66% |
| Oitavas | 61.82% |
| Quartas | 39.82% |
| Semi | 21.78% |
| Final | 10.89% |
Validação do modelo
O modelo foi validado utilizando um método chamado Leave-One-World-Cup-Out, onde se treina o dataset com 4 copas e testa em 1. Na avaliação histórica, o modelo apontou corretamente com maior probabilidade de título 3 dos 5 últimos campeões.
| World Cup | Actual Champion | Predicted Champion | Champion Probability |
|---|---|---|---|
| 2006 | Italy | 🥈 France | 4.94% |
| 2010 | Spain | ✅ Spain | 33.71% |
| 2014 | Germany | ✅ Germany | 19.84% |
| 2018 | France | Brazil | 24.38% |
| 2022 | Argentina | ✅ Argentina | 20.17% |
| Métrica | Números |
|---|---|
| 🏆 Acertou o campeão | 3 / 5 |
| 4️⃣ Campeão entre os 4 primeiros | 4 / 5 |
Código fonte
O projeto completo está no GitHub e inclui:
- Pipeline para preparação dos dados
- Treinamento dos modelos
- Hiperparametrização via grid search
- Avaliação de performance
- Predição da copa de 2026
https://github.com/e7alves/world_cup_predictor
Artigo mais detalhado:
Disclaimer
Não gaste seu dinheiro com apostas com base nos resultados apresentados 😂😂😂
A intenção é apenas diversão e aprendizado.