1

🇧🇷 🇧🇷 🇧🇷 Provavelmente não seremos HEXA!! 😅

Ehh amigos acho que não vai ser dessa vez que o hexa virá! Pelo menos de acordo com o modelo que desenvolvi.

Nesses últimos dias trabalhei em um projeto para tentar prever o resultado da Copa do Mundo 2026 usando Machine Learning.

A ideia principal do projeto é a seguinte:

  • Treinar um modelo classificador para predizer as probabilidades de partidas da copa do mundo, por exemplo:

    Brasil vs França
    Brasil vence 40%
    França vence 30%
    Empate 30%

  • Depois de uma série de validações dos modelos, selecionar o que apresentar melhor performance e fazer uma simulação Monte Carlo da Copa do Mundo de 2026 com 1.000.000 de iterações com base nas probabilidades geradas;

  • A partir do resultado da simulação, calcular as probabilidades de cada seleção de chegar ao título.

Utilizei como features:

  • Rating das seleções dos games EA Sports FIFA;
  • Ranking da FIFA;
  • Número de títulos das seleções, para representar a tradição;
  • Elo rating, que é um sistema de ranking mais elaborado que o ranking da FIFA, que leva em consideração o contexto das partidas.

O dataset foi construído utilizando partidas das Copas do Mundo entre 2006 e 2022.

O Resultado

TeamTitle Probability
🇪🇸Espanha24.82%
🇫🇷França19.67%
🏴󠁧󠁢󠁥󠁮󠁧󠁿Inglaterra14.13%
🇵🇹Portugal12.07%
🇦🇷Argentina10.00%
🇧🇷Brazil04.90%
🇩🇪Alemanha02.44%

O Brasil aparece na sexta posição com apenas 4.90% de chance de ser campeão 😭😭😭.

Outros números da seleção brasileira:

FaseProbabilidade de alcançar
Top 3296.66%
Oitavas61.82%
Quartas39.82%
Semi21.78%
Final10.89%

Validação do modelo

O modelo foi validado utilizando um método chamado Leave-One-World-Cup-Out, onde se treina o dataset com 4 copas e testa em 1. Na avaliação histórica, o modelo apontou corretamente com maior probabilidade de título 3 dos 5 últimos campeões.

World CupActual ChampionPredicted ChampionChampion Probability
2006Italy🥈 France4.94%
2010Spain✅ Spain33.71%
2014Germany✅ Germany19.84%
2018FranceBrazil24.38%
2022Argentina✅ Argentina20.17%
MétricaNúmeros
🏆 Acertou o campeão3 / 5
4️⃣ Campeão entre os 4 primeiros4 / 5

Código fonte

O projeto completo está no GitHub e inclui:

  • Pipeline para preparação dos dados
  • Treinamento dos modelos
  • Hiperparametrização via grid search
  • Avaliação de performance
  • Predição da copa de 2026

https://github.com/e7alves/world_cup_predictor

Artigo mais detalhado:

https://medium.com/@e7alves/predicting-the-fifa-world-cup-2026-champion-with-machine-learning-a21d217284b0

Disclaimer
Não gaste seu dinheiro com apostas com base nos resultados apresentados 😂😂😂
A intenção é apenas diversão e aprendizado.

Carregando publicação patrocinada...
1

oi jovem,
cara, nao sei essa seria a forma ideal de treinar esse modelo, justamente pq parece ser muito subjetivo usar apenas essas caracteristicas, sem usar talvez a habilidade combinada de jogadores individualmente...
concordo que pegar as diferencas entre os times rating between both teams sao interessantes;
isso daqui foi engracado: "EA Fifa game rating" uahuahe
inclusive, seria ateh interessante pegar o valor da cartinha de cada jogador la no fifa e testar as partidas jogadas... daria um trabalho desgracado, mas seria o suprassumo rsrsr
de forma geral, muito legal;

feature_descriptions = {
    "att_diff": "Difference in attacking rating between both teams (EA Fifa game rating).",
    "mid_diff": "Difference in midfield rating between both teams (EA Fifa game rating).",
    "def_diff": "Difference in defensive rating between both teams (EA Fifa game rating).",
    "fifa_rank_diff": "Difference in FIFA ranking positions.",
    "titles_diff": "Difference in number of World Cup titles won.",
    "elo_diff": "Difference in Elo ratings between both teams."
}