Um modelo estatístico para campeonatos de Futebol · Sumário • Apresentar um modelo para jogos...

Preview:

Citation preview

Um modelo estatístico para

campeonatos de Futebol

Zwinglio Guimarães

IFUSP

Tratamento Estatístico de dados em Física Experimental - 2016

Sumário

• Apresentar um modelo para jogos de Futebol

– Incerteza dos jogos

– Vantagem de ser o mandante

• Caracterizar campeonatos

• Extrapolação (Basquete)

• Simulações Monte-Carlo

– Avaliar a resolução dos campeonatos

– Comparar diferentes sistemas de disputa

• Conclusões

A arte do Futebol

• Alguns conceitos empíricos:

– Os resultados dos jogos são imprevisíveis

• “Futebol é uma caixinha de surpresas”

• “O jogo se define é no campo”

– O mandante tem maior chance de ganhar

• “Empatar fora de casa é um bom resultado”

– No campeonato Brasileiro os times são mais

equilibrados do que nos regionais

• “No Brasileirão não tem jogo fácil”

O jogo como uma medição

Time A GA x GB Time B

Resultado da partida: R = GA - GB

RInterpretação estatística:

Onde ε é um erro aleatório e Δ é o valor médio esperado para

o resultado da partida (relacionado aos times A e B).

Resultados de jogos

RInterpretação estatística:

pdf(ε) ?

Δ ?

Modelo I – p/ copas do mundo

Δ é a diferença entre as qualidades efetivas de A e B Δ = QA - QB

Ajuste pelo Método dos Mínimos Quadrados permite estimar:

• A qualidade efetiva de cada time, Q

• A incerteza, σ, no resultado R de cada jogo

• As características dos erros, ε, pela análise de resíduos

BA QQR

Ajuste pelo MMQ

Modelo para o resultado

dos jogos:

Na forma matricial:

Onde:

𝑅1 = 𝑄𝐴 − 𝑄𝐵

𝑅2 = 𝑄𝐶 − 𝑄𝐷

⋮𝑅𝑁 = 𝑄𝐴 − 𝑄𝐷

𝑌 = X∙ 𝐴𝐗 =

1 −1 0 00 0 1 −1⋮ ⋮ ⋮ ⋮1 0 0 −1

𝑌 =

𝑅1

𝑅2

⋮𝑅𝑁

𝐴 =

𝑄𝐴

𝑄𝐵

𝑄𝐶

𝑄𝐷

Ajuste de funções lineares nos

parâmetros pelo MMQ (revisão)

• Escrevendo a função modelo como:

𝐆(𝑥) = 𝑎1𝑔1 𝑥 + 𝑎2𝑔2 𝑥 + ⋯ + 𝑎𝑀𝑔𝑀(𝑥)

• O sistema linear de equações do MMQ pode ser escrito

de forma matricial: 𝐷 = 𝐌 𝐴

𝐷𝑙 =

𝑖=1

𝑁𝑦𝑖𝑔𝑙(𝑥𝑖)

𝜎𝑖2 𝑀𝑙,𝑐 =

𝑖=1

𝑁𝑔𝑙(𝑥𝑖)𝑔𝑐(𝑥𝑖)

𝜎𝑖2

cuja solução é: 𝐴 =

𝑎1

𝑎2

⋮ 𝑎𝑀

= (𝐌−1)𝐷 com V 𝐴 = 𝐌−1

Ajuste pelo MMQ - II

O modelo para o resultado dos

jogos na forma matricial:

Implica que a matriz X é:

𝐗 =

𝟏 −𝟏 𝟎 𝟎𝟎 𝟎 𝟏 −𝟏⋮ ⋮ ⋮ ⋮𝟏 𝟎 𝟎 −𝟏

Com:

𝑌 =

𝑅1

𝑅2

⋮𝑅𝑁

𝐴 =

𝑄𝐴

𝑄𝐵

𝑄𝐶

𝑄𝐷

𝑌 = 𝐗 ∙ 𝐴

𝐗 = 𝑔1 𝑔2 𝑔3 𝑔4

Possibilitando escrever M e 𝐷

e determinar 𝐴 pelo MMQ.

Exemplo de resultados (Q) 02

Exemplo de resultados (ε) 02

• Desvio-padrão, σε = 1,3(2)

• Curtose, Kε = 4,0 (14)

Quantificando o ε – COPAS

Mais sobre o ε – COPAS (58 a 06)

• Desvio-padrão, σε = 1,53(6)

• Curtose, Kε = 3,5 (4)

Campeonatos Nacionais: BR

MQQ BA Novo modelo

para Δ:

Distribuição

assimétrica:

Mandante tem

vantagem.

Efeito do mando de jogo – BR

Considerando o

efeito do mando:

MQQ BA

Sem considerar o

mando:

BA QQ

σε = 1,58 (2) Kε = 3,5 (2)

Quantificadores de ε - BRσε = 1.58 (2) Kε = 3.5 (2)

Qualidades dos times no BR

σQ = 0,47 (8)

M = 0,58 (8)

σQ = 0,42 (8)

M = 0,47 (8)

σQ = 0,32 (7)

M = 0,47 (7)

Caracterização do Brasileirão

Caracterização de campeonatos

ε em diversos campeonatosσε ~ 1,55 Kε ~ 3,4

Kε ~ 3.4 e as probabilidades

A x B com

QA – QB = 0,45

M = 0,5

B x A

ALGUMAS APLICAÇÕES

Dúvidas Históricas

Final da copa 98

França 3 x 0 Brasil

Δ = 0,2 (1,5)

copa 1978

Argentina 6 x 0 Peru

Δ = 0,7 (1,1)

Mudança de Q devida ao técnico

EXTRAPOLAÇÃO PARA

CAMPEONATOS DE

BASQUETE

Extrapolação: ε no Basquete

σε ~ 11 Kε ~ 3,4

Extrapolação - Campeonatos

Futebol x Basquete

Assimetrias e Curtoses

SIMULAÇÕES MONTE

CARLO PARA AVALIAR

SISTEMAS DE DISPUTA

R

Simulações Monte Carlo

Interpretação estatística:

Características do ε:

R

Simulações Monte Carlo

Interpretação estatística:

Simular os resultados (Saldo de gols) das partidas de um

campeonato e determinar a classificação obtida segundo os

critérios do campeonato.

As qualidades efetivas e os fatores de mando são definidos com

base nos valores típicos dos campeonatos do tipo escolhido.

MQQ BA Modelo para Δ:

σε ~ 1,55 Kε ~ 3,4Características do ε:

R

Simulações Monte Carlo

Interpretação estatística:

Simular os resultados (Saldo de gols) das partidas de um

campeonato e determinar a classificação obtida segundo os

critérios do campeonato.

As qualidades efetivas e os fatores de mando são definidos com

base nos valores típicos dos campeonatos do tipo escolhido.

MQQ BA Modelo para Δ:

σε ~ 1,55 Kε ~ 3,4Características do ε:

Exemplo Monte Carlo – BRCaracterísticas do Campeonato Brasileiro:

σQ = 0,45 M = 0,50

20 times, pontos corridos 2 turnos

BR (pts corridos 2 turnos, 20 times)

Paulistão (com semifinais, 20 times)

copa do BR (mata-mata, 64 times)

Características comuns:

σε = 1,55 Kε = 3,4

σQ = 0,45 M = 0,50

32 times

Comparação Sistemas

Comparação de sistemas c/ 16 times

Discussão

A modelagem proposta permitiu:

– Quantificar alguns conceitos intuitivos:

• Imprevisibilidade (σε ~ 1,55 é maior que o |Δ| típico)

• Vantagem de ser o mandante (M ~ 0,4 em camp. por pontuação)

• Equilíbrio dos campeonatos (σQ ~ 0,5 em camp. nacionais)

– Identificar semelhanças entre o Futebol e Basquete

• Características dos campeonatos (Imprevisibilidade, vantagem do

mandante e equilíbrio dos times)

– Caracterizar campeonatos e avaliar sistemas de disputa

• O melhor time é o campeão em apenas ~50% das vezes

• Grande dificuldade para definir os 4 melhores (e os 4 piores)

• Segunda fase eliminatória não ajuda a identificar o melhor time

Conclusões

• Propriedades gerais do Futebol e do Basquete

foram obtidos com uma modelagem simples

• Quantificação possibilita outras investigações:

– Origem da vantagem de ser o mandante

– Evolução temporal da Qualidade efetiva

– Causas das incertezas dos jogos

– Relação entre qualidade efetiva e índices técnicos

– Avaliar resultados polêmicos / dúvidas históricas

Futebol e Basquete são caixinhas de incertezas

Previsões (modelo intuitivo)

Desvio-padrão

médio: 0,82 (7)

Comparação Bolão x Copas

BOLÃO:

σε = 0,82 (7)

Kε = 3,7 (6)

COPAS (58 a 06):

σε = 1,53 (6)

Kε = 3,5 (4)

Ajuste pelo MMQ

NDAN

DC

BA

QQR

QQR

QQR

22

11

Da tabela de jogos:

AY X

Na forma matricial:

1001

1100

0011

X

NR

R

R

Y

2

1

D

C

B

A

Q

Q

Q

Q

A

Onde:

O ajuste pelo MMQ - II

AY X

YA T

A

1~

~VXV

11~

XVXV

T

A

Solução só depende de Y, X e Vε:

1001

1100

0011

X

NR

R

R

Y

2

1

D

C

B

A

Q

Q

Q

Q

A

~

~

~

~

~

NIV2

Recommended