Upload
others
View
0
Download
0
Embed Size (px)
Citation preview
Big-Data- and Data-Science-Day 2018KONZEPTION EINES TRACKING-BASIERTEN SYSTEMS ZUR SPIELERBEWERTUNG IM FUßBALL
Agenda1. Einführung
2. Opta Daten
3. Methoden
4. Designprinzipien
5. Implementierung der Artefakte
6. Ergebnisse
7. Evaluation
8. Limitationen
9. Fazit und Ausblick
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
EinführungZiel der Arbeit:
▪ Erstellung eines Systems zur individuellen Spielerbewertung
▪ Top 10 Spieler identifizieren
Datenbasis:
▪ Opta Event Daten
Verwendete Technologien:
▪ RapidMiner
▪ Tableau
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Opta Daten
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
▪ 306 Spiele der 1. Bundesliga Saison 2016/17
▪ Je Spiel 1500 bis 2200 Events
▪ → 575.078 aufgezeichnete Events
MethodenExpected Goals:
▪ Reines XG-Modell
▪ Zonenbasiertes XG-Modell
Expected Possession Value:
▪ Bewertung ob ein Ballbesitz sich positiv oder negativ ausgewirkt hat
▪ Problem: Nur die Position des aktuellen Spielers des Events bekannt
▪ Lösung: XG-Zonenmodell als Bewertungskriterium
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Methoden – Expected Goal
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Reines XG-Modell:
▪ Tore ÷ Schüsse
▪ Wird häufig auf Teamebene verwendet
Zonenbasiertes XG-Modell:
▪ Einteilung des Spielfelds
▪ Bewertung der einzelnen Zonen (nicht Spieler)
Bildquelle: Cronin, B. (2017): An analysis of different expected goals models
Methoden – Expected Possession Value
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
▪ Kommt ursprünglich aus dem Basketball
▪ Bewertet Aktion bezüglich der Veränderung der potentiellen Wahrscheinlichkeit zu Punkten
Bildquelle: Cervone, D.; D‘Amour, A.; Bronn, L.; Goldsberry, K. (2014):POINTWISE: Predicting Points and Valuing Decisions in Real Time with NBA Optical Tracking Data
Expected Goal Zonen
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
XG-Modell erstellen:
▪ Schüsse & Tore den Zonen zuweisen
▪ Zonenwert = Tore/Schüsse
Expected Goal Berechnung
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Eigentore
Schüsse & ToreSchüsse & Tore
Inklusive Zonen
Tore
Inklusive Zonen
Rekonstruktion des Laufwegs
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
▪ Es handelt sich beim ersten Event um ein Event vom Typ Pass
▪ Der Startpunkt des zweiten Events ist ungleich dem Zielpunkt des ersten Events
▪ Beide Events werden vom gleichen Team durchgeführt
▪ Der Ausgang des ersten Events war positiv
Designprinzipien1. Extraktion der Zielkoordinaten
2. Generierung der Zonen
3. Elfmeter und Eigentore entfernen
4. Erstellung Expected Goal Modell
5. Erstellung Expected Possession Value Modell
6. Kombination XG-Modell, EPV-Modell & Zonen
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Implementierung - Einlesen
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
▪ Über alle 306 Spiele iterieren
▪ Umwandeln der XML Struktur in tabellarische Form
→ Pro Event 50 Attribute
Ergebnis:
Collection mit 306 Example Sets
Implementierung - Qualifier▪ Loop über alle
Example Sets
▪ Entfernen von nicht benötigten Attributen
▪ Passzielkoordinaten und Elfmeter als eigene Attribute aus den Qualifiern erzeugen
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Implementierung - Qualifier
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Implementierung – Zonen hinzufügen▪ Startkoordinaten eines
Events mit Zonenraster abgleichen
→ Attribut: Startzone
▪ Bei Events, die Zielkoordinaten besitzen diese ebenfalls abgleichen
→ Attribut: Zielzone
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Implementierung – XG Werte der Zonen▪ Prozess wird zwei mal in
unterschiedlicher Parametrisierung durchlaufen
1. Schüsse + Tore
2. Tore
▪ Anzahl je Zone ermitteln und abspeichern
▪ Die XG Werte der einzelnen Zonen können mit den Outputs dieses Prozesses berechnet werden
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Implementierung – individuelle Spielerbewertung 1
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Implementierung – individuelle Spielerbewertung 2
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
▪ Zuvor errechnete XG Werte für Start- und Zielzonen als neue Attribute hinzufügen
▪ Lag einbauen → damit aufeinanderfolgende Events verglichen werden können
▪ Berechnen der Differenz von Start- und Zielzone, wenn es sich um Dribbel handelt
Implementierung – individuelle Spielerbewertung 2
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Bedingung:
▪ Start ≠ Ziel
▪ Team ID identisch
▪ Outcome = 1
▪ Type_id = 1
→ Differenz Start- und Zielzone Spieler aus E2 zuschreiben
Implementierung – individuelle Spielerbewertung 3
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
▪ Schleife iteriert so häufig über den Subprozess, wie es Attributausprägungen für die Spieler ID gibt
▪ Filtern auf aktuelle Spieler ID
▪ Summieren aller XG Veränderungen
▪ Hinzufügen der Spieler ID zu neuem „Example“
Ergebnisse – Top 10 Spieler
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Evaluation – Abgleich mit den Bewertungen von Kicker und LigaInsider
Vorgehensweise:
▪ Mapping der Bewertungen: Kicker 215 Spieler, LigaInsider 274 Spieler
▪ Normalisieren der Daten → Skala von 0 – 100
▪ RMSE und MAE des Zonenmodells und Kicker bzw. LigaInsider berechnen
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
𝑧𝑖 = 100 ∗𝑥𝑖 −min 𝑥
max 𝑥 − min 𝑥
σ𝑖=1𝑛 |𝑦𝑖 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑 𝑣𝑎𝑙𝑢𝑒 − 𝑦𝑖(𝑎𝑐𝑡𝑢𝑎𝑙 𝑣𝑎𝑙𝑢𝑒)|
𝑛MAE =
σ𝑖=1𝑛 𝑦𝑖 𝑝𝑟𝑒𝑑𝑖𝑐𝑡𝑒𝑑 𝑣𝑎𝑙𝑢𝑒 − 𝑦𝑖 𝑎𝑐𝑡𝑢𝑎𝑙 𝑣𝑎𝑙𝑢𝑒
2
𝑛RMSE =
Evaluation – RMSE & MAE
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Kennzahl Vergleichsbewertung Wert
RMSE Kicker 26,10
RMSE Kicker gefiltert auf offensiv 22,22
RMSE LigaInsider 23,48
MAE Kicker 22,55
MAE Kicker gefiltert auf offensiv 19,18
MAE LigaInsider 21,00
Evaluation – Designprinzipien
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Kicker RMSE LigaInsider RMSEKicker mittlerer absoluter Fehler
LigaInsider mittlerer absoluter Fehler
Zonenmodell - bereinigt 26,10 23,48 22,55 21,00
Zonenmodell - nicht bereinigt 34,69 29,92 31,57 35,32
reine XG Werte 39,18 33,22 36,25 33,98
Evaluation – Abgleich Top 15Kicker LigaInsider Zonenmodell
A. Robben T. Alcântara A. Robben
F. Ribery A. Robben O. Dembélé
R. Lewandowski R. Lewandowski F. Ribéry
E. Forsberg E. Forsberg P. Aubameyang
P. Lahm M. Kruse T. Alcântara
T. Alcântara H. Çalhanoğlu P. Lahm
O. Dembelé P. Aubameyang T. Werner
M. Kruse F. Ribéry A. Kramaric
T. Werner N. Keita E. Forsberg
N. Keita M. Ferreira de Souza T. Müller
S. Rudy A. Vidal J. Brandt
M. Reus O. Dembélé S. Zuber
K. Demirbay P. Lahm Wendell
A. Modeste X. Alonso M. Gómez
M. Javi T. Werner S. Wagner
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Kicker +Zonenmodell= 7 Übereinstimmungen
LigaInsider +Zonenmodell= 8 Übereinstimmungen
Limitationen
▪ Modell eignet sich nur für offensive Spieler
▪ Daten sind beschränkt auf eine Saison
▪ Spielzeit wurde nicht miteinbezogen
▪ Opta Daten:
▪ Nur die Position des Spielers, der das aktuelle Event durchführt ist bekannt
▪ Beschränkung der Bewertungsfaktoren auf Ballbesitz
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Fazit und AusblickFazit:
▪ Modell eignet sich als Indikator für die Bewertung von offensiven Leistungen
▪ Für eine umfassendere Bewertung muss das Modell angepasst oder ergänzt werden
Ausblick:
▪ Zonenmodell verbessern:▪ Feinere Zonen
▪ Geschwindigkeit und Distanz eines Sprints miteinbeziehen
▪ Modell für Defensivleistungen▪ Zonenmodell erweitern
▪ Separates Modell
BACHELORKOLLOQUIUM CHRISTOPHER FUNKE
Vielen Dank für Ihre Aufmerksamkeit