Prognose - Wer gewinnt die WM 2018?
In den folgenden Tagen der Fußball WM zeigen wir Euch hier in unserem Blog datenbasiert und täglich neu berechnet unsere Antwort auf die Frage, wer die Top-Favoriten für den FIFA WM Pokal sind.
"Die Wahrscheinlichkeit, nicht Meister zu werden, ist größer als die Wahrscheinlichkeit, dem Abstieg nicht zu entgehen." Dettmar Cramer
Hier seht ihr unsere heutige Antwort vom 14.07.2018 um 23:00 Uhr
Fußball-WM Prognose 2018: Wer wird Weltmeister? Schlägt Data Science das Tierorakel?
Überall auf der Welt, am Kiosk, im öffentlichen Nahverkehr und vor allem in unzähligen Tippgemeinschaften, beschäftigen sich gerade gewiefte Fußballfans mit der Frage: Wer wird Weltmeister der Fußball WM 2018?
Wir haben die Fußball-Weltmeisterschaft 2018 mit Hilfe statistischer Data Science-Modelle 10.000 Mal simuliert und so die Wahrscheinlichkeiten für den nächsten Fußball-Weltmeister und damit die WM Favoriten bestimmt.
Die Frage ist, ob wir es mit unserer INWT Statistics WM Prognose schaffen, besser als das offizielle WM Orakel, die taube Katze Achilles, zu sein.
WM Orakel Achilles: Tierische WM Prognosen bestimmen, wer Weltmeister wird?
Seit Wochen streiten ExpertInnen aller Couleur: Wer ist diesmal der WM Favorit? Wer wird nach dem WM Finale am 15. Juli 2018 zum neuen Fußball-Weltmeister gekürt und darf die „flaschengroße Goldstatue“, den FIFA WM Pokal, in den Händen halten und sich selbst mit Sekt, Bier oder vielleicht Wodka benässen?
Auch bisher musste man sich beim Tippen und bei Fachgesprächen zu dem Thema „Wer gewinnt die WM?“ nicht nur auf sein Bauchgefühl, das Studium von Fußballfachliteratur sowie sein in unzähligen Fußballspielen erworbenes Fachwissen verlassen. Man konnte sich auch auf die anerkannten WM Prognosen der Fußball-Orakel stützen. So sagte Krake Paul aus Oberhausen (Nordrhein-Westfalen) 2010 den Ausgang aller sieben WM Spiele der deutschen Mannschaft richtig voraus, indem er sich zwischen Muschelfleisch aus einem von zwei Gläsern entscheiden musste. Seine Muschelfleischprognosen waren so gut, dass Paul für seine fundierten Vorhersagen sogar Morddrohungen von enttäuschten Fans und folglich Personenschutz erhielt.
Für die kommende WM 2018 in Russland wird die taube, weiße Katze Achilles aus der Eremitage in St. Petersburg seinen Platz einnehmen. Achilles hatte sich beim Confed Cup 2017 als offizielles, tierisches WM Orakel qualifiziert, als er den Sieg Russlands gegen Neuseeland vorhergesagt hatte. Für die Fußball-Weltmeisterschaft 2018 hat er nun Vor-Ort-Kenntnis, was seinen WM Prognosen durchaus zugutekommen dürfte. Achilles tut seine Vorhersageergebnisse kund, indem er zwischen zwei Schüsseln mit Katzenfutter wählt, auf denen jeweils eine Flagge der Mannschaften zu sehen ist.
Weiß Achilles, wer die WM 2018 gewinnt?
Bei einer 50%-Tippgenauigkeit (kein Orakel) sollte man 3 bis 4 richtig prognostizierte Spielergebnisse bei 7 Deutschlandspielen erwarten. Gehen wir davon aus, dass Achilles über fundiertes Fachwissen und übersinnliche Fähigkeiten verfügt, sollte die Wahrscheinlichkeit höher als 50% sein, also zum Beispiel 75%. Dann müsste er die Ergebnisse von 5 bis 6 von 7 Deutschlandspielen richtig vorhersagen.
Das ist schon recht viel. Übrigens gehen wir hier auch stillschweigend davon aus, dass Deutschland ins Finale kommt, also wirklich 7 Spiele spielt. Das ist natürlich gewagt. Doch trotz Achilles erwiesener Qualifikation und daher auch hoher Trefferwahrscheinlichkeit haben seine WM Prognosen einen entscheidenden Haken: Die Vorhersagen basieren nur auf seiner eigenen, ganz persönlichen Einschätzung, so fundiert sie auch sein mag.
WM Prognose 2018: Data Science vs. Tierorakel – wir stellen uns Achilles
Als Unternehmen für Data Science und Predictive Analytics ist unser Unternehmen INWT Statistics darauf spezialisiert, mit Hilfe von großen Datenmengen und statistischen Modellen qualifizierte und sehr genaue Vorhersagen für unsere Kunden zu treffen. Das klappt für viele Themenbereiche: Letztes Jahr haben wir die Ergebnisse der Bundestagswahl 2017 vorhergesagt. Über unser INWT Statistics Wahlprognose-Tool berichtete damals sogar die New York Times. Unsere Vorhersagen waren im Mittel zwischen 5 und 9 Prozent besser als die Wahlprognosen aller renommierten Meinungsforschungsinstitute.
Natürlich kann man einwenden: Fußballspiele sind nicht einfach nur Daten. Vielleicht sogar: Fußball ist unser Leben. Fußballfans mag beruhigen: wir kennen uns nicht nur mit Prognosen aus, sondern haben auch ausgewiesenes Fußballwissen. Seit mehreren Jahren schon unterstützen wir den Wettanbieter Tipico bei der Berechnung von deren Live-Wettquoten, auch im Bereich Fußball.
Wir hoffen, dass wir daher auch bei der Frage „Wer ist WM Favorit?“ und „Wer gewinnt die WM 2018 in Russland?“ an unseren letztjährigen Prognose-Erfolg anknüpfen können. Schließlich gilt auch für uns: "Das nächste Spiel ist immer das nächste" (Matthias Sammer).
Data Science und Predictive Analytics im Fußball: WM Prognosen auf Basis statistischer Modelle
Eines müssen wir zugeben: Auch wir können nicht die Zukunft komplett vorhersagen (und hier könnte WM Orakel Achilles aufgrund übersinnlicher Fähigkeiten einen entscheidenden Vorteil haben – wir werden sehen). Wir können also nicht mit kompletter Sicherheit sagen, wer Weltmeister wird, wie weit Deutschland kommt oder welche Teams ins Halbfinale einziehen. Das liegt ganz einfach daran, dass die Zukunft eben nun mal unsicher ist. Eine Verletzung durchs falsche Foul zur falschen Zeit am falschen Ort – und schon ist alles anders.
Das bedeutet für alle Fußballfans und Wettbegeisterte an dieser Stelle:
- auch ein sehr unwahrscheinliches Ereignis kann durchaus eintreten,
- und auch ein sehr wahrscheinliches Ereignis muss nicht zwangsläufig eintreten.
Was wir aber mit Hilfe von Data Science und Predictive Analytics können: sehr genau und verlässlich prognostizieren, wie wahrscheinlich es beispielsweise ist, dass Argentinien den Siegerpokal in den Händen halten wird, dass Deutschland gegen Mexiko 3:1 gewinnt oder dass Saudi-Arabien ins Halbfinale einziehen wird.
Wir können und werden euch also sagen, wer am wahrscheinlichsten Weltmeister wird. Nicht Peru. Aber auch wenn es sehr unwahrscheinlich ist – ihr dürft Peru oder anderen Eurer Herzensmannschaften trotzdem entspannt die Daumen drücken … denn wer weiß, wer am Ende lacht.
INWT Statistics WM-Prognose: Buchmacherquoten, Fifa-Weltrangliste und historische Daten als Datengrundlage
Als zentrale Datengrundlage für die Modellierung der INWT Statistics Prognose zur Fußball-Weltmeisterschaft 2018 und der Frage „Wer gewinnt die WM 2018“ dienen drei unterschiedliche Datenquellen:
- die Ergebnisse aller Qualifikations- und Freundschaftsspiele der letzten zwei Jahre, an denen die Fußballnationalmannschaften teilgenommen haben;
- die Fifa-Weltrangliste für Fußballnationalmannschaften; und
- die Buchmacherquoten zum WM-Sieger und zu einzelnen Begegnungen der Fußballnationalmannschaften.
Die Wettquoten der Buchmacher beim Fußball enthalten die Einschätzung der wettenden Fußballfans und der Buchmacher zu den Ausgängen von zukünftigen Fußballspielen. Das Schöne an diesen Daten ist: Die Wettquoten bilden die Erwartungen der Fußballfans und -experten komplett ab. Sonst könnten die Buchmacher sehr viel Geld verlieren.
Die Buchmacher berechnen für ihre Dienste als Wettanbieter zusätzlich zu den reellen Gewinnquoten noch einen Aufschlag. Daher bereinigen wir die Buchmacherquoten mit einem speziellen Verfahren von diesem Aufschlag. Wir nutzen die Buchmacherquoten von Tipico im Bereich Fußball, die auf der Website von Tipico für die Allgemeinheit öffentlich zugänglich sind. Tipico gehört zu den drei größten seriösen Anbietern für Fußballwetten weltweit und ist langjähriger Kunde von INWT.
Die Daten der FIFA-Weltrangliste (offizielle Bezeichnung FIFA/Coca-Cola-Weltrangliste), die vom Weltverband FIFA geführt wird, bilden die Grundlage für die Einteilung der Nationalverbände in Setztöpfe zur Auslosung der WM-Qualifikationsgruppen. Die Fifa-Weltrangliste berücksichtigt alle Leistungen der Nationalmannschaften der vergangenen Jahre und gewichtet diese nach deren Wichtigkeit (Freundschaftsspiele bekommen zum Beispiel ein geringeres Gewicht als Weltmeisterschaftsspiele).
Auch die Ergebnisse der vergangenen Qualifikations- und Freundschaftsspiele nehmen wir mit in unsere Prognose auf, denn manchmal schlummert auch bei diesen Partien historisches Potential. Die Ergebnisse der vergangenen Qualifikations- und Freundschaftsspiele fließen mit verschiedenen Faktoren wie Motivation, Heimvorteil, Mannschaftsstärke im Turnierverlauf und kürzliche Ereignisse in unser statistisches Modell zu den Gewinnquoten ein.
WM Vorhersage mit Data Science: Unsere Methodik zur statistischen Modellierung der Ergebnisse der Fußball-Weltmeisterschaft 2018
Im Wesentlichen besteht die statistische Modellierung unserer Prognose aus drei Schritten:
Schritt 1:
Die Ergebnisse der drei Datenquellen bzw. Datenmodelle (1) Qualifikations- und Freundschaftsspiele, (2) Fifa-Weltrangliste und (3) Buchmacherquoten zum WM-Sieger gewichten wir und berechnen für jede denkbare Begegnung zwischen zwei Fußballnationalmannschaften die Wahrscheinlichkeiten für Sieg, Niederlage und Unentschieden sowie die Anzahl von Toren, die die beiden Mannschaften wahrscheinlich schießen werden.
Schritt 2:
Die Berechnungen für Sieg, Niederlage, Unentschieden und Toranzahl reichen jedoch nicht aus. Wer Gruppenerster oder -zweiter wird, kann von dem Torverhältnis abhängen, daher muss der Spielausgang mit den geschossenen Toren für beide Mannschaften simuliert werden.
Wir gehen davon aus, dass die Torverhältnisse eines Fußballspiels einer bestimmten statistischen Verteilung gehorchen: der (bivariaten) Poissonverteilung. Die Poissonverteilung ist für die Torverhältnisse gut geeignet, weil sie die „Verteilung der seltenen Ereignisse“ aufzeigt. So ist die Wahrscheinlichkeit, dass ein bestimmtes Torverhältnis in einem Fußballspiel eintritt, aufgrund der Vielzahl der möglichen Ausgänge sehr gering.
Gleichzeitig kann man sich durch die Eintrittswahrscheinlichkeiten der Torverhältnisse die Größenordnungen gut bewusst machen. Wir können so die Wahrscheinlichkeit berechnen, dass bei einem Spiel ein bestimmtes Torverhältnis erzielt wird. Das ist gut für unsere WM-Vorhersage 2018: Denn es gibt uns die Möglichkeit, die Wahrscheinlichkeiten vorherzusagen, welche Mannschaft welches Spiel der Fußball-WM gewinnen wird – und wer Weltmeister wird. Natürlich berücksichtigen wir in der KO-Phase auch Verlängerungen und Elfmeterschießen.
Schritt 3:
Doch wie schon gesagt: Der konkrete Ausgang einer Begegnung ist sehr unsicher. Der Verlauf einer WM für eine bestimmte Fußballmannschaft hängt außerdem von den Ergebnissen der Begegnungen zwischen den anderen Fußballmannschaften ab. Spielt Brasilien gegen Deutschland oder vielleicht eher gegen Mexiko oder Schweden im Achtelfinale? Geringe Unterschiede z.B. in der Tordifferenz können zu einem völlig anderen Turnierverlauf führen. Daher simulieren wir den gesamten Verlauf der WM in einer so genannten Monte-Carlo-Simulation.
Die Monte-Carlo-Simulation ist ein statistisches Verfahren, bei dem sehr viele gleichartige Zufallsexperimente durchgeführt werden. Wir tun also so, als würde die Weltmeisterschaft nicht nur ein einziges Mal, sondern 10.000 Mal stattfinden. Daraus können wir solide ableiten, welches der wahrscheinlichste Ausgang für bestimmte Ereignisse (beispielsweise: Wer wird Weltmeister?, Wer wird wahrscheinlich Gruppenzweiter in Gruppe A? oder auch: Wer scheidet wahrscheinlich im Achtelfinale aus?) sein wird.
Links
- fussballmathe.de
- FIFA World Cup 2018: A Data-Driven Approach to Ideal Team Line-Ups (James Le auf towardsdatascience.com)
- Prediction competition for FIFA World Cup 2018
- INWT Statistics Wahlprognose-Tool
- Probabilistic Forecasting for the 2018 FIFA World Cup by Achim Zeileis
- Russland: WM-Orakel 2018 - Katze Achilles - Video - WELT.de
- Prediction of the FIFA World Cup 2018 - A random forest approach with an emphasis on estimated team ability parameters