Donnerstag, 28. August 2014

UEFA Champions League 2014/15: Die wahrscheinlichen Gruppengegner der deutschen Teams


Morgen Abend findet die Auslosung der UEFA Champions League 2014/15 statt. Mit welchen Gegnern müssen die deutschen Mannschaften Bayer Leverkusen, Bayern München, Borussia Dortmund und Schalke 04 rechnen? Mannschaften aus dem gleichen Verband dürfen nicht in einer Gruppe spielen, und aufgrund des aktuellen Konfliktes in der Ukraine darf Schachtar Donezk nicht gegen die russischen Vereine aus Moskau und St. Petersburg antreten. Aus diesem Grund ist nicht jede Gruppenkonstellation gleich wahrscheinlich. 
 
Mit Hilfe einer Monte-Carlo Simulation berechnen wir hier (wie zuvor zum Achtelfinale der letzten Saison) die wahrscheinlichsten Gegner der deutschen Teams. 32 Mannschaften aus 18 Verbänden von Belgien bis Weißrussland verteilen sich dabei gleichmäßig auf vier Töpfe. In jeder der acht Gruppen spielt ein Team aus jedem Topf, wobei in keiner Gruppen zwei Mannschaften eines Verbandes landen dürfen. Deutschland, England und Spanien stellen dabei insgesamt vier Mannschaften, drei kommen aus Portugal. Frankreich, Italien und Russland stellen zwei Teams (wobei rein methodisch Russland und Ukraine mit drei Mannschaften zusammengefasst werden, da diese Teams nicht in eine Gruppe zugelost werden dürfen). Die übrigen Teams kommen jeweils aus anderen Ländern.
Die Verbände unterscheiden sich allerdings nicht nur in Bezug auf die Anzahl der Mannschaften, die sie stellen, sondern auch in Hinblick auf die Verteilung der Töpfe, wie folgende Tabelle zeigt:

Drei der acht Mannschaften in Topf 1 kommen aus Spanien, zwei aus Portugal und England, und mit Bayern München ist eine deutsche Mannschaft im höchsten Los vertreten. Mit Borussia Dortmund und Schalke 04 finden wir zwei weitere deutsche Vereine in Topf 2. In Topf 3 ist Bayer Leverkusen durch die Champions League Qualifikation gelangt. Die drei Spanier aus Topf 1 können dabei alle Mannschaften aus Topf 2 als Gruppengegner zugelost bekommen, aber mehrere deutsche Mannschaften dürfen nicht in einer Gruppe landen. Auch darf Manchester City als einziges englisches Team aus Topf 2 nicht gegen die beiden Nachbarn aus London Arsenal oder Chelsea (beide Topf 1) spielen. 

Rechnet man nun zusätzlich Topf 3 und Topf 4 ein, so ergeben sich zahlreiche theoretische Kombinationen, die aufgrund des Regelwerkes nicht erlaubt sind. Wie groß wirkt sich dies aus?
Wir verwenden dabei 250.000 Simulationen. Für Bayern München aus Topf 1 ergibt sich dabei mit etwas höherer Wahrscheinlichkeit Manchester City, da dieser Verein durch Arsenal und Chelsea weniger potenzielle Gegner in Topf 1 hat, als die anderen Mannschaften, die gegen Bayern spielen dürfen. In 21% der Simulationen finden sich beide Vereine in einer Gruppe wieder, während dies bei knapp unter 16% der anderen Teams der Fall ist. Bilbao darf gleich gegen drei Mannschaften aus Topf 1 nicht antreten und entsprechend höher ist Wahrscheinlichkeit, dass die Basken gegen die Bayern spielen werden. In Topf 4 sehen wir dagegen kaum Unterschiede, da keines dieser Mannschaften einen Gegner aus dem gleichen Verband in Topf 1 hat. 


Borussia Dortmund und Schalke 04 unterscheiden sich nicht in Hinblick auf die Wahrscheinlichkeiten der möglichen Gruppengegner. Auch sie haben eine leicht höhere Wahrscheinlichkeit eine englischen Gegner zu erhalten (jeweils 32% entweder Arsenal oder Chelsea). ZSKA Moskau ist mit 18,5% der wahrscheinliche Gegner aus Topf 3 (da ZSKA weder gegen St. Petersburg noch gegen Donezk spielen darf) gefolgt von Liverpool mit 15%. Monaco und Rom sind leicht wahrscheinlicher als die übrigen Vereine aus Topf 4 (aufgrund einem franz. und italienischen Team in Topf 2).


Für Bayer Leverkusen ist entsprechend ein englischer Gegner aus Topf 1 ein klein wenig unwahrscheinlicher, dafür ist aber mit Manchester City, Donezk und St. Petersburg, ein Verein auf Topf 2 aus England, Ukraine oder Russland ein wahrscheinlicherer Gruppengegner (18,1% gegenüber etwas über 15%).


Geht man nun von den Wahrscheinlichkeiten für einzelne Gegner weg, und guckt sich die Wahrscheinlichkeiten für unterschiedliche Gruppenkonstellationen an, so findet man beispielsweise, für Borussia Dortmund oder Schalke 04, 336 mögliche Konstellationen, deren Wahrscheinlichkeit zwischen ca. 0,2% und 0,5% liegt. Eine ganze leichte Gruppe ist dabei eher unwahrscheinlich, da insbesondere Monaco und Rom aus Topf 4, oder Liverpool aus Topf 3 hier häufig gezogen wird. Allerdings sind Real Madrid oder Barcelona nicht die wahrscheinlichsten Gegner. Für Bayern München oder Bayer Leverkusen sieht das entsprechend aus.
















Sonntag, 17. August 2014

Spannende Meisterschaften und die Nationalmannschaft

Vor einem halben Jahr haben wir analysiert, wie viele Punkte die jeweilige Meistermannschaft in der Bundesliga sammeln konnte. Die letzten Spielzeiten waren von extrem deutlichen Meisterschaften geprägt, stärker noch als die Bundesligaspielzeiten 1971-1972 und 1972-1973 in denen Bayern München mit jeweils 79 Punkten Meister wurde (umgerechnet auf die 3-Punkte-Regel). In diesem Post wollen wir untersuchen, ob und wie sich dies auf die deutsche Nationalmannschaft ausgewirkt hat. Nebenbei ist dabei natürlich auch die Frage interessant: Wann war die deutsche Nationalmannschaft erfolgreich, mit Spielen aus unterschiedlichen oder wenigen Vereinen? Und profitiert die Nationalmannschaft von eindeutigen Meisterschaften und eingespielten Spielern?

In diesem Post betrachten wir die Vereinszusammensetzung der Startspieler der Deutschen Nationalmannschaft bei Welt- und Europameisterschaften seit 1954. Wie viele Vereine stellen in jedem Turnier die Stammspieler der Nationalmannschaft und wie groß ist die Anzahl der Spieler des Vereins mit dem größten Kontigent? Ist ein großer Block in der Nationalmannschaft wie wir ihn bei dieser Weltmeisterschaft in Brasilien mit Bayern München Spielern gesehen haben ungewöhnlich? Oder haben wir so eine Gruppe bereits häufiger in der Vergangenheit gesehen? Wir beschränken uns dabei auf Startspieler, da die Informationen für Einwechselspieler für die Vergangenheit nicht immer einfach verfügbar ist. Die Daten beruhen auf der Datenbank von weltfussball.de. 

In der folgenden Grafik haben wir die durchschnittliche Zahl der Startspieler von dem Verein, der die meisten Spieler stellt über die Zeit dargestellt. In grau sind dabei die erzielten Punkte der Meistermannschaft in der Bundesliga (seit 1963/1964) dargestellt.

 

Gehen wir chronologisch vor: Die Fußball-Weltmeisterschaft 1954 in Ungarn wurde von Spielern des 1. FC Kaiserslautern dominiert. Der Verein stelle mit Werner Kohlmeyer, Werner Liebrich, Horst Eckel, Ottmar Walter und Fritz Walter zwischen in der Gruppenphase zwischen 3 und 4 Startspieler, in der KO-Runde sogar jeweils fünf Spieler. Insgesamt ein Durchschnittswert von 4,4. Die folgenden Weltmeisterschaft 1958, 1962, 1966 und 1970 konnte kein Verein mehr als drei Startspieler stellen. So spielten zum Beispiel beim verloren gegangen Finale der Weltmeisterschaft 1966 in England, bekannt durch das legendäre Wembley Tor, drei Spieler von Borussia Dortmund, je zwei vom Hamburger Sportverein und dem 1. FC Köln, und je ein Spieler vom AC Mailand, Bayern München, Bologna FC, und SV Werder Bremen. Beim "Jahrhundertspiel", dem Halbfinale der WM 1970 gegen Italien, starteten drei Bayern München Spieler, je zwei HSV und FC Köln Spieler, und je ein Spieler von Borussia Mönchengladbach, AC Mailand, Eintracht Frankfurt und Hertha BSC.  

Aber in der vierten Europameisterschaft 1972 in Belgien, der ersten mit Deutscher Beteiligung, änderte sich dies deutlich. Die deutsche Nationalmannschaft brauchte nur zwei Spiele in der Endrunde mit identischer Startaufstellung zum Titel, in denen standen mit Sepp Maier, Georg Schwarzenbeck, Franz Beckenbauer, Uli Hoeneß, Paul Breitner und Gerd Müller sechs Spieler von Bayern München auf dem Platz. Ansonsten stelle Borussia Mönchengladbach mit Günter Netzer, Herbert Wimmer und Jupp Heynckes drei Spieler und SV Werder Bremen und Schalke 04 mit Horst-Dieter Höttges und Erwin Kremers je einen. Beim zweiten Weltmeistertitel 1974 im eigenen Land änderte sich relativ wenig in Bezug auf die Startaufstellung. Paul Breitner wechselte nach der WM zu Real Madrid und weltfussball.de zählt ihn im historischen Kader schon als Real Madrid Spieler. Entsprechend starteten meist fünf Spieler von Bayern München, nur im Spiel gegen Jugoslawien war es vier. Unter den übrigen Vereinen stellten Borussia Mönchengladbach mit Berti Vogts, Rainer Bonhof, Herbert Wimmer und Jupp Heynckes, 1. FC Köln mit Bernd Cullmann, Heinz Flohe und Wolfgang Overath, Eintracht Frankfurt mit Jürgen Grabowski und Bernd Hölzenbein sowie Fortuna Düsseldorf mit Dieter Herzog Startspieler.   

Die folgenden Jahre waren mit einem Europameisterschaftstitel 1980 in Italien und zwei Vizeweltmeisterschaften 1982 in Spanien und 1986 in Mexiko von einer Nationalmannschaft bestehend aus Spielern unterschiedlicher Vereine geprägt. Beim dritten Weltmeistertitel 1990 in Italien gab es beispielsweise kein Spiel in denen mehr als drei Spieler eines Vereins auf dem Spiel standen (erneut nur Startspieler). Inter Mailand stellte mit Lothar Matthäus, Andi Brehme und Jürgen Klinsmann meist drei Startspieler, Bayern München mit Stefan Reuter, Klaus Augenthaler, Hans Pflügler, Jürgen Kohler und Olaf Thon entweder zwei oder drei. In fast jedem Spiel starten mit Thomas Berthold und Rudi Völler auch zwei Spieler von AS Rom. Es waren aber mit Spielern wie Bodo Illgner, Pierre Littbarski, Thomas Häßler, Guido Buchwald, Uwe Bein und Karl-Heinz Riedle auch Startspieler vom 1. FC Köln, Juventus Turin, VfB Stuttgart, Eintracht Frankfurt und Werder Bremen/Lazio Rom verteten.

Die aus deutscher Sicht teilweise erfolgreichen, häufig aber auch enttäuschenden Turniere zwischen 1992 und 2004 waren von starken Kontigenten einzelner Mannschaften (1996 und 2000), aber auch sehr ausgeglichenen Nationalmannschaften (1992, 1994, 2004) geprägt. Ein klares Muster ist dabei nicht zu erkennen. Zwar konnte ein starker Block um Bayern München und Borussia Dortmund die Europameisterschaft 1996 in England gewinnen und Deutschland den dritten Titel bei einer Europameisterschaft sichern. Hier spielten beispielsweise je vier Spieler der beiden Vereine in der Startformation im Halbfinale und sechs Spieler von Bayern München im Finale. Aber ein starker Block aus München konnte die Enttäuschung vier Jahre später bei der Europameisterschaft 2000 in den Niederlanden nicht verhindern, als Deutschland zusammen mit England bereits nach der Vorrunde abreisen musste. Auf der anderen Seite waren auch die Weltmeisterschaft 1994 und 1998 in den USA und in Frankreich mit zwei Viertelfinalniederlagen gegen Bulgarien und Kroatien eher enttäuschend, während die Europameisterschaft 1992 in Schweden im Finale nur knapp verloren ging. Hier konnte keine Mannschaft in einem Spiel mehr als zwei Spieler stellen. Und Deutschland in Japan und Südkorea bei der Weltmeisterschaft 2002 überraschend (und aufgrund leichter Gegner in der Final-Runde) das Finale erreichen konnte. Hier schaffte es nur Bayer Leverkusen im Halbfinale gegen Südkorea vier Spieler zu stellen, während Bayern München meist drei Spieler stellte.

Im Sommermärchen 2006 waren Philipp Lahm, Bastian Schweinsteiger und Lukas Podolski für Bayern München gesetzt, Michael Ballack war auf dem Weg nach London und wird bei weltfussball.de bereits als Chelsea Spieler gezählt, währen die übrigen Startspieler aus unterschiedlichen Vereinen kamen. Torsten Frings und Miroslav Klose waren Stammspieler, Tim Borowski spielte für Frings im Halbfinale sowie beim Auftaktspiel (und als regelmäßiger Einwechselspieler). Per Mertesacker war von Hannover auf dem Weg in Richtung Bremen. Ansonsten starteten (ohne das Spiel um den dritten Platz) Spielern wie Jens Lehmann, Arne Friedrich, Christoph Metzelder, Sebastian Kehl, Bernd Schneider und Robert Huth aus Arsenal FC, Hertha BSC, Borussia Dortmund, Bayer Leverkusen und Chelsea FC.

In der Europameisterschaft 2008 in Österreich und der Schweiz sowie bei der Weltmeisterschaft 2010 in Südafrika begann unter Jürgen Löw eine Entwicklung zu einem großen Block, die die Bayern München Spieler Bastian Schweinsteiger und Philipp Lahm ergänzten. Während der ersten beiden Gruppenspiele der Europameisterschaft 2012 in Polen und der Ukraine und dem Achtelfinale der Weltmeisterschaft 2014 in Brasilien gegen Algerien sah man zum ersten Mal 7 Startspieler aus einer Mannschaft während eines großen Turniers in der dt. Nationalmannschaft. Diese Periode war überaus erfolgreich, zwei Finalteilnahmen und zwei mal das Erreichen des Halbfinales und der vierte Weltmeistertitel für Deutschland. 

Wir sahen bereits, dass in den Bundesligaspielzeiten 1972 und 1973 die Meisterschaft mit einer sehr hohen Punkteausbeute einherging. Die Europameisterschafts-Elf um die Bayern München und Borussia Mönchengladbach gilt heute noch als die vermutlich beste deutsche Mannschaft. Ein ähnliches Phänomen beobachtet wir heute wieder. Nach drei Rekordmeisterschaften durch Borussia Dortmund und Bayern München folgt durchaus nicht überraschend eine Nationalmannschaft, die zumindest durch Bayern München geprägt ist. Entsprechend finden wir über den gesamten Zeitraum 1954-2014 eine mittlere bis hohe Korrelation zwischen der Anzahl der Startspieler von dem Verein mit dem größten Kontigent und dem Punkten der Meistermannschaft in der Bundesliga in Höhe von 0,51. Ein ähnliches Bild ergibt sich auch, wenn wir die Differenz zwischen Bundesligameister und Zweiten verwenden oder die Standardabweichung der Punkte pro Spielzeit.

Ein anderes Maß für die Konzentration in der Nationalmannschaft bestätigt ebenfalls diese Beobachtung. Hier schauen wir uns nicht die Zahl der Spieler der Mannschaft mit dem größten Kontigent an, sondern die Zahl der vertretenden Mannschaften in der Startformation:


Die Grafik muss man entsprechend spiegelverkehrt zur obigen lesen. Fast durchschnittlich zehn vertretenden Mannschaften während der Weltmeisterschaft 1994 bedeutet, dass es sich hier um einen bunt zusammengewürfelten Haufen gehandelt hat. Auffälig ist hier besonders die Europameisterschaft 1972 wo in der Finalrunde nur vier Mannschaften unter den Startspielern vertreten waren (mit Bayern München, Mönchengladbach, Schalke und Werder Bremen, siehe oben). Aber auch die letzten beiden Turniere sind sehr auffälig mit wenig vertretenden Mannschaften. Im Gegensatz zur obigen Grafik fällt aber auf, dass der erste deutsche Weltmeistertitel 1954 eher durch Spieler aus unterschiedlichen Teams plus einen kleineren Block um FC Kaiserslautern herum gewonnen werden konnte.

Die Analysen zeigen, dass nicht unerwartet eine Dominanz in der Liga auch auf dei Nationalmannschaft überträgt. Große Erfolge konnten dabei mit eingespielten Mannschaften wie 1972, 1974 oder eben 2014 erzielt werden. Aber auch eine "wilde Truppe" aus unterschiedlichen Teams kann erfolgreich sein, wie wir es 1980 oder 1990 gesehen haben. Und der erste Weltmeistertitel 1954 und die der letzte Europameistertitel 1996 lagen irgendwo dazwischen.

Ein klares Muster konnten wir dabei soweit nicht finden. Als einfache statistische Analyse haben wir daher die pro Jahr durchschnittlich erzielten Punkte pro Pflichtspiel (auch Qualifikation für WM / EM, Confed-Cup aber ohne Freundschaftsspiele) mit der durchschnittlichen Zahl der Startspieler des Vereines mit dem größten Kontingent verglichen. Dabei haben wir zur Einfachheit halber alle Spielausgänge auch Elfmeterschießen gewertet. Hier zeigt sich eine leichte bis moderate positive Korrelation von 0.34. Für die Zahl der vertretenden Vereine der Startspieler ist die Korrelation aber sehr gering: -0.14. Auf eine detaillierte Analyse mit einzelnen Spieldaten inkl. wollen wir an dieser Stelle verzichten.

Zusammenfassend finden wir einen robusten Zusammenhang zwischen der Situation an der Spitze der Bundesliga und der Spielerzusammensetzung in der Nationalmannschaft (dies gilt auch für Qualifikationsspiele und Freundschaftsspiele, die wir hier weitgehend ausgeklammert haben). Große Erfolge wurden mit Mannschaften aus wenigen Vereinen erzielt, wie 1972 oder 2014, aber auch mit weniger eingespielten Mannschaften wie 1980 oder 1990. Einen leichten Vorteil für die Nationalmannschaft könnte aber existieren, falls viele Spieler durch ihre Vereine miteinander vertraut sind. Dies könnte (leider) auf einen Zielkonflikt zwischen Spannung in der Bundesliga in Bezug auf die Meisterschafteund Erfolg der Nationalmannschaft hindeuten.

Sonntag, 13. Juli 2014

Ein Ex-Post Vergleich der Prognose der FIFA Weltmeisterschaft 2014



Nachdem wir am Anfang der FIFA Weltmeisterschaft 2014 unterschiedliche Prognosen in Hinblick auf ihre Methodiken vorgestellt und diskutiert haben, wollen nun zum Ende der Weltmeisterschaft in Brasilien vergleichen, wie gut die Prognosen den tatsächlichen Turnierbaum vorhergesagt haben. In den hier vorliegenden Prognosen ist die Vorhersage für einen Weltmeistertitel Argentiniens dabei meist relativ ähnlich zu den Chancen für Deutschlands. Daher macht es nur einen geringen Unterschied, ob wir das Finale noch abwarten oder nicht.

Wir haben die Autoren der hier vorgestellten Prognosen kontaktiert, und um einen Turnierbaum mit berechneten Überlebenswahrscheinlichkeiten für jedes Team und jede Runde gebeten (falls diese nicht öffentlich verfügbar waren wie bei Goldman Sachs oder Goalimpact). Damit sind Prognosen wie von Gerhards et al. ausgeschieden, die keine Simulation durchgeführt haben. Bis auf die Commerzbank haben uns freundlicherweise alle Autoren geantwortet und ihre Überlebenswahrscheinlichkeiten zur Verfügung gestellt, womit wir sechs Prognosen vergleichen können. Vielen Dank an dieser Stelle an Achim Zeileis, Gunther Schauberger und Ritchie King!

Die hier diskutierten Prognosen im Vergleich, die Daten findet ihr hier (siehe einzelne Sheets):
 

Hierunter sind drei Prognosen, die sich auf historische Mannschaftsdaten stützen, zwei Vorhersagen, die detailliert Spielerstärken aus nationalen Ligen modellieren und eine Studie, die die Wettquoten für den Sieg bei der diesjährigen WM verwendet hat.

Unter den Prognosen, die historische Mannschaftsdaten verwenden, findet sich erstens die Prognose von Goldman Sachs, die wir bereits vorgestellt haben. Zweitens, eine Vorhersage von zwei Statistikern aus München, Groll und Schauberger (eine ausführlichere Präsentation ist hier zu finden), die uns leider erst im Laufe der Weltmeisterschaft aufgefallen ist und daher im letzten Artikel nicht enthalten ist. Und drittens eine Abwandlung meines eigenen Algorithmus, welches ich für unterschiedliche Tippspiele verwendet habe und das ich als Vergleich für ein einfaches Modell mit historischen Daten vorstellen möchte. 

Die Prognose von Groll und Schauberger verwendet Daten der Weltmeisterschaften von 2002 bis 2010 und eine Reihe von Kontrollvariablen, wie das Bruttosozialprodukt pro Kopf, Bevölkerung, FIFA Weltrangliste, Heim und Kontinentalvorteil, Charakteristika des Trainers und der Mannschaft, z.B. Anzahl der Champions League Spielern, und noch einige mehr, sowie teamspezifische Fehlerterme, um die erzielten Tore vorherzusagen.

Meine eigene Prognose, die ich für Tippspiele verwendet habe, nutzt als Datengrundlage die WM Qualifikationsspiele der letzten 6 Jahre und stützt sich auf die Wettquoten und Elo-Rankings (sowie teamspezifische Fehlerterme), um die erzielten Tore einer jeder Mannschaft zu modellieren. Damit eignet sie sich leider nicht für eine Simulation, da die Wettquoten nur für die tatsächlichen Partien vorliegen. Hier habe ich um einen Vergleich zu ermöglichen eine einfachere Prognose gewählt, die nur die Elo-Rankings und teamspezifische Fehlerterme verwendet. Sowohl die Prognose von Groll und Schauberger wie meine eigene verwenden dabei Poisson-Spezifikationen, da damit sichergestellt werden kann, dass die Prädiktion für die erzielten Tore nicht negativ wird.

Zwei der Prognosen modellieren die Stärke der Spieler, FiveThirtyEight.com und Goalimpact.com, und eine Studie (Zeileis, Leitner und Hornik) verwendet die Wettquoten für den Gewinn der Weltmeisterschaft einer jeder Mannschaft. Diese drei Prognosen haben wir bereits Anfang der Weltmeisterschaft vorgestellt.

Zur Methodik: Hier nehme ich an, dass die Wahrscheinlichkeit des Erreichens des Achtelfinales bzw. der weiteren Runden einer Mannschaft unabhängig davon ist, wer aus der Ursprungsgruppe noch das Achtelfinale erreicht. Damit kann ich dann einfach die Wahrscheinlichkeiten einer jeder Mannschaft die nächste Runde zu erreichen (ihre Überlebenswahrscheinlichkeiten) aufmultiplizieren. Die Berechnungen sind hier einsehbar. Diese Annahme ist natürlich nicht erfüllt, aber eine Verletzung der Annahme wird vermutlich keine größeren Auswirkungen haben und gilt für alle Prognosen gleichermaßen. Auch kann ich hier wenig machen, da ich aus den Überlebenswahrscheinlichkeiten für jede Mannschaft und jede Runde nicht die Wahrscheinlichkeit für jede mögliche Achtelfinalpartie berechnen kann, da das entsprechende Gleichungssysteme unterbestimmt (pro Gruppe gibt es sechs mögliche Kombinationen der Achtelfinalteilnehmer aber nur fünf Gleichungen stehen zur Verfügung, da ich meist keine Informationen darüber habe, welche Mannschaft mit welcher Wahrscheinlichkeit Gruppenerster bzw. -zweiter wird).

Zunächst zu den einzelnen Gruppen, die folgenden Grafik zeigt die Wahrscheinlichkeit für jede Mannschaft jeder Gruppe das Achtelfinale zu erreichen. Blau hervorgehoben ist der Gruppenerste und rot der Gruppenzweite. Auf der x-Achse ist jeweils für jedes Team die Wahrscheinlichkeit aus unterschiedlichen Prognosen dargestellt, das Achtelfinale zu erreichen. Diese Wahrscheinlichkeiten addieren sich jeweils pro Gruppe zu 2, da jede Gruppe zwei Mannschaften ins Achtelfinale schickt. GS steht dabei für Goldman Sachs, GI für Goalimpact, Zeileis für Zeileis et al., FTE für FiveThirtyEight, Groll für Groll & Schauenberger und Elo + RE für meine eigene Prognose.


Einen unwahrscheinlichen Ausgang aus Sicht der Prognose nahm Gruppe D wo sich Costa Rica den Gruppensieg sichern konnte. Bei allen Prognosen aber nur die geringste Wahrscheinlichkeit vorhergesagt bekam, überhaupt das Achtelfinale zu erreichen, Werte zwischen 11% (Groll) und 40% (Goalimpact). Daneben sahen alle Prognosen Spanien als den wahrscheinlichsten Gruppensieger in Gruppen B, aber sowohl Niederlande wie Chile wurden auch nennenswerte Chancen zugestanden. In den Gruppen F, G, H wurde die Gruppenersten Argentinien, Deutschland und Belgien einstimmig vorhergesagt, aber der Gruppenzweite war jeweils etwas überraschend. Die Prognosen sahen eher Bosnien Herzegowina vor Nigeria, Portugal vor den USA, und meist sowohl Russland wie Südkorea vor Algerien voraus. 

Multiplizieren wir alle Überlebenswahrscheinlichkeiten für das Achtelfinale für die Mannschaften die tatsächlich das Achtelfinale erreicht haben, sehen wir ein relativ einheitliches Bild. Meine Prognose, die nur Elo-Werte und team-spezifische Fehlerterme verwendet, schneidet in dieser Runde am besten ab vor der FiveThirtyEight.com Prognose. Allerdings muss ich dazu sagen, dass mein ursprüngliches Modell welches die Wettquoten für alle Gruppenspiel mitmodelliert hat (und für diese Stufe noch angewendet werden kann da die Wettquoten für alle Gruppenspiele vor der WM zur Verfügung standen), hier  am schlechtesten ab (6.12e-06), da dies zu sehr hohen Wahrscheinlichkeiten für die Achtelfinalteilnahmen der Favoritenmannschaften führt. 

Zur Abschätzung wie aussagekräftig die Unterschiede sind, habe ich aus der Goldman Sachs Prognose (siehe dort Seite 7) noch deren Berechnung für die Weltmeisterschaft 2010 mit dem tatsächlichen Turnierbaum aus Südafrika verglichen. Dies erlaubt uns ansatzweise nicht nur Variation zwischen den Prognosen zu vergleichen, sondern auch innerhalb einer Prognose zwei Ziehungen gegen gegenüberzustellen. Hier sehen wir, dass zumindest Goldman Sachs vor vier Jahren eine deutliche bessere Prognose gelungen ist als 2014. Und damit erscheinen die Unterschiede zwischen den Prognosen in ihren Vorhersagen für das Achtelfinale 2014 eher gering.


In allen Achtelfinalspielen konnten sich interessanterweise jeweils die Gruppenersten durchsetzen. Auch war dies meist die Mannschaft, die die Prognosen vor der Weltmeisterschaft mit größerer Wahrscheinlichkeit im Viertelfinale gesehen haben (y-Achse). Eine Ausnahme bildeten hier nur Kolumbien, das aber nahezu gleichauf mit Uruguay stand, und Costa Rica, dem aufgrund seiner schweren Gruppen, etwas niedrigere Chancen eingeräumt wurden, das Viertelfinale zu erreichen als Griechenland. Auf den y-Achsen sehen wir immer die Wahrscheinlichkeit vor der WM, dass die Mannschaft das Viertelfinale erreicht, also nicht bedingt auf die Achtelfinalteilnahme.

Die höchste Wahrscheinlichkeit für die tatsächlichen Viertelfinalpartien finden wir bei FiveThirtyEight.com gefolgt von Goldman Sachs und Zeileis et al. Allerdings erscheinen die Unterschiede im Vergleich mit den Unterschieden zwischen Goldman Sachs 2010 und 2014 ebenfalls eher gering.


Im Viertelfinale konnte sich jeweils die Mannschaft durchsetzen, der die höhere Chance prognostiziert wurde, ins Halbfinale zu gelangen. Der Niederlande wurden auf den ersten Blick erstaunlich geringe Chancen eingeräumt die Runde der letzten vier zu erreichen. Der Grund liegt daran, dass sie die "Todesgruppe" mit Spanien und Chile überstehen mussten und als Gruppenzweiten wahrscheinlich auf den Brasilien getroffen wären. Belgien galt als einer der Geheimfavoriten, zwei der Prognosen, Goalimpact.com und Groll & Schauberger, haben dem Land sogar etwa gleich hohe Chancen zugerechnet, das Halbfinale zu erreichen wie Argentinien. Interessant ist die Spannbreite der Wahrscheinlichkeiten für eine Halbfinalteilnahme von beispielsweise Brasilien (zwischen 31% Goalimpact und 72% Goldman Sachs) oder Argentinien (21% bis 56%).


Betrachten wir das Produkt der Wahrscheinlichkeiten für die Halbfinalteilnehmer Argentinien, Brasilien, Deutschland und Niederlande an, so sehen wir das Goldman Sachs in 2014 diese Konstellation mit einer Wahrscheinlichkeit von immerhin fast 6% vorhergesehen hat. Schlusslicht ist Goalimpact.com, die entsprechend nur eine Wahrscheinlichkeit von 0,3% berechnet haben während alle anderen Prognosen bei knapp über 1% liegen. Ein Vergleich mit der Goldman Sachs Prognose von 2010 für die damaligen Halbfinalisten Deutschland, Niederlande, Spanien und Uruguay zeigt aber erneut, dass die Unterschiede vermutlich im zufälligen Rahmen liegen. Der Grund für den niedrigen Wert von 2010 liegt insbesondere daran, dass Goldman Sachs damals Uruguay nur geringere Chance von unter 9% eingeräumt hat ins Halbfinale vorzustoßen. Auch sah die Investmentbank damals keinen ähnlich hohen Favoriten wie Brasilien 2014. 


Im Halbfinale der diesjährigen setzte sich Argentinien gegen die Niederlande durch und Deutschland gewann überraschend hoch gegen Brasilien. Goldman Sachs, Zeileis et al. und FiveThirtyEight sahen Brasilien eher als Favoriten, teilweise mit aus meiner Sicht sehr hohen Wahrscheinlichkeiten die Weltmeisterschaft im eigenen Land zu holen (siehe die Diskussion der Prognosen). Goalimpact, Groll & Schauenberger und meine eigene Prognose sahen beide Mannschaften etwa gleichauf.

 
Die Finalkonstellation aus Argentinien und Deutschland ist alles andere als unwahrscheinlich aus Sicht der meisten Prognosen. Deren erwartete Wahrscheinlichkeit mit meist 5% bis 7% ist damit durchaus vergleichbar zur Weltmeisterschaft 2010 wo Spanien sich am Ende gegen die Niederlande durchsetzen konnte. Nur Goalimpact sah hier eine niedrigere Wahrscheinlichkeit von 2%.


Multipliziert man alle Wahrscheinlichkeiten zusammen, so schneidet die Goldman Sachs Prognose relativ gut ab, die diesen Turnierbaum für etwa 1.5-mal so wahrscheinlich gehalten hat wie die Prognose von FiveThirtyEight.com. Vielleicht fällt die Kritik des Wall Street Journal "Goldman Sachs blamiert sich mit WM-Prognose" an der Goldman Sachs Studie aus diesem Blickwinkel etwas zu hart aus. Am schlechtesten schneidet die Prognose von Goalimpact ab. Aber der Unterschied ist meiner Ansicht nach nicht besonders groß, wenn man sich das Produkt der Wahrscheinlichkeiten aus dem Jahr 2010 anguckt. Interessant wäre es natürlich das Elo-Modell für die früheren Weltmeisterschaften zu berechnen, um größere Variation in den Prognosegüten zu erhalten.


Wie kommen die Unterschiede zwischen den Prognosen zustande? Ein wichtiger Unterschied betrifft allgemein die Höhe der Wahrscheinlichkeiten, die den Favoriten eingeräumt wird. Hier sahen die Prognosen von Goldman Sachs, FiveThirtyEight und Groll & Schauberger große Chancen für Favoriten. Goldman Sachs und FiveThirtyEight prognostizierten Brasiliens Weltmeistertitel mit 49% bzw. 45%. Groll und Schauberger sahen eine 56% Chance, dass entweder Brasilien oder Deutschland Weltmeister wird. Der Hauptunterschied zwischen den Goldman Sachs und FiveThirtyEight Prognosen macht das Erreichen des Halbfinales durch Niederlande aus, 28% gegenüber 7%. Groll & Schauberger sahen Deutschland knapp als Favoriten für den Titel (29%) und würden entsprechend besser abschneiden, falls Deutschland heute gewinnt.

In der Grafik weiter unten haben wir die Standardabweichung der Überlebenswahrscheinlichkeiten der Mannschaften pro Stufe abgebildet. Die Überlebenswahrscheinlichkeiten in der Prognose von Goalimpact liegen deutlich enger beieinander, Brasilien ist hier mit 13% knapp der Favorit vor Deutschland und Spanien mit 12% bzw. 10%. Gerade in der Ko-Phase haben sich hier aber doch viele Favoriten durchsetzen können, und entsprechend geringer ist der Turnierbaum aus Sicht dieser Prognose. Interessant wären hier Prognosen wie für die Weltmeisterschaft 2002 in Japan und Südkorea, bei der im Halbfinale neben Brasilien und Deutschland auch die Türkei und Südkorea standen. 

Fazit:

Insgesamt erscheinen die Unterschiede zwischen den Prognosen im zufälligen Rahmen. Auch ist bei der Weltmeisterschaft nicht unbedingt erkennbar, dass komplexere Modelle besser abschneiden als einfachere. Zeileis, Leitner und Hornik verwenden mit den Wettquoten für die Weltmeisterschaft jeder Mannschaft nur eine einzelne Zahl. Groll und Schauberger verwenden deutlich mehr Kontrollvariablen als meine Analyse. Interessant wäre hier ein ausführlicherer Vergleich mit Ligadaten am besten aus unterschiedlichen Ländern.

Persönlich hat mir mein Prognosemodell aber geholfen, bei Tippspielen gut abzuschneiden. Vor dem Finale bin ich bei einem Tippspiel auf Platz 8 von 100 angekommen, deutlich besser als vor zwei Jahren. Dies deutet an, dass zumindest gegenüber normalen Interessierten ein Informationsgewinn geholt werden kann.