Posts mit dem Label Trend werden angezeigt. Alle Posts anzeigen
Posts mit dem Label Trend werden angezeigt. Alle Posts anzeigen

Sonntag, 17. August 2014

Spannende Meisterschaften und die Nationalmannschaft

Vor einem halben Jahr haben wir analysiert, wie viele Punkte die jeweilige Meistermannschaft in der Bundesliga sammeln konnte. Die letzten Spielzeiten waren von extrem deutlichen Meisterschaften geprägt, stärker noch als die Bundesligaspielzeiten 1971-1972 und 1972-1973 in denen Bayern München mit jeweils 79 Punkten Meister wurde (umgerechnet auf die 3-Punkte-Regel). In diesem Post wollen wir untersuchen, ob und wie sich dies auf die deutsche Nationalmannschaft ausgewirkt hat. Nebenbei ist dabei natürlich auch die Frage interessant: Wann war die deutsche Nationalmannschaft erfolgreich, mit Spielen aus unterschiedlichen oder wenigen Vereinen? Und profitiert die Nationalmannschaft von eindeutigen Meisterschaften und eingespielten Spielern?

In diesem Post betrachten wir die Vereinszusammensetzung der Startspieler der Deutschen Nationalmannschaft bei Welt- und Europameisterschaften seit 1954. Wie viele Vereine stellen in jedem Turnier die Stammspieler der Nationalmannschaft und wie groß ist die Anzahl der Spieler des Vereins mit dem größten Kontigent? Ist ein großer Block in der Nationalmannschaft wie wir ihn bei dieser Weltmeisterschaft in Brasilien mit Bayern München Spielern gesehen haben ungewöhnlich? Oder haben wir so eine Gruppe bereits häufiger in der Vergangenheit gesehen? Wir beschränken uns dabei auf Startspieler, da die Informationen für Einwechselspieler für die Vergangenheit nicht immer einfach verfügbar ist. Die Daten beruhen auf der Datenbank von weltfussball.de. 

In der folgenden Grafik haben wir die durchschnittliche Zahl der Startspieler von dem Verein, der die meisten Spieler stellt über die Zeit dargestellt. In grau sind dabei die erzielten Punkte der Meistermannschaft in der Bundesliga (seit 1963/1964) dargestellt.

 

Gehen wir chronologisch vor: Die Fußball-Weltmeisterschaft 1954 in Ungarn wurde von Spielern des 1. FC Kaiserslautern dominiert. Der Verein stelle mit Werner Kohlmeyer, Werner Liebrich, Horst Eckel, Ottmar Walter und Fritz Walter zwischen in der Gruppenphase zwischen 3 und 4 Startspieler, in der KO-Runde sogar jeweils fünf Spieler. Insgesamt ein Durchschnittswert von 4,4. Die folgenden Weltmeisterschaft 1958, 1962, 1966 und 1970 konnte kein Verein mehr als drei Startspieler stellen. So spielten zum Beispiel beim verloren gegangen Finale der Weltmeisterschaft 1966 in England, bekannt durch das legendäre Wembley Tor, drei Spieler von Borussia Dortmund, je zwei vom Hamburger Sportverein und dem 1. FC Köln, und je ein Spieler vom AC Mailand, Bayern München, Bologna FC, und SV Werder Bremen. Beim "Jahrhundertspiel", dem Halbfinale der WM 1970 gegen Italien, starteten drei Bayern München Spieler, je zwei HSV und FC Köln Spieler, und je ein Spieler von Borussia Mönchengladbach, AC Mailand, Eintracht Frankfurt und Hertha BSC.  

Aber in der vierten Europameisterschaft 1972 in Belgien, der ersten mit Deutscher Beteiligung, änderte sich dies deutlich. Die deutsche Nationalmannschaft brauchte nur zwei Spiele in der Endrunde mit identischer Startaufstellung zum Titel, in denen standen mit Sepp Maier, Georg Schwarzenbeck, Franz Beckenbauer, Uli Hoeneß, Paul Breitner und Gerd Müller sechs Spieler von Bayern München auf dem Platz. Ansonsten stelle Borussia Mönchengladbach mit Günter Netzer, Herbert Wimmer und Jupp Heynckes drei Spieler und SV Werder Bremen und Schalke 04 mit Horst-Dieter Höttges und Erwin Kremers je einen. Beim zweiten Weltmeistertitel 1974 im eigenen Land änderte sich relativ wenig in Bezug auf die Startaufstellung. Paul Breitner wechselte nach der WM zu Real Madrid und weltfussball.de zählt ihn im historischen Kader schon als Real Madrid Spieler. Entsprechend starteten meist fünf Spieler von Bayern München, nur im Spiel gegen Jugoslawien war es vier. Unter den übrigen Vereinen stellten Borussia Mönchengladbach mit Berti Vogts, Rainer Bonhof, Herbert Wimmer und Jupp Heynckes, 1. FC Köln mit Bernd Cullmann, Heinz Flohe und Wolfgang Overath, Eintracht Frankfurt mit Jürgen Grabowski und Bernd Hölzenbein sowie Fortuna Düsseldorf mit Dieter Herzog Startspieler.   

Die folgenden Jahre waren mit einem Europameisterschaftstitel 1980 in Italien und zwei Vizeweltmeisterschaften 1982 in Spanien und 1986 in Mexiko von einer Nationalmannschaft bestehend aus Spielern unterschiedlicher Vereine geprägt. Beim dritten Weltmeistertitel 1990 in Italien gab es beispielsweise kein Spiel in denen mehr als drei Spieler eines Vereins auf dem Spiel standen (erneut nur Startspieler). Inter Mailand stellte mit Lothar Matthäus, Andi Brehme und Jürgen Klinsmann meist drei Startspieler, Bayern München mit Stefan Reuter, Klaus Augenthaler, Hans Pflügler, Jürgen Kohler und Olaf Thon entweder zwei oder drei. In fast jedem Spiel starten mit Thomas Berthold und Rudi Völler auch zwei Spieler von AS Rom. Es waren aber mit Spielern wie Bodo Illgner, Pierre Littbarski, Thomas Häßler, Guido Buchwald, Uwe Bein und Karl-Heinz Riedle auch Startspieler vom 1. FC Köln, Juventus Turin, VfB Stuttgart, Eintracht Frankfurt und Werder Bremen/Lazio Rom verteten.

Die aus deutscher Sicht teilweise erfolgreichen, häufig aber auch enttäuschenden Turniere zwischen 1992 und 2004 waren von starken Kontigenten einzelner Mannschaften (1996 und 2000), aber auch sehr ausgeglichenen Nationalmannschaften (1992, 1994, 2004) geprägt. Ein klares Muster ist dabei nicht zu erkennen. Zwar konnte ein starker Block um Bayern München und Borussia Dortmund die Europameisterschaft 1996 in England gewinnen und Deutschland den dritten Titel bei einer Europameisterschaft sichern. Hier spielten beispielsweise je vier Spieler der beiden Vereine in der Startformation im Halbfinale und sechs Spieler von Bayern München im Finale. Aber ein starker Block aus München konnte die Enttäuschung vier Jahre später bei der Europameisterschaft 2000 in den Niederlanden nicht verhindern, als Deutschland zusammen mit England bereits nach der Vorrunde abreisen musste. Auf der anderen Seite waren auch die Weltmeisterschaft 1994 und 1998 in den USA und in Frankreich mit zwei Viertelfinalniederlagen gegen Bulgarien und Kroatien eher enttäuschend, während die Europameisterschaft 1992 in Schweden im Finale nur knapp verloren ging. Hier konnte keine Mannschaft in einem Spiel mehr als zwei Spieler stellen. Und Deutschland in Japan und Südkorea bei der Weltmeisterschaft 2002 überraschend (und aufgrund leichter Gegner in der Final-Runde) das Finale erreichen konnte. Hier schaffte es nur Bayer Leverkusen im Halbfinale gegen Südkorea vier Spieler zu stellen, während Bayern München meist drei Spieler stellte.

Im Sommermärchen 2006 waren Philipp Lahm, Bastian Schweinsteiger und Lukas Podolski für Bayern München gesetzt, Michael Ballack war auf dem Weg nach London und wird bei weltfussball.de bereits als Chelsea Spieler gezählt, währen die übrigen Startspieler aus unterschiedlichen Vereinen kamen. Torsten Frings und Miroslav Klose waren Stammspieler, Tim Borowski spielte für Frings im Halbfinale sowie beim Auftaktspiel (und als regelmäßiger Einwechselspieler). Per Mertesacker war von Hannover auf dem Weg in Richtung Bremen. Ansonsten starteten (ohne das Spiel um den dritten Platz) Spielern wie Jens Lehmann, Arne Friedrich, Christoph Metzelder, Sebastian Kehl, Bernd Schneider und Robert Huth aus Arsenal FC, Hertha BSC, Borussia Dortmund, Bayer Leverkusen und Chelsea FC.

In der Europameisterschaft 2008 in Österreich und der Schweiz sowie bei der Weltmeisterschaft 2010 in Südafrika begann unter Jürgen Löw eine Entwicklung zu einem großen Block, die die Bayern München Spieler Bastian Schweinsteiger und Philipp Lahm ergänzten. Während der ersten beiden Gruppenspiele der Europameisterschaft 2012 in Polen und der Ukraine und dem Achtelfinale der Weltmeisterschaft 2014 in Brasilien gegen Algerien sah man zum ersten Mal 7 Startspieler aus einer Mannschaft während eines großen Turniers in der dt. Nationalmannschaft. Diese Periode war überaus erfolgreich, zwei Finalteilnahmen und zwei mal das Erreichen des Halbfinales und der vierte Weltmeistertitel für Deutschland. 

Wir sahen bereits, dass in den Bundesligaspielzeiten 1972 und 1973 die Meisterschaft mit einer sehr hohen Punkteausbeute einherging. Die Europameisterschafts-Elf um die Bayern München und Borussia Mönchengladbach gilt heute noch als die vermutlich beste deutsche Mannschaft. Ein ähnliches Phänomen beobachtet wir heute wieder. Nach drei Rekordmeisterschaften durch Borussia Dortmund und Bayern München folgt durchaus nicht überraschend eine Nationalmannschaft, die zumindest durch Bayern München geprägt ist. Entsprechend finden wir über den gesamten Zeitraum 1954-2014 eine mittlere bis hohe Korrelation zwischen der Anzahl der Startspieler von dem Verein mit dem größten Kontigent und dem Punkten der Meistermannschaft in der Bundesliga in Höhe von 0,51. Ein ähnliches Bild ergibt sich auch, wenn wir die Differenz zwischen Bundesligameister und Zweiten verwenden oder die Standardabweichung der Punkte pro Spielzeit.

Ein anderes Maß für die Konzentration in der Nationalmannschaft bestätigt ebenfalls diese Beobachtung. Hier schauen wir uns nicht die Zahl der Spieler der Mannschaft mit dem größten Kontigent an, sondern die Zahl der vertretenden Mannschaften in der Startformation:


Die Grafik muss man entsprechend spiegelverkehrt zur obigen lesen. Fast durchschnittlich zehn vertretenden Mannschaften während der Weltmeisterschaft 1994 bedeutet, dass es sich hier um einen bunt zusammengewürfelten Haufen gehandelt hat. Auffälig ist hier besonders die Europameisterschaft 1972 wo in der Finalrunde nur vier Mannschaften unter den Startspielern vertreten waren (mit Bayern München, Mönchengladbach, Schalke und Werder Bremen, siehe oben). Aber auch die letzten beiden Turniere sind sehr auffälig mit wenig vertretenden Mannschaften. Im Gegensatz zur obigen Grafik fällt aber auf, dass der erste deutsche Weltmeistertitel 1954 eher durch Spieler aus unterschiedlichen Teams plus einen kleineren Block um FC Kaiserslautern herum gewonnen werden konnte.

Die Analysen zeigen, dass nicht unerwartet eine Dominanz in der Liga auch auf dei Nationalmannschaft überträgt. Große Erfolge konnten dabei mit eingespielten Mannschaften wie 1972, 1974 oder eben 2014 erzielt werden. Aber auch eine "wilde Truppe" aus unterschiedlichen Teams kann erfolgreich sein, wie wir es 1980 oder 1990 gesehen haben. Und der erste Weltmeistertitel 1954 und die der letzte Europameistertitel 1996 lagen irgendwo dazwischen.

Ein klares Muster konnten wir dabei soweit nicht finden. Als einfache statistische Analyse haben wir daher die pro Jahr durchschnittlich erzielten Punkte pro Pflichtspiel (auch Qualifikation für WM / EM, Confed-Cup aber ohne Freundschaftsspiele) mit der durchschnittlichen Zahl der Startspieler des Vereines mit dem größten Kontingent verglichen. Dabei haben wir zur Einfachheit halber alle Spielausgänge auch Elfmeterschießen gewertet. Hier zeigt sich eine leichte bis moderate positive Korrelation von 0.34. Für die Zahl der vertretenden Vereine der Startspieler ist die Korrelation aber sehr gering: -0.14. Auf eine detaillierte Analyse mit einzelnen Spieldaten inkl. wollen wir an dieser Stelle verzichten.

Zusammenfassend finden wir einen robusten Zusammenhang zwischen der Situation an der Spitze der Bundesliga und der Spielerzusammensetzung in der Nationalmannschaft (dies gilt auch für Qualifikationsspiele und Freundschaftsspiele, die wir hier weitgehend ausgeklammert haben). Große Erfolge wurden mit Mannschaften aus wenigen Vereinen erzielt, wie 1972 oder 2014, aber auch mit weniger eingespielten Mannschaften wie 1980 oder 1990. Einen leichten Vorteil für die Nationalmannschaft könnte aber existieren, falls viele Spieler durch ihre Vereine miteinander vertraut sind. Dies könnte (leider) auf einen Zielkonflikt zwischen Spannung in der Bundesliga in Bezug auf die Meisterschafteund Erfolg der Nationalmannschaft hindeuten.

Samstag, 26. April 2014

Toreverteilung Bundesliga 1963-2012

Im letzten Post haben wir uns mit dem Heimvorteil und dessen Entwicklung über die Zeit beschäftigt. Hier wollen wir uns dieser Analyse direkt anschließen, indem wir die Trends einzelner Ergebnisse in der Bundesliga untersuchen.
Die folgende Grafik zeigt die relative Häufigkeit unterschiedlicher Spielausgänge in der Bundesliga von der Spielzeit 1963/1964 bis zur Winterpause 2013/2014 und beruht auf 15.394 Spielen. In den Spalten sieht man dabei die erzielten Tore der Heimmannschaft, in den Spalten die Tore der Auswärtsmannschaft. Unentschieden sind auf der Diagonalen zu finden, während Siege der Heimmannschaft unterhalb der Diagonale zu finden sind, und Siege des Gastteams oberhalb der Diagonalen:

Das häufigste Ergebnis ist mit Abstand ein 1:1, das in 11,6% aller Spiele aufgetreten ist. Insgesamt enden aber nur 25,8% aller Spiele mit einem Unentschieden. Diese Zahl erhält man aus der obigen Grafik, wenn man alle Zahlen auf der Diagonale aufsummiert. Wie im letzten Post festgestellt wurde, enden 51,2% aller Bundesligapartien mit einem Sieg der Heimmannschaft (die Summe unter der Diagonale). Es ist hier deutlich ersichtlich, dass Heimsiege häufiger auftreten als Auswärtssiege. Die zweit-, dritt- und vierthäufigsten Ergebnisse sind Siege der Heimmannschaft mit 2:1, 1:0 und 2:0. Ein Auswärtssieg ist unter den acht häufigsten Ergebnissen gar nicht zu finden, was leichter ersichtlich ist, wenn man obige Tabelle nach Häufigkeit der Ergebnisse sortiert. Allerdings ist hier zu beachten, dass der Heimvorteil über die Zeit zurückgegangen ist und die langjährigen Häufigkeiten nicht unbedingt der Anordnung der letzten Jahre entspricht, aber mehr dazu weiter unten:

In der folgenden Grafik haben wir die durchschnittliche Zahl der Tore der Heim- und Auswärtsmannschaft über alle Bundesligaspielzeiten abgebildet. Hier sieht man deutlich den Rückgang des Heimvorteils. Schossen Heimmannschaft in der Bundesliga bis Anfang der 1980er Jahre im Durchschnitt noch fast 2,1 Tore, so ist dies Ende der 80er Jahre auf 1,7 Tore pro Spiel zurückgegangen. Interessant ist besonders, dass der Rückgang innerhalb von relativ wenigen Spielzeiten in den 80er passiert ist. Die Gründe hierfür sind vermutlich taktische Umstellungen hin zu einem defensiveren Spiel.

Bei den Auswärtsmannschaften sehen wir dagegen keinen deutlichen Trend. Die durchschnittliche Anzahl der Tore geht bis etwa 2002/2003 sehr leicht zurück, seitdem jedoch wieder etwas hinauf. Der letzte Anstieg ist auch statistisch signifikant (auf dem 5%-Niveau).

Insgesamt haben sich hierdurch die durchschnittliche Anzahl der Heim- und der Auswärtstore deutlich angenähert. In der letzten Bundesligaspielzeit 2012/2013 schossen Heimmannschaften im Durchschnitt 1.59 Tore und Auswärtsmannschaften 1.34 Tore. Der Unterschied ist weiterhin ebenfalls statistisch signifikant (auf dem 5%-Niveau, wobei hier die Abhängigkeit beider Variable nicht betrachtet wurde).


Es stellt sich natürlich die Frage, ob die beobachteten Veränderungen durch einzelne bestimmte Ergebnisse geprägt sind, oder ob sie die Trends allgemein über die einzelnen Ergebnisse hinaus entwickelt haben. Im Folgenden zeigen wir die durchschnittlichen Ergebnisse für je zehn der ersten 50 Spielzeiten der Bundesliga auf.

Auf die Entwicklung einzelner Ergebnisse wollen wir nun genauer eingehen, um zu sehen, ob die Entwicklung der Heimtore zum Beispiel durch hohe Siege bestimmt wird. Auch für Unentschieden und Auswärtssiege analysieren wir die Entwicklung einzelner Ergebnisse, denn hier könnten gegenläufige Entwicklungen zu einem stabilen Gesamtbildführen.

Die Entwicklung der einzelnen Ergebnisse analysieren wir mit Hilfe von nicht-parametrischen Regressionsmethoden, die es flexibler erlauben, die Veränderungen über die Zeit darzustellen, als das mit Hilfe von linearen Regressionsmodellen möglich ist. Das "np"-Packet in der Statistik-Programmiersprache R erlaubt, eine einfache Implementierung von nicht-parametrischen Kernel Regressionsmodellen.
Wir verwenden hierbei in allen folgenden Analyse eine feste Bandbreite (von 2.5), um die Vergleichbarkeit zu erleichtern. Beginnen wir mit dem Heimsiegen. In der folgenden Grafik seht ihr die Entwicklung unterschiedlicher Ergebnisse von Heimsiegen über die Zeit, wobei wir alle Ergebnisse mit 3 oder mehr Punkten zusammengefasst haben. (3+1):1 steht damit für 3:1, 4:1, 5:1 und so weiter, während (3++):(3+) Ausgänge wie 4:3, 5:3, 5:4 ... umfassen. Um die gelbe Kurve für (3+:2) herum haben wir die durchschnittlichen Ergebnisse pro Saison eingetragen, so dass man erkennen kann, wie die nicht-parametrischen Kurven im Vergleich zu den zugrundeliegenden Daten verlaufen.

Die Grafik für die Heimsiege zeigt, dass trotz des Rückgangs des Heimvorteils, häufige Spielausgänge wie 2:0 (grün) und 1:0 (blau) gleichwahrscheinlich geblieben sind. Der häufigste Ausgang eines Heimsieges in Form von 2:1 (rot) ging anteilsmäßig an allen Spielen lange Zeit zurück, von Ende der 1960er bis Anfang der 1990er, ist seitdem jedoch wieder etwas häufiger zu sehen. Diese Siege der Heimmannschaft, die mit weniger Tore erreicht werden, können den allgemeinen Trend also nicht erklären. Zurückzugehen scheinen dagegen insbesondere hohe Heimsiege wie 3:1, 3:0, 3:2 (und höher) sowie Spiele in denen die Heimmannschaft letztendlich trotz vieler Gegentore gewinnt wie 4:3 (braun). Es sind also die Kantersiege und hohe Spielausgänge, die wir seltener sehen. Dies spiegelt sich natürlich in der durchschnittlichen Zahl der erzielten Heimtore wieder, wie wir es weiter oben gesehen haben.

Als nächstes gucken wir uns die Entwicklung der Unentschieden an. (3+):(3+) steht hierbei für 3:3, 4:4 oder 5:5. Ein 5:5 ist übrigens zwei mal aufgetreten, am 6. Spieltag der Saison 1973/1974 im Spiel Schalke 04 gegen Bayern München und am 13. Spieltag der folgenden Saison in der Begegnung Eintracht Frankfurt gegen VfB Stuttgart. Die unterschiedlichen Ausgänge der Unentschieden laufen relativ parallel, insgesamt ist der Anteil der Unentschieden stabil, wobei erkennbar ist, dass die Zunahme der Unentschieden Ende der 1980er insbesondere durch torarme 0:0 (blau) und 1:1 (rot) getrieben ist, während 2:2 (grün) und höhere Unentschiede (3+):(3+) sich über die Zeit kaum verändert haben. Nach der Einführung der 3-Punkte-Regel ist dieser Anstieg aber langfristig wieder zurückgegangen. Zur Illustration haben wir unter die geglättete Kurve der 1:1 auch die Durchschnitte pro Saison eingezeichnet.

Bei den Auswärtssiegen haben wir festgestellt, dass deren Anteil seit Anfang der 2000er leicht angestiegen ist. In der folgenden Grafik sieht der Anstieg von Auswärtssiegen aufgrund des feineren Maßstabs (die y-Achse endet hier bei 8%) deutlich ausgeprägter aus, wobei auch leicht zu erkennen ist, dass der Anteil der Auswärtssiege insbesondere in den letzten Jahrzehnten angestiegen ist. Hohe Spielausgänge wie 2:(3+) (gelb) sind dabei auch nicht erkennbar zurückgegangen, im Gegensatz zu den Heimsiegen wie wir es weiter oben festgestellt haben. Nur sehr torreiche Partien, die mit einer Heimniederlage enden, wie 3:4 sieht man heutzutage seltener, waren aber auch früher sehr selten. Der Heimvorteil geht eindeutig zurück, und dies bei ganz unterschiedlichen Spielausgängen.


Samstag, 5. April 2014

Der Heimvorteil: Klarer Trend über die Zeit



Ein bekanntes Phänomen beim Fußball ist der "Heimvorteil". Nationalmannschaften scheiden bei Weltmeisterschaften zu Hause oft relativ erfolgreich ab. In der Champions League und im European Cup drücken Spieler und Trainer die Daumen, dass sie das Rückspiel doch bitte im eigenen Stadion antreten dürfen, und auch in der Bundesliga sehen wir einen beachtlichen (statistischen) Vorteil der Heimmannschaft gegenüber dem Team, dass auswärts antretten muss.

Im langjährigen Durschnitt von 1963/1964 bis zur Winterpause der Saison 2013/2014 sehen wir, dass die Heimmannschaft 51,2% aller Bundesligapiele gewinnen konnte (in 15.394 Spielen), aber nur in 22,9% aller Spiele konnte sich das Auswärtsteam durchsetzen. Dies hat ganz unterschiedliche Gründe: Die Fans spielen natürlich eine große Rolle, die Schiedsrichter bevorteilen die Heimmannschaft (und werden ebenfalls durch die Fans beeinflusst; siehe Dohmen, 2008), die Anreise mag ein Grund sein oder die Kenntniss des eigenen Platzes. Skarupke (2000) hat den Heimvorteil, sowie mögliche Gründe dafür, auch in einem wissenschaftlichen Arbeitspapier untersucht.

Aber wie hat sich der Heimvorteil über die Zeit entwickelt? Die folgende Grafik zeigt die durchschnittliche Anzahl der Heimsiege pro Saison und weist auf einen klaren Trend hin: Die Bedeutung des Heimvorteils hat nach den 1970er über die Zeit abgenommen. Der Rückgang war besonders deutlich von Ende der 70er bis zum Ende der 80er Jahre, hat sich aber seitdem weiter fortgesetzt. In der folgenden Grafik ist der Anteil der Siege an allen Spielen zu sehen:

Ein sehr ähnliches Bild ergibt sich, wenn man nur die Spiele betrachtet, die ohne Unentschieden geendet sind:

Die 3-Punkte-Regel hat hier anscheinend nur einen geringen Einfluss. Die durchschnittliche Anzahl an Heimsiegen in den Jahren vor und nach der Umstellung der Zählweise ist sehr ähnlich. Aber selbst seit der Einführung zur Saison 1995/1996 scheint die Bedeutung weiter abzunehmen. 


Zur Einfachheit haben wir im Folgenden die ersten 50 Jahre der Bundesliga in fünf Dekaden unterteilt und uns die durchschnittliche Anzahl der Spiele angeguckt, in denen die Heimmannschaft gewonnen hat. Hier sieht man deutlich, dass in den letzten zehn Jahren die durchschnittliche Zahl an Heimsiegen mit 45,7% deutlich unter der langfristigen Quote von 51,2% lag. Bis zur Winterpause lag der Anteil an Heimsiegen übrigens bei 46,7%. Der Fernsehsender ntv hat über diese Entwicklung geschrieben, dass der Heimvorteil kein Vorteil mehr sei, aber das stimmt nicht, auch in der ersten Häfte der Saison 2013/2014 gewann die Heimmannschaft noch deutlich häufiger, denn der Anteil der Auswärtssiegen lag nur bei 30,3. Dies entspricht im Durchschnitt 1,63 Punkten für die Heimmannaschaft gegenüber 1,14 Punkten für die Gäste, in statistisch signifikanter Unterschied.

Damit geht die Frage einher, ob der Rückgang des Heimvorteils durch mehr Unentschieden oder durch mehr Auswärtssiege kompensiert wurde. Im Folgenden gucken wir uns zunächst die Anzahl der Auswärtssiege an.

Hier ist ebenfalls ein klarer Trend zu mehr Auswärtssiegen zu erkennen, der gegenläufig zur Entwicklung der Heimsiege verläuft. Dieser Trend ist leichter zu erkennen, da er die Schwankungen um die Trendkurve geringer sind. Legen wir eine quadratische Funktion durch die durchschnittliche Anzahl der Heimsiege pro Saison, so erklärt diese Funktion 85% der Varianz der Unterschiede (das Bestimmtheitsmaß) in der Auswärtssiegquote über die unterschiedlichen Spielzeiten der Bundesliga, aber „nur“ 54% der Varianz der Heimsiegquote über die unterschiedlichen Saisons.


Was könnten die Gründen für den Rückgang des Heimvorteil sein? Ein Grund mag sein, dass die Anreisen komfortabler geworden sind, und die Auswärtsspieler heutzutage entsprechend weniger erschöpft sind. Aber auch die Schiedsrichterausbildung wird heute professioneller ablaufen als vor einigen Jahren, und dies könnte dazu beitragen, dass die Schiedsrichter fairer entscheiden, und weniger durch das Heimpublikum beeinflusst werden. Auch die verbesserten Trainingsmöglichkeiten könnten ein Grund sein, Spielfeldgrößen unterscheiden sich teilweise relativ deutlich, und heutzutage stehen den Vereinen teilweise Plätze unterschiedlicher Größe zur Verfügung.

Als letztes zeigen wir noch die Entwicklung der Unentschieden, allgemein enden in der Bundesliga knapp unter 26% aller Spiele mit einem Unentschieden (bis zur Winterpause waren dies 23% der Spiele in der Saison 2013/2014):

Bei der Entwicklung der Unentschieden ist kein allgemeiner Trend zu erkennen. Deutlich ist aber der Anstieg der Unentschieden ab Mitte der 1980er Jahre, der zur Einführung der 3-Punkte-Regel geführt hat. Akademische Studien wie zum Beispiel Dilger und Geyer (2007) bzw. Dilger und Geyer (2009) haben daraufhin untersucht, inwiefern die 3-Punkte-Regel ursächlich dazu beigetragen hat, die Anzahl der Unentschieden zu senken. Die oben genannten Studie kommen, dabei zum Ergebnis, dass die 3-Punkte-Regel tatsächlich erfolgreich war, Unentschieden zu verringern. Das Ergebnis wird allerdings von Strauß et al. (2009) angezweifelt.

Sieht man sich die Entwicklung an, so scheint es schwer festzustellen, ob der Anstieg Mitte der 1980er nur ein temporäres Phänomen war, oder tatsächlich durch die 3-Punkte-Regel gestoppt werden konnte. Aber vielleicht werden wir uns mit der Fragestellung in einem zukünftigen Post beschäftigen.

Der Heimvorteil ist, wie wir in das in der Einleitung angedeutet haben, ein internationales Phänomen. Obwohl das Ausmaß des Heimvorteils historisch zwischen den europäische Ligen sehr unterschiedlich war, verläuft die Entwicklung des Heimvorteils in den großen in Europa sehr ähnlich. Dies wird in zwei lesenswerten Artikeln bei ClubElo.com beschrieben. Die Bundesliga ist übrigens nicht besonders auffällig, in der Vergangenheit war der Heimvorteil in Spanien größer und in England niedriger als hierzulande. Heutzutage ist dagegen die Größe des Heimvorteils in Europa sehr ähnlich:
ClubElo.com "Home Field Advantage per Country"
ClubElo.com "The mysterious decline of home advantage"


Daten: Bundesliga Spiele 1963/1964 - Winterpause 2013/2014

Weitere Informationen:
Bring, Johan, and Marcus Thuresson. "Three points for a win in soccer: Is it fair?." Chance 24.3 (2011): 47-53.
Dilger, Alexander, and Hannah Geyer. "Theoretische und empirische Analyse der Drei-Punkte-Regel." Sport und Gesellschaft 3 (2007).
Dilger, Alexander, and Hannah Geyer. "Are three points for a win really better than two? A comparison of German soccer league and cup games." Journal of Sports Economics 10.3 (2009): 305-318.
Dohmen, Thomas J. "The influence of social forces: Evidence from the behavior of football referees." Economic Inquiry 46.3 (2008): 411-424.
Skarupke, Robert. "Quantifizierung des Heimvorteils im deutschen Profifußball: Eine empirische Untersuchung für die 1. Fußball-Bundesliga". (August 2000) (2000).
Strauß, B., N. Hagemann, and F. Loffing. "Die Drei-Punkte-Regel in der deutschen 1. Fußballbundesliga und der Anteil unentschiedener Spiele." Sportwissenschaft 39.1 (2009): 16-22.

Samstag, 21. Dezember 2013

Spanische oder schottische Verhältnisse: Gibt es einen Trend in der Bundesliga?

Das Thema dieses Posts beschäftigt sich mit der Frage, ob in den letzten Jahren in der Bundesliga ein Trend hin zu spanischen oder schottischen Verhältnissen feststellbar ist. Wir wollen untersuchen, ob es der Fall ist, dass sich der Meister bzw. der Führende deutlicher abgesetzt haben, als das in der Vergangenheit der Fall war. Die Dominanz von Bayern München in der aktuellen und der letzten Spielzeit ist in den Medien breit diskutiert wurden, und ein Blick auf die aktuelle Tabelle scheint dies auch zu bestätigen. Aber handelt es sich hierbei wirklich um einen Trend oder nur um aktuelles Phänomen, das vielleicht in zwei Jahren schon wieder ganz anders aussieht?

Um diese Frage zu beantworten gucken wir uns zunächst die Abschlusstabellen der Bundesliga nach dem 34. Spieltag an; getrennt für die Spielzeiten vor und nach der Einführung der 3 Punkte Regel (wobei wir immer mit der 3 Punkte Regel rechnen). Die ersten beiden Spielzeiten sowie die Bundesliga Saison „1991/1992“ in denen 16 bzw. 20 Mannschaften mitgespielt haben, lassen wir dabei außen vor (sie würden das generelle Bild allerdings nicht ändern). Die fünf stärksten und schwächsten Spielzeiten haben wir dabei graphisch nochmal hervorgehoben.

In der folgenden Grafik sehen wir pro Bundesligasaison die Punkte des jeweiligen Meisters. Im langjährigen Durchschnitt von 1963/64 bis 2012/13 wurde die "durchschnittliche Meisterschaft" mit ziemlich genau 70 Punkten gewonnen. Vor Einführung der 3-Punkte-Regel ist kein Trend erkennbar. Insbesondere die Spielzeiten kurz vor der Umstellung der Punktebewertung scheinen sich durch relativ „leicht“-gewonnene Meisterschaften auszuzeichnen. In der Saison 1993/94 reicht Bayern München zum Beispiel (umgerechnet) 61 Punkte für die Meistterschafle. Ein Grund hierfür sind eine große Zahl an Unentschieden in diesen Spielzeiten, die auch zur Einführung der 3 Punkte Regel beigetragen haben. 


In der Zeit nach der Einführung der 3 Punkte Regel scheint es allerdings einen leichten Aufwärtstrend zu geben (die Gerade ist auch „statistisch signifikant“ auf dem 5% Niveau), der allerdings auch stark durch die Spielzeiten 2011/12 und 2012/13 bestimmt wird, in denen Borussia Dortmund bzw. Bayern München neue Höchstwerte gesetzt haben. Sieht man von diesen beiden Spielzeiten ab, so sehen die Anzeichen für einen langfristigen Trend deutlich schwächer aus. Die Spielzeiten 2008/2009 und 2009/2010, in denen VfL Wolfsburg und Bayern München Meister wurden, lagen beispielsweise im langjährigen Durchschnitt ca. 70 Punkten. Insgesamt war die durchschnittliche Punktezahl des Meisters nach der Einführung der 3-Punkte Regel höher, aber dies mag für sich genommen erstmal ein allgemeiner (konstanter) Effekt der Umstellung sein.
Um auch die Informationen der aktuellen Saison miteinzubeziehen, schauen wir uns als nächstes die Punkte der führenden Mannschaft nach dem 16. Spieltag an, um zu beobachten ob wir hier ein ähnliches Muster erkennen können, und ob sich ein möglicher Trend in dieser Saison fortsetzt. Zur Vervollständigung haben wir hier auch die Spielzeiten mit 16 bzw. 20 Teams hinzugezogen, da die maximal möglichen Punkte nach 16 Spieltagen gleich hoch sind.


Die Grafik der Punktestände des „16. Spieltagsmeisters“ zeigt dabei ein sehr ähnliches Bild. Es ist kein Trend vor Einführung der 3-Punkte-Regel erkennbar. Wenn überhaupt ist der Anstieg der Gerade eher negativ. Dagegen sehen wir nach Einführung der 3-Punkte-Regel einen positiven Trend. Der Trend ist statistisch nur marginal „signifikant“ auf einem Signifikanzniveau von 0.2, da die Punktestände nach dem 16. Spieltag von Spielzeit zu Spielzeit deutlich mehr streuen als die Endpunktestände nach dem 34. Spieltag. Dies ist ein Bild was wir aus statistischer Sicht erwarten würden, denn die Fallzahlen pro Saison sind hier natürlich geringer. Nichtsdestotrotz, zeigt sich, dass drei der punktstärksten Führenden zu diesem Zeitpunkt einer Saison in den letzten vier Spielzeiten zu finden sind. Borussia Dortmund war in der „Rekordsaison“ 2011/2012 zu diesem Zeitpunkt übrigens unauffällig. Sie gewannen erst nach dem 16. Spieltag alle ihre Spiele bis auf zwei Unentschieden. Daneben sehen wir, dass Bayern München in der 10. Bundesligasaison 1972/73 mit 40 Punkten nach dem 16. Spieltag, ebenfalls sehr weit oben zu finden ist.

Conclusio:
Was schließen wir aus diesen Analysen? Ist es zu früh von einem Trend zur Polarisierung der Liga zu sprechen? Vermutlich ja, denn guckt man sich beispielsweise nur die Spielzeiten bis zur Saison 1972/73 an (in der Bayern München zum zweiten Mal in Folge Meister wurde), könnte man ebenfalls leicht einen Trend erkennen. Allerdings sind die letzten Spielzeiten auch Bezug auf die erreichten Punkte des Meisters bzw. des Führenden nach 16 Spieltagen beachtlich. Nach einem einfachen statistischen Rechenbeisiel würden wir entsprechende Punktzahlen basierend auf den ersten 48 Spielzeiten kaum erwarten würden.[1] Aktuell befinden wir uns sicher in einer Zeit mit (mindestens) einer außergewöhnlich punktestarken Mannschaft, aber ist meiner Meinung nach noch zu früh von einem langfristigen Trend zu sprechen. Dazu tragen auch die sehr "durchschnittlichen" Spielzeiten 2009 und 2010 bei.

Interessant wird es zu sehen, wie es sich die Bundesliga verhält, sobald die aktuelle Generation der Spieler von Borussia Dortmund und insbesondere Bayern München abgelöst (oder abgekauft) werden.

Die Datengrundelage zu allen Spielen findet ihr hier.


[1] Hierzu ein sehr simples Rechenbeispiel: In den ersten 48 Spielzeiten ist der Durchschnitt der Punkte des Meisters 69,9 Punkte und die Standardabweichung davon ist 5.2. Die Verteilung entspricht (sehr) grob einer Normalverteilung. Basierend auf einer Normalverteilung mit diesem Erwartungswert und der Standardabweichung, würden wir einen Wert von 81 (oder mehr) jedoch nur alle 50 Jahre erwarten,  eine Punktzahl von über 90 ist dabei noch deutlich unwahrscheinlicher.