Samstag, 26. April 2014

Toreverteilung Bundesliga 1963-2012

Im letzten Post haben wir uns mit dem Heimvorteil und dessen Entwicklung über die Zeit beschäftigt. Hier wollen wir uns dieser Analyse direkt anschließen, indem wir die Trends einzelner Ergebnisse in der Bundesliga untersuchen.
Die folgende Grafik zeigt die relative Häufigkeit unterschiedlicher Spielausgänge in der Bundesliga von der Spielzeit 1963/1964 bis zur Winterpause 2013/2014 und beruht auf 15.394 Spielen. In den Spalten sieht man dabei die erzielten Tore der Heimmannschaft, in den Spalten die Tore der Auswärtsmannschaft. Unentschieden sind auf der Diagonalen zu finden, während Siege der Heimmannschaft unterhalb der Diagonale zu finden sind, und Siege des Gastteams oberhalb der Diagonalen:

Das häufigste Ergebnis ist mit Abstand ein 1:1, das in 11,6% aller Spiele aufgetreten ist. Insgesamt enden aber nur 25,8% aller Spiele mit einem Unentschieden. Diese Zahl erhält man aus der obigen Grafik, wenn man alle Zahlen auf der Diagonale aufsummiert. Wie im letzten Post festgestellt wurde, enden 51,2% aller Bundesligapartien mit einem Sieg der Heimmannschaft (die Summe unter der Diagonale). Es ist hier deutlich ersichtlich, dass Heimsiege häufiger auftreten als Auswärtssiege. Die zweit-, dritt- und vierthäufigsten Ergebnisse sind Siege der Heimmannschaft mit 2:1, 1:0 und 2:0. Ein Auswärtssieg ist unter den acht häufigsten Ergebnissen gar nicht zu finden, was leichter ersichtlich ist, wenn man obige Tabelle nach Häufigkeit der Ergebnisse sortiert. Allerdings ist hier zu beachten, dass der Heimvorteil über die Zeit zurückgegangen ist und die langjährigen Häufigkeiten nicht unbedingt der Anordnung der letzten Jahre entspricht, aber mehr dazu weiter unten:

In der folgenden Grafik haben wir die durchschnittliche Zahl der Tore der Heim- und Auswärtsmannschaft über alle Bundesligaspielzeiten abgebildet. Hier sieht man deutlich den Rückgang des Heimvorteils. Schossen Heimmannschaft in der Bundesliga bis Anfang der 1980er Jahre im Durchschnitt noch fast 2,1 Tore, so ist dies Ende der 80er Jahre auf 1,7 Tore pro Spiel zurückgegangen. Interessant ist besonders, dass der Rückgang innerhalb von relativ wenigen Spielzeiten in den 80er passiert ist. Die Gründe hierfür sind vermutlich taktische Umstellungen hin zu einem defensiveren Spiel.

Bei den Auswärtsmannschaften sehen wir dagegen keinen deutlichen Trend. Die durchschnittliche Anzahl der Tore geht bis etwa 2002/2003 sehr leicht zurück, seitdem jedoch wieder etwas hinauf. Der letzte Anstieg ist auch statistisch signifikant (auf dem 5%-Niveau).

Insgesamt haben sich hierdurch die durchschnittliche Anzahl der Heim- und der Auswärtstore deutlich angenähert. In der letzten Bundesligaspielzeit 2012/2013 schossen Heimmannschaften im Durchschnitt 1.59 Tore und Auswärtsmannschaften 1.34 Tore. Der Unterschied ist weiterhin ebenfalls statistisch signifikant (auf dem 5%-Niveau, wobei hier die Abhängigkeit beider Variable nicht betrachtet wurde).


Es stellt sich natürlich die Frage, ob die beobachteten Veränderungen durch einzelne bestimmte Ergebnisse geprägt sind, oder ob sie die Trends allgemein über die einzelnen Ergebnisse hinaus entwickelt haben. Im Folgenden zeigen wir die durchschnittlichen Ergebnisse für je zehn der ersten 50 Spielzeiten der Bundesliga auf.

Auf die Entwicklung einzelner Ergebnisse wollen wir nun genauer eingehen, um zu sehen, ob die Entwicklung der Heimtore zum Beispiel durch hohe Siege bestimmt wird. Auch für Unentschieden und Auswärtssiege analysieren wir die Entwicklung einzelner Ergebnisse, denn hier könnten gegenläufige Entwicklungen zu einem stabilen Gesamtbildführen.

Die Entwicklung der einzelnen Ergebnisse analysieren wir mit Hilfe von nicht-parametrischen Regressionsmethoden, die es flexibler erlauben, die Veränderungen über die Zeit darzustellen, als das mit Hilfe von linearen Regressionsmodellen möglich ist. Das "np"-Packet in der Statistik-Programmiersprache R erlaubt, eine einfache Implementierung von nicht-parametrischen Kernel Regressionsmodellen.
Wir verwenden hierbei in allen folgenden Analyse eine feste Bandbreite (von 2.5), um die Vergleichbarkeit zu erleichtern. Beginnen wir mit dem Heimsiegen. In der folgenden Grafik seht ihr die Entwicklung unterschiedlicher Ergebnisse von Heimsiegen über die Zeit, wobei wir alle Ergebnisse mit 3 oder mehr Punkten zusammengefasst haben. (3+1):1 steht damit für 3:1, 4:1, 5:1 und so weiter, während (3++):(3+) Ausgänge wie 4:3, 5:3, 5:4 ... umfassen. Um die gelbe Kurve für (3+:2) herum haben wir die durchschnittlichen Ergebnisse pro Saison eingetragen, so dass man erkennen kann, wie die nicht-parametrischen Kurven im Vergleich zu den zugrundeliegenden Daten verlaufen.

Die Grafik für die Heimsiege zeigt, dass trotz des Rückgangs des Heimvorteils, häufige Spielausgänge wie 2:0 (grün) und 1:0 (blau) gleichwahrscheinlich geblieben sind. Der häufigste Ausgang eines Heimsieges in Form von 2:1 (rot) ging anteilsmäßig an allen Spielen lange Zeit zurück, von Ende der 1960er bis Anfang der 1990er, ist seitdem jedoch wieder etwas häufiger zu sehen. Diese Siege der Heimmannschaft, die mit weniger Tore erreicht werden, können den allgemeinen Trend also nicht erklären. Zurückzugehen scheinen dagegen insbesondere hohe Heimsiege wie 3:1, 3:0, 3:2 (und höher) sowie Spiele in denen die Heimmannschaft letztendlich trotz vieler Gegentore gewinnt wie 4:3 (braun). Es sind also die Kantersiege und hohe Spielausgänge, die wir seltener sehen. Dies spiegelt sich natürlich in der durchschnittlichen Zahl der erzielten Heimtore wieder, wie wir es weiter oben gesehen haben.

Als nächstes gucken wir uns die Entwicklung der Unentschieden an. (3+):(3+) steht hierbei für 3:3, 4:4 oder 5:5. Ein 5:5 ist übrigens zwei mal aufgetreten, am 6. Spieltag der Saison 1973/1974 im Spiel Schalke 04 gegen Bayern München und am 13. Spieltag der folgenden Saison in der Begegnung Eintracht Frankfurt gegen VfB Stuttgart. Die unterschiedlichen Ausgänge der Unentschieden laufen relativ parallel, insgesamt ist der Anteil der Unentschieden stabil, wobei erkennbar ist, dass die Zunahme der Unentschieden Ende der 1980er insbesondere durch torarme 0:0 (blau) und 1:1 (rot) getrieben ist, während 2:2 (grün) und höhere Unentschiede (3+):(3+) sich über die Zeit kaum verändert haben. Nach der Einführung der 3-Punkte-Regel ist dieser Anstieg aber langfristig wieder zurückgegangen. Zur Illustration haben wir unter die geglättete Kurve der 1:1 auch die Durchschnitte pro Saison eingezeichnet.

Bei den Auswärtssiegen haben wir festgestellt, dass deren Anteil seit Anfang der 2000er leicht angestiegen ist. In der folgenden Grafik sieht der Anstieg von Auswärtssiegen aufgrund des feineren Maßstabs (die y-Achse endet hier bei 8%) deutlich ausgeprägter aus, wobei auch leicht zu erkennen ist, dass der Anteil der Auswärtssiege insbesondere in den letzten Jahrzehnten angestiegen ist. Hohe Spielausgänge wie 2:(3+) (gelb) sind dabei auch nicht erkennbar zurückgegangen, im Gegensatz zu den Heimsiegen wie wir es weiter oben festgestellt haben. Nur sehr torreiche Partien, die mit einer Heimniederlage enden, wie 3:4 sieht man heutzutage seltener, waren aber auch früher sehr selten. Der Heimvorteil geht eindeutig zurück, und dies bei ganz unterschiedlichen Spielausgängen.


Samstag, 5. April 2014

Der Heimvorteil: Klarer Trend über die Zeit



Ein bekanntes Phänomen beim Fußball ist der "Heimvorteil". Nationalmannschaften scheiden bei Weltmeisterschaften zu Hause oft relativ erfolgreich ab. In der Champions League und im European Cup drücken Spieler und Trainer die Daumen, dass sie das Rückspiel doch bitte im eigenen Stadion antreten dürfen, und auch in der Bundesliga sehen wir einen beachtlichen (statistischen) Vorteil der Heimmannschaft gegenüber dem Team, dass auswärts antretten muss.

Im langjährigen Durschnitt von 1963/1964 bis zur Winterpause der Saison 2013/2014 sehen wir, dass die Heimmannschaft 51,2% aller Bundesligapiele gewinnen konnte (in 15.394 Spielen), aber nur in 22,9% aller Spiele konnte sich das Auswärtsteam durchsetzen. Dies hat ganz unterschiedliche Gründe: Die Fans spielen natürlich eine große Rolle, die Schiedsrichter bevorteilen die Heimmannschaft (und werden ebenfalls durch die Fans beeinflusst; siehe Dohmen, 2008), die Anreise mag ein Grund sein oder die Kenntniss des eigenen Platzes. Skarupke (2000) hat den Heimvorteil, sowie mögliche Gründe dafür, auch in einem wissenschaftlichen Arbeitspapier untersucht.

Aber wie hat sich der Heimvorteil über die Zeit entwickelt? Die folgende Grafik zeigt die durchschnittliche Anzahl der Heimsiege pro Saison und weist auf einen klaren Trend hin: Die Bedeutung des Heimvorteils hat nach den 1970er über die Zeit abgenommen. Der Rückgang war besonders deutlich von Ende der 70er bis zum Ende der 80er Jahre, hat sich aber seitdem weiter fortgesetzt. In der folgenden Grafik ist der Anteil der Siege an allen Spielen zu sehen:

Ein sehr ähnliches Bild ergibt sich, wenn man nur die Spiele betrachtet, die ohne Unentschieden geendet sind:

Die 3-Punkte-Regel hat hier anscheinend nur einen geringen Einfluss. Die durchschnittliche Anzahl an Heimsiegen in den Jahren vor und nach der Umstellung der Zählweise ist sehr ähnlich. Aber selbst seit der Einführung zur Saison 1995/1996 scheint die Bedeutung weiter abzunehmen. 


Zur Einfachheit haben wir im Folgenden die ersten 50 Jahre der Bundesliga in fünf Dekaden unterteilt und uns die durchschnittliche Anzahl der Spiele angeguckt, in denen die Heimmannschaft gewonnen hat. Hier sieht man deutlich, dass in den letzten zehn Jahren die durchschnittliche Zahl an Heimsiegen mit 45,7% deutlich unter der langfristigen Quote von 51,2% lag. Bis zur Winterpause lag der Anteil an Heimsiegen übrigens bei 46,7%. Der Fernsehsender ntv hat über diese Entwicklung geschrieben, dass der Heimvorteil kein Vorteil mehr sei, aber das stimmt nicht, auch in der ersten Häfte der Saison 2013/2014 gewann die Heimmannschaft noch deutlich häufiger, denn der Anteil der Auswärtssiegen lag nur bei 30,3. Dies entspricht im Durchschnitt 1,63 Punkten für die Heimmannaschaft gegenüber 1,14 Punkten für die Gäste, in statistisch signifikanter Unterschied.

Damit geht die Frage einher, ob der Rückgang des Heimvorteils durch mehr Unentschieden oder durch mehr Auswärtssiege kompensiert wurde. Im Folgenden gucken wir uns zunächst die Anzahl der Auswärtssiege an.

Hier ist ebenfalls ein klarer Trend zu mehr Auswärtssiegen zu erkennen, der gegenläufig zur Entwicklung der Heimsiege verläuft. Dieser Trend ist leichter zu erkennen, da er die Schwankungen um die Trendkurve geringer sind. Legen wir eine quadratische Funktion durch die durchschnittliche Anzahl der Heimsiege pro Saison, so erklärt diese Funktion 85% der Varianz der Unterschiede (das Bestimmtheitsmaß) in der Auswärtssiegquote über die unterschiedlichen Spielzeiten der Bundesliga, aber „nur“ 54% der Varianz der Heimsiegquote über die unterschiedlichen Saisons.


Was könnten die Gründen für den Rückgang des Heimvorteil sein? Ein Grund mag sein, dass die Anreisen komfortabler geworden sind, und die Auswärtsspieler heutzutage entsprechend weniger erschöpft sind. Aber auch die Schiedsrichterausbildung wird heute professioneller ablaufen als vor einigen Jahren, und dies könnte dazu beitragen, dass die Schiedsrichter fairer entscheiden, und weniger durch das Heimpublikum beeinflusst werden. Auch die verbesserten Trainingsmöglichkeiten könnten ein Grund sein, Spielfeldgrößen unterscheiden sich teilweise relativ deutlich, und heutzutage stehen den Vereinen teilweise Plätze unterschiedlicher Größe zur Verfügung.

Als letztes zeigen wir noch die Entwicklung der Unentschieden, allgemein enden in der Bundesliga knapp unter 26% aller Spiele mit einem Unentschieden (bis zur Winterpause waren dies 23% der Spiele in der Saison 2013/2014):

Bei der Entwicklung der Unentschieden ist kein allgemeiner Trend zu erkennen. Deutlich ist aber der Anstieg der Unentschieden ab Mitte der 1980er Jahre, der zur Einführung der 3-Punkte-Regel geführt hat. Akademische Studien wie zum Beispiel Dilger und Geyer (2007) bzw. Dilger und Geyer (2009) haben daraufhin untersucht, inwiefern die 3-Punkte-Regel ursächlich dazu beigetragen hat, die Anzahl der Unentschieden zu senken. Die oben genannten Studie kommen, dabei zum Ergebnis, dass die 3-Punkte-Regel tatsächlich erfolgreich war, Unentschieden zu verringern. Das Ergebnis wird allerdings von Strauß et al. (2009) angezweifelt.

Sieht man sich die Entwicklung an, so scheint es schwer festzustellen, ob der Anstieg Mitte der 1980er nur ein temporäres Phänomen war, oder tatsächlich durch die 3-Punkte-Regel gestoppt werden konnte. Aber vielleicht werden wir uns mit der Fragestellung in einem zukünftigen Post beschäftigen.

Der Heimvorteil ist, wie wir in das in der Einleitung angedeutet haben, ein internationales Phänomen. Obwohl das Ausmaß des Heimvorteils historisch zwischen den europäische Ligen sehr unterschiedlich war, verläuft die Entwicklung des Heimvorteils in den großen in Europa sehr ähnlich. Dies wird in zwei lesenswerten Artikeln bei ClubElo.com beschrieben. Die Bundesliga ist übrigens nicht besonders auffällig, in der Vergangenheit war der Heimvorteil in Spanien größer und in England niedriger als hierzulande. Heutzutage ist dagegen die Größe des Heimvorteils in Europa sehr ähnlich:
ClubElo.com "Home Field Advantage per Country"
ClubElo.com "The mysterious decline of home advantage"


Daten: Bundesliga Spiele 1963/1964 - Winterpause 2013/2014

Weitere Informationen:
Bring, Johan, and Marcus Thuresson. "Three points for a win in soccer: Is it fair?." Chance 24.3 (2011): 47-53.
Dilger, Alexander, and Hannah Geyer. "Theoretische und empirische Analyse der Drei-Punkte-Regel." Sport und Gesellschaft 3 (2007).
Dilger, Alexander, and Hannah Geyer. "Are three points for a win really better than two? A comparison of German soccer league and cup games." Journal of Sports Economics 10.3 (2009): 305-318.
Dohmen, Thomas J. "The influence of social forces: Evidence from the behavior of football referees." Economic Inquiry 46.3 (2008): 411-424.
Skarupke, Robert. "Quantifizierung des Heimvorteils im deutschen Profifußball: Eine empirische Untersuchung für die 1. Fußball-Bundesliga". (August 2000) (2000).
Strauß, B., N. Hagemann, and F. Loffing. "Die Drei-Punkte-Regel in der deutschen 1. Fußballbundesliga und der Anteil unentschiedener Spiele." Sportwissenschaft 39.1 (2009): 16-22.