Samstag, 21. Dezember 2013

Spanische oder schottische Verhältnisse: Gibt es einen Trend in der Bundesliga?

Das Thema dieses Posts beschäftigt sich mit der Frage, ob in den letzten Jahren in der Bundesliga ein Trend hin zu spanischen oder schottischen Verhältnissen feststellbar ist. Wir wollen untersuchen, ob es der Fall ist, dass sich der Meister bzw. der Führende deutlicher abgesetzt haben, als das in der Vergangenheit der Fall war. Die Dominanz von Bayern München in der aktuellen und der letzten Spielzeit ist in den Medien breit diskutiert wurden, und ein Blick auf die aktuelle Tabelle scheint dies auch zu bestätigen. Aber handelt es sich hierbei wirklich um einen Trend oder nur um aktuelles Phänomen, das vielleicht in zwei Jahren schon wieder ganz anders aussieht?

Um diese Frage zu beantworten gucken wir uns zunächst die Abschlusstabellen der Bundesliga nach dem 34. Spieltag an; getrennt für die Spielzeiten vor und nach der Einführung der 3 Punkte Regel (wobei wir immer mit der 3 Punkte Regel rechnen). Die ersten beiden Spielzeiten sowie die Bundesliga Saison „1991/1992“ in denen 16 bzw. 20 Mannschaften mitgespielt haben, lassen wir dabei außen vor (sie würden das generelle Bild allerdings nicht ändern). Die fünf stärksten und schwächsten Spielzeiten haben wir dabei graphisch nochmal hervorgehoben.

In der folgenden Grafik sehen wir pro Bundesligasaison die Punkte des jeweiligen Meisters. Im langjährigen Durchschnitt von 1963/64 bis 2012/13 wurde die "durchschnittliche Meisterschaft" mit ziemlich genau 70 Punkten gewonnen. Vor Einführung der 3-Punkte-Regel ist kein Trend erkennbar. Insbesondere die Spielzeiten kurz vor der Umstellung der Punktebewertung scheinen sich durch relativ „leicht“-gewonnene Meisterschaften auszuzeichnen. In der Saison 1993/94 reicht Bayern München zum Beispiel (umgerechnet) 61 Punkte für die Meistterschafle. Ein Grund hierfür sind eine große Zahl an Unentschieden in diesen Spielzeiten, die auch zur Einführung der 3 Punkte Regel beigetragen haben. 


In der Zeit nach der Einführung der 3 Punkte Regel scheint es allerdings einen leichten Aufwärtstrend zu geben (die Gerade ist auch „statistisch signifikant“ auf dem 5% Niveau), der allerdings auch stark durch die Spielzeiten 2011/12 und 2012/13 bestimmt wird, in denen Borussia Dortmund bzw. Bayern München neue Höchstwerte gesetzt haben. Sieht man von diesen beiden Spielzeiten ab, so sehen die Anzeichen für einen langfristigen Trend deutlich schwächer aus. Die Spielzeiten 2008/2009 und 2009/2010, in denen VfL Wolfsburg und Bayern München Meister wurden, lagen beispielsweise im langjährigen Durchschnitt ca. 70 Punkten. Insgesamt war die durchschnittliche Punktezahl des Meisters nach der Einführung der 3-Punkte Regel höher, aber dies mag für sich genommen erstmal ein allgemeiner (konstanter) Effekt der Umstellung sein.
Um auch die Informationen der aktuellen Saison miteinzubeziehen, schauen wir uns als nächstes die Punkte der führenden Mannschaft nach dem 16. Spieltag an, um zu beobachten ob wir hier ein ähnliches Muster erkennen können, und ob sich ein möglicher Trend in dieser Saison fortsetzt. Zur Vervollständigung haben wir hier auch die Spielzeiten mit 16 bzw. 20 Teams hinzugezogen, da die maximal möglichen Punkte nach 16 Spieltagen gleich hoch sind.


Die Grafik der Punktestände des „16. Spieltagsmeisters“ zeigt dabei ein sehr ähnliches Bild. Es ist kein Trend vor Einführung der 3-Punkte-Regel erkennbar. Wenn überhaupt ist der Anstieg der Gerade eher negativ. Dagegen sehen wir nach Einführung der 3-Punkte-Regel einen positiven Trend. Der Trend ist statistisch nur marginal „signifikant“ auf einem Signifikanzniveau von 0.2, da die Punktestände nach dem 16. Spieltag von Spielzeit zu Spielzeit deutlich mehr streuen als die Endpunktestände nach dem 34. Spieltag. Dies ist ein Bild was wir aus statistischer Sicht erwarten würden, denn die Fallzahlen pro Saison sind hier natürlich geringer. Nichtsdestotrotz, zeigt sich, dass drei der punktstärksten Führenden zu diesem Zeitpunkt einer Saison in den letzten vier Spielzeiten zu finden sind. Borussia Dortmund war in der „Rekordsaison“ 2011/2012 zu diesem Zeitpunkt übrigens unauffällig. Sie gewannen erst nach dem 16. Spieltag alle ihre Spiele bis auf zwei Unentschieden. Daneben sehen wir, dass Bayern München in der 10. Bundesligasaison 1972/73 mit 40 Punkten nach dem 16. Spieltag, ebenfalls sehr weit oben zu finden ist.

Conclusio:
Was schließen wir aus diesen Analysen? Ist es zu früh von einem Trend zur Polarisierung der Liga zu sprechen? Vermutlich ja, denn guckt man sich beispielsweise nur die Spielzeiten bis zur Saison 1972/73 an (in der Bayern München zum zweiten Mal in Folge Meister wurde), könnte man ebenfalls leicht einen Trend erkennen. Allerdings sind die letzten Spielzeiten auch Bezug auf die erreichten Punkte des Meisters bzw. des Führenden nach 16 Spieltagen beachtlich. Nach einem einfachen statistischen Rechenbeisiel würden wir entsprechende Punktzahlen basierend auf den ersten 48 Spielzeiten kaum erwarten würden.[1] Aktuell befinden wir uns sicher in einer Zeit mit (mindestens) einer außergewöhnlich punktestarken Mannschaft, aber ist meiner Meinung nach noch zu früh von einem langfristigen Trend zu sprechen. Dazu tragen auch die sehr "durchschnittlichen" Spielzeiten 2009 und 2010 bei.

Interessant wird es zu sehen, wie es sich die Bundesliga verhält, sobald die aktuelle Generation der Spieler von Borussia Dortmund und insbesondere Bayern München abgelöst (oder abgekauft) werden.

Die Datengrundelage zu allen Spielen findet ihr hier.


[1] Hierzu ein sehr simples Rechenbeispiel: In den ersten 48 Spielzeiten ist der Durchschnitt der Punkte des Meisters 69,9 Punkte und die Standardabweichung davon ist 5.2. Die Verteilung entspricht (sehr) grob einer Normalverteilung. Basierend auf einer Normalverteilung mit diesem Erwartungswert und der Standardabweichung, würden wir einen Wert von 81 (oder mehr) jedoch nur alle 50 Jahre erwarten,  eine Punktzahl von über 90 ist dabei noch deutlich unwahrscheinlicher.
 


Samstag, 14. Dezember 2013

Wahrscheinlichkeit der Paarungen im UEFA Champions League 2013/14 Auslosung Achtelfinale

Unserer erster Post befasst sich mit der Auslosung des Achtelfinales der diesjährigen UEFA Champions League (2013/14) am 16. Dezember 2013. Wir wollen hier die Frage beantworten, mit welcher Wahrscheinlichkeit werden die deutschen Mannschaften gegen einzelne mögliche Gegner antreten?

Bestimmte Teams sind für die deutschen Mannschaften wahrscheinlicher als andere, den für die Auslosung gelten bestimmte Regeln (siehe §7.09 im UEFA Regelwerk):

a) Clubs from the same association cannot be drawn against each other.
b) The winners and runners-up of the same group cannot be drawn against each other.
c) The group-winners cannot be drawn against each other.
d) The runners-up cannot be drawn against each other.


Die genauen Wahrscheinlichkeiten könnten theoretisch exakt berechnet werden. Allerdings stellen nicht alle Ländern (oder Verbände) die gleiche Zahl von Teams. Da Mannschaften eines Landes erst im Viertelfinale gegeneinander antreten dürfen, macht dies die Berechnung der
exakten Wahrscheinlichkeiten schwierig (hier ist die mathematische Methodik beschrieben, mit der die exakten Wahrscheinlichkeiten berechnet werden können): Aus den Gruppen A, D, E und F hat es jeweils eine Mannschaften aus Deutschland und England geschafft das Achtelfinale zu erreichen, wobei je zwei deutsche und je zwei englische Teams auf Platz 1 und Platz 2 liegen. Dagegen haben es „nur“ drei spanische Teams geschafft weiterzukommen (weil Real Sociedad in Gruppe A ausgeschieden ist). Die drei spanischen Mannschaften haben allerdings alle drei den ersten Platz ihrer jeweiligen Gruppe erreicht. 

Eine Monte-Carlo Simulation ist eine einfache Methode, die hierbei helfen kann die Wahrscheinlichkeiten zu berechnen, mit der jeder Gruppensieger einem möglichen Gruppenzweiten zugelost wird. Hierbei nutzen wir durch den Computer berechnete Zufallszahlen und simulieren damit die Auslosung sehr häufig (in unserem Fall 10.000 mal) und gucken wie häufig bestimmte Konstellationen vorkommen.  

Insgesamt ergeben sich so ungefähr 4.000 mögliche Achtelfinalpaarungen, die die Regeln der UEFA erfüllen, von 8! = 8 x 7 x 6 x 5 x 4 x 3 x 2 = 40.320  theoretisch vorstellbaren Kombinationen die Gruppenzweiten den Gruppenersten zuzulosen. Die möglichen Paarungen haben wir einfachhalber mit Hilfe des Computers berechnet, indem wir alle nicht gültigen Kombinationen gelöscht haben.

Eine Schwierigkeit besteht allerdings darin, dass es leicht passieren kann, dass wir bei einer Auslosung zum Ende hin mit Mannschaften übrigbleiben, die wir aufgrund der oben genannten Regeln nicht mehr gegenseitig zuordneren dürfen.
Beispielsweise könnten wir bei einer „naiven“ Ziehung als letzte vier Teams die Gruppensieger Manchester United und Bayern München, und die Gruppenzweiten Arsenal London und Milan, übrigbehalten. Obwohl Milan ein möglicher Gegner beider Mannschaften darstellt, würden wir keine Lösung finden. Manchester City darf als englisches Team nach Regel a) nicht seinem englischen Kontrahenten Manchester United zugelost werden. Auch Bayern München stellt als Vorrundengegner in Gruppe D nach Regel b) kein möglicher Gegner dar. Die UEFA wird vermutlich mit bestimmten Mitteln sicherstellen, dass es bei der Ziehung im Fernsehen zum Ende hin nicht zu unmöglichen Paarungskonstellationen kommt (zum Beispiel mit genügend Urnen haben). Wir haben auch die UEFA angefragt, wie sie sicherstellen, dass es am Ende nicht zu "illegalen" Konstellationen kommt. Leider haben wir keine Antwort erhalten. Dies ist insbesondere nach unwahrscheinlichen Zufallstreffer vom letzten Jahr sehr schade.
 
Um sicherzustellen, dass das nicht eintritt, haben wir die Auslosung in jedem Schritt mit den Gruppenersten begonnen, die am wenigsten potenziell Gegner besitzen (und bei mehreren Fällen unter diesen Gruppenerstern gelost). Am Anfang haben wir entsprechend entweder mit einem englischen oder deutschen Gruppensieger angefangen (also entweder mit ManU, Bayern, Chelsea oder dem BVB), da diese Teams jeweils nur fünf mögliche Gegner haben (nicht-englische bzw. nicht-deutsche Gruppenzweite aus anderen Vorrundengruppen). Die spanischen Mannschaften Atlético, Barca oder Real und das französische Team Paris haben dagegen sieben mögliche Achtelfinalgegner.  

Hier seht ihr das Ergebnis. Auf Grund der geringeren Anzahl an möglichen Gegnern sind Englisch – Deutsche Paarungen besonders wahrscheinlich. Dagegen sind andere Paarungen zwischen Mannschaften mit vielen möglichen Gegnern eher unwahrscheinlich.

Ein sehr ähnliches Muster mit geringen Abweichungen hat 2010MisterChip bei Twitter veröffentlicht. Wir haben ihn versucht zu kontaktieren, um herauszufinden, wie er die Wahrscheinlichkeiten berechnet hat. Leider haben wir keine Antwort erhalten.

Der Code (in der Statistik Programmiersprache) findet ihr hier. Ein anderen Code (fürs letzte Jahr) ebenfalls für R ist hier zu finden.

Ideen, Anmerkungen?