Donnerstag, 28. August 2014

UEFA Champions League 2014/15: Die wahrscheinlichen Gruppengegner der deutschen Teams


Morgen Abend findet die Auslosung der UEFA Champions League 2014/15 statt. Mit welchen Gegnern müssen die deutschen Mannschaften Bayer Leverkusen, Bayern München, Borussia Dortmund und Schalke 04 rechnen? Mannschaften aus dem gleichen Verband dürfen nicht in einer Gruppe spielen, und aufgrund des aktuellen Konfliktes in der Ukraine darf Schachtar Donezk nicht gegen die russischen Vereine aus Moskau und St. Petersburg antreten. Aus diesem Grund ist nicht jede Gruppenkonstellation gleich wahrscheinlich. 
 
Mit Hilfe einer Monte-Carlo Simulation berechnen wir hier (wie zuvor zum Achtelfinale der letzten Saison) die wahrscheinlichsten Gegner der deutschen Teams. 32 Mannschaften aus 18 Verbänden von Belgien bis Weißrussland verteilen sich dabei gleichmäßig auf vier Töpfe. In jeder der acht Gruppen spielt ein Team aus jedem Topf, wobei in keiner Gruppen zwei Mannschaften eines Verbandes landen dürfen. Deutschland, England und Spanien stellen dabei insgesamt vier Mannschaften, drei kommen aus Portugal. Frankreich, Italien und Russland stellen zwei Teams (wobei rein methodisch Russland und Ukraine mit drei Mannschaften zusammengefasst werden, da diese Teams nicht in eine Gruppe zugelost werden dürfen). Die übrigen Teams kommen jeweils aus anderen Ländern.
Die Verbände unterscheiden sich allerdings nicht nur in Bezug auf die Anzahl der Mannschaften, die sie stellen, sondern auch in Hinblick auf die Verteilung der Töpfe, wie folgende Tabelle zeigt:

Drei der acht Mannschaften in Topf 1 kommen aus Spanien, zwei aus Portugal und England, und mit Bayern München ist eine deutsche Mannschaft im höchsten Los vertreten. Mit Borussia Dortmund und Schalke 04 finden wir zwei weitere deutsche Vereine in Topf 2. In Topf 3 ist Bayer Leverkusen durch die Champions League Qualifikation gelangt. Die drei Spanier aus Topf 1 können dabei alle Mannschaften aus Topf 2 als Gruppengegner zugelost bekommen, aber mehrere deutsche Mannschaften dürfen nicht in einer Gruppe landen. Auch darf Manchester City als einziges englisches Team aus Topf 2 nicht gegen die beiden Nachbarn aus London Arsenal oder Chelsea (beide Topf 1) spielen. 

Rechnet man nun zusätzlich Topf 3 und Topf 4 ein, so ergeben sich zahlreiche theoretische Kombinationen, die aufgrund des Regelwerkes nicht erlaubt sind. Wie groß wirkt sich dies aus?
Wir verwenden dabei 250.000 Simulationen. Für Bayern München aus Topf 1 ergibt sich dabei mit etwas höherer Wahrscheinlichkeit Manchester City, da dieser Verein durch Arsenal und Chelsea weniger potenzielle Gegner in Topf 1 hat, als die anderen Mannschaften, die gegen Bayern spielen dürfen. In 21% der Simulationen finden sich beide Vereine in einer Gruppe wieder, während dies bei knapp unter 16% der anderen Teams der Fall ist. Bilbao darf gleich gegen drei Mannschaften aus Topf 1 nicht antreten und entsprechend höher ist Wahrscheinlichkeit, dass die Basken gegen die Bayern spielen werden. In Topf 4 sehen wir dagegen kaum Unterschiede, da keines dieser Mannschaften einen Gegner aus dem gleichen Verband in Topf 1 hat. 


Borussia Dortmund und Schalke 04 unterscheiden sich nicht in Hinblick auf die Wahrscheinlichkeiten der möglichen Gruppengegner. Auch sie haben eine leicht höhere Wahrscheinlichkeit eine englischen Gegner zu erhalten (jeweils 32% entweder Arsenal oder Chelsea). ZSKA Moskau ist mit 18,5% der wahrscheinliche Gegner aus Topf 3 (da ZSKA weder gegen St. Petersburg noch gegen Donezk spielen darf) gefolgt von Liverpool mit 15%. Monaco und Rom sind leicht wahrscheinlicher als die übrigen Vereine aus Topf 4 (aufgrund einem franz. und italienischen Team in Topf 2).


Für Bayer Leverkusen ist entsprechend ein englischer Gegner aus Topf 1 ein klein wenig unwahrscheinlicher, dafür ist aber mit Manchester City, Donezk und St. Petersburg, ein Verein auf Topf 2 aus England, Ukraine oder Russland ein wahrscheinlicherer Gruppengegner (18,1% gegenüber etwas über 15%).


Geht man nun von den Wahrscheinlichkeiten für einzelne Gegner weg, und guckt sich die Wahrscheinlichkeiten für unterschiedliche Gruppenkonstellationen an, so findet man beispielsweise, für Borussia Dortmund oder Schalke 04, 336 mögliche Konstellationen, deren Wahrscheinlichkeit zwischen ca. 0,2% und 0,5% liegt. Eine ganze leichte Gruppe ist dabei eher unwahrscheinlich, da insbesondere Monaco und Rom aus Topf 4, oder Liverpool aus Topf 3 hier häufig gezogen wird. Allerdings sind Real Madrid oder Barcelona nicht die wahrscheinlichsten Gegner. Für Bayern München oder Bayer Leverkusen sieht das entsprechend aus.
















Sonntag, 17. August 2014

Spannende Meisterschaften und die Nationalmannschaft

Vor einem halben Jahr haben wir analysiert, wie viele Punkte die jeweilige Meistermannschaft in der Bundesliga sammeln konnte. Die letzten Spielzeiten waren von extrem deutlichen Meisterschaften geprägt, stärker noch als die Bundesligaspielzeiten 1971-1972 und 1972-1973 in denen Bayern München mit jeweils 79 Punkten Meister wurde (umgerechnet auf die 3-Punkte-Regel). In diesem Post wollen wir untersuchen, ob und wie sich dies auf die deutsche Nationalmannschaft ausgewirkt hat. Nebenbei ist dabei natürlich auch die Frage interessant: Wann war die deutsche Nationalmannschaft erfolgreich, mit Spielen aus unterschiedlichen oder wenigen Vereinen? Und profitiert die Nationalmannschaft von eindeutigen Meisterschaften und eingespielten Spielern?

In diesem Post betrachten wir die Vereinszusammensetzung der Startspieler der Deutschen Nationalmannschaft bei Welt- und Europameisterschaften seit 1954. Wie viele Vereine stellen in jedem Turnier die Stammspieler der Nationalmannschaft und wie groß ist die Anzahl der Spieler des Vereins mit dem größten Kontigent? Ist ein großer Block in der Nationalmannschaft wie wir ihn bei dieser Weltmeisterschaft in Brasilien mit Bayern München Spielern gesehen haben ungewöhnlich? Oder haben wir so eine Gruppe bereits häufiger in der Vergangenheit gesehen? Wir beschränken uns dabei auf Startspieler, da die Informationen für Einwechselspieler für die Vergangenheit nicht immer einfach verfügbar ist. Die Daten beruhen auf der Datenbank von weltfussball.de. 

In der folgenden Grafik haben wir die durchschnittliche Zahl der Startspieler von dem Verein, der die meisten Spieler stellt über die Zeit dargestellt. In grau sind dabei die erzielten Punkte der Meistermannschaft in der Bundesliga (seit 1963/1964) dargestellt.

 

Gehen wir chronologisch vor: Die Fußball-Weltmeisterschaft 1954 in Ungarn wurde von Spielern des 1. FC Kaiserslautern dominiert. Der Verein stelle mit Werner Kohlmeyer, Werner Liebrich, Horst Eckel, Ottmar Walter und Fritz Walter zwischen in der Gruppenphase zwischen 3 und 4 Startspieler, in der KO-Runde sogar jeweils fünf Spieler. Insgesamt ein Durchschnittswert von 4,4. Die folgenden Weltmeisterschaft 1958, 1962, 1966 und 1970 konnte kein Verein mehr als drei Startspieler stellen. So spielten zum Beispiel beim verloren gegangen Finale der Weltmeisterschaft 1966 in England, bekannt durch das legendäre Wembley Tor, drei Spieler von Borussia Dortmund, je zwei vom Hamburger Sportverein und dem 1. FC Köln, und je ein Spieler vom AC Mailand, Bayern München, Bologna FC, und SV Werder Bremen. Beim "Jahrhundertspiel", dem Halbfinale der WM 1970 gegen Italien, starteten drei Bayern München Spieler, je zwei HSV und FC Köln Spieler, und je ein Spieler von Borussia Mönchengladbach, AC Mailand, Eintracht Frankfurt und Hertha BSC.  

Aber in der vierten Europameisterschaft 1972 in Belgien, der ersten mit Deutscher Beteiligung, änderte sich dies deutlich. Die deutsche Nationalmannschaft brauchte nur zwei Spiele in der Endrunde mit identischer Startaufstellung zum Titel, in denen standen mit Sepp Maier, Georg Schwarzenbeck, Franz Beckenbauer, Uli Hoeneß, Paul Breitner und Gerd Müller sechs Spieler von Bayern München auf dem Platz. Ansonsten stelle Borussia Mönchengladbach mit Günter Netzer, Herbert Wimmer und Jupp Heynckes drei Spieler und SV Werder Bremen und Schalke 04 mit Horst-Dieter Höttges und Erwin Kremers je einen. Beim zweiten Weltmeistertitel 1974 im eigenen Land änderte sich relativ wenig in Bezug auf die Startaufstellung. Paul Breitner wechselte nach der WM zu Real Madrid und weltfussball.de zählt ihn im historischen Kader schon als Real Madrid Spieler. Entsprechend starteten meist fünf Spieler von Bayern München, nur im Spiel gegen Jugoslawien war es vier. Unter den übrigen Vereinen stellten Borussia Mönchengladbach mit Berti Vogts, Rainer Bonhof, Herbert Wimmer und Jupp Heynckes, 1. FC Köln mit Bernd Cullmann, Heinz Flohe und Wolfgang Overath, Eintracht Frankfurt mit Jürgen Grabowski und Bernd Hölzenbein sowie Fortuna Düsseldorf mit Dieter Herzog Startspieler.   

Die folgenden Jahre waren mit einem Europameisterschaftstitel 1980 in Italien und zwei Vizeweltmeisterschaften 1982 in Spanien und 1986 in Mexiko von einer Nationalmannschaft bestehend aus Spielern unterschiedlicher Vereine geprägt. Beim dritten Weltmeistertitel 1990 in Italien gab es beispielsweise kein Spiel in denen mehr als drei Spieler eines Vereins auf dem Spiel standen (erneut nur Startspieler). Inter Mailand stellte mit Lothar Matthäus, Andi Brehme und Jürgen Klinsmann meist drei Startspieler, Bayern München mit Stefan Reuter, Klaus Augenthaler, Hans Pflügler, Jürgen Kohler und Olaf Thon entweder zwei oder drei. In fast jedem Spiel starten mit Thomas Berthold und Rudi Völler auch zwei Spieler von AS Rom. Es waren aber mit Spielern wie Bodo Illgner, Pierre Littbarski, Thomas Häßler, Guido Buchwald, Uwe Bein und Karl-Heinz Riedle auch Startspieler vom 1. FC Köln, Juventus Turin, VfB Stuttgart, Eintracht Frankfurt und Werder Bremen/Lazio Rom verteten.

Die aus deutscher Sicht teilweise erfolgreichen, häufig aber auch enttäuschenden Turniere zwischen 1992 und 2004 waren von starken Kontigenten einzelner Mannschaften (1996 und 2000), aber auch sehr ausgeglichenen Nationalmannschaften (1992, 1994, 2004) geprägt. Ein klares Muster ist dabei nicht zu erkennen. Zwar konnte ein starker Block um Bayern München und Borussia Dortmund die Europameisterschaft 1996 in England gewinnen und Deutschland den dritten Titel bei einer Europameisterschaft sichern. Hier spielten beispielsweise je vier Spieler der beiden Vereine in der Startformation im Halbfinale und sechs Spieler von Bayern München im Finale. Aber ein starker Block aus München konnte die Enttäuschung vier Jahre später bei der Europameisterschaft 2000 in den Niederlanden nicht verhindern, als Deutschland zusammen mit England bereits nach der Vorrunde abreisen musste. Auf der anderen Seite waren auch die Weltmeisterschaft 1994 und 1998 in den USA und in Frankreich mit zwei Viertelfinalniederlagen gegen Bulgarien und Kroatien eher enttäuschend, während die Europameisterschaft 1992 in Schweden im Finale nur knapp verloren ging. Hier konnte keine Mannschaft in einem Spiel mehr als zwei Spieler stellen. Und Deutschland in Japan und Südkorea bei der Weltmeisterschaft 2002 überraschend (und aufgrund leichter Gegner in der Final-Runde) das Finale erreichen konnte. Hier schaffte es nur Bayer Leverkusen im Halbfinale gegen Südkorea vier Spieler zu stellen, während Bayern München meist drei Spieler stellte.

Im Sommermärchen 2006 waren Philipp Lahm, Bastian Schweinsteiger und Lukas Podolski für Bayern München gesetzt, Michael Ballack war auf dem Weg nach London und wird bei weltfussball.de bereits als Chelsea Spieler gezählt, währen die übrigen Startspieler aus unterschiedlichen Vereinen kamen. Torsten Frings und Miroslav Klose waren Stammspieler, Tim Borowski spielte für Frings im Halbfinale sowie beim Auftaktspiel (und als regelmäßiger Einwechselspieler). Per Mertesacker war von Hannover auf dem Weg in Richtung Bremen. Ansonsten starteten (ohne das Spiel um den dritten Platz) Spielern wie Jens Lehmann, Arne Friedrich, Christoph Metzelder, Sebastian Kehl, Bernd Schneider und Robert Huth aus Arsenal FC, Hertha BSC, Borussia Dortmund, Bayer Leverkusen und Chelsea FC.

In der Europameisterschaft 2008 in Österreich und der Schweiz sowie bei der Weltmeisterschaft 2010 in Südafrika begann unter Jürgen Löw eine Entwicklung zu einem großen Block, die die Bayern München Spieler Bastian Schweinsteiger und Philipp Lahm ergänzten. Während der ersten beiden Gruppenspiele der Europameisterschaft 2012 in Polen und der Ukraine und dem Achtelfinale der Weltmeisterschaft 2014 in Brasilien gegen Algerien sah man zum ersten Mal 7 Startspieler aus einer Mannschaft während eines großen Turniers in der dt. Nationalmannschaft. Diese Periode war überaus erfolgreich, zwei Finalteilnahmen und zwei mal das Erreichen des Halbfinales und der vierte Weltmeistertitel für Deutschland. 

Wir sahen bereits, dass in den Bundesligaspielzeiten 1972 und 1973 die Meisterschaft mit einer sehr hohen Punkteausbeute einherging. Die Europameisterschafts-Elf um die Bayern München und Borussia Mönchengladbach gilt heute noch als die vermutlich beste deutsche Mannschaft. Ein ähnliches Phänomen beobachtet wir heute wieder. Nach drei Rekordmeisterschaften durch Borussia Dortmund und Bayern München folgt durchaus nicht überraschend eine Nationalmannschaft, die zumindest durch Bayern München geprägt ist. Entsprechend finden wir über den gesamten Zeitraum 1954-2014 eine mittlere bis hohe Korrelation zwischen der Anzahl der Startspieler von dem Verein mit dem größten Kontigent und dem Punkten der Meistermannschaft in der Bundesliga in Höhe von 0,51. Ein ähnliches Bild ergibt sich auch, wenn wir die Differenz zwischen Bundesligameister und Zweiten verwenden oder die Standardabweichung der Punkte pro Spielzeit.

Ein anderes Maß für die Konzentration in der Nationalmannschaft bestätigt ebenfalls diese Beobachtung. Hier schauen wir uns nicht die Zahl der Spieler der Mannschaft mit dem größten Kontigent an, sondern die Zahl der vertretenden Mannschaften in der Startformation:


Die Grafik muss man entsprechend spiegelverkehrt zur obigen lesen. Fast durchschnittlich zehn vertretenden Mannschaften während der Weltmeisterschaft 1994 bedeutet, dass es sich hier um einen bunt zusammengewürfelten Haufen gehandelt hat. Auffälig ist hier besonders die Europameisterschaft 1972 wo in der Finalrunde nur vier Mannschaften unter den Startspielern vertreten waren (mit Bayern München, Mönchengladbach, Schalke und Werder Bremen, siehe oben). Aber auch die letzten beiden Turniere sind sehr auffälig mit wenig vertretenden Mannschaften. Im Gegensatz zur obigen Grafik fällt aber auf, dass der erste deutsche Weltmeistertitel 1954 eher durch Spieler aus unterschiedlichen Teams plus einen kleineren Block um FC Kaiserslautern herum gewonnen werden konnte.

Die Analysen zeigen, dass nicht unerwartet eine Dominanz in der Liga auch auf dei Nationalmannschaft überträgt. Große Erfolge konnten dabei mit eingespielten Mannschaften wie 1972, 1974 oder eben 2014 erzielt werden. Aber auch eine "wilde Truppe" aus unterschiedlichen Teams kann erfolgreich sein, wie wir es 1980 oder 1990 gesehen haben. Und der erste Weltmeistertitel 1954 und die der letzte Europameistertitel 1996 lagen irgendwo dazwischen.

Ein klares Muster konnten wir dabei soweit nicht finden. Als einfache statistische Analyse haben wir daher die pro Jahr durchschnittlich erzielten Punkte pro Pflichtspiel (auch Qualifikation für WM / EM, Confed-Cup aber ohne Freundschaftsspiele) mit der durchschnittlichen Zahl der Startspieler des Vereines mit dem größten Kontingent verglichen. Dabei haben wir zur Einfachheit halber alle Spielausgänge auch Elfmeterschießen gewertet. Hier zeigt sich eine leichte bis moderate positive Korrelation von 0.34. Für die Zahl der vertretenden Vereine der Startspieler ist die Korrelation aber sehr gering: -0.14. Auf eine detaillierte Analyse mit einzelnen Spieldaten inkl. wollen wir an dieser Stelle verzichten.

Zusammenfassend finden wir einen robusten Zusammenhang zwischen der Situation an der Spitze der Bundesliga und der Spielerzusammensetzung in der Nationalmannschaft (dies gilt auch für Qualifikationsspiele und Freundschaftsspiele, die wir hier weitgehend ausgeklammert haben). Große Erfolge wurden mit Mannschaften aus wenigen Vereinen erzielt, wie 1972 oder 2014, aber auch mit weniger eingespielten Mannschaften wie 1980 oder 1990. Einen leichten Vorteil für die Nationalmannschaft könnte aber existieren, falls viele Spieler durch ihre Vereine miteinander vertraut sind. Dies könnte (leider) auf einen Zielkonflikt zwischen Spannung in der Bundesliga in Bezug auf die Meisterschafteund Erfolg der Nationalmannschaft hindeuten.

Sonntag, 13. Juli 2014

Ein Ex-Post Vergleich der Prognose der FIFA Weltmeisterschaft 2014



Nachdem wir am Anfang der FIFA Weltmeisterschaft 2014 unterschiedliche Prognosen in Hinblick auf ihre Methodiken vorgestellt und diskutiert haben, wollen nun zum Ende der Weltmeisterschaft in Brasilien vergleichen, wie gut die Prognosen den tatsächlichen Turnierbaum vorhergesagt haben. In den hier vorliegenden Prognosen ist die Vorhersage für einen Weltmeistertitel Argentiniens dabei meist relativ ähnlich zu den Chancen für Deutschlands. Daher macht es nur einen geringen Unterschied, ob wir das Finale noch abwarten oder nicht.

Wir haben die Autoren der hier vorgestellten Prognosen kontaktiert, und um einen Turnierbaum mit berechneten Überlebenswahrscheinlichkeiten für jedes Team und jede Runde gebeten (falls diese nicht öffentlich verfügbar waren wie bei Goldman Sachs oder Goalimpact). Damit sind Prognosen wie von Gerhards et al. ausgeschieden, die keine Simulation durchgeführt haben. Bis auf die Commerzbank haben uns freundlicherweise alle Autoren geantwortet und ihre Überlebenswahrscheinlichkeiten zur Verfügung gestellt, womit wir sechs Prognosen vergleichen können. Vielen Dank an dieser Stelle an Achim Zeileis, Gunther Schauberger und Ritchie King!

Die hier diskutierten Prognosen im Vergleich, die Daten findet ihr hier (siehe einzelne Sheets):
 

Hierunter sind drei Prognosen, die sich auf historische Mannschaftsdaten stützen, zwei Vorhersagen, die detailliert Spielerstärken aus nationalen Ligen modellieren und eine Studie, die die Wettquoten für den Sieg bei der diesjährigen WM verwendet hat.

Unter den Prognosen, die historische Mannschaftsdaten verwenden, findet sich erstens die Prognose von Goldman Sachs, die wir bereits vorgestellt haben. Zweitens, eine Vorhersage von zwei Statistikern aus München, Groll und Schauberger (eine ausführlichere Präsentation ist hier zu finden), die uns leider erst im Laufe der Weltmeisterschaft aufgefallen ist und daher im letzten Artikel nicht enthalten ist. Und drittens eine Abwandlung meines eigenen Algorithmus, welches ich für unterschiedliche Tippspiele verwendet habe und das ich als Vergleich für ein einfaches Modell mit historischen Daten vorstellen möchte. 

Die Prognose von Groll und Schauberger verwendet Daten der Weltmeisterschaften von 2002 bis 2010 und eine Reihe von Kontrollvariablen, wie das Bruttosozialprodukt pro Kopf, Bevölkerung, FIFA Weltrangliste, Heim und Kontinentalvorteil, Charakteristika des Trainers und der Mannschaft, z.B. Anzahl der Champions League Spielern, und noch einige mehr, sowie teamspezifische Fehlerterme, um die erzielten Tore vorherzusagen.

Meine eigene Prognose, die ich für Tippspiele verwendet habe, nutzt als Datengrundlage die WM Qualifikationsspiele der letzten 6 Jahre und stützt sich auf die Wettquoten und Elo-Rankings (sowie teamspezifische Fehlerterme), um die erzielten Tore einer jeder Mannschaft zu modellieren. Damit eignet sie sich leider nicht für eine Simulation, da die Wettquoten nur für die tatsächlichen Partien vorliegen. Hier habe ich um einen Vergleich zu ermöglichen eine einfachere Prognose gewählt, die nur die Elo-Rankings und teamspezifische Fehlerterme verwendet. Sowohl die Prognose von Groll und Schauberger wie meine eigene verwenden dabei Poisson-Spezifikationen, da damit sichergestellt werden kann, dass die Prädiktion für die erzielten Tore nicht negativ wird.

Zwei der Prognosen modellieren die Stärke der Spieler, FiveThirtyEight.com und Goalimpact.com, und eine Studie (Zeileis, Leitner und Hornik) verwendet die Wettquoten für den Gewinn der Weltmeisterschaft einer jeder Mannschaft. Diese drei Prognosen haben wir bereits Anfang der Weltmeisterschaft vorgestellt.

Zur Methodik: Hier nehme ich an, dass die Wahrscheinlichkeit des Erreichens des Achtelfinales bzw. der weiteren Runden einer Mannschaft unabhängig davon ist, wer aus der Ursprungsgruppe noch das Achtelfinale erreicht. Damit kann ich dann einfach die Wahrscheinlichkeiten einer jeder Mannschaft die nächste Runde zu erreichen (ihre Überlebenswahrscheinlichkeiten) aufmultiplizieren. Die Berechnungen sind hier einsehbar. Diese Annahme ist natürlich nicht erfüllt, aber eine Verletzung der Annahme wird vermutlich keine größeren Auswirkungen haben und gilt für alle Prognosen gleichermaßen. Auch kann ich hier wenig machen, da ich aus den Überlebenswahrscheinlichkeiten für jede Mannschaft und jede Runde nicht die Wahrscheinlichkeit für jede mögliche Achtelfinalpartie berechnen kann, da das entsprechende Gleichungssysteme unterbestimmt (pro Gruppe gibt es sechs mögliche Kombinationen der Achtelfinalteilnehmer aber nur fünf Gleichungen stehen zur Verfügung, da ich meist keine Informationen darüber habe, welche Mannschaft mit welcher Wahrscheinlichkeit Gruppenerster bzw. -zweiter wird).

Zunächst zu den einzelnen Gruppen, die folgenden Grafik zeigt die Wahrscheinlichkeit für jede Mannschaft jeder Gruppe das Achtelfinale zu erreichen. Blau hervorgehoben ist der Gruppenerste und rot der Gruppenzweite. Auf der x-Achse ist jeweils für jedes Team die Wahrscheinlichkeit aus unterschiedlichen Prognosen dargestellt, das Achtelfinale zu erreichen. Diese Wahrscheinlichkeiten addieren sich jeweils pro Gruppe zu 2, da jede Gruppe zwei Mannschaften ins Achtelfinale schickt. GS steht dabei für Goldman Sachs, GI für Goalimpact, Zeileis für Zeileis et al., FTE für FiveThirtyEight, Groll für Groll & Schauenberger und Elo + RE für meine eigene Prognose.


Einen unwahrscheinlichen Ausgang aus Sicht der Prognose nahm Gruppe D wo sich Costa Rica den Gruppensieg sichern konnte. Bei allen Prognosen aber nur die geringste Wahrscheinlichkeit vorhergesagt bekam, überhaupt das Achtelfinale zu erreichen, Werte zwischen 11% (Groll) und 40% (Goalimpact). Daneben sahen alle Prognosen Spanien als den wahrscheinlichsten Gruppensieger in Gruppen B, aber sowohl Niederlande wie Chile wurden auch nennenswerte Chancen zugestanden. In den Gruppen F, G, H wurde die Gruppenersten Argentinien, Deutschland und Belgien einstimmig vorhergesagt, aber der Gruppenzweite war jeweils etwas überraschend. Die Prognosen sahen eher Bosnien Herzegowina vor Nigeria, Portugal vor den USA, und meist sowohl Russland wie Südkorea vor Algerien voraus. 

Multiplizieren wir alle Überlebenswahrscheinlichkeiten für das Achtelfinale für die Mannschaften die tatsächlich das Achtelfinale erreicht haben, sehen wir ein relativ einheitliches Bild. Meine Prognose, die nur Elo-Werte und team-spezifische Fehlerterme verwendet, schneidet in dieser Runde am besten ab vor der FiveThirtyEight.com Prognose. Allerdings muss ich dazu sagen, dass mein ursprüngliches Modell welches die Wettquoten für alle Gruppenspiel mitmodelliert hat (und für diese Stufe noch angewendet werden kann da die Wettquoten für alle Gruppenspiele vor der WM zur Verfügung standen), hier  am schlechtesten ab (6.12e-06), da dies zu sehr hohen Wahrscheinlichkeiten für die Achtelfinalteilnahmen der Favoritenmannschaften führt. 

Zur Abschätzung wie aussagekräftig die Unterschiede sind, habe ich aus der Goldman Sachs Prognose (siehe dort Seite 7) noch deren Berechnung für die Weltmeisterschaft 2010 mit dem tatsächlichen Turnierbaum aus Südafrika verglichen. Dies erlaubt uns ansatzweise nicht nur Variation zwischen den Prognosen zu vergleichen, sondern auch innerhalb einer Prognose zwei Ziehungen gegen gegenüberzustellen. Hier sehen wir, dass zumindest Goldman Sachs vor vier Jahren eine deutliche bessere Prognose gelungen ist als 2014. Und damit erscheinen die Unterschiede zwischen den Prognosen in ihren Vorhersagen für das Achtelfinale 2014 eher gering.


In allen Achtelfinalspielen konnten sich interessanterweise jeweils die Gruppenersten durchsetzen. Auch war dies meist die Mannschaft, die die Prognosen vor der Weltmeisterschaft mit größerer Wahrscheinlichkeit im Viertelfinale gesehen haben (y-Achse). Eine Ausnahme bildeten hier nur Kolumbien, das aber nahezu gleichauf mit Uruguay stand, und Costa Rica, dem aufgrund seiner schweren Gruppen, etwas niedrigere Chancen eingeräumt wurden, das Viertelfinale zu erreichen als Griechenland. Auf den y-Achsen sehen wir immer die Wahrscheinlichkeit vor der WM, dass die Mannschaft das Viertelfinale erreicht, also nicht bedingt auf die Achtelfinalteilnahme.

Die höchste Wahrscheinlichkeit für die tatsächlichen Viertelfinalpartien finden wir bei FiveThirtyEight.com gefolgt von Goldman Sachs und Zeileis et al. Allerdings erscheinen die Unterschiede im Vergleich mit den Unterschieden zwischen Goldman Sachs 2010 und 2014 ebenfalls eher gering.


Im Viertelfinale konnte sich jeweils die Mannschaft durchsetzen, der die höhere Chance prognostiziert wurde, ins Halbfinale zu gelangen. Der Niederlande wurden auf den ersten Blick erstaunlich geringe Chancen eingeräumt die Runde der letzten vier zu erreichen. Der Grund liegt daran, dass sie die "Todesgruppe" mit Spanien und Chile überstehen mussten und als Gruppenzweiten wahrscheinlich auf den Brasilien getroffen wären. Belgien galt als einer der Geheimfavoriten, zwei der Prognosen, Goalimpact.com und Groll & Schauberger, haben dem Land sogar etwa gleich hohe Chancen zugerechnet, das Halbfinale zu erreichen wie Argentinien. Interessant ist die Spannbreite der Wahrscheinlichkeiten für eine Halbfinalteilnahme von beispielsweise Brasilien (zwischen 31% Goalimpact und 72% Goldman Sachs) oder Argentinien (21% bis 56%).


Betrachten wir das Produkt der Wahrscheinlichkeiten für die Halbfinalteilnehmer Argentinien, Brasilien, Deutschland und Niederlande an, so sehen wir das Goldman Sachs in 2014 diese Konstellation mit einer Wahrscheinlichkeit von immerhin fast 6% vorhergesehen hat. Schlusslicht ist Goalimpact.com, die entsprechend nur eine Wahrscheinlichkeit von 0,3% berechnet haben während alle anderen Prognosen bei knapp über 1% liegen. Ein Vergleich mit der Goldman Sachs Prognose von 2010 für die damaligen Halbfinalisten Deutschland, Niederlande, Spanien und Uruguay zeigt aber erneut, dass die Unterschiede vermutlich im zufälligen Rahmen liegen. Der Grund für den niedrigen Wert von 2010 liegt insbesondere daran, dass Goldman Sachs damals Uruguay nur geringere Chance von unter 9% eingeräumt hat ins Halbfinale vorzustoßen. Auch sah die Investmentbank damals keinen ähnlich hohen Favoriten wie Brasilien 2014. 


Im Halbfinale der diesjährigen setzte sich Argentinien gegen die Niederlande durch und Deutschland gewann überraschend hoch gegen Brasilien. Goldman Sachs, Zeileis et al. und FiveThirtyEight sahen Brasilien eher als Favoriten, teilweise mit aus meiner Sicht sehr hohen Wahrscheinlichkeiten die Weltmeisterschaft im eigenen Land zu holen (siehe die Diskussion der Prognosen). Goalimpact, Groll & Schauenberger und meine eigene Prognose sahen beide Mannschaften etwa gleichauf.

 
Die Finalkonstellation aus Argentinien und Deutschland ist alles andere als unwahrscheinlich aus Sicht der meisten Prognosen. Deren erwartete Wahrscheinlichkeit mit meist 5% bis 7% ist damit durchaus vergleichbar zur Weltmeisterschaft 2010 wo Spanien sich am Ende gegen die Niederlande durchsetzen konnte. Nur Goalimpact sah hier eine niedrigere Wahrscheinlichkeit von 2%.


Multipliziert man alle Wahrscheinlichkeiten zusammen, so schneidet die Goldman Sachs Prognose relativ gut ab, die diesen Turnierbaum für etwa 1.5-mal so wahrscheinlich gehalten hat wie die Prognose von FiveThirtyEight.com. Vielleicht fällt die Kritik des Wall Street Journal "Goldman Sachs blamiert sich mit WM-Prognose" an der Goldman Sachs Studie aus diesem Blickwinkel etwas zu hart aus. Am schlechtesten schneidet die Prognose von Goalimpact ab. Aber der Unterschied ist meiner Ansicht nach nicht besonders groß, wenn man sich das Produkt der Wahrscheinlichkeiten aus dem Jahr 2010 anguckt. Interessant wäre es natürlich das Elo-Modell für die früheren Weltmeisterschaften zu berechnen, um größere Variation in den Prognosegüten zu erhalten.


Wie kommen die Unterschiede zwischen den Prognosen zustande? Ein wichtiger Unterschied betrifft allgemein die Höhe der Wahrscheinlichkeiten, die den Favoriten eingeräumt wird. Hier sahen die Prognosen von Goldman Sachs, FiveThirtyEight und Groll & Schauberger große Chancen für Favoriten. Goldman Sachs und FiveThirtyEight prognostizierten Brasiliens Weltmeistertitel mit 49% bzw. 45%. Groll und Schauberger sahen eine 56% Chance, dass entweder Brasilien oder Deutschland Weltmeister wird. Der Hauptunterschied zwischen den Goldman Sachs und FiveThirtyEight Prognosen macht das Erreichen des Halbfinales durch Niederlande aus, 28% gegenüber 7%. Groll & Schauberger sahen Deutschland knapp als Favoriten für den Titel (29%) und würden entsprechend besser abschneiden, falls Deutschland heute gewinnt.

In der Grafik weiter unten haben wir die Standardabweichung der Überlebenswahrscheinlichkeiten der Mannschaften pro Stufe abgebildet. Die Überlebenswahrscheinlichkeiten in der Prognose von Goalimpact liegen deutlich enger beieinander, Brasilien ist hier mit 13% knapp der Favorit vor Deutschland und Spanien mit 12% bzw. 10%. Gerade in der Ko-Phase haben sich hier aber doch viele Favoriten durchsetzen können, und entsprechend geringer ist der Turnierbaum aus Sicht dieser Prognose. Interessant wären hier Prognosen wie für die Weltmeisterschaft 2002 in Japan und Südkorea, bei der im Halbfinale neben Brasilien und Deutschland auch die Türkei und Südkorea standen. 

Fazit:

Insgesamt erscheinen die Unterschiede zwischen den Prognosen im zufälligen Rahmen. Auch ist bei der Weltmeisterschaft nicht unbedingt erkennbar, dass komplexere Modelle besser abschneiden als einfachere. Zeileis, Leitner und Hornik verwenden mit den Wettquoten für die Weltmeisterschaft jeder Mannschaft nur eine einzelne Zahl. Groll und Schauberger verwenden deutlich mehr Kontrollvariablen als meine Analyse. Interessant wäre hier ein ausführlicherer Vergleich mit Ligadaten am besten aus unterschiedlichen Ländern.

Persönlich hat mir mein Prognosemodell aber geholfen, bei Tippspielen gut abzuschneiden. Vor dem Finale bin ich bei einem Tippspiel auf Platz 8 von 100 angekommen, deutlich besser als vor zwei Jahren. Dies deutet an, dass zumindest gegenüber normalen Interessierten ein Informationsgewinn geholt werden kann.  

Mittwoch, 18. Juni 2014

Brasilien wird Weltmeister?! Prognosen für die Weltmeisterschaft 2014 in Brasilien



Während in Brasilien die ersten Vorrundenspiele der Weltmeisterschaft 2014 laufen wollen wir einen Blick hinter Prognosen von Fußballspielen und insbesondere der diesjährigen Weltmeisterschaft werfen. Wie gut sind Fußballspiele vorherzusagen, welche Methoden schneiden erfolgreich ab? Eine unvollständige Literaturübersicht ohne eigene Daten. Dafür mit einer subjektiven Bewertung der Stärken und Schwächen der einzelnen Prognosen.

Banken wie Commerzbank oder Goldman Sachs, Zeitungen wie das Handelsblatt in Kooperation mit Beratungen wie Deloitte, und auch Forscher und Statistiker aus Deutschland, Österreich und den USA haben es gewagt, eine Prognose für die aktuelle Fußballweltmeisterschaft zu modellieren. Die meisten Studien sehen dabei Brasilien vor Argentinien, Deutschland und Spanien vorne.

Commerzbank, Deloitte und Goldman Sachs und gehen dabei mit ähnlichen Methoden vor, sie stützen sich vor allem auf das Elo-Ranking welches aus dem Schachspiel für die Bewertung von Fußballmannschaften übertragen wurde. Für die Deloitte und Handelsblattprognose liegen aber kaum Informationen vor, weshalb wir uns im Folgenden auf die Prognose der beiden Banken beschränken werden. Daneben wollen wir im Anschluss drei Prognosen von Statistikern und Wissenschaftlern näher beleuchten.

Zunächst ist es aber wichtig zu wissen, wie das Elo-Bewertungssystem funktioniert, welches für Nationalmannschaften aber auch für Fußballvereine existiert. Elo ist ein Versuch die relativen Fähigkeiten von unterschiedlichen Mannschaften zu erfassen und basiert auf den Ergebnissen von früheren Spielen dieser Mannschaft. Hierbei wird jedoch im Gegensatz zur Bundesliga oder zur WM Gruppenphase keine feste Punktzahl für ein Sieg oder ein Unentschieden gegeben. Der Gewinn oder Verlust an Punkten errechnet sich aus der Differenz von Elo-Werten der beiden Mannschaften im direkten Vergleich. Siege oder Unentschieden gegen stärkere Teams gehen also positiver in die Wertung ein, wohingegen einem schwächeren Team bei der ohnehin erwarteten Niederlage nicht so viele Punkte abgezogen werden. Nach jedem Spiel werden die Elo-Werte der beiden Teams aktualisiert, abhängig davon welches Team besser oder schlechter abschneidet als man anhand der Elo-Werte im Voraus erwarten würde. Ein Elo-Ranking kann sich nur auf Sieg / Unentschieden / Niederlage beziehen, oder auch die Tordifferenz berücksichtigen. Eines der größeren Probleme anhand des Elo-Rankings ist es gute Startwerte für die Qualität von Mannschaften zu finden, insbesondere falls nur wenige relevante Spiele gespielt wurden. Hvattum und Arntzen (2010) beschreiben die Verwendung von Elo-Rankings im Fußball näher und testen die Vorhersagefähigkeit dieses Bewertungssystems im Vergleich mit anderen Methoden. Hierbei schneiden Wettquoten etwas besser ab, ein Ergebnis welches auch Leitner, Zeileis und Hornik (2010) bestätigen. Insgesamt kann man aber meiner Ansicht nach festhalten, dass das Elo-Rating etabliert und als ausreichend solide bezeichnet werden kann.

Zurück zu den Prognosen der beiden Banken. Neben dem Elo-Ranking spielen in beiden Prognosen auch frühere Spiele eine wichtige Rolle und es wird auch jeweils der Heim- bzw. Kontinentalvorteil einer Weltmeisterschaft hinzugezogen. Goldman Sachs berechnet dabei Regressionskoeffizient aus allen Spielen seit 1960 sowie die erzielten Tore und Gegentore der letzten 10 bzw. 5 internationalen Pflichtspiele. Dazu kommen noch historische Weltmeisterschaftsergebnisse, aber nur für die sieben Nationen, Argentinien, Brasilien, Deutschland, England, Frankreich, Italien, Niederlande und Spanien. Die Commerzbank verwendet die erzielten Punkte in den letzten 20 Weltmeisterschaften als zusätzliche erklärende Variable. Der Heim- und Kontinentalvorteil wird bei Goldman Sachs ebenfalls aus historischen Daten (seit 1960) berechnet, während die Commerzbank diese ad hoc festlegt.
Die Goldman Sachs Analyse scheint allgemein etwas ausgearbeiteter, und ist auch detaillierter beschrieben. Sie verwenden eine Monte-Carlo Simulation, die wir auch zur Berechnung der wahrscheinlichen Gegner der dt. Mannschaften im diesjährigen UEFA Champions League  Achtelfinale verwendet haben und modellieren direkt die Tore mit Hilfe einer Poisson-Verteilung, die ihre Probleme besitzt (siehe z.B. Bittner et al., 2007), aber hierfür wohl angemessen erscheint. Bei der Commerzbank Prognose ist nicht im Detail beschrieben, wie sie die Wahrscheinlichkeiten berechnen, aber vermutlich wird dies ähnlich erfolgt sein. 

Was mich persönlich bei der Commerzbank Prognose irritiert ist die Aufnahme einer Variable, die den letztjährigen Weltmeister beschreibt, weil „aus statistischer Sicht sinkt […] die Wahrscheinlichkeit, dass der aktuelle Weltmeister das kommende Turnier gewinnt“. Sehen wir mal von der geringen Stichprobengröße ab, ist das für mich ein typisches Beispiel von „Regression to the Mean“ welches vermutlich auch den Finalverlierer betrifft, und kein Effekt von geringerer Motivation durch den Gewinn der Weltmeisterschaft beschreibt. Also warum wird das nicht für alle Mannschaften modelliert.

Bei der Goldman Sachs Prognose wundert mich wiederum die hohe Wahrscheinlichkeit, die sie für den Gewinn durch Brasilien errechnen (48,5%). Bei 32 Teams, eine fast 50%-Chance zu gewinnen? Das erscheint mir persönlich sehr hoch. Auf Platz 2 bis 4 folgen Argentinien, Deutschland und Spanien mit ähnlichen Prognosewerten in Höhe von 14%, 11% und 10%. Die Commerzbank sieht dagegen für Brasilien mit einer Chance von 1 zu 10 (10,3%) minimal vor Spanien (10,2%), Deutschland (10,0%), Argentinien (8,8%) und Niederlande (8,5%). Eine deutliche Diskrepanz.

Ein Hauptproblem beider Studien liegt für mich in unterschiedlichen Gründen. Erstens in der Gewichtung von früheren und heutigen Spielen. Wie repräsentativ sind Spiele von 1960 (für die Goldman Sachs Prognose) bzw. von 1994 (für Commerzbank) für heutige Partien? Hier sehe ich große Probleme bei der Modellierung über lange Zeiträume. Zweitens, die Berechnung des Heimvorteils ist für mich in beiden Studien hochproblematisch. Der Heimvorteil hat über die Zeit stark abgenommen, in der Bundesliga wie auch in anderen Ligen oder bei internationalen Spielen (siehe die Diskussion der fivethirtyeight.com Prognose weiter unten). Die Stichprobengröße ist natürlich relativ gering, und beide Studien überzeugen mich nicht, wie sie den Heimvorteil modellieren. Die Goldman Sachs Prognose nimmt zeitkonstante Heimvorteile und zeitkonstante mannschaftsspezifische Kontinentalvorteile. Die Prognose von Commerzbank weist auf den Rückgang des Heimvorteils hin, verwendet aber einfach einen „Heimvorteil-Einheitskoeffizienten“, wobei nicht näher eingegangen wird, wie dieser sich berechnet. 

Eine ganz andere Vorgehensweise nimmt die akademische Studie von Achim Zeileis, Christoph Leitner und Kurt Hornik (2014), die zum wiederholten Male (z.B. nach der UEFA Europameisterschaft 2008 und der FIFA Weltmeisterschaft 2010) Wettquoten verwenden. Sie aggregieren die Quoten von 22 Wettanbietern und nutzen diese ebenfalls für eine Monte-Carlo Simulation. In einer früheren Studie haben diese Autoren gezeigt, dass sie damit die Europameisterschaft 2008 besser vorhersagen können als mit einem (einfachen) Elo-Ranking. Die Autoren sehen, wie beide vorherigen Prognosen, ebenfalls Brasilien vorne. Die Wahrscheinlichkeit für einen Weltmeistersieg Brasiliens liegt bei 22,5% und damit zwischen den Gewinnwahrscheinlichkeiten der beiden anderen Studien. Auf Platz 2-4 folgen wie bei der Prognose von Goldman Sachs Argentinien, Deutschland und Spanien mit 16%, 13% und 12%. Die Studie gefällt mir gut, die Wahrscheinlichkeit für einen Sieg Brasiliens ist hoch, immerhin fast ein Viertel, aber vielleicht nicht unrealistisch hoch. Die Autoren weisen auch auf eine hohe positive Korrelation der aus den Quoten abgeleiten Siegwahrscheinlichkeiten im direkten Vergleich mit der FIFA–Rangliste und (noch etwas deutlicher) mit dem Elo-Ranking. 

Der Ansatz der Studie ist interessant und theoretisch gut begründet, denn schließlich haben zwei Ökonomen dieses Jahr den Nobelpreis gewonnen, die sich mit der Effizienz von Märkten auseinander gesetzt haben (und ein Dritter, der die ökonometrische Analyse stark weiterentwickelt hat). Aber ich bin etwas skeptisch, ob in den Wettquoten wirklich alle Informationen eingespeist sind. Meine eigenen Analysen der internationalen Spiele der letzten Jahre zeigt statistisch hochsignifikante Korrelationen der Elo-Werte beider Teams mit den erzielten Toren kontrolliert um die Wettquoten (die ebenfalls hochsignifikant sind). Es gibt auch unter wissenschaftlichen Studien Indizien, dass neben den Wettquoten weitere Informationen ausgenutzt werden können, z.B. Constantinou and Fenton (2012). In Zukunft wäre es schön zu sehen, ob es ein Informationsgewinn gibt, falls weitere Variablen wie das Elo-Ranking verwendet werden würden, und falls ja, wie groß dieser aussehen würde. Der Vergleich mit der Elo-Methode, die die Autoren in Leitner et al. (2010) angewandt haben, ignoriert Unentschieden und modelliert keine Tordifferenzen. Aber etwas gravierender ist vielleicht der folgende Punkt, ich zweifele etwas an der Annahme, dass der Gewinn des Anbieters pro Team konstant ist (damit man aus den Quoten auf die zugrundeliegenden Wahrscheinlichkeiten schließen kann), ein Gegenargument hierfür könnte ein mögliches Ausnutzen des Favorite-longshot bias sein (siehe zum Beispiel Direr, 2013). Hier hätte ich mir eine etwas ausführliche Begründung der Annahme gewünscht, oder zumindest eine Diskussion der Auswirkungen falls die Annahme nicht gilt. Allerdings ist das natürlich einfach gesagt, und schwierig zu modellieren. Alles in allem aber eine interessante Studie, die für mich die Frage aufwirft, ob es sich überhaupt lohnt, sich mit einer komplexen Prognose zu beschäftigen. 

Eine Prognose, die mir von der Beschreibung her gefällt, stammt von Nate Silver im US-Blog www.fivethirtyeight.com, einem amerikanischen Statistiker, der durch Baseball- und US-Wahlkampfprognosen bekannt geworden ist.  In seiner Prognose verwendet er Länderspiele der letzten vier Jahre und verbindet dies mit Spielerdaten der Kader. Für alle Spieler in den größeren Ligen analysieren sie Gewinnquoten mit und ohne Einsatz eines Spielers (zumindest verstehe ich deren Beschreibung in diesem Sinne). Damit guckt er sich auch Freundschaftsspiele an, zumindest falls der Kader in einem solchen Spiel ähnlich ist zu dem in Pflichtspielen. Separat wird auf die Offensive und Defensive modelliert, um bessere Ergebnisprognosen zu erhalten. Ferner geht er detailliert auf dem Heimvorteil ein und hat ausführliche Analysen angewandt in denen er herausfindet, dass Ost-West-Reisen statistisch relevanter sind als Nord-Süd-Reisen. Der Grund liegt hier vermutlich im Jet-Lag durch Zeitverschiebungen. Auch bestätigt er die Abnahme des Heimvorteils über die Zeit und verwendet daher für dessen Berechnung nur Spiele seit 2006. Nichtsdestotrotz findet er, ähnlich zur Goldman Sachs Prognose, eine Chance von 1 zu 2 (45,2%), dass Brasilien Weltmeister wird, gefolgt von der bereits bekannten Rangfolge Argentinien (13%), Deutschland (11%) und Spanien (8%). Auch hier gilt natürlich meine Verwunderung über diese hohe Wahrscheinlichkeit für den sechsten Titel von Brasilien.

Die letzte Studie, die wir vorstellen wollen, stammt von den drei deutschen Sozialwissenschaftlern Jürgen Gerhards, Michael Mutz und Gert G. Wagner, die Marktwertdaten von transfermarkt.de verwenden. Die Autoren machen im Gegensatz zu den anderen Studien keine Simulation und geben daher keine Wahrscheinlichkeit für unterschiedliche Mannschaften an. Sie sehen als einzige Studie nicht Brasilien als wahrscheinlichsten Sieger an, sondern tippen auf Spanien, da diese Mannschaft den höchsten Kaderwert besitzt. Demnach erzielt Spanien im Finale gegen Deutschland ihren zweiten Weltmeistertitel während Brasilien und Argentinien im Halbfinale ausscheiden. Die Autoren weisen darauf hin, dass "Einfachheit [...] ein zentrales Gütekriterium von Wissenschaft" ist. Dem kann ich nur zustimmen, komplexe Modelle lassen deren Probleme oft schlechter einschätzen und mögen vielleicht vergangene Spiele mehr oder weniger perfekt vorhersagen, ihre Prognosefähigkeit für neue Daten kann aber sehr schlecht sein. Trotzdem schätze ich das einfache Modell als ausbaufähig ein. Marktwerte sind nicht das perfekte Kriterium, da natürlich auch Faktoren wie die Werbewirksamkeit hier eine Rolle spielen, so dass es vielleicht sinnvoll wäre weitere Variablen wie Wettquoten oder Elo-Rankings hinzuzufügen, was aber natürlich zu mehr Komplexität führt. Auch könnte man die Marktwerte des Kaders genauer analysieren, um potenzielle Schwächen wie das Fehlen eines erfahrenen Linksverteidigers zu beleuchten (dies war meine Idee für einen Algorithmus den ich aber aus Zeitmangel nicht umsetzen konnte). Zumindest eine grobe Aufteilung in Offensive und Defensive wie bei fivethirtyeight.com könnte vielleicht hilfreich sein.

Zusammenfassend sehen wir unterschiedliche Prognosen, die unterschiedliche Methoden anwenden, und fast alle Brasilien als Sieger sehen vor Argentinien, Deutschland und Spanien (teilweise in anderer Reihenfolge). Als Datengrundlagen verwenden diese Studien Elo-Rankings, Wettquoten, Marktwerte oder Spielerdaten mit Verknüpfung zu Ligaspielen. Eine große Herausforderung stellt dabei die Quantifizierung des Heimvorteils für Brasilien und eines Kontinentalvorteils für die übrigen südamerikanischen Mannschaften dar. Eine verwandte Schwierigkeit liegt im Abwägen welche Spiele man als Datengrundlage hinzuzieht, so dass ausreichend historische Spiele zur Verfügung stehen, Prognosen aber nicht auf längst vergangenen Kadern beruhen. Verwendet man auch Freundschaftsspiele, und wie stellt man sicher, dass ausreichend Spiele zwischen Kandidaten für den Weltmeisterschaftssieg vorhanden sind?

Empirisch sind die Prognosen schwer zu vergleichen und zu bewerten. Leider konnte ich meist keinen Hinweis finden, wo man selbst die verwendeten Daten bzw. die Skripte herunterladen kann. Die Datengrundlagen variieren stark und dies macht den Vergleich der historischen Prognosefähigkeit schwierig. Auch gibt es keine generelle vereinbarte loss function, die uns sagt, wie man z.B. richtige Tendenzen gegenüber komplett falschen Tipps bewertet, und die wir bei jedem Tippspiel definieren (wohl ein generelles Problem in der Literatur). Das macht auch die retrospektive Bewertung in einigen Wochen schwierig.

Für meine Tippspiele habe ich mit einem geringen Zeitbudget Elo-Rankings zusammen mit Wettquoten und mannschaftsspezifischen Effekten ("random effects") verwendet, um die geschossenen Tore zu simulieren. Nach den ersten Spieltagen liege ich damit in den Tippspielen, zu denen ich eingeladen wurde, relativ weit zurück. Die nicht-ganzzahligen Toreprognosen scheinen dabei gut zu funktionen (wenn man mal z.B. von Spanien gegen Niederlande 1:5 absieht), aber es ist mir nur schlecht gelungen von den prognostizierten Toren, zum Beispiel 1,1 vs 0,9 bei Elfenbeinküste gegen Japan (Ausgang 2:1) auf Sieg für eine Mannschaft bzw. Unentschieden zu tippen. Auch könnte ich mir vorstellen, dass eine separate Modellierung für Offensive und Defensive genauere Torprognosen, und damit auch bessere Endprognosen, liefern könnte. Sehr viel besser kann man die Frage der Prognostizierbarkeit von Fußballspielen aber sicher in Ligawettbewerben wie der Bundesliga beantworten.

PS: Ein Beispiel für eine Methode zur Berechnung der Stärke einzelner Spieler beschreibt die Webseite www.goalimpact.com, die die Tordifferenz einer Mannschaft (auf Minutenbasis) in Abhängig von der Aufstellung analysiert. Die genauen Details des Algorithmus sind leider nicht veröffentlicht, aber in der Beschreibung heißt es, dass hier, unter Berücksichtigung von Gegner, Mitspielern und Heimvorteil, die durchschnittliche Tordifferenz einer Mannschaft mit oder ohne Einsatz eines Spielers berechnet, wobei auch Einwechselspieler berücksichtigt werden. Ein interessanter Ansatz, ich bin gespannt zu sehen, ob man mit solchen Ansätzen bessere Prognosen erhalten kann.


Prognosen und Studien im Text:

Commerzbank Economic Research. Economic Insight - Das schöne Spiel: Die Ökonomie der Fußball WM 2014. 4. Juni 2014.
Fivethirtyeight.com. It’s Brazil’s World Cup to Lose.
Gerhards, Jürgen, Michael Mutz, and Gert G. Wagner. Spannung bis zum Abpfiff – Die Prognose des Fußballweltmeisters ist schwieriger als bei der letzten WM. DIW Wochenbericht 24/2014.
Goldman Sachs. The World Cup and Economics 2014.