Kann man einen
Weltmeister ausrechnen?
Ich habe alle Zahlen der WM bekommen und spiele jedes K.-o.-Spiel durch. Hier zeige ich dir meine Hausaufgaben — Schritt für Schritt, mit Bildern. Und ehrlich: wo ich an meine Grenzen komme.
Ich presse über 50 Statistiken pro Team in eine Stärkezahl von 0–100, rechne daraus jedes Spiel als Wahrscheinlichkeit aus und spiele die ganze WM 20.000-mal durch.
Aber: Ich kenne jedes Team nur aus 3 Spielen. Nimm mich nicht zu ernst.
Mein Weltmeister — mit Ansage
Titelchance über alle simulierten Turniere.
Auf dem Papier gewinnt …. Aber Papier hat noch nie ein Tor geschossen.
Und so schmilzt selbst mein Favorit zusammen
Jede Runde ist ein neues Spiel — der Favorit hat die besseren Karten, aber sicher ist nichts. Wer Runde für Runde meist gewinnt, steht nach sieben K.-o.-Spielen trotzdem nur bei rund einem Drittel.
Die Spannweite ist die eigentliche Aussage — nicht die eine fette Zahl.
1 · Woher meine Zahlen kommen
Alles kommt aus einer Quelle: den offiziellen FIFA-Team-Statistiken der WM-Gruppenphase — für alle 48 Teams, je 3 Spiele. Über 50 Kennzahlen pro Team: Tore, erwartete Tore (xG — wie dick die Chancen waren), Pässe, Pressing, Laufwege, Standards, Disziplin. Nichts erfunden, nichts dazugekauft.
Gut zwei Dutzend davon fließen wirklich in meine Rechnung — der Rest ist Beiwerk. Und Achtung: höher ist nicht immer besser. Viel Ballbesitz ist kein Selbstzweck, wenige Gegentore dagegen schon. Wo „weniger = besser" gilt, drehe ich die Kennzahl vorher um.
Kein offizielles FIFA-Produkt — ein Hobbyprojekt zur Podcast-Folge. Die Daten gehören der FIFA, die Interpretation der KI (und uns). Alle Rohwerte kannst du auf Daten selbst nachschlagen.
2 · So rechne ich
Von der rohen Kennzahl zum Weltmeister — in fünf Schritten. Die Mathe-Details habe ich in „Tiefer rein"-Kästchen gepackt; überspring sie ruhig.
Jede Zahl wird vergleichbar gemacht
Ein roher Wert allein sagt wenig. Ich messe jede Kennzahl daran, wie sie im Schnitt aller 48 Teams liegt. 0 heißt Durchschnitt. Plus heißt besser als das Feld, Minus schlechter — und genau diese +/–-Zahlen siehst du später bei den Stärke-Duellen.
Tiefer rein: nur 3 Spiele
Drei Spiele sind eine winzige Stichprobe. Damit ein einziges Gala-Spiel nicht alles verzerrt, ziehe ich Ausreißer vorsichtig zurück Richtung Mittelfeld — Statistiker sagen „Shrinkage". Diesen geglätteten Wert vergleiche ich dann mit dem Feld; heraus kommt die +/–-Zahl von eben (Fachwort: z-Wert).
Sechs Stärken pro Team
Aus den passenden Kennzahlen baue ich sechs Team-Qualitäten — die sechs Duelle, die jedes Spiel entscheiden:
Tiefer rein: Gegner-Korrektur
Wer gegen starke Gegner glänzt, ist mehr wert als wer schwache Gegner abschießt. Deshalb gewichte ich jede Stärke noch danach, wie hart die drei Gruppengegner waren. Ehrlich: Bei nur 12 isolierten Gruppen ist das eine grobe Korrektur, keine Wissenschaft.
Eine Stärkezahl: der Power-Index (EPI)
Die sechs Stärken verschmelze ich zu einer Zahl von 0–100 — meinem Power-Index, kurz EPI (Emergence Power-Index). Genau die Zahl, die auf jeder Spiel-Seite neben den Teams steht. 50 = Durchschnitt, höher = stärker.
Was im EPI wie schwer zählt
Angriff + Abwehr = 62 % meiner Bewertung. Wer vorne trifft und hinten dichthält, steht bei mir oben — alles andere ist Feintuning.
Aus zwei Stärken wird ein Ergebnis
Treffen zwei Teams aufeinander, übersetze ich den Stärke-Abstand in erwartete Tore für jede Seite. Daraus ergibt sich, wie wahrscheinlich jedes Ergebnis ist — 0:0, 1:0, 2:1 und so weiter.
Beispielspiel
Höhe = wie wahrscheinlich genau so viele Tore fallen.
Tiefer rein: Poisson, Dixon-Coles & der Anker 1,49
Tore folgen ungefähr einer Poisson-Verteilung (seltene, zufällige Ereignisse). Den typisch knappen Fußball-Ergebnissen (0:0, 1:1) gebe ich mit einer Dixon-Coles-Korrektur etwas mehr Gewicht.
Der einzige fest aus den Daten verankerte Wert ist die Tor-Grundrate 1,49 Tore pro Team und Spiel (215 Tore in 144 Team-Spielen). Alles andere sind Stellschrauben, die ich von Hand gesetzt habe.
Im K.-o. gibt es kein Remis: Steht es nach 90 Minuten unentschieden, simuliere ich Verlängerung und Elfmeterschießen — und das Elfmeterschießen ist fast ein Münzwurf.
Die ganze WM, 20.000-mal
Ich spiele das komplette Turnier zigtausendmal durch und zähle, wie oft jedes Team welche Runde erreicht und am Ende Weltmeister wird. Genau daraus entsteht der Trichter ganz oben.
Tiefer rein: warum „reproduzierbar" gut ist
Ich würfle immer mit demselben Start-Wert (Programmierer nennen das „Seed", hier die 42). Das heißt: Wer meine Rechnung wiederholt, bekommt exakt dieselben Zahlen heraus — nichts ist Zufall im Sinne von „mal so, mal so". Jede Prozentzahl auf dieser Seite lässt sich zurückverfolgen.
3 · Warum Spanien — und nicht Frankreich?
Das ist die Frage, die fast jeder stellt. Die Antwort steckt in zwei Buchstaben: xG.
Erwartete Tore (xG) schätzen, wie dick eine Torchance war — egal, ob der Ball am Ende reinging. Ein Lupfer aus 30 Metern, der zufällig sitzt, zählt für mich weniger als fünf Großchancen, die am Pfosten landen. Ich glaube den verdienten Chancen mehr als dem Zufall.
Über alle 48 Teams hängt die Titelchance viel enger an den erwarteten als an den echten Toren:
Je länger der Balken (und je größer die Zahl rechts, von 0 bis 1), desto enger hängen die beiden zusammen. Zusammenhang heißt aber nicht automatisch Ursache — er zeigt nur, worauf ich höre.
Der Mensch sieht 10 Tore. Ich sehe, wie viele davon verdient waren.
Dasselbe Prinzip trifft die anderen großen Namen: Ich gehe nicht nach Ruf, sondern nach den Zahlen. Wo Brasilien, Argentinien & Co. bei mir landen, siehst du im Turnierbaum.
4 · Was ich nicht weiß
Ich kenne nur kalte Gruppenphasen-Statistik. Alles, was ein Mensch über ein Spiel weiß, fehlt mir:
- Tore & erwartete Tore (xG)
- Pässe, Ballbesitz, Pressing
- Standards, Laufwege, Tempo
- Disziplin (Karten, Fouls)
- kleiner Heimvorteil für USA, Mexiko, Kanada
- Verletzungen & Sperren
- Aufstellungen & Wechsel
- Tagesform & Selbstvertrauen
- Taktik & Trainer-Matchpläne
- Wetter, Platz, Schiedsrichter, Glück
Fällt euer Stürmer verletzt aus, merke ich das nicht. Ihr schon.
5 · Wie ehrlich ist das hier?
Nur 3 Spiele Mein ganzes Wissen über jedes Team sind drei Gruppenspiele. Das ist ein plausibles Bild, kein Faktenprotokoll. Nimm mich nicht zu ernst.
- Meine Gewichte sind von Hand gesetzt, nicht trainiert. Es gibt ja noch keine WM-K.-o.-Ergebnisse, an denen ich hätte lernen können. Sie sind erfahrene Schätzungen aus der Fußball-Statistik — kein vom Computer optimiertes Modell.
- Ich bin kein Wettbüro. Meine Prozente sind eine begründete Schätzung, keine Quote und keine Gewissheit.
Und vier Stellen, an denen die Rohdaten kaputt waren — offen gezeigt, nicht versteckt:
Die FIFA-Spalte war in sich widersprüchlich (Mexiko 3 % trotz Zu-Null). Rausgenommen und selbst sauber nachgerechnet: Paraden ÷ (Paraden + Gegentore).
In der Originaltabelle stand dort der Text „Hi." statt einer Zahl. Als fehlend behandelt — nicht erraten.
Eine Disziplin-Spalte (indirekte Rote Karten) war bei allen 48 Teams 0. Trägt keine Information — rausgelassen.
Die Höchstgeschwindigkeit fehlt im offiziellen Export. Nicht erfunden — Athletik nutzt die vorhandenen Lauf- und Tempowerte.
6 · Wenn echte Spiele dazwischenfunken
Die WM läuft. Sobald ein Spiel wirklich gespielt ist, zieht im Turnierbaum das echte Ergebnis ein (die große Zahl) — daneben steht klein, wie wahrscheinlich ich diesen Ausgang vorher fand.
- Die kleine Prozentzahl ist eine Chance aufs Weiterkommen — kein getippter Spielstand. Sie sagt „so oft kommt dieses Team eine Runde weiter" (Verlängerung und Elfmeter zähle ich mit), nicht „es endet 2:1".
- Die Realität gewinnt immer. Ein echtes Ergebnis überschreibt meine Prognose — aber ich rechne dann nicht die ganze WM neu. Mein ursprünglicher Tipp bleibt als Vergleich stehen. So siehst du, wo ich richtig lag und wo nicht.
- Manchmal hatte ich eine Paarung „nicht auf dem Zettel". Voll durchsimuliere ich die erste K.-o.-Runde und den Weg meines Favoriten. Schickt die Realität zwei Teams ins Duell, die ich nie zusammen erwartet hatte, falle ich auf einen schlichten Stärke-Vergleich (EPI) zurück.
Ehrlich: schwer zu sagen. Eine 35-%-Überraschung ist kein „Fehler" — die hatte ich ja mit eingepreist. Fair beurteilen lässt sich ein Wahrscheinlichkeits-Tipp erst über viele Spiele, nicht an einem. Wo meine Tipps auf die Wirklichkeit treffen, siehst du Spiel für Spiel im Turnierbaum.
Live-Ergebnisse kommen von football-data.org. Stand und Uhrzeit stehen im Turnierbaum.
Der Spalt
Der Spalt zwischen durchgerechnet und was wirklich passiert — das ist die eigentliche Geschichte. Aus genau diesem Bruch entstehen Drama, Außenseiter und Legenden. Und genau darum geht's in Folge 11.
KI im Fußball
Diese Seite ist die Fußnote zur Folge. Wollen wir einen durchgerechneten Fußball? Der lebt doch vom Unberechenbaren — vom Last-Minute-Tor, vom Außenseiter. Genau dieser Spannung geht die Folge nach.