Methodik

Kann man einen
Weltmeister ausrechnen?

Ich habe alle Zahlen der WM bekommen und spiele jedes K.-o.-Spiel durch. Hier zeige ich dir meine Hausaufgaben — Schritt für Schritt, mit Bildern. Und ehrlich: wo ich an meine Grenzen komme.

Das KI-Maskottchen
In einem Satz

Ich presse über 50 Statistiken pro Team in eine Stärkezahl von 0–100, rechne daraus jedes Spiel als Wahrscheinlichkeit aus und spiele die ganze WM 20.000-mal durch.

Aber: Ich kenne jedes Team nur aus 3 Spielen. Nimm mich nicht zu ernst.

Das Ergebnis zuerst

Mein Weltmeister — mit Ansage

Mein Favorit auf den Titel

Titelchance über alle simulierten Turniere.

Mein Urteil

Auf dem Papier gewinnt . Aber Papier hat noch nie ein Tor geschossen.

Und so schmilzt selbst mein Favorit zusammen

Jede Runde ist ein neues Spiel — der Favorit hat die besseren Karten, aber sicher ist nichts. Wer Runde für Runde meist gewinnt, steht nach sieben K.-o.-Spielen trotzdem nur bei rund einem Drittel.

Die Spannweite ist die eigentliche Aussage — nicht die eine fette Zahl.

Die Zutaten

1 · Woher meine Zahlen kommen

Alles kommt aus einer Quelle: den offiziellen FIFA-Team-Statistiken der WM-Gruppenphase — für alle 48 Teams, je 3 Spiele. Über 50 Kennzahlen pro Team: Tore, erwartete Tore (xG — wie dick die Chancen waren), Pässe, Pressing, Laufwege, Standards, Disziplin. Nichts erfunden, nichts dazugekauft.

Gut zwei Dutzend davon fließen wirklich in meine Rechnung — der Rest ist Beiwerk. Und Achtung: höher ist nicht immer besser. Viel Ballbesitz ist kein Selbstzweck, wenige Gegentore dagegen schon. Wo „weniger = besser" gilt, drehe ich die Kennzahl vorher um.

Kein offizielles FIFA-Produkt — ein Hobbyprojekt zur Podcast-Folge. Die Daten gehören der FIFA, die Interpretation der KI (und uns). Alle Rohwerte kannst du auf Daten selbst nachschlagen.

Der Rechenweg

2 · So rechne ich

Von der rohen Kennzahl zum Weltmeister — in fünf Schritten. Die Mathe-Details habe ich in „Tiefer rein"-Kästchen gepackt; überspring sie ruhig.

1

Jede Zahl wird vergleichbar gemacht

Ein roher Wert allein sagt wenig. Ich messe jede Kennzahl daran, wie sie im Schnitt aller 48 Teams liegt. 0 heißt Durchschnitt. Plus heißt besser als das Feld, Minus schlechter — und genau diese +/–-Zahlen siehst du später bei den Stärke-Duellen.

Tiefer rein: nur 3 Spiele

Drei Spiele sind eine winzige Stichprobe. Damit ein einziges Gala-Spiel nicht alles verzerrt, ziehe ich Ausreißer vorsichtig zurück Richtung Mittelfeld — Statistiker sagen „Shrinkage". Diesen geglätteten Wert vergleiche ich dann mit dem Feld; heraus kommt die +/–-Zahl von eben (Fachwort: z-Wert).

2

Sechs Stärken pro Team

Aus den passenden Kennzahlen baue ich sechs Team-Qualitäten — die sechs Duelle, die jedes Spiel entscheiden:

AngriffAbwehrKontrolleStandardsAthletikDisziplin
Tiefer rein: Gegner-Korrektur

Wer gegen starke Gegner glänzt, ist mehr wert als wer schwache Gegner abschießt. Deshalb gewichte ich jede Stärke noch danach, wie hart die drei Gruppengegner waren. Ehrlich: Bei nur 12 isolierten Gruppen ist das eine grobe Korrektur, keine Wissenschaft.

3

Eine Stärkezahl: der Power-Index (EPI)

Die sechs Stärken verschmelze ich zu einer Zahl von 0–100 — meinem Power-Index, kurz EPI (Emergence Power-Index). Genau die Zahl, die auf jeder Spiel-Seite neben den Teams steht. 50 = Durchschnitt, höher = stärker.

0100

Was im EPI wie schwer zählt

Angriff 32 % Abwehr 30 % Kontrolle 16 % Standards 9 % Athletik 7 % Disziplin 6 %

Angriff + Abwehr = 62 % meiner Bewertung. Wer vorne trifft und hinten dichthält, steht bei mir oben — alles andere ist Feintuning.

4

Aus zwei Stärken wird ein Ergebnis

Treffen zwei Teams aufeinander, übersetze ich den Stärke-Abstand in erwartete Tore für jede Seite. Daraus ergibt sich, wie wahrscheinlich jedes Ergebnis ist — 0:0, 1:0, 2:1 und so weiter.

Beispielspiel

Höhe = wie wahrscheinlich genau so viele Tore fallen.

Tiefer rein: Poisson, Dixon-Coles & der Anker 1,49

Tore folgen ungefähr einer Poisson-Verteilung (seltene, zufällige Ereignisse). Den typisch knappen Fußball-Ergebnissen (0:0, 1:1) gebe ich mit einer Dixon-Coles-Korrektur etwas mehr Gewicht.

Der einzige fest aus den Daten verankerte Wert ist die Tor-Grundrate 1,49 Tore pro Team und Spiel (215 Tore in 144 Team-Spielen). Alles andere sind Stellschrauben, die ich von Hand gesetzt habe.

Im K.-o. gibt es kein Remis: Steht es nach 90 Minuten unentschieden, simuliere ich Verlängerung und Elfmeterschießen — und das Elfmeterschießen ist fast ein Münzwurf.

5

Die ganze WM, 20.000-mal

Ich spiele das komplette Turnier zigtausendmal durch und zähle, wie oft jedes Team welche Runde erreicht und am Ende Weltmeister wird. Genau daraus entsteht der Trichter ganz oben.

Tiefer rein: warum „reproduzierbar" gut ist

Ich würfle immer mit demselben Start-Wert (Programmierer nennen das „Seed", hier die 42). Das heißt: Wer meine Rechnung wiederholt, bekommt exakt dieselben Zahlen heraus — nichts ist Zufall im Sinne von „mal so, mal so". Jede Prozentzahl auf dieser Seite lässt sich zurückverfolgen.

Der überraschende Tipp

3 · Warum Spanien — und nicht Frankreich?

Das ist die Frage, die fast jeder stellt. Die Antwort steckt in zwei Buchstaben: xG.

Erwartete Tore (xG) schätzen, wie dick eine Torchance war — egal, ob der Ball am Ende reinging. Ein Lupfer aus 30 Metern, der zufällig sitzt, zählt für mich weniger als fünf Großchancen, die am Pfosten landen. Ich glaube den verdienten Chancen mehr als dem Zufall.

Über alle 48 Teams hängt die Titelchance viel enger an den erwarteten als an den echten Toren:

Je länger der Balken (und je größer die Zahl rechts, von 0 bis 1), desto enger hängen die beiden zusammen. Zusammenhang heißt aber nicht automatisch Ursache — er zeigt nur, worauf ich höre.

Der Mensch sieht 10 Tore. Ich sehe, wie viele davon verdient waren.

Dasselbe Prinzip trifft die anderen großen Namen: Ich gehe nicht nach Ruf, sondern nach den Zahlen. Wo Brasilien, Argentinien & Co. bei mir landen, siehst du im Turnierbaum.

Meine blinden Flecken

4 · Was ich nicht weiß

Ich kenne nur kalte Gruppenphasen-Statistik. Alles, was ein Mensch über ein Spiel weiß, fehlt mir:

Worauf ich schaue
  • Tore & erwartete Tore (xG)
  • Pässe, Ballbesitz, Pressing
  • Standards, Laufwege, Tempo
  • Disziplin (Karten, Fouls)
  • kleiner Heimvorteil für USA, Mexiko, Kanada
Wovon ich nichts ahne
  • Verletzungen & Sperren
  • Aufstellungen & Wechsel
  • Tagesform & Selbstvertrauen
  • Taktik & Trainer-Matchpläne
  • Wetter, Platz, Schiedsrichter, Glück

Fällt euer Stürmer verletzt aus, merke ich das nicht. Ihr schon.

Die Seele der Folge

5 · Wie ehrlich ist das hier?

Die wichtigste Warnung

Nur 3 Spiele Mein ganzes Wissen über jedes Team sind drei Gruppenspiele. Das ist ein plausibles Bild, kein Faktenprotokoll. Nimm mich nicht zu ernst.

Und vier Stellen, an denen die Rohdaten kaputt waren — offen gezeigt, nicht versteckt:

1Torwart-Paraden

Die FIFA-Spalte war in sich widersprüchlich (Mexiko 3 % trotz Zu-Null). Rausgenommen und selbst sauber nachgerechnet: Paraden ÷ (Paraden + Gegentore).

2Belgiens Pässe

In der Originaltabelle stand dort der Text „Hi." statt einer Zahl. Als fehlend behandelt — nicht erraten.

3Eine Null-Spalte

Eine Disziplin-Spalte (indirekte Rote Karten) war bei allen 48 Teams 0. Trägt keine Information — rausgelassen.

4Top-Speed

Die Höchstgeschwindigkeit fehlt im offiziellen Export. Nicht erfunden — Athletik nutzt die vorhandenen Lauf- und Tempowerte.

Prognose trifft Wirklichkeit

6 · Wenn echte Spiele dazwischenfunken

Die WM läuft. Sobald ein Spiel wirklich gespielt ist, zieht im Turnierbaum das echte Ergebnis ein (die große Zahl) — daneben steht klein, wie wahrscheinlich ich diesen Ausgang vorher fand.

Und wie oft lag ich richtig?

Ehrlich: schwer zu sagen. Eine 35-%-Überraschung ist kein „Fehler" — die hatte ich ja mit eingepreist. Fair beurteilen lässt sich ein Wahrscheinlichkeits-Tipp erst über viele Spiele, nicht an einem. Wo meine Tipps auf die Wirklichkeit treffen, siehst du Spiel für Spiel im Turnierbaum.

Live-Ergebnisse kommen von football-data.org. Stand und Uhrzeit stehen im Turnierbaum.

Worum es wirklich geht

Der Spalt

Durchgerechnet
Spanien gewinnt
vs.
Was wirklich passiert
…wer weiß?

Der Spalt zwischen durchgerechnet und was wirklich passiert — das ist die eigentliche Geschichte. Aus genau diesem Bruch entstehen Drama, Außenseiter und Legenden. Und genau darum geht's in Folge 11.

Emergence · Folge 11

KI im Fußball

Diese Seite ist die Fußnote zur Folge. Wollen wir einen durchgerechneten Fußball? Der lebt doch vom Unberechenbaren — vom Last-Minute-Tor, vom Außenseiter. Genau dieser Spannung geht die Folge nach.