DFB-Pokal Vorhersagen

Fußball vorhersagen dfb pokal — das ist eine Suchanfrage, hinter der eine ernsthafte methodische Frage steckt. Der DFB-Pokal ist der Wettbewerb, der Algorithmen am härtesten bestraft. Nicht weil die Spiele schlechter sind, sondern weil das K.O.-Format, die Rotation und der Aufeinanderprall verschiedener Spielklassen genau die Variablen erzeugen, mit denen selbst gut kalibrierte Modelle nur bedingt umgehen können.

Favoritenstürze sind im DFB-Pokal keine Kuriosität — sie sind strukturell eingebaut. Jede Saison eliminiert die erste Runde mindestens einen Bundesligisten gegen einen Amateurklub oder Zweitligisten. Das liegt nicht am Pech und nicht am Wunder, auch wenn Medien es gerne so verkaufen. Es liegt an einer Kombination aus taktischer Rotation, reduziertem Fokus und Heimvorteil für den Underdog — alles Faktoren, die Prognosemodelle nicht vollständig abbilden können.

Dieser Artikel erklärt, warum der DFB-Pokal für Algorithmen strukturell schwierig ist, welche Rolle Rotation als blinder Fleck spielt und welche Analyse-Ansätze für Pokal-Spiele trotzdem sinnvoll sind. DFB-Pokal-Tipps haben einen Platz — aber man muss wissen, welchen. Und wer das nicht einkalkuliert, wundert sich jedes Jahr über denselben Favoritensturz, den er hätte kommen sehen können.

Warum der Pokal für Algorithmen schwierig ist

Der Kern des Problems ist simpel: Im K.O.-System gibt es keine zweite Chance. Ein Ligaspiel, das unglücklich ausgeht, wird durch den nächsten Spieltag korrigiert — die statistische Grundgesamtheit ist groß genug. Im DFB-Pokal endet eine Fehler-Prognose mit dem Ausscheiden des Favoriten, und das Modell hatte nur einen Datenpunkt. Das ist kein Algorithmus-Problem — das ist ein Mathematikproblem.

Das K.O.-Format und die Rolle des Zufalls

In einem Einstufensystem entscheidet ein einziges Spiel. Selbst wenn ein Bundesligist mit 75 Prozent Wahrscheinlichkeit gewinnt, scheidet er in einem von vier Pokal-Duellen gegen den schwächeren Gegner aus — rein statistisch. Das ist kein Scheitern des Modells. Das ist das Wesen des K.O.-Formats. Der Unterschied zur Liga: Dort würde dasselbe Team über 34 Spieltage seine überlegene Qualität aufbauen. Im Pokal hat es eine Begegnung, um zu liefern. Und an einem schlechten Tag, gegen einen motivierten Außenseiter auf kleinem Geläuf, kann das schiefgehen.

Klassenunterschiede und ihre Grenzen

In den frühen DFB-Pokalrunden treffen Bundesligisten auf Amateurklubs oder Drittligisten. Das ist für Prognosemodelle ein grundlegendes Datenproblem: Wie bewertet man einen Viertligisten, der keine Sportec-Daten hat, keine veröffentlichten xG-Werte und kaum Medienberichterstattung? Modelle, die mit Bundesliga-Trainingsdaten arbeiten, extrapolieren hier ins Leere. Das funktioniert für die grobe Richtung — Bundesligist gewinnt wahrscheinlich — aber nicht für die Präzision, die man für eine belastbare Wahrscheinlichkeitsaussage braucht.

Das Modell CatBoost, das auf Basis des Kelly Index Spiele in Kategorien eingeteilt, erreicht auf hochgradig vorhersehbaren Begegnungen (Type 1) eine Trefferquote von 70 Prozent (arXiv:2211.15734). Auf Spielen mit gemischter Vorhersagbarkeit (Type 2) fällt sie auf 55 bis 60 Prozent. DFB-Pokal-Partien zwischen verschiedenen Spielklassen bewegen sich strukturell in einer dritten, noch unschärferen Kategorie — keine ausreichenden Daten für eine valide Klassifizierung.

Heimvorteil des Außenseiters

In den frühen Pokalrunden spielen Amateurklubs häufig zu Hause — auf kleinen Plätzen, vor eigenem Publikum, in bekannter Umgebung. Der Heimvorteil des Underdogs in solchen Konstellationen ist real und wird von Modellen systematisch unterschätzt, weil historische Bundesliga-Heimvorteildaten für diese spezifische Asymmetrie (kleiner Klub vs. großer Gast) kaum verwertbare Vergleichsfälle liefern.

Rotation und Reservespieler: der blinde Fleck

Rotation ist im DFB-Pokal keine Ausnahme — sie ist die Regel. Trainer großer Bundesligaklubs schonen ihre Stammkräfte für die Liga oder europäische Wettbewerbe, besonders in frühen Pokalrunden gegen vermeintlich schwächere Gegner. Das ist rational. Für Prognosemodelle ist es ein strukturelles Problem.

Ein Modell, das auf den historischen Leistungsdaten einer Bundesliga-Stammelf basiert, erstellt eine Prognose für eine Mannschaft, die so nicht auf dem Platz stehen wird. Die Wahrscheinlichkeitsverteilung — sagen wir 72 Prozent Heimsieg für den Favoriten — wurde unter der Annahme berechnet, dass die üblichen Stammspieler antreten. Wenn der Trainer stattdessen fünf oder sechs Kaderspieler aufstellt, ist diese Zahl schlicht falsch. Nicht leicht falsch — strukturell falsch.

Vorhersagezeitpunkt als entscheidender Faktor

Wer DFB-Pokal-Prognosen nutzt, sollte ausschließlich auf Vorhersagen zurückgreifen, die nach Aufstellungsbekanntgabe aktualisiert wurden. Im DFB-Pokal veröffentlichen Bundesligaklubs ihre Aufstellungen ebenfalls etwa 60 Minuten vor Anpfiff an die Medien. Bis dahin ist jede Prognose auf einen Schätzwert der zu erwartenden Rotation angewiesen. Manche Dienste modellieren Rotation explizit — sie bewerten, wie stark ein Team typischerweise rotiert und passen die Wahrscheinlichkeiten entsprechend an. Aber auch das ist ein Näherungswert, kein Faktum.

Reservespieler: der fehlende Datensatz

Reservespieler haben in vielen Fällen kaum Bundesliga-Minuten gesammelt. Ihre individuelle Leistungsqualität lässt sich aus den verfügbaren Daten nicht zuverlässig ableiten. Das ist der eigentliche blinde Fleck: Nicht die Rotation an sich, sondern die fehlende statistische Greifbarkeit der eingewechselten oder von Anfang an aufgestellten Spieler. Ein Bundesligareservespieler kann ein guter Fußballer sein — aber solange er kaum gespielt hat, hat das Modell schlicht keine verlässliche Grundlage für eine Bewertung.

Wann Rotation zum Vollrisiko wird

Besonders gefährlich wird Rotation, wenn sie kombiniert auftritt: Fünf oder sechs Wechsel gegenüber der Liga-Standardelf, dazu ein Heimspiel des Außenseiters auf schwerem Geläuf, und ein Bundesligist, der diese Saison schon mehrfach in frühen Pokalrunden Probleme hatte. Jeder dieser Faktoren für sich ist handhabbar. Zusammen produzieren sie eine Ausgangslage, in der eine Überraschung keine statistische Kuriosität mehr ist, sondern eine völlig realistische Möglichkeit — auch wenn das Prognose-Tool noch 68 Prozent für den Favoriten anzeigt.

Analyse-Ansätze für Pokal-Spiele

Trotz aller strukturellen Schwächen gibt es Analyse-Ansätze, die für DFB-Pokal-Prognosen einen realen Mehrwert liefern — vorausgesetzt, man wendet sie mit den richtigen Erwartungen an.

Prognosen nach Aufstellung neu bewerten

Der wichtigste Schritt: keine Prognose nutzen, die vor Aufstellungsbekanntgabe erstellt wurde — zumindest nicht für Entscheidungen. Nach Aufstellungsveröffentlichung lassen sich die Kräfteverhältnisse deutlich besser einschätzen. Wer die Startelf des Bundesligisten kennt, weiß, ob es sich um eine Rotations- oder eine Vollbesetzung handelt. Das verändert die Wahrscheinlichkeiten substanziell — und Prognosen, die darauf noch nicht reagiert haben, sind veraltet.

Postmatch-Datenbasis als Referenz

Für die Beurteilung, welche Modelle für Pokal-Spiele grundsätzlich besser geeignet sind, lohnt der Blick auf Forschungsdaten: Forcher et al. (Frontiers in Sports and Active Living, 2025) zeigen, dass xG-Modelle post-match eine Trefferquote von 65,6 Prozent auf 306 Bundesliga-Spielen erreichen. Das ist eine Obergrenze unter Idealbedingungen — mit vollständigem Spielverlauf und homogenen Ligadaten. Für DFB-Pokal-Prämatch-Prognosen liegt die realisierbare Genauigkeit strukturell darunter. Wer das weiß, setzt Pokal-Prognosen richtig ein: als grobe Orientierung, nicht als präzise Wahrscheinlichkeitsaussage.

Taktische Lageanalyse als Ergänzung

Was Algorithmen nicht liefern können, kann eine kontextuelle Analyse ergänzen: Wie motiviert ist der Bundesligist wirklich? Steht der Trainer unter Druck, oder ist die Ligaposition komfortabel genug für echte Rotation? Hat der Pokal für diesen Klub in dieser Saison Priorität? Diese Fragen sind nicht in Datenpunkten messbar — aber für jemanden, der die Situation kennt, beantwortbar. Eine Kombination aus algorithmischer Wahrscheinlichkeit und situativem Kontext ist für Pokal-Spiele geeigneter als das Vertrauen auf einen einzigen Score.

Spätere Runden: besser prognostizierbar

Die methodische Qualität von DFB-Pokal-Prognosen steigt mit jeder gespielten Runde. Ab dem Achtelfinale sind kaum noch Amateurklubs dabei — alle verbliebenen Teams kommen aus der Bundesliga oder der 2. Bundesliga, verfügen über ausreichende Datensätze und spielen mit mindestens angepasstem Fokus. Rotation existiert weiterhin, ist aber seltener und weniger radikal. Das Halbfinale und Finale des DFB-Pokals sind für Algorithmen deutlich zugänglicher als die erste Runde — und Prognosen dafür entsprechend verlässlicher.

Hinweis zum verantwortungsvollen Umgang

DFB-Pokal-Prognosen sind mit strukturell höherer Unschärfe behaftet als Bundesliga-Vorhersagen. Der Zufallsanteil im K.O.-Format ist real — kein Algorithmus kompensiert ihn vollständig. Nutzen Sie Prognosen als Informationshilfe, nicht als Entscheidungsersatz. Sportwetten sind in Deutschland nur bei GGL-lizenzierten Anbietern legal. Spielen Sie verantwortungsvoll und mit festen Budgetgrenzen. Bei problematischem Spielverhalten: BZgA-Hotline 0800 1 37 27 00 (kostenlos, 24h).

Datenquelle: arXiv — «Football Match Prediction Using Kelly Index Classification» (arXiv:2211.15734). URL: arXiv:2211.15734 (PDF)