Sportec Solutions Bundesliga-Daten – 25 Frames pro Sekunde, Positionsdaten, DFL Daten KI

Sportec solutions bundesliga daten — wer Bundesliga-Prognosen verstehen will, muss wissen, auf welcher Datenbasis sie stehen. Hinter dem Gros der methodisch seriösen Fußball-KI-Prognosen für die Bundesliga steckt eine einzige Primärquelle: Sportec Solutions, die DFL-Tochtergesellschaft, die seit Jahren die offiziellen Tracking- und Event-Daten der deutschen Profiligen erhebt. Kein anderer Datenanbieter hat für die Bundesliga eine vergleichbar tiefe und vollständige Dateninfrastruktur aufgebaut.

Sportec Solutions ist nicht nur ein Datendienstleister — es ist die Infrastruktur, auf der der gesamte analytische Unterbau des modernen deutschen Fußballs aufbaut. Von der taktischen Analyse im Spieltags-Briefing bis zur Transferbewertung durch Data Scientists: Die Positionsdaten aus dem Sportec-System sind der gemeinsame Nenner. Für externe Prognose-Entwickler und Forscher ist der Zugang zu diesen Daten das entscheidende Qualitätsmerkmal — und gleichzeitig die höchste Einstiegshürde.

Dieser Artikel erklärt, was Sportec Solutions erfasst und wie, wie Rohdaten in Prognosen fließen und welche Ligen und Wettbewerbe heute von der Sportec-Infrastruktur abgedeckt werden.

Was Sportec Solutions erfasst und wie

Die Datenerhebung von Sportec Solutions ist in ihrer Vollständigkeit einzigartig im deutschen Fußball. Sie kombiniert zwei komplementäre Datenkategorien: Positionsdaten und Event-Daten.

Positionsdaten: 25 Frames pro Sekunde

Sportec Solutions erfasst die Positionsdaten jedes Spielers auf dem Spielfeld 25 Mal pro Sekunde (TAB Bundestag — «Big Data und KI im Fußball», Themenkurzprofil Nr. 72, Juni 2024). Das ist die x/y-Koordinate jedes Akteurs im Sekundenbruchteil — inklusive Torhüter, Schiedsrichter und Ball. Diese Frequenz — 25 Frames pro Sekunde — entspricht der Bildrate von Broadcast-Video, ist aber mit höherer Genauigkeit georeferenziert. Das Ergebnis: Für jedes Bundesliga-Spiel entsteht ein vollständiges kinetisches Protokoll aller 22 Feldspieler plus Ball, mit einer zeitlichen Auflösung von 40 Millisekunden pro Datenpunkt.

Event-Daten: jede Aktion im Spiel

Parallel zu den Positionsdaten erhebt Sportec Solutions vollständige Event-Daten: jeden Pass mit Startpunkt, Endpunkt, Empfänger und Erfolg; jeden Schuss mit Position, Körperteil, vorheriger Aktion und Abschluss-xG; jeden Zweikampf mit Gegenspieler und Outcome; jede Auswechslung, Karte, Ecke und Freistoß. Diese Event-Daten sind strukturiert und maschinenlesbar — ein direkter Input für maschinelle Lernmodelle, die auf dieser Grundlage trainiert werden. Im Unterschied zu manuell erhobenen Daten, die Verzögerungen von Stunden oder Tagen haben, sind Sportec-Event-Daten kurz nach Spielende vollständig verfügbar.

Wie die Daten erhoben werden

Die Positionsdaten werden durch Kamerasysteme in den Bundesliga-Stadien erhoben — typischerweise mehrere Kameras pro Stadion, die eine vollständige Feldabdeckung sicherstellen. Die Rohdaten werden automatisch durch Bildverarbeitungsalgorithmen in Koordinatendaten konvertiert. Event-Daten entstehen durch eine Kombination aus automatischer Erkennung und manueller Verifikation durch spezialisiertes Personal. Der hybride Ansatz sichert hohe Genauigkeit bei gleichzeitig kurzen Verarbeitungszeiten.

Warum 25 fps der relevante Standard sind

25 Frames pro Sekunde ist kein willkürlicher technischer Standard. Es ist die Minimalfrequenz, die für eine verlässliche Rekonstruktion von Laufwegen, Sprintdistanzen und taktischen Formationsanalysen notwendig ist. Bei niedrigerer Frequenz — etwa 10 fps, wie bei frühen Tracking-Systemen — werden schnelle Richtungsänderungen und Kurzpass-Kombinationen nur unvollständig erfasst. Für EPV-Modelle (Expected Possession Value), die den Wert jeder Ballposition im Verlauf einer Angriffssequenz berechnen, ist eine hohe Datenfrequenz unverzichtbar. Modelle, die auf Sportec-Daten trainiert sind, haben damit einen strukturellen Datenvorteil gegenüber Modellen, die auf öffentlich zugängliche, niedrigfrequente Datensätze zurückgreifen.

Zugang für externe Entwickler und Forscher

Der Zugang zu Sportec-Daten ist über die DFL-Struktur geregelt und nicht frei zugänglich. Universitäten, Forschungsinstitute und ausgewählte Analytics-Unternehmen können unter bestimmten Bedingungen Datenzugang erhalten — häufig im Rahmen von Kooperationsprojekten mit der DFL oder einzelnen Vereinen. Diese Zugangsbeschränkung ist der Grund, warum hochwertige Bundesliga-Prognosen von externen Anbietern selten sind: Ohne Sportec-Daten oder vergleichbare proprietäre Quellen ist die Datengrundlage strukturell schwächer.

Von Rohdaten zur Prognose: der Datenfluss

Wie werden aus 25 Positionsdaten-Frames pro Sekunde und tausenden von Event-Einträgen pro Spiel schließlich Prognosen für das nächste Spielereignis? Der Datenfluss ist mehrstufig und umfasst mehrere Transformationsschritte.

Schritt 1: Aggregation zu Spieler- und Teamkennzahlen

Aus den Rohdaten werden zunächst Kennzahlen aggregiert: xG pro Spiel, xGA (Expected Goals Against), Pressing-Intensität (PPDA — Passes Allowed per Defensive Action), Laufkilometer, Sprintanteile, Expected Possession Value (EPV) und weitere. Diese Aggregationen fassen das Spielgeschehen pro Match in interpretierbare Metriken zusammen — von wenigen Millionen Rohdatenpunkten pro Spiel auf einige Dutzend Kennzahlen.

Schritt 2: Formkurven und saisonale Normierung

Im zweiten Schritt werden diese Spiel-Kennzahlen über mehrere Spiele geglättet: Formkurven der letzten fünf oder zehn Spiele, gewichtet nach Spielstärke des Gegners. Dieser Normierungsschritt ist wichtig, weil ein xG-Wert von 2,1 gegen einen Abstiegskandidaten deutlich weniger aussagt als derselbe Wert gegen einen Champions-League-Teilnehmer. Modelle, die diese Gegnerqualitäts-Adjustierung vornehmen, produzieren kalibrierte Stärkeschätzungen statt rohstatistischer Durchschnittswerte.

Schritt 3: Prognose-Modell und Ausgabe

Die normalisierten Teamstärken beider Begegnungsparteien werden in ein Prognosemodell eingespeist — typischerweise ein Machine-Learning-Algorithmus wie Random Forest, Gradient Boosting oder ein neuronales Netz, das auf historischen Spielausgängen trainiert wurde. Der Output ist eine Wahrscheinlichkeitsverteilung über alle möglichen Ausgänge: Heimsieg, Unentschieden, Auswärtssieg — und bei detaillierteren Modellen auch Über/Unter-Tore-Prognosen und Expected-Score-Verteilungen. Der gesamte Prozess von Spielende bis zur fertigen Prognose für das nächste Spiel dauert bei gut implementierten Systemen wenige Stunden.

Aufstellungseinfluss: das entscheidende Update

Die finale und wichtigste Datenanpassung vor einem Spiel ist das Aufstellungs-Update. Wenn bekannt ist, dass ein Stammtorjäger verletzt fehlt, verändert sich der erwartete xG-Wert des Teams messbar. Modelle, die Aufstellungsdaten in Echtzeit verarbeiten und die Prognose entsprechend aktualisieren, sind für die taktische Einschätzung konkreter Spiele erheblich wertvoller als Modelle, die nur auf historischen Teamdurchschnittswerten basieren.

Welche Ligen und Wettbewerbe abgedeckt sind

Sportec Solutions hat seinen Abdeckungsbereich in den letzten Jahren systematisch ausgebaut — von der 1. und 2. Bundesliga auf weitere Wettbewerbe und Ligen.

1. und 2. Bundesliga: vollständige Abdeckung seit Jahren

Die 1. und 2. Bundesliga sind seit mehreren Saisonen vollständig durch Sportec Solutions abgedeckt. Alle 306 Spiele der 1. Bundesliga und alle 306 Spiele der 2. Bundesliga pro Saison werden mit vollständigen Positions- und Event-Daten erfasst. Das ergibt pro Saison über 600 Spiele mit hochauflösenden Daten — eine Basis, die für das Training von Prognosemodellen erheblich größer ist als der öffentlich zugängliche Datensatz für die meisten anderen europäischen Ligen.

DFB-Pokal: ab Saison 2022/23

Ab der Saison 2022/23 wurde die Datenerfassung auf den DFB-Pokal ausgeweitet (TAB Bundestag Nr. 72, Juni 2024). Das ist für Prognosemodelle relevant, weil der DFB-Pokal spezifische Spielkonstellationen enthält — Bundesligisten gegen Unterligisten, Spieler mit geringerer Einsatzzeit und taktische Variationen gegenüber dem Liga-Alltag. Die Aufnahme in die Sportec-Infrastruktur ermöglicht eine datengestützte Analyse dieser Besonderheiten.

3. Liga und Frauen-Bundesliga: ab Saison 2023/24

Ab der Saison 2023/24 erstreckt sich die Sportec-Datenerhebung auf die 3. Liga und die Google Pixel Frauen-Bundesliga (TAB Bundestag Nr. 72, Juni 2024). Die 3. Liga ist für Prognosemodelle besonders interessant, weil sie eine Liga mit höherer Ergebnisvolatilität und weniger gut dokumentierten Teamstärken ist — Bereiche, in denen Tracking-Daten den größten Informationsgewinn liefern können. Die Frauen-Bundesliga profitiert von einer Dateninfrastruktur, die für den Männerfußball entwickelt wurde, nun aber auch das Wachstum der Analysetiefe im Frauenfußball ermöglicht.

Was noch nicht abgedeckt ist

Unterhalb der 3. Liga — Regionalliga, Oberliga und darunter — gibt es keine Sportec-Abdeckung. Prognosen für diese Spielklassen basieren auf manuell erhobenen Event-Daten oder öffentlich zugänglichen Statistiken, deren Qualität und Vollständigkeit deutlich hinter dem Bundesliga-Standard zurückbleibt. Wer Prognosen für Nicht-Bundesliga-Spiele liest, sollte diesen Qualitätsunterschied in der Datenbasis einkalkulieren.

Hinweis zum verantwortungsvollen Umgang

Bundesliga-Prognosen auf Basis von Sportec-Daten sind methodisch die fundiertesten verfügbaren — aber auch sie können falsch liegen. Sportwetten in Deutschland sind ausschließlich bei GGL-lizenzierten Anbietern legal. Spielen Sie verantwortungsvoll und mit festen Budgetgrenzen. Bei problematischem Spielverhalten: BZgA-Hotline 0800 1 37 27 00 (kostenlos, Mo–Do 10–22 Uhr, Fr–So 10–18 Uhr).

Datenquelle: TAB Bundestag — «Big Data und KI im Fußball», Themenkurzprofil Nr. 72 (Simone Ehrenberg-Silies), Juni 2024. URL: TAB Bundestag Nr. 72 (PDF)