Das Champions-League-Finale war nicht nur ein aufregendes Spiel, sondern auch ein potenzieller Spielveränderer: Liverpools Stürmer Mo Salah, Spieler des Jahres, Empfänger des Goldenen Schuhs und Ägyptens bekanntester Spieler hatte plötzlich sein Ticket für die Weltmeisterschaft erhalten nach einer aggressiven Herausforderung von Sergio Ramos wurde er in Frage gestellt, was ihn verletzte.

Die Auswirkungen dieses Zweikampfes könnten enorm gewesen sein: Wenn Salah nicht für sein Land spielen konnte (es stellte sich heraus, dass er das fast Unmögliche getan hat und fit ist), hätte dies die Chancen Ägyptens in der Weltmeisterschaft und während Ägypten beeinträchtigen können Es ist unwahrscheinlich, dass die späteren Runden des Wettbewerbs beunruhigt werden, wie wenn ein Schmetterling auf der anderen Seite der Welt mit den Flügeln schlägt. Die Leistung Ägyptens könnte sich wiederum darauf auswirken, wie die anderen Teams in seiner Gruppe abschneiden Trophäe.

Dies bedeutet, dass Salahs potenzieller Rückgang nur einer von Millionen von Datenpunkten ist. Einer von Millionen Faktoren, die das Ergebnis des Wettbewerbs beeinflussen könnten.

Wie können wir dann in den Griff bekommen, was uns erwartet? Gibt es eine Möglichkeit, die Leistung von Teams vorherzusagen? Könnte Big Data, das bereits unzählige andere Branchen verändert hat, auch ein tieferes Verständnis für das schöne Spiel schaffen? Könnte es vorhersagen, wer die Weltmeisterschaft gewinnen wird??

Datenpunkte

Opta Sports und STATS sind zwei Unternehmen, die versuchen, solche Fragen zu beantworten. Als Unternehmen für Sportdaten haben sie das Ziel, Daten zu sammeln und für ihre Kunden zu verstehen. Dazu gehören Sportmannschaften und -verbände sowie Medien, die nach Datenwissen Ausschau halten (ähm)..

“Es ist sehr leicht zu glauben, dass mehr Daten gut sind, aber bis Sie wissen, wie Sie sie verwenden werden und was Sie daraus lernen können, können dies manchmal Daten sein, um Daten zu erhalten”

Paul Power, STATS.com

Was sammeln sie dann eigentlich? Der Marketingmanager von Opta, Peter Deeley, erklärte, dass sein Unternehmen für jedes Fußballspiel rund 2000 einzelne Datenpunkte sammelt, die sich hauptsächlich auf die Daten konzentrieren “am Ball” Aktionen. Ein Team von drei Analysten - einer für jede Seite und jemand, der schwierige Momente überprüfen muss - wird in der Datendrehscheibe des Unternehmens in Leeds sitzen und im Wesentlichen alles aufzeichnen, was auf dem Platz passiert: jeder Pass, jede Flanke und jeder Schuss sowie die Positionen auf dem Feld, an denen jede Interaktion stattgefunden hat.

Die Daten werden den Kunden live zur Verfügung gestellt. Aus diesem Grund kann zum Beispiel Gary Lineker aus Großbritannien (und der ehemalige englische Nationalspieler) den Zuschauern über Statistiken wie Ballbesitz und Schüsse zur Halbzeit erzählen.

Stats.com macht dasselbe - und Paul Power, ein Data Scientist des Unternehmens, wollte mir gerne erzählen, dass nicht nur Menschen zur Datenerfassung verwendet werden, sondern neue Computer Vision-Technologien.

Wenn es darum geht, die Position jedes Spielers auf dem Spielfeld genau zu erfassen, verwendet sein Unternehmen Kameras, die um den Rand platziert werden, um dies herauszufinden, und erspart den Spielern die Notwendigkeit, Tracking-Beacons unter ihren Hemden zu tragen, wie es in Sportarten wie Rugby Union der Fall ist.

Aber warum bleiben wir bei Menschen? Computer Vision konnte nicht zum Protokollieren verwendet werden alles dieser Art von Daten? “Die Menschen sind immer noch am besten, weil die Nuancen von Computern nicht verstanden werden können,” argumentiert Paul.

Er gibt als Beispiel an, was passiert, wenn ein Spieler in die Enge getrieben wird und den Ball aus Verzweiflung wegstößt, aber zum Glück wird der Ball dann von einem Spieler derselben Mannschaft empfangen. Für eine Maschine kann dies wie ein langer Durchlauf aussehen, da Maschinen den Kontext der Vorgänge oder das Aussehen von Panik im Gesicht des Spielers nicht bestimmen können - es würde einen langen Durchlauf aufzeichnen, während das Ereignis technisch gesehen etwas ist sonst: eine lösung. Das bedeutet, dass ohne einen Menschen, der diese Anrufe tätigt, die protokollierten Daten möglicherweise weniger genau sind.

Der Opta-Ansatz

Wir wissen, dass beide Unternehmen über viele Daten verfügen - aber wer glaubt, dass sie die Weltmeisterschaft tatsächlich gewinnen wird? Obwohl beide Unternehmen viele detaillierte Daten für ihre Kunden generieren, unterschieden sich STATS und Opta interessanterweise bei der Modellierung dieses Sommerturniers.

In Optas Fall erklärte mir Peter, dass sein Weltmeisterschaftsmodell die unzähligen Daten der einzelnen Spieler nicht berücksichtigt. Stattdessen hat sich Opta nur dafür entschieden, die Leistung der jeweiligen Nationalmannschaften auf Teamebene zu betrachten. Zum Beispiel die Einschätzung der Chancen Ägyptens anhand der bisherigen Leistungen des ägyptischen Teams und ohne Berücksichtigung der Verletzungssituation von Mo Salah.

“Datenwissenschaftler für die Weltmeisterschaft haben sich die historischen Leistungen verschiedener Länder angesehen. Welchen Unterschied macht es, wenn Sie als Gastgeberland spielen? Welchen Unterschied macht es, dass Sie auf Ihrem Heimatkontinent spielen? "

Peter Deeley, Opta

“Die Datenwissenschaftler für die Weltmeisterschaft untersuchten die historische Leistung verschiedener Länder. Welchen Unterschied macht es, wenn Sie als Gastgeberland spielen? Welchen Unterschied macht es, dass Sie auf Ihrem Heimatkontinent [und] spielen? Es macht, wenn Sie die letzten Weltmeisterschaften gewonnen haben,” Peter erklärt.

Die Datenwissenschaftler konnten das Modell dann durch hunderttausende Male optimieren, um iterative Verbesserungen vorzunehmen und das relative Gewicht jedes Faktors im Algorithmus anzupassen.

Dies ist eine Überraschung, da Sie davon ausgehen, dass je mehr Daten desto besser sind, aber Peter glaubt, dass dieses Modell immer noch gute Vorhersagen liefern kann.

“Eine Weltmeisterschaft findet nur alle vier Jahre statt, daher werden Sie oft feststellen, dass ein anständiger Spieler, der für ein Land spielt, das oft bei Weltmeisterschaften spielt, nur in zwei Weltmeisterschaftsturnieren spielt - Sie haben nicht so viele Daten dass sich die Spieler auf das breitere Team auswirken, innerhalb der internationalen Aufstellung.” er sagt.

Und er glaubt, dass diese Daten auf Teamebene ausreichen: “Italien gewann 2006 - es waren keine Favoriten und die Qualität der Mannschaft, obwohl sie gut waren. Es war kein Team, das einen Superstar auf Cristiano-Ronaldo-Niveau hatte.”

Er erklärt weiter: “Es ist wirklich interessant, bei den Weltmeisterschaften stimmt es, dass die Mannschaften, die sich historisch gut behaupten, weiterhin gut abschneiden. Deutschland hat in den letzten drei Weltmeisterschaften zumindest das Halbfinale erreicht.

"Auch wenn Sie behaupten können, dass ihre Mannschaft dieses Mal nicht so gut ist wie beim letzten Mal, haben sie immer noch den Ruf, aktueller Weltmeister zu sein, eine Mannschaft zu sein, die in der Regel eine gute Leistung zeigt - und dies auf ihrem Heimatkontinent Dies bedeutet, dass sie im Allgemeinen eine gute Chance haben, unabhängig von ihrem Team, aber sie haben in der Vergangenheit bei Turnieren gute Leistungen gezeigt.”

“Es ist sehr leicht zu glauben, dass mehr Daten gut sind, aber bis Sie wissen, wie Sie sie verwenden werden und was Sie daraus lernen können, können dies manchmal Daten sein, um Daten zu erhalten”, er sagt.

Das STATS-Modell

STATS hat die Weltmeisterschaft etwas anders modelliert. Im Gegensatz zu seinem Rivalen berücksichtigt es die Daten der einzelnen Spieler für das, was es nennt “Was, wenn?” Analytics.

Laut Paul bedeutet dies, dass STATS einzelne Spielerdaten effektiv nutzen kann, um nicht nur die Leistung eines Teams zu ermitteln, sondern auch die Auswirkungen des Austauschs von Spielern innerhalb und außerhalb des Teams zu quantifizieren. In Mo Salahs Fall behauptet STATS, dass sein System in der Lage wäre, die Auswirkungen auf Ägypten zu bestimmen, ob er fit genug ist, um zu spielen oder nicht.

“Sie können diese verschiedenen Situationen einbinden, und dies würde in der Lage sein, ein Ergebnis zu generieren, und diese Maßnahme wäre entweder die Anzahl der erzielten oder zugespielten Tore oder die Wahrscheinlichkeit eines Gewinns: Wie erhöht oder verringert der Spieler seine Chancen? ", Erklärt Paul.

“Wir können uns das anschauen, die Simulationen ausführen und das wird uns tatsächlich sagen: Mo Salah ist vielleicht 0,3 eines Tores wert oder wenn er nicht spielt und ein anderer Spieler kommt, verringert dies die Gewinnwahrscheinlichkeit um 3% oder 10%. oder es kann sich tatsächlich erhöhen, abhängig von dem Team, gegen das sie tatsächlich spielen.”

(Bild: © Getty Images)

Warum glaubt STATS, dass der individuelle Ansatz besser funktioniert als der Blick auf Teams??

“Jeder weiß, wenn Sie Ihre Star-Spieler vermissen, wird sich dies auf die Leistung auswirken. Sie benötigen kein komplexes neuronales Netzwerk, um dies zu sagen,” sagt Paul. “Wenn Sie das in Ihrem Dataset vermissen, wird dies wahrscheinlich Ihre Wahrscheinlichkeiten und Ihre Vorhersagen verzerren”.

“Wir wissen, dass durch das Hinzufügen dieser zusätzlichen Funktionen zu den Spielern bessere Auswirkungen erzielt werden, da wir die direkten Beziehungen zwischen Individuen besser modellieren können und obwohl es sich um einen Mannschaftssport handelt, wissen wir, dass bestimmte Individuen einen größeren Einfluss haben auf das Ergebnis als bestimmte andere.

"Wenn Sie zum Beispiel einen Außenverteidiger vermissen, ist dies möglicherweise weniger ein Problem als der Verlust eines zentralen Mittelfeldspielers. Daher müssen Sie dies berücksichtigen. Deshalb sind wir sehr zuversichtlich in das Modell dass wir generiert haben.”

Sag mir, wer gewinnen wird, verdammt noch mal

Nun kommen wir zu der alles entscheidenden Frage: Welches Land wird nach Ansicht der beiden Modelle voraussichtlich gewinnen? In beiden Fällen haben sie als richtige Statistik-Nerds Wahrscheinlichkeitsprognosen geliefert, die etwas mehr Nuance enthalten als Sie, Dave, der blind schwört, dass Deutschland erneut gewinnen wird, weil er ein gutes Gefühl dafür hat.

Ich habe STATS nach seinen Vorhersagen gefragt, und zwar traurig, obwohl das Unternehmen bereit ist, mir alle Daten mitzuteilen, auf die es Zugriff hat und wie es zugänglich ist würde Ich mache tatsächlich eine Vorhersage. Mir wurde gesagt, dass sie ihre Prognosen in diesem Jahr nicht veröffentlichen werden. Warum? Aus Angst, falsch zu sein? Nein, die Antwort ist viel unkomplizierter: Dies sind wertvolle Informationen, und sie möchten nur zahlenden Kunden die Bohnen überlassen.

Wir haben jedoch eine Vorhersage von Opta. Der langjährige Weltcup-Gewinner Brasilien (ohne Erwähnung des Jahres 2014) wird erneut als wahrscheinlichster Champion eingestuft und erhält somit eine Gewinnchance von 14,2%. Das heißt, wenn Sie die Weltmeisterschaft 20 Mal mit den gleichen Teams bestritten haben, würden Sie nur erwarten, dass Brasilien etwa dreimal gewinnt. Wie Ihr Kumpel Dave liebt auch Opta Deutschland - mit einer Chance von 11,4%, die Trophäe wieder mit nach Hause zu nehmen.

Ein anderes Unternehmen, das gerne Vorhersagen macht und eine beängstigende Genauigkeit in den Ergebnissen erzielt, ist EA Sports. Für die letzten drei Weltmeisterschaften hat er den späteren Weltcup-Gewinner zu Recht vorausgesagt.

Anhand der detaillierten Daten zu den Spielern und zur Mannschaftswertung in FIFA 2018 und seinem WM-Add-On wurde eine Simulation des Turniers durchgeführt, und Frankreich war der spätere Gewinner, der im Finale Deutschland gewann. Da Deutschland und Spanien für die Weltmeisterschaften 2014 und 2010 vorhergesagt wurden, könnte dies eine gute Nachricht sein.

Dann gibt es auch Blue Yonder, ein Unternehmen, das dafür bekannt ist, dass KI verwendet wird, um die Bestandsverwaltung in einigen der größten Supermärkte der Welt vorherzusagen. Vor kurzem hat es seine Hand auf die Vorhersage der Weltmeisterschaft gerichtet. Linkes Feld ja, aber seine Technologie hat jedes internationale Fußballspiel seit 1872 analysiert, wobei über 1 Million Simulationen der Weltmeisterschaft durchgeführt wurden, und glaubt, dass Brasilien die Favoriten ist, um Russland zu gewinnen, mit einer Gewinnchance von 22,5%.

Und was ist mit England? Die schlechte Nachricht für Gareth Southgate ist, dass Opta seinem Team eine niedrige Chance von 1,9% gibt, während Blue Yonder dies ein wenig auf 5,7% erhöht..

Wenn Opta und Blue Yonder recht haben, können wir uns auf ein weiteres Elfmeterschießen freuen. Seufzer.

TechRadars WM-Berichterstattung wird Ihnen in Verbindung mit Honour präsentiert.