Die Rolle der Granger-Kausalität bei der Identifizierung kausaler Zusammenhänge für die Zeitreihenvorhersage

Nachricht

HeimHeim / Nachricht / Die Rolle der Granger-Kausalität bei der Identifizierung kausaler Zusammenhänge für die Zeitreihenvorhersage

Aug 10, 2023

Die Rolle der Granger-Kausalität bei der Identifizierung kausaler Zusammenhänge für die Zeitreihenvorhersage

Geschichte nur für Mitglieder David Andres Folgen Sie DataDrivenInvestor – Teilen Wir haben Vector Autoregression oder VAR in einem früheren Artikel eingeführt. Aber macht es wirklich Sinn, zwei (oder mehr) verschiedene zu verwenden?

Geschichte nur für Mitglieder

David Andres

Folgen

DataDrivenInvestor

--

Aktie

Wir haben die Vektorautoregression oder VAR in einem früheren Artikel eingeführt. Aber ist es wirklich sinnvoll, zwei (oder mehr) verschiedene Variablen für eine Prognose zu verwenden? Die Antwort ist nein, zumindest nicht immer. Es wird nur dann wirklich von Vorteil sein, wenn zwischen ihnen eine Art Beziehung besteht. Die Verwendung unabhängiger Variablen könnte zu Störungen im Modell führen und die Vorhersagen eher verschlechtern als verbessern.

Haftungsausschluss: Einige Teile dieses Artikels wurden mit Hilfe von KI verbessert, wobei KI-generierter Python-Code als Basis verwendet oder Absätze zur Verbesserung der Klarheit umformuliert wurden.

Eine einfache Möglichkeit, zu überprüfen, ob eine Beziehung besteht, könnte darin bestehen, die Korrelation zwischen den Variablen zu überprüfen. Dies ist jedoch nicht die einzige Art von Beziehung, die zwei Variablen haben können.

Wir könnten auch prüfen, ob es irgendeinen Kausalzusammenhang zwischen ihnen gibt. Zunächst muss jedoch etwas Wesentliches verstanden werden: Unsere Tests zeigen, dass Kausalität nicht unbedingt bedeutet, dass das eine die Ursache für das andere ist, sondern lediglich, dass es eine Art Korrelation in früheren Daten gibt.

Lassen Sie uns dieses Konzept anhand eines Beispiels besser verstehen, das herausfinden soll, ob COVID-Fälle und Todesfälle irgendwie miteinander zusammenhängen.

Lassen Sie uns zunächst die Daten importieren und einige grundlegende Verarbeitungen durchführen. Wir werden COVID-Daten aus Deutschland verwenden. Die Daten sind nach Bundesstaat, Landkreis, Alter und Geschlecht aufgeteilt; Der Einfachheit halber werden wir sie jedoch zusammenfassen.