Blog

Business Case: Bayes'sches Prognosemodell für die Bundestagswahl

Task

Der Ausgang der Bundestagswahl ist von großem gesellschaftlichem Interesse. Um einen Einblick über die derzeitigen Präferenzen der Wähler*innen zu erhalten, veröffentlichen verschiedene Umfrageinstitute regelmäßig Ergebnisse der sogenannten Sonntagsfrage. Die Sonntagsfrage ermittelt, welche Partei die Befragten wählen würden, wenn am kommenden Sonntag Bundestagswahl wäre. Es ist jedoch bekannt, dass Umfragen Limitationen haben. Häufig sind sie verzerrt, sei es durch unrepräsentative Stichproben oder andere methodische Probleme. Zudem spiegeln die Umfragen nur das gegenwärtige Stimmungsbild wider und können statistisch gesehen keine Einschätzung zum Ausgang einer zukünftigen Wahl geben.

Mit unserem Wahlprognosemodell wollen wir diesen Herausforderungen begegnen. Im Gegensatz zu herkömmlichen Wahlumfragen wird nicht nur eine Prognose für eine hypothetische Wahl am nächsten Sonntag, sondern auch für die Wahl selbst gemacht. Außerdem werden in unserem Modell Unsicherheitsquellen berücksichtigt wie z.B. Stichprobenfehler und Verzerrungen der Wahlumfragen. Eine weitere Besonderheit ist, dass wir neben dem eigentlichen Wahlergebnis auch Wahrscheinlichkeiten für Koalitionen und bestimmte Ereignisse ermitteln (z.B. "Wie wahrscheinlich ist es, dass die Grünen stärker sind als die SPD?").

Data

Als Grundlage für das Modell verwenden wir historische Wahlumfragen mehrerer Umfrageinstitute, die auf www.wahlrecht.de verfügbar sind. Wir verwenden außerdem die Ergebnisse der vergangenen Bundestagswahlen sowie Daten zum Regierungs- bzw. Oppositionsstatus der Parteien. Für die Berechnung der Wahrscheinlichkeiten verschiedener Koalitionen leiten wir die "Vorlieben" der Parteien aus den Ergebnissen und den gebildeten Koalitionen der Landtagswahlen ab.

Analytics

Zur Vorhersage des Wahlausgangs verwenden wir ein Bayes'sches State-Space-Modell. Durch die Simulation einer Vielzahl von möglichen Wahlausgängen, lässt sich eine Prognose inklusive Unsicherheitsbereich ableiten. Das Modell berücksichtigt ein Lang- und Kurzzeitgedächtnis der Wahlbevölkerung, da die Stimmenanteile der Parteien nach größeren kurzfristigen Veränderungen üblicherweise zu ihren langfristigen Trends zurückkehren. Der Effekt, dass die Stimmenanteile von Regierungsparteien häufig zurückgehen, wird ebenso berücksichtigt wie die "Hauseffekte" (manche Parteien schneiden bei bestimmten Instituten durchgehend besser oder schlechter ab) und Korrelationen der Umfrageinstitute.

Die Wahrscheinlichkeiten für verschiedene Koalitionen werden mit einem Bayes'schen multinomialen Logit-Modell und den simulierten Wahlausgängen geschätzt. Das Modell basiert auf den Ergebnissen der letzten Bundestags- und Landtagswahlen. Mit der Information über alle rechnerisch möglichen Koalitionen und der tatsächlich regierenden Koalition, lernt das Modell die "Vorlieben" der Parteien in Abhängigkeit der Wahlergebnisse und den zur Verfügung stehenden Koalitionspartner*innen.

Solution

Unsere Wahlprognose liefert nicht nur eine Vorhersage für eine hypothetische Wahl am nächsten Sonntag, sondern auch für die Bundestagswahl an sich und ist in der Lage, die Unsicherheit der Vorhersage zu beziffern. Damit gibt unsere Prognose nicht nur Einblick in die aktuellen Präferenzen der Wähler*innen, sondern auch einen Ausblick bis zur Wahl und die darüber hinaus laufende Koalitionsbildung.