# Structurize Wahl-O-Mat responses from 2021

The Wahl-O-Mat for the German parliamentary elections in 2021 can be found here: https://www.wahl-o-mat.de/bundestagswahl2021/app/main_app.html

For each of 38 political statements in the Wahl-O-Mat, parties shared their positions (yes/no/neutral) and a short explanation. 

After going through the Wahl-O-Mat, all these explanations can be viewed. I saved them as HTML files and turned them into a DataFrame below.

In [1]:
import re
import pandas as pd

with open('wahlomat_responses_2021/Standpunkte Wahl-O-Mat.html', 'r', encoding='utf-8') as file:
        content = file.read()

# Keep only the parties who are in the parliament
content = content.split('Die FREIEN WÄHLER sind 2010')[0]

# Strip all newlines
content = content.replace('\n', '')

# Remove multiple spaces
content = re.sub(' +', ' ', content)

# Updated regular expression patterns
statement_pattern = r'gestimmt\.\D*gestimmt\.(.*?)Begr'
response_pattern = r'Die Partei hat (nicht zugestimmt|zugestimmt|neutral gestimmt)\. Die Partei hat'
explanation_pattern = r'„(.*?)”'

# Find all matches with DOTALL to include newlines in the statement
statements = re.findall(statement_pattern, content, re.DOTALL)
responses = re.findall(response_pattern, content, re.DOTALL)
explanations = re.findall(explanation_pattern, content, re.DOTALL)

# Clean up statements
statements = [s.strip().replace('\n', ' ') for s in statements]

# Create a DataFrame
data = {'statement': statements, 'response': responses, 'explanation': explanations}
df = pd.DataFrame(data)

# Add party information as a column
party = ['CDU/CSU'] * 38 + ['SPD'] * 38 + ['AfD'] * 38 + ['FDP'] * 38 + ['Linke'] * 38 + ['Gruene'] * 38
df['party'] = party



In [2]:
df.sample(5)

Unnamed: 0,statement,response,explanation,party
110,Asyl soll weiterhin nur politisch Verfolgten g...,zugestimmt,Seit 2015 trägt Deutschland aus eigenem Versch...,AfD
87,Spenden von Unternehmen an Parteien sollen wei...,zugestimmt,Derzeit ist die Abzugsfähigkeit von Unternehme...,AfD
113,"Unternehmen sollen selbst entscheiden, ob sie ...",zugestimmt,"Ob Homeoffice möglich ist, kommt auf die jewei...",AfD
168,Der Solidaritätszuschlag soll vollständig abge...,nicht zugestimmt,Der Solidaritätszuschlag wird schon jetzt nur ...,Linke
62,Deutschland soll aus der Europäischen Union au...,nicht zugestimmt,Die Einheit Europas ist eine zivilisatorische ...,SPD


In [3]:
# Export to CSV
df.to_csv('wahlomat_responses_2021/wahlomat_2021.csv', index=False)