# Financial Analysis

The main jupyter notebook for the analysis of Finnish election candidate finances. *This will, in all likelihood, not remain one file once exploration is complete*. Potential avenues include:
- General regression analysis, observing how much different factors at play (where a candidate got their money from, how they spent it, and other correlatory effects impacted the election results).
    - Previously held electoral experience, financial information
- Isolate anomalies, or people outside of the norm. I.e. Candidate 8 appears to have been very successful even though they spent very little, why is that?
- Who funds who, who spends where based on party, age
- Comparison on effectiveness for different types of ad spending
- Whether self funding is useful/successful

Important drawbacks to remember:
- This information only focuses on the winners of the election, rather then the losers. May be a winner bias, i.e. losers did spend more on self fundraising but those candidates who were already successful used it more effectively.
- Correlation != causuation and information can make things worse. Obvious but I'm writing it anyways because it must always be kept in mind.



In [15]:
import pandas as pd

kuntavaalit_2012 = pd.read_csv("files/finances/Liite_10_Kuntavaalit_2012_VI.csv", sep=";", on_bad_lines='warn')
# display(kuntavaalit_2012)
display(kuntavaalit_2012[5375:5378])

Skipping line 256: expected 41 fields, saw 43
Skipping line 325: expected 41 fields, saw 43
Skipping line 794: expected 41 fields, saw 42
Skipping line 953: expected 41 fields, saw 43
Skipping line 1289: expected 41 fields, saw 42
Skipping line 1646: expected 41 fields, saw 44
Skipping line 1730: expected 41 fields, saw 42
Skipping line 2028: expected 41 fields, saw 42
Skipping line 2315: expected 41 fields, saw 42
Skipping line 2544: expected 41 fields, saw 42
Skipping line 2661: expected 41 fields, saw 43
Skipping line 2952: expected 41 fields, saw 42
Skipping line 2962: expected 41 fields, saw 42
Skipping line 3204: expected 41 fields, saw 44
Skipping line 3963: expected 41 fields, saw 42
Skipping line 4034: expected 41 fields, saw 42
Skipping line 4693: expected 41 fields, saw 42
Skipping line 4697: expected 41 fields, saw 42
Skipping line 4726: expected 41 fields, saw 43
Skipping line 4961: expected 41 fields, saw 42
Skipping line 4979: expected 41 fields, saw 43
Skipping line 504

Unnamed: 0,'Ehdokasnumero','Kuntanumero','Etunimet','Sukunimi','Arvo/ammatti/tehtava','Vaalipiiri/Kunta','Puolue','Ehdokkaan mahdollisen tukiryhman nimi','Vaalirahoitukseni ei ole ylittanyt 800 euroa','Vaalikampanjan kulut yhteensa',...,"'2.5 Ei sisalla yhtaan vahintaan 800 euron tukisuoritusta puolueelta (""x"")'",'2.5 Rahoitus sisaltaa puolueelta saatua tukea yhteensa lisatietokentan teksti','2.6 Rahoitus sisaltaa puolueyhdistyksilta saatua tukea yhteensa',"'2.6 Ei sisalla yhtaan vahintaan 800 euron tukisuoritusta puolueyhdistyksilta (""x"")'",'2.6 Rahoitus sisaltaa puolueyhdistyksilta saatua tukea yhteensa lisatietokentan teksti','2.7 Rahoitus sisaltaa muilta tahoilta saatua tukea yhteensa',"'2.7 Ei sisalla yhtaan vahintaan 800 euron tukisuoritusta muilta tahoilta (""x"")'",'2.7 Rahoitus sisaltaa muilta tahoilta saatua tukea yhteensa lisatietokentan teksti','2.8 Rahoitus sisaltaa valitettya tukea yhteensa','E. vapaaehtoinen erittely'
5375,'0386','049','Janna Kirsi Elina','Koivisto',"'yhteiskuntatieteen maisteri, kansainvälisten ...",'Espoo','VIHR','','X','',...,' ','','',' ','','',' ','','',''
5376,'0415','049','Jyrki Johannes','Myllärniemi',"'Diakoni, sosionomi yamk.'",'Espoo','VIHR','','','2982',...,'X','','','X','','','X','','',''
5377,'0448','049','Mika Pertti','Soininen','lastenpsykiatri','Espoo','VIHR','','X','',...,' ','','',' ','','',' ','','',''


In [None]:
import csv

with open('files/finances/Liite_10_Kuntavaalit_2012_VI.csv', 'r', encoding='utf-8') as f:
    reader = csv.reader(f, delimiter=";")
    header = next(reader)
    print(f"Header has {len(header)} fields")
    
    problem_lines = [256, 325, 794, 953, 1289, 1646, 1730, 2028, 
                     2315, 2544, 2661, 2952, 2962, 3204, 3963, 4034,
                     4693, 4697, 4726, 4961, 4979, 5046, 5271, 5376]
    
    for i, row in enumerate(reader, start=2):  # start=2 because header is line 1
        if i in problem_lines:
            print(f"\nLine {i}: {len(row)} fields")
            print(f"Raw content: {row}")
            # Show which fields might be problematic
            if len(row) > 41:
                # for val in row[41:]:
                #     print(val)
                print(f"Extra fields: {row[41:]}")

Header has 1 fields

Line 256: 7 fields
Raw content: ["'0204';'980';'Esko Tapani';'Morikka';'lehtori", " eläkeläinen';'Ylöjärvi';'PS';'';'';'2114", "90';'777", "49';'';'';'';'';'';'312", "42';'';'';'';'1025';'2114", "90';'2114", "90';'';'';'X';'';'';'X';'';'';'X';'';'';'X';'';'';'X';'';'';'1. Vaalikampanjan kulut yhteensä - Muut kulut: Avustus paikallisyhd. 1000 € ja &quot;lisenssimaksu&quot;'"]

Line 325: 7 fields
Raw content: ["'0086';'205';'Eila Anneli';'Aavakare';'kauppateknikko", " hyvinvointiterapeutti';'Kajaani';'PS';'';'X';'';'';'';'';'';'';'';'';'';'';'';'';'';'';'';'';' ';'';'';' ';'';'';' ';'';'';' ';'';'';' ';'';'';'1. Vaalikampanjan kulut yhteensä 755 eur - Vaalimainonta: Sanoma-", ' ilmaisjakelu- ja aikakauslehdet 244 eur; Ulkomainonta 13', '00 eur; Vaalilehtien', ' esitteiden ja muun painetun materiaalin hankinta 369', '00 eur - Vaalitilaisuudet 129', "00 eur 2. Vaalikampanjan rahoitus yhteensä 755 eur 2.1 Rahoitus sisältää omia varoja yhteensä 755 eur'"]

Line 794: 8 fi