# Update Abstimmungsresultate
Datum: 29.09.2021

Immer nach den Abstimmungen werden die Abstimmungsresultate vom Datamanagement aufbereitet und auf der «[**Abstimmungs-Datenbank
von Statistik Stadt Zürich**](http://sszsttprd/statisticstools/Modules/Abstimmungen/Intranet/)» verfügbar gemacht.

Für OGD kann dann via Exportfunktion (Format Roh > Export) ein Excelfile exportiert und unter folgendem Pfad abgelegt werden: 
`\\szh.loc\ssz\applikationen\OGD\Daten\Quelldaten\SSZ\Politik\abstimmungen\__Modules_Abstimmungen_Export_AbstimmungenExport.xls`

Damit das die Ressourcen des Datasets «[Abstimmungsresultate der Stadt Zürich, seit 1933](https://data.stadt-zuerich.ch/dataset/politik-abstimmungen-seit-1933)» **manuell** aktualisiert werden können, muss das exportierte Excel noch 
 - als **Csv** aufbereitet und
 - das Attribut 'Abstimmungs_Datum' noch ins korrekte Datumsformat (**JJJJ-MM-TT / ISO 8601**) umgewandelt
 werden.
 
Früher wurden diese simplen Schritte im Libre Office (Open Office) gemacht. Nun sollen sie noch einfacher per Python gemacht werden.



<!---  
Dieses Notebook verwendet als Vorlage die Webseite «[Kitas in Berlin - Jupyter Notebook](https://juanitorduz.github.io/kitas_berlin/)» 
---!>


In [50]:
#%pip install geopandas fiona requests folium mplleaflet contextily

In [137]:
import numpy as np
import pandas as pd
import pandas as pd
import pivottablejs
from pivottablejs import pivot_ui


## Zuletzt veröffentlichte Abstimmungsresultate
Wie sehen die aktuell auf dem OGD-Katalog veröffentlichten Daten dazu aus?

In [122]:
url_abstimmungsresultate =r"https://data.stadt-zuerich.ch/dataset/politik-abstimmungen-seit-1933/download/abstimmungen_seit1933.csv"

# Read the data
bisherige_abstimmungsresultate = pd.read_csv(
    url_abstimmungsresultate, 
    sep=','    
    )
bisherige_abstimmungsresultate.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 9662 entries, 0 to 9661
Data columns (total 16 columns):
 #   Column                 Non-Null Count  Dtype  
---  ------                 --------------  -----  
 0   Abstimmungs_Datum      9662 non-null   object 
 1   Nr_Politische_Ebene    9662 non-null   int64  
 2   Name_Politische_Ebene  9662 non-null   object 
 3   Abstimmungs_Text       9662 non-null   object 
 4   Nr_Resultat_Gebiet     9662 non-null   int64  
 5   Name_Resultat_Gebiet   9662 non-null   object 
 6   Nr_Wahlkreis_StZH      5102 non-null   float64
 7   Name_Wahlkreis_StZH    5102 non-null   object 
 8   Stimmberechtigt        6524 non-null   float64
 9   Ja                     9662 non-null   int64  
 10  Nein                   9662 non-null   int64  
 11  Stimmbeteiligung (%)   9662 non-null   float64
 12  Ja (%)                 9662 non-null   float64
 13  Nein (%)               9662 non-null   float64
 14  StaendeJa              380 non-null    object 
 15  Stae

In [123]:
bisherige_abstimmungsresultate.head(2)

Unnamed: 0,Abstimmungs_Datum,Nr_Politische_Ebene,Name_Politische_Ebene,Abstimmungs_Text,Nr_Resultat_Gebiet,Name_Resultat_Gebiet,Nr_Wahlkreis_StZH,Name_Wahlkreis_StZH,Stimmberechtigt,Ja,Nein,Stimmbeteiligung (%),Ja (%),Nein (%),StaendeJa,StaendeNein
0,2021-06-13,3,Stadt Zürich,Totalrevision der Gemeindeordnung,3,Stadt Zürich,,,234017.0,93080,30620,55.9,75.2,24.8,,
1,2021-06-13,3,Stadt Zürich,Totalrevision der Gemeindeordnung,3,Stadt Zürich,2.0,Kreis 1+2,22896.0,9055,3204,56.6,73.9,26.1,,


## Importiere die neusten Abstimmungsresultate zur Datenaufbereitung

Wir importieren das von der Abstimmungsdatenbank exportierte Excelfile und bereiten es für die Veröffentlichung für OGD auf.


Link zu `read_excel()` in Pandas: https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.read_excel.html

`pandas.read_excel(io, sheet_name=0, header=0, names=None, index_col=None, usecols=None, squeeze=False, dtype=None, engine=None, converters=None, true_values=None, false_values=None, skiprows=None, nrows=None, na_values=None, keep_default_na=True, na_filter=True, verbose=False, parse_dates=False, date_parser=None, thousands=None, comment=None, skipfooter=0, convert_float=None, mangle_dupe_cols=True, storage_options=None)`

In [124]:
# Filepath
fp = r"\\szh.loc\ssz\applikationen\OGD\Daten\Quelldaten\SSZ\Politik\abstimmungen\__Modules_Abstimmungen_Export_AbstimmungenExport.xls"

# Read the data
imp_abstimmungsresultate = pd.read_excel(
    io = fp, 
    parse_dates=True,
    dtype={'Abstimmungs_Text': str}
    )



In [125]:
imp_abstimmungsresultate.info()


<class 'pandas.core.frame.DataFrame'>
RangeIndex: 9708 entries, 0 to 9707
Data columns (total 16 columns):
 #   Column                 Non-Null Count  Dtype         
---  ------                 --------------  -----         
 0   Abstimmungs_Datum      9708 non-null   datetime64[ns]
 1   Nr_Politische_Ebene    9708 non-null   int64         
 2   Name_Politische_Ebene  9708 non-null   object        
 3   Abstimmungs_Text       9708 non-null   object        
 4   Nr_Resultat_Gebiet     9708 non-null   int64         
 5   Name_Resultat_Gebiet   9708 non-null   object        
 6   Nr_Wahlkreis_StZH      5140 non-null   float64       
 7   Name_Wahlkreis_StZH    5140 non-null   object        
 8   Stimmberechtigt        6573 non-null   float64       
 9   Ja                     9708 non-null   int64         
 10  Nein                   9708 non-null   int64         
 11  Stimmbeteiligung (%)   9708 non-null   float64       
 12  Ja (%)                 9708 non-null   float64       
 13  Nei

In [127]:
#test = imp_abstimmungsresultate.query("Abstimmungs_Datum == '2011-11-27'")
#test.head(20)

## Gibt es beim Import Probleme?
Damit sauber exportiert werden kann, müssen die Daten auch sauber eingelesen werden. Wie können wir das aber testen?

Was sind die unique values per feature

In [128]:
imp_abstimmungsresultate.apply(lambda x: x.unique().size, axis=0)

Abstimmungs_Datum         415
Nr_Politische_Ebene         3
Name_Politische_Ebene       3
Abstimmungs_Text         2497
Nr_Resultat_Gebiet          3
Name_Resultat_Gebiet        3
Nr_Wahlkreis_StZH          17
Name_Wahlkreis_StZH        17
Stimmberechtigt          1168
Ja                       8551
Nein                     8183
Stimmbeteiligung (%)     1575
Ja (%)                    851
Nein (%)                  851
StaendeJa                  94
StaendeNein                89
dtype: int64

## Speichere die neuen Resultate in ein OGD-konformes CSV-File

OGD-konform bedeutet:
- **Datenformat**: `CSV`, 
- **Encoding**: in `UTF8`, 
- **Strings**: Zwischen Anführungszeichen `""` 
- **Separator**: ` , `

Link zu `to_csv()` in Pandas: https://pandas.pydata.org/docs/reference/api/pandas.DataFrame.to_csv.html

DataFrame.to_csv(path_or_buf=None, sep=',', na_rep='', float_format=None, columns=None, header=True, index=True, index_label=None, mode='w', encoding=None, compression='infer', quoting=None, quotechar='"', line_terminator=None, chunksize=None, date_format=None, doublequote=True, escapechar=None, decimal='.', errors='strict', storage_options=None)

In [129]:
export_path=r"\\szh.loc\ssz\applikationen\OGD\Daten\Quelldaten\SSZ\Politik\abstimmungen\abstimmungen_seit1933.csv"

imp_abstimmungsresultate.to_csv(
    export_path,
    encoding="UTF-8-sig",
    quotechar='"',
    quoting=2,
    index=False,
    date_format='%Y-%m-%d'
)
print('done')

# encoding="UTF-8",
#date_format='%Y-%m-%dT%H:%M:%SZ'


done


## Testing

Teste den import der eben exportierten Daten. Klappt alles wie gewollt?

In [139]:
# Read the data
checkNewCsv = pd.read_csv(
    export_path, 
    parse_dates=True,
    )

In [140]:
#checkNewCsv.info(2)


In [141]:
from pivottablejs import pivot_ui

pivot_ui(checkNewCsv)

In [150]:

checkNewCsv.query("Abstimmungs_Datum == '2011-11-27' & Nr_Politische_Ebene==2")

Unnamed: 0,Abstimmungs_Datum,Nr_Politische_Ebene,Name_Politische_Ebene,Abstimmungs_Text,Nr_Resultat_Gebiet,Name_Resultat_Gebiet,Nr_Wahlkreis_StZH,Name_Wahlkreis_StZH,Stimmberechtigt,Ja,Nein,Stimmbeteiligung (%),Ja (%),Nein (%),StaendeJa,StaendeNein
2968,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,2,Kanton Zürich,,,859238.0,150750,214995,44.14,41.2,58.8,,
2969,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,3,Stadt Zürich,,,219343.0,35801,51720,42.07,40.9,59.1,,
2970,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,3,Stadt Zürich,2.0,Kreis 1+2,22073.0,3497,5515,43.09,38.8,61.2,,
2971,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,3,Stadt Zürich,3.0,Kreis 3,26562.0,4340,5642,39.87,43.5,56.5,,
2972,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,3,Stadt Zürich,4.0,Kreis 4+5,21208.0,3155,3988,36.05,44.2,55.8,,
2973,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,3,Stadt Zürich,5.0,Kreis 6,18228.0,3549,4852,48.97,42.2,57.8,,
2974,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,3,Stadt Zürich,6.0,Kreis 7+8,30578.0,5303,9509,51.01,35.8,64.2,,
2975,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,3,Stadt Zürich,7.0,Kreis 9,28240.0,4018,6187,38.08,39.4,60.6,,
2976,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,3,Stadt Zürich,8.0,Kreis 10,23145.0,4458,6124,48.02,42.1,57.9,,
2977,2011-11-27,2,Kanton Zürich,A. Gesetz über den Flughafen Zürich (Flughafen...,3,Stadt Zürich,9.0,Kreis 11,34832.0,5280,7503,38.32,41.3,58.7,,
