## Open Government Data, provided by **Statistisches Amt des Kantons Basel-Stadt - Fachstelle OGD**
*Autogenerated Python starter code for data set with identifier* **100186**

## Dataset
# **Grosser Rat: Live-Abstimmungsergebnisse**

## Data set links

[Direct data shop link for dataset](https://data.bs.ch/explore/dataset/100186)

## Metadata
- **Dataset_identifier** `100186`
- **Title** `Grosser Rat: Live-Abstimmungsergebnisse`
- **Description** `<p>Dieser Datensatz zeigt die Resultate der Abstimmungen des Grossen Rates Basel-Stadt, einzeln für jedes Ratsmitglied und jede Abstimmung. An Sitzungstagen werden die Daten in Echtzeit aktualisiert. </p><p>Abstimmungen an Sitzungen, welche während der Coronavirus-Ausnahmesituation 2020/2021 im Kongresscenter Basel abgehalten wurden, sind nun auch in diesem Datensatz vorhanden. </p><p>Die Daten können auch als Website und PDF Datei hier eingesehen werden: </p><ul><li>Aktuelle Sitzung: <a href='https://grosserrat.bs.ch/ratsbetrieb/tagesordnung/abstimmungsergebnisse' target='_blank'>https://grosserrat.bs.ch/ratsbetrieb/tagesordnung/abstimmungsergebnisse</a><a href='http://abstimmungen.grosserrat-basel.ch/index_aktuell.php' target='_blank'></a></li><li>Vergangene Sitzungen (Archiv): <a href='http://abstimmungen.grosserrat-basel.ch/index_archiv.php' target='_blank'>http://abstimmungen.grosserrat-basel.ch/index_archiv.php</a><a href='http://abstimmungen.grosserrat-basel.ch/index_archiv.php' target='_blank'></a></li></ul><p>Bitte beachten Sie, dass für das offizielle Abstimmungsergebnis das jeweilige Sitzungsprotokoll des Grossen Rates massgeblich ist (elektronische Fassung: <a href='https://ratsprotokolle.grosserrat.bs.ch/shareparl/' target='_blank'>https://ratsprotokolle.grosserrat.bs.ch/shareparl/</a>)</p><p>Änderungsprotokoll:<br>5. April 2024: Der Parlamentsdienst nutzt seit dem September 2023 ein neues Abstimmungssystem. Dies führt zu einigen Änderungen bei den Daten, die geliefert werden. Die Daten konnten mit folgenden Spalten ergänzt werden: Signatur Geschäft, Signatur Dokument, Erweiterte Abstimmungsnummer, Anrede der abstimmenden Person und Funktion der abstimmenden Person. Des Weiteren haben sich die Abstimmungstypen geändert.<br>Die Abstimmungstypen vor dem September 2023: Abstimmung, Schlussabstimmung, Antrag, offene Wahl, Rückweisung, Eventualabstimmung, Eintreten, Ordnungsantrag, ungültig<br>Die Abstimmungstypen nach dem September 2023: Anwesenheit, Ad Hoc einfaches Mehr, Ad Hoc 2/3 Mehr, Eventual Abstimmung, Schlussabstimmung, Quorum erfassen</p>`
- **Contact_name** `Fachstelle für OGD Basel-Stadt`
- **Issued** `2022-11-09`
- **Modified** `2024-11-08T13:02:00+00:00`
- **Rights** `NonCommercialAllowed-CommercialAllowed-ReferenceRequired`
- **Temporal_coverage_start_date** `2012-06-06T07:04:41+00:00`
- **Temporal_coverage_end_date** `None`
- **Themes** `['Politik', 'Gesetzgebung', 'Verwaltung']`
- **Keywords** `['Abstimmung', 'Demokratie']`
- **Publisher** `Parlamentsdienst des Grossen Rates`
- **Reference** `https://grosserrat.bs.ch/parlament/parlamentsdienst`


## Imports and helper functions

In [None]:
%matplotlib inline
import matplotlib.pyplot as plt
plt.style.use('ggplot')

params = {
    'text.color': (0.25, 0.25, 0.25),
    'figure.figsize': [18, 6],
   }

plt.rcParams.update(params)

import pandas as pd
import requests
import os

In [None]:
# helper function for reading datasets with proper separator
def get_dataset(url):
    r = requests.get(url, params={'format': 'csv', 'timezone': 'Europe%2FZurich'})
    data_path = os.path.join(os.getcwd(), '..', 'data')
    if not os.path.exists(data_path):
      os.makedirs(data_path)
    csv_path = os.path.join(data_path, '100186.csv')
    with open(csv_path, 'wb') as f:
        f.write(r.content)
    data = pd.read_csv(url, sep=';', on_bad_lines='warn', encoding_errors='ignore', low_memory=False)
    # if dataframe only has one column or less the data is not ";" separated
    if data.shape[1] <= 1:
        print("The data wasn't imported properly. Very likely the correct separator couldn't be found.\nPlease check the dataset manually and adjust the code.")
    return data

## Load data

The dataset is read into a dataframe

In [None]:
df = get_dataset('https://data.bs.ch/explore/dataset/100186/download')

## Analyze data

In [None]:
# drop columns that have no values
df.dropna(how='all', axis=1, inplace=True)

In [None]:
print(f'The dataset has {df.shape[0]:,.0f} rows (observations) and {df.shape[1]:,.0f} columns (variables).')
print(f'There seem to be {df.duplicated().sum()} exact duplicates in the data.')

In [None]:
df.info(memory_usage='deep', verbose=True)

In [None]:
df.head()

In [None]:
# display a small random sample transposed in order to see all variables
df.sample(3).T

In [None]:
# describe non-numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(exclude='number'))
except:
    print("No categorical data in dataset.")

In [None]:
# describe numerical features
try:
    with pd.option_context('display.float_format', '{:,.2f}'.format):
        display(df.describe(include='number'))
except:
    print("No numercial data in dataset.")

In [None]:
# check missing values with missingno
# https://github.com/ResidentMario/missingno
import missingno as msno
msno.matrix(df, labels=True, sort='descending');

In [None]:
# plot a histogram for each numerical feature
try:
    df.hist(bins=25, rwidth=.9)
    plt.tight_layout()
    plt.show()
except:
    print("No numercial data to plot.") 

In [None]:
# continue your code here...

**Questions about the data?** Fachstelle für OGD Basel-Stadt | opendata@bs.ch