# Datenjournalismus in Python - 
# Eine praktische Einführung in die Programmierung


### Natalie Widmann




Wintersemester 2022 / 2023


Universität Leipzig





## Organisation

![Timeline](../imgs/kursplan.png)

## Projekt

# Teil III - APIs




## Was ist eine API?

Eine API (Application Programming Interface) ist eine Schnittstelle, die es Software-Programmen ermöglicht, miteinander zu kommunizieren und Daten auszutauschen. Sie stellt eine spezifizierte Menge von Funktionen und Protokollen bereit, die von anderen Programmen genutzt werden können, um zum Beispiel auf bestimmte Daten zuzugreifen oder bestimmte Funktionen auszuführen.

Ein einfaches Beispiel für die Nutzung einer API ist die Integration von Wetterdaten in eine App. Die App nutzt dabei die Funktionen und Protokolle der Wetter-API, um aktuelle Wetterdaten von einer Wetter-Website abzurufen und in der App anzuzeigen.


![API](../imgs/API.png)

### Unser erster API Request in Python

Wir testen die [Open Notify API](http://open-notify.org/) die anzeigt wie viele Menschen gerade im All sind.



Dafür benutzen wir das `requests` python package.

Dokumentation: https://requests.readthedocs.io/en/latest/

In [None]:
!pip install requests

In [None]:
import requests

Um Daten einer API abzufragen verwendet man einen sogenannten `GET` request.
Dafür hat das `request` package die Funktion `requests.get()`.
Diese nimmt als Argument die url entgegen.



In [None]:
url = 'http://api.open-notify.org/astros.json'
response = requests.get(url)

In [None]:
response

In [None]:
dir(response)

### Status Codes

Die Antwort eines request, enthält einen response Code der sagt ob die Anfrage erfolgreich war.

Der Status Code wird über `.status_code` abgerufen.

In [None]:
response.status_code

### Die häufigsten HTTP-API-Statuscodes


- **200 OK**: Der Server hat die Anfrage erfolgreich verarbeitet und die gewünschte Ressource zurückgegeben.


- **301 Moved Permanently**: Die angeforderte Ressource wurde permanent an eine andere URL umgeleitet.


- **400 Bad Request**: Die Anfrage konnte aufgrund eines Syntaxfehlers oder ungültiger Anfrageparameter nicht verarbeitet werden.


- **401 Unauthorized**: Der Server konnte die Anfrage nicht authentifizieren und fordert daher eine gültige Anmeldung.


- **403 Access Forbidden**: Die Zugansdaten sind für die Abfrage nicht ausreichend.


- **404 Not Found**: Die angeforderte Ressource wurde vom Server nicht gefunden.


- **500 Internal Server Error**: Der Server hat einen internen Fehler und kann die Anfrage nicht verarbeiten.



### API Data

Die Daten der API können über `.json()` abgerufen werden.

In [None]:
data = response.json()

In [None]:
data

In [None]:
type(data)

#### Welche Daten sind verfügbar?

Zeige alle Keys im Dictionary an.

Zeige die Anzahl an Menschen an, die gerade im All ist

Drucke die Namen aller Menschen im All aus

## Abgeordnetenwatch

**Das Ziel**

Unsere Vision ist eine selbstbestimmte Gesellschaft. Diese befördern wir durch mehr Beteiligungsmöglichkeiten und Transparenz in der Politik.

**Was wir wollen:**
- eine öffentliche Form des Austausches zwischen Bürger:innen und der Politik bieten
- höheren Rechenschaftsdruck der Politiker gegenüber den Wähler:innen herbeiführen
- Parlamente und Abgeordnete stärker in den Fokus der Öffentlichkeit rücken
- umfangreichere und vollständigere Berichterstattung über Politik ermöglichen
- Medienberichte leichter hinterfragbar machen
- einfachen und direkten Zugang zu politischen Informationen, mehr Transparenz
- eine dauerhafte Beteiligungsmöglichkeit für Wähler:innen schaffen


**API Dokumentation**

https://www.abgeordnetenwatch.de/api

In [None]:
import requests
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians'
response = requests.get(url)

### Die API Antwort verstehen und deuten

In [None]:
response.status_code

In [None]:
result = response.json()

In [None]:
result

In [None]:
type(result)

In [None]:
result.keys()

In [None]:
result['meta']

In [None]:
result['data']

In [None]:
type(result['data'])

In [None]:
len(result['data'])

In [None]:
result['data'][0]

### Relevante Daten extrahieren

In [None]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians'
response = requests.get(url)
data = response.json()['data']

In [None]:
data

In [None]:
len(data)

### Parameter anpassen

Anzahl der Ergebnisse erhöhen

In [None]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?&range_end=1000'
response = requests.get(url)
data = response.json()['data']

In [None]:
data

In [None]:
len(data)

### Request Funktion verallgemeinern

In [None]:
def request_data(url):
    response = requests.get(url)
    return response.json()['data']

In [None]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?&range_end=1000'
data = request_data(url)

In [None]:
data

In [None]:
def request_data(url, limit=1000):
    limit = f'&range_end={limit}'
    response = requests.get(url + limit)
    return response.json()['data']

In [None]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
data = request_data(url, limit=30)

In [None]:
len(data)

### Daten zu einzelnen Politikern abfragen


https://www.abgeordnetenwatch.de/api/entitaeten/politician

In [None]:
politiker_id = '79334'
url = f'https://www.abgeordnetenwatch.de/api/v2/politicians/{politiker_id}?'
data = request_data(url)

In [None]:
data

### In der Query filtern

In [None]:
# Nach Vornamen filtern
base_url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
query_filter = "first_name=Gregor"
url = base_url + query_filter
data = request_data(url)

In [None]:
data

In [None]:
# Nach Geburtsjahr kleiner gleich X
base_url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
query_filter = "year_of_birth[lte]=1932"
url = base_url + query_filter
data = request_data(url)

In [None]:
data

In [None]:
# Mehrere Filter mit & verknüpfen
base_url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
query_filter = "residence=Leipzig&first_name=Klaus"
url = base_url + query_filter
data = request_data(url)

In [None]:
data

In [None]:
# Filtern auf Basis einer anderen Entität
base_url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
query_filter = "party[entity.label]=CDU"
url = base_url + query_filter
data = request_data(url)

In [None]:
data

### Aktuelle Abstimmungen im Bundestag

https://www.abgeordnetenwatch.de/api/entitaeten/poll

In [None]:
poll_id = 4876
url = f'https://www.abgeordnetenwatch.de/api/v2/polls/{poll_id}?'
data = request_data(url)

In [None]:
data

In [None]:
# Alle Abstimmungen der Abgeordneten
poll_id = '4876'
url = f'https://www.abgeordnetenwatch.de/api/v2/votes?poll={poll_id}'
data = request_data(url)

In [None]:
data

In [None]:
len(data)

### Daten in DataFrame umwandeln und bearbeiten

In [None]:
import pandas as pd
df = pd.DataFrame(data)

In [None]:
df

In [None]:
def extract_name(label):
    return label.split('-')[0].strip()

In [None]:
df['name'] = df['label'].apply(extract_name)

In [None]:
def extract_fraction(fraction_dict):
    label = fraction_dict['label']
    return label.split('(')[0].strip()

In [None]:
extract_fraction(data[0]['fraction'])

In [None]:
df['fraction'] = df['fraction'].apply(extract_fraction)

In [None]:
df

### Abstimmungsverhalten nach Partei

In [None]:
df = df[['name', 'fraction', 'vote', 'reason_no_show',]]

In [None]:
df.groupby('fraction')['vote'].value_counts()

### Daten speichern

In [None]:
df.to_csv('abstimmung.csv')

# Zeit für Feedback



Link: https://ahaslides.com/JQFRG

![Feedback QR Code](../imgs/qrcode_vl8.png)

