# Datenjournalismus in Python - 
# Eine praktische Einführung in die Programmierung


### Natalie Widmann




Wintersemester 2022 / 2023


Universität Leipzig





## Organisation

![Timeline](../imgs/kursplan.png)

## Projekt

# Teil III - APIs




## Was ist eine API?

Eine API (Application Programming Interface) ist eine Schnittstelle, die es Software-Programmen ermöglicht, miteinander zu kommunizieren und Daten auszutauschen. Sie stellt eine spezifizierte Menge von Funktionen und Protokollen bereit, die von anderen Programmen genutzt werden können, um zum Beispiel auf bestimmte Daten zuzugreifen oder bestimmte Funktionen auszuführen.

Ein einfaches Beispiel für die Nutzung einer API ist die Integration von Wetterdaten in eine App. Die App nutzt dabei die Funktionen und Protokolle der Wetter-API, um aktuelle Wetterdaten von einer Wetter-Website abzurufen und in der App anzuzeigen.


![API](../imgs/API.png)

### Unser erster API Request in Python

Wir testen die [Open Notify API](http://open-notify.org/) die anzeigt wie viele Menschen gerade im All sind.



Dafür benutzen wir das `requests` python package.

Dokumentation: https://requests.readthedocs.io/en/latest/

In [1]:
!pip install requests

Defaulting to user installation because normal site-packages is not writeable


In [2]:
import requests

Um Daten einer API abzufragen verwendet man einen sogenannten `GET` request.
Dafür hat das `request` package die Funktion `requests.get()`.
Diese nimmt als Argument die url entgegen.



In [13]:
url = 'http://api.open-notify.org/astros.json'
response = requests.get(url)

In [14]:
response

<Response [200]>

In [8]:
dir(response)

['__attrs__',
 '__bool__',
 '__class__',
 '__delattr__',
 '__dict__',
 '__dir__',
 '__doc__',
 '__enter__',
 '__eq__',
 '__exit__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getstate__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__lt__',
 '__module__',
 '__ne__',
 '__new__',
 '__nonzero__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__setattr__',
 '__setstate__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 '__weakref__',
 '_content',
 '_content_consumed',
 '_next',
 'apparent_encoding',
 'close',
 'connection',
 'content',
 'cookies',
 'elapsed',
 'encoding',
 'headers',
 'history',
 'is_permanent_redirect',
 'is_redirect',
 'iter_content',
 'iter_lines',
 'json',
 'links',
 'next',
 'ok',
 'raise_for_status',
 'raw',
 'reason',
 'request',
 'status_code',
 'text',
 'url']

### Status Codes

Die Antwort eines request, enthält einen response Code der sagt ob die Anfrage erfolgreich war.

Der Status Code wird über `.status_code` abgerufen.

In [10]:
response.status_code

200

### Die häufigsten HTTP-API-Statuscodes


- **200 OK**: Der Server hat die Anfrage erfolgreich verarbeitet und die gewünschte Ressource zurückgegeben.


- **301 Moved Permanently**: Die angeforderte Ressource wurde permanent an eine andere URL umgeleitet.


- **400 Bad Request**: Die Anfrage konnte aufgrund eines Syntaxfehlers oder ungültiger Anfrageparameter nicht verarbeitet werden.


- **401 Unauthorized**: Der Server konnte die Anfrage nicht authentifizieren und fordert daher eine gültige Anmeldung.


- **403 Access Forbidden**: Die Zugansdaten sind für die Abfrage nicht ausreichend.


- **404 Not Found**: Die angeforderte Ressource wurde vom Server nicht gefunden.


- **500 Internal Server Error**: Der Server hat einen internen Fehler und kann die Anfrage nicht verarbeiten.



### API Data

Die Daten der API können über `.json()` abgerufen werden.

In [19]:
data = response.json()

In [20]:
data

{'message': 'success',
 'people': [{'name': 'Sergey Prokopyev', 'craft': 'ISS'},
  {'name': 'Dmitry Petelin', 'craft': 'ISS'},
  {'name': 'Frank Rubio', 'craft': 'ISS'},
  {'name': 'Nicole Mann', 'craft': 'ISS'},
  {'name': 'Josh Cassada', 'craft': 'ISS'},
  {'name': 'Koichi Wakata', 'craft': 'ISS'},
  {'name': 'Anna Kikina', 'craft': 'ISS'},
  {'name': 'Fei Junlong', 'craft': 'Shenzhou 15'},
  {'name': 'Deng Qingming', 'craft': 'Shenzhou 15'},
  {'name': 'Zhang Lu', 'craft': 'Shenzhou 15'}],
 'number': 10}

In [21]:
type(data)

dict

#### Welche Daten sind verfügbar?

Zeige alle Keys im Dictionary an.

In [22]:
data.keys()

dict_keys(['message', 'people', 'number'])

Zeige die Anzahl an Menschen an, die gerade im All ist

In [23]:
len(data['people'])

10

In [24]:
data['number']

10

Drucke die Namen aller Menschen im All aus

In [36]:
for astronaut in data['people']:
    print(astronaut['name'])

Sergey Prokopyev
Dmitry Petelin
Frank Rubio
Nicole Mann
Josh Cassada
Koichi Wakata
Anna Kikina
Fei Junlong
Deng Qingming
Zhang Lu


## Abgeordnetenwatch

**Das Ziel**

Unsere Vision ist eine selbstbestimmte Gesellschaft. Diese befördern wir durch mehr Beteiligungsmöglichkeiten und Transparenz in der Politik.

**Was wir wollen:**
- eine öffentliche Form des Austausches zwischen Bürger:innen und der Politik bieten
- höheren Rechenschaftsdruck der Politiker gegenüber den Wähler:innen herbeiführen
- Parlamente und Abgeordnete stärker in den Fokus der Öffentlichkeit rücken
- umfangreichere und vollständigere Berichterstattung über Politik ermöglichen
- Medienberichte leichter hinterfragbar machen
- einfachen und direkten Zugang zu politischen Informationen, mehr Transparenz
- eine dauerhafte Beteiligungsmöglichkeit für Wähler:innen schaffen


**API Dokumentation**

https://www.abgeordnetenwatch.de/api

In [37]:
import requests
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians'
response = requests.get(url)

### Die API Antwort verstehen und deuten

In [38]:
response.status_code

200

In [39]:
result = response.json()

In [40]:
result

{'meta': {'abgeordnetenwatch_api': {'version': '2.3',
   'changelog': 'https://www.abgeordnetenwatch.de/api/version-changelog/aktuell',
   'licence': 'CC0 1.0',
   'licence_link': 'https://creativecommons.org/publicdomain/zero/1.0/deed.de',
   'documentation': 'https://www.abgeordnetenwatch.de/api/entitaeten/politician'},
  'status': 'ok',
  'status_message': '',
  'result': {'count': 100,
   'total': 30975,
   'range_start': 0,
   'range_end': 100}},
 'data': [{'id': 179602,
   'entity_type': 'politician',
   'label': 'Christian Wendel',
   'api_url': 'https://www.abgeordnetenwatch.de/api/v2/politicians/179602',
   'abgeordnetenwatch_url': 'https://www.abgeordnetenwatch.de/profile/christian-wendel',
   'first_name': 'Christian',
   'last_name': 'Wendel',
   'birth_name': None,
   'sex': 'm',
   'year_of_birth': None,
   'party': {'id': 2,
    'entity_type': 'party',
    'label': 'CDU',
    'api_url': 'https://www.abgeordnetenwatch.de/api/v2/parties/2'},
   'party_past': None,
   'educ

In [41]:
type(result)

dict

In [42]:
result.keys()

dict_keys(['meta', 'data'])

In [43]:
result['meta']

{'abgeordnetenwatch_api': {'version': '2.3',
  'changelog': 'https://www.abgeordnetenwatch.de/api/version-changelog/aktuell',
  'licence': 'CC0 1.0',
  'licence_link': 'https://creativecommons.org/publicdomain/zero/1.0/deed.de',
  'documentation': 'https://www.abgeordnetenwatch.de/api/entitaeten/politician'},
 'status': 'ok',
 'status_message': '',
 'result': {'count': 100, 'total': 30975, 'range_start': 0, 'range_end': 100}}

In [44]:
result['data']

[{'id': 179602,
  'entity_type': 'politician',
  'label': 'Christian Wendel',
  'api_url': 'https://www.abgeordnetenwatch.de/api/v2/politicians/179602',
  'abgeordnetenwatch_url': 'https://www.abgeordnetenwatch.de/profile/christian-wendel',
  'first_name': 'Christian',
  'last_name': 'Wendel',
  'birth_name': None,
  'sex': 'm',
  'year_of_birth': None,
  'party': {'id': 2,
   'entity_type': 'party',
   'label': 'CDU',
   'api_url': 'https://www.abgeordnetenwatch.de/api/v2/parties/2'},
  'party_past': None,
  'education': None,
  'residence': None,
  'occupation': None,
  'statistic_questions': None,
  'statistic_questions_answered': None,
  'qid_wikidata': None,
  'field_title': None},
 {'id': 179601,
  'entity_type': 'politician',
  'label': 'Lena Kotré',
  'api_url': 'https://www.abgeordnetenwatch.de/api/v2/politicians/179601',
  'abgeordnetenwatch_url': 'https://www.abgeordnetenwatch.de/profile/lena-kotre',
  'first_name': 'Lena',
  'last_name': 'Kotré',
  'birth_name': None,
  'se

In [45]:
type(result['data'])

list

In [46]:
len(result['data'])

100

In [56]:
result['data'][20]['party']['label']

'PIRATEN'

Gib den Beruf aller Politiker:innen aus

In [58]:
for i in result['data']:
    print(i['party']['label'])
    if i['occupation'] != None:
        print(i['occupation'])
    print('--\n')

CDU
--

AfD
Rechtsanwältin
--

AfD
MdL
--

AfD
MdL
--

AfD
MdL
--

SPD
Energieanlagenelektroniker, Hausmann, Ortsvorsteher
--

Die Friesen
Zusteller bei der Deutschen Post AG
--

Bündnis 90/Die Grünen
Marina-Fachkraft 
--

Einzelbewerbung
Kaufmann für Spedition und Logistikdienstleistung
--

Die PARTEI
Entwicklungsingenieur 
--

Solidarität, Gerechtigkeit, Veränderung
Produktionsleiter
--

dieBasis
Rentner
--

Einzelbewerbung
Rentner 
--

ZENTRUM
Berufsschullehrer 
--

dieBasis
Pensionär
--

Einzelbewerbung
Angestellter 
--

FREIE WÄHLER
--

FDP
Landwirt 
--

Einzelbewerbung
Bauleiter, Tätowierer
--

dieBasis
Dipl. Soziologin
--

PIRATEN
Rettungssanitäter
--

dieBasis
Künstlerin
--

dieBasis
--

dieBasis
--

Einzelbewerbung
Gleichstellungsbeauftragte
--

AfD
--

AfD
--

AfD
--

AfD
--

AfD
--

AfD
--

AfD
Hufschmied
--

AfD
--

AfD
--

AfD
--

AfD
--

AfD
--

AfD
--

AfD
--

CDU
stellvertretende Schulleiterin
--

CDU
--

FDP
--

SPD
Oberstudienrat, Schriftführender Abgeordneter, Kultur

### Relevante Daten extrahieren

In [None]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians'
response = requests.get(url)
data = response.json()['data']

In [None]:
data

In [None]:
len(data)

### Parameter anpassen

Anzahl der Ergebnisse erhöhen

In [68]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?&range_end=1000'
response = requests.get(url)
data = response.json()['data']

In [66]:
data

[{'id': 179602,
  'entity_type': 'politician',
  'label': 'Christian Wendel',
  'api_url': 'https://www.abgeordnetenwatch.de/api/v2/politicians/179602',
  'abgeordnetenwatch_url': 'https://www.abgeordnetenwatch.de/profile/christian-wendel',
  'first_name': 'Christian',
  'last_name': 'Wendel',
  'birth_name': None,
  'sex': 'm',
  'year_of_birth': None,
  'party': {'id': 2,
   'entity_type': 'party',
   'label': 'CDU',
   'api_url': 'https://www.abgeordnetenwatch.de/api/v2/parties/2'},
  'party_past': None,
  'education': None,
  'residence': None,
  'occupation': None,
  'statistic_questions': None,
  'statistic_questions_answered': None,
  'qid_wikidata': None,
  'field_title': None},
 {'id': 179601,
  'entity_type': 'politician',
  'label': 'Lena Kotré',
  'api_url': 'https://www.abgeordnetenwatch.de/api/v2/politicians/179601',
  'abgeordnetenwatch_url': 'https://www.abgeordnetenwatch.de/profile/lena-kotre',
  'first_name': 'Lena',
  'last_name': 'Kotré',
  'birth_name': None,
  'se

In [67]:
len(data)

100

In [68]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?&range_end=1000'
response = requests.get(url)
data = response.json()['data']

### Request Funktion verallgemeinern

In [70]:
def request_data(url):
    response = requests.get(url)
    return response.json()['data']

In [84]:
def request_data(url, limit):
    limit_str = f'&range_end={limit}'
    response = requests.get(url + limit_str)
    return response.json()['data']

In [82]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
data = request_data(url, 10)

In [83]:
len(data)

10

In [85]:
def request_data(url, limit=1000):
    limit_str = f'&range_end={limit}'
    response = requests.get(url + limit_str)
    return response.json()['data']

In [90]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
data = request_data(url, limit=5)

In [91]:
len(data)

5

### Daten zu einzelnen Politikern abfragen


https://www.abgeordnetenwatch.de/api/entitaeten/politician

In [98]:
url = 'https://www.abgeordnetenwatch.de/api/v2/politicians/130471?'
data = request_data(url)

In [99]:
data

[]

In [102]:
politiker_id = '79236'
url = f'https://www.abgeordnetenwatch.de/api/v2/politicians/{politiker_id}?'
data = request_data(url)

In [103]:
data

{'id': 79236,
 'entity_type': 'politician',
 'label': 'Birgit Kömpel',
 'api_url': 'https://www.abgeordnetenwatch.de/api/v2/politicians/79236',
 'abgeordnetenwatch_url': 'https://www.abgeordnetenwatch.de/profile/birgit-koempel',
 'first_name': 'Birgit',
 'last_name': 'Kömpel',
 'birth_name': 'Schwab',
 'sex': 'f',
 'year_of_birth': 1967,
 'party': {'id': 1,
  'entity_type': 'party',
  'label': 'SPD',
  'api_url': 'https://www.abgeordnetenwatch.de/api/v2/parties/1'},
 'party_past': None,
 'education': 'Personalberaterin',
 'residence': 'Eichenzell (Fulda)',
 'occupation': 'Personalberaterin/Senior Recruiterin',
 'statistic_questions': 3,
 'statistic_questions_answered': 3,
 'qid_wikidata': 'Q15792744',
 'field_title': None}

### In der Query filtern

In [114]:
# Nach Vornamen filtern
base_url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
query_filter = "last_name[cn]=üll"
url = base_url + query_filter
data = request_data(url)

In [None]:
# Nach Geburtsjahr kleiner gleich X
base_url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
query_filter = "year_of_birth[lte]=1932"
url = base_url + query_filter
data = request_data(url)

In [None]:
data

In [118]:
# Mehrere Filter mit & verknüpfen
base_url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
query_filter = "residence=Leipzig&first_name=Klaus"
url = base_url + query_filter
data = request_data(url)

In [119]:
data

[{'id': 118911,
  'entity_type': 'politician',
  'label': 'Klaus Fuchs',
  'api_url': 'https://www.abgeordnetenwatch.de/api/v2/politicians/118911',
  'abgeordnetenwatch_url': 'https://www.abgeordnetenwatch.de/profile/klaus-fuchs',
  'first_name': 'Klaus',
  'last_name': 'Fuchs',
  'birth_name': None,
  'sex': 'm',
  'year_of_birth': 1954,
  'party': {'id': 15,
   'entity_type': 'party',
   'label': 'MLPD',
   'api_url': 'https://www.abgeordnetenwatch.de/api/v2/parties/15'},
  'party_past': None,
  'education': 'Kommunikationselektroniker',
  'residence': 'Leipzig',
  'occupation': 'Kommunikationselektroniker',
  'statistic_questions': None,
  'statistic_questions_answered': None,
  'qid_wikidata': None,
  'field_title': None}]

In [120]:
# Filtern auf Basis einer anderen Entität
base_url = 'https://www.abgeordnetenwatch.de/api/v2/politicians?'
query_filter = "party[entity.label]=CDU"
url = base_url + query_filter
data = request_data(url)

In [121]:
data

[{'id': 179602,
  'entity_type': 'politician',
  'label': 'Christian Wendel',
  'api_url': 'https://www.abgeordnetenwatch.de/api/v2/politicians/179602',
  'abgeordnetenwatch_url': 'https://www.abgeordnetenwatch.de/profile/christian-wendel',
  'first_name': 'Christian',
  'last_name': 'Wendel',
  'birth_name': None,
  'sex': 'm',
  'year_of_birth': None,
  'party': {'id': 2,
   'entity_type': 'party',
   'label': 'CDU',
   'api_url': 'https://www.abgeordnetenwatch.de/api/v2/parties/2'},
  'party_past': None,
  'education': None,
  'residence': None,
  'occupation': None,
  'statistic_questions': None,
  'statistic_questions_answered': None,
  'qid_wikidata': None,
  'field_title': None},
 {'id': 179562,
  'entity_type': 'politician',
  'label': 'Sandra Gockel',
  'api_url': 'https://www.abgeordnetenwatch.de/api/v2/politicians/179562',
  'abgeordnetenwatch_url': 'https://www.abgeordnetenwatch.de/profile/sandra-gockel',
  'first_name': 'Sandra',
  'last_name': 'Gockel',
  'birth_name': No

### Aktuelle Abstimmungen im Bundestag

https://www.abgeordnetenwatch.de/api/entitaeten/poll

In [None]:
poll_id = 4876
url = f'https://www.abgeordnetenwatch.de/api/v2/polls/{poll_id}?'
data = request_data(url)

In [None]:
data

In [None]:
# Alle Abstimmungen der Abgeordneten
poll_id = '4876'
url = f'https://www.abgeordnetenwatch.de/api/v2/votes?poll={poll_id}'
data = request_data(url)

In [None]:
data

In [None]:
len(data)

### Daten in DataFrame umwandeln und bearbeiten

In [None]:
import pandas as pd
df = pd.DataFrame(data)

In [None]:
df

In [None]:
def extract_name(label):
    return label.split('-')[0].strip()

In [None]:
df['name'] = df['label'].apply(extract_name)

In [None]:
def extract_fraction(fraction_dict):
    label = fraction_dict['label']
    return label.split('(')[0].strip()

In [None]:
extract_fraction(data[0]['fraction'])

In [None]:
df['fraction'] = df['fraction'].apply(extract_fraction)

In [None]:
df

### Abstimmungsverhalten nach Partei

In [None]:
df = df[['name', 'fraction', 'vote', 'reason_no_show',]]

In [None]:
df.groupby('fraction')['vote'].value_counts()

### Daten speichern

In [None]:
df.to_csv('abstimmung.csv')

# Zeit für Feedback



Link: https://ahaslides.com/JQFRG

![Feedback QR Code](../imgs/qrcode_vl8.png)

