# Teil 12: Internetzugriff mit dem `requests`-Paket
Um innerhalb eines Python-Programms in Echtzeit auf Daten aus dem Internet zuzugreifen, ist das `requests`-Paket eine beliebte und einfache Lösung. Für uns ist es außerdem die erste **externe Bibliothek**, die wir zunächst über einen Paket-Manager installieren müssen. 

## 12.1 Bibliotheken installieren

Ein **Paket** oder eine **Bibliothek** ist eine Sammlung von Code, den andere Programmierer:innen entwickelt haben, um die Standard-Funktionalität von Python zu erweitern. Viele dieser Pakete können wir in unseren eigenen Projekten einsetzen, indem wir sie in unser Projekt importieren. Weil der importierte Code seinerseits von anderen Bibliotheken abhängen kann, benutzen wir **Paket-Manager**, um automatisch alle Abhängigkeiten zu installieren.


In [None]:
# Installation im Anaconda Navigator über GUI



In [None]:
# Installation mit pip
! pip install requests


Nachdem ein Paket installiert wurde, kann es mit dem `import`-Befehl in ein Python-Programm eingebunden werden

In [None]:
import requests

## 12.2 Webinhalte mit HTTP GET herunterladen

Jedes Mal, wenn wir eine Webseite im Internet "aufrufen", passiert eigentlich Folgendes:
1. Die **URL** bzw. der Link wird in eine **IP-Adresse** umgewandelt (mithilfe des [Domain Name System](https://de.wikipedia.org/wiki/Domain_Name_System)).
2. Über die IP-Adresse wird ein bestimmter Computer erreicht, auf dem die angeforderten Ressourcen als Dateien liegen - diesen Computer bezeichnet man als **Server**.
3. Unser Browser (z.B. Firefox oder Chrome) sendet an diesen Server die **Aufforderung** (*request*), uns die gewünschte Webseite zu schicken. Wie diese Aufforderung genau auszusehen hat, bestimmt das **Protokoll zur Übertragung von Hyper Text** ([HTTP](https://de.wikipedia.org/wiki/Hypertext_Transfer_Protocol)).
4. Wenn alles gut läuft, schickt der Server eine **Antwort** (*response*), die die Webseite enthält - in der Regel als HTML-Datei ([Hyper Text Markup Language](https://de.wikipedia.org/wiki/Hypertext_Markup_Language)).
6. Unser Browser speichert die HTML-Datei temporär auf unserem Computer ab und stellt sie in einem lesbaren Format dar.

Das `requests`-Paket macht etwas ganz ähnliches: Es schickt eine **Aufforderung** an einen Server und gibt uns in unserem Programm Zugriff auf die gesendete **Antwort**. Die einfachste Möglichkeit, das zu tun, ist die `requests.get(URL)` Funktion:

In [None]:
import requests

# Die Antwort des Servers wird in der Variable "response" gespeichert
response = requests.get("https://www.gutenberg.org/cache/epub/22367/pg22367.txt")

# Mit .text können wir auf den Inhalt der Antwort als String zugreifen
print(response.text)

### 🧪Experiment: Webseiten
Das obige Beispiel hat gut funktioniert, weil wir eine .txt-Datei heruntergeladen haben, die im Browser genau so aussieht wie in unserem Python-Skript. Was passiert, wenn du eine normale Webseite herunterlädst?

In [None]:
import requests

# Gebe hier als String-Parameter einen Link zu einer Webseite ein, die du oft besuchst
response = requests.get()

print(response.text)

## 12.3 Mit APIs auf strukturierte Daten zugreifen

Oft ist es mühsam, eine HTML-Datei nach den relevanten Daten zu durchsuchen, die im eigenen Programm benötigt werden. Deshalb stellen einige Anbieter sogenannte **Programmierschnittstellen** (*application programming interface*, kurz *API*) zur Verfügung, die uns einen handlichen Zugriff auf vorstrukturierte Daten gewähren.

Auf viele Internet-APIs kann man genau so einfach zugreifen, wie auf eine normale Webseite:

In [None]:
import requests

res = requests.get("https://www.openthesaurus.de/synonyme/search?q=test&format=application/json")

print(res.text)

Als Antwortformat benutzen viele APIs das bereits bekannte **JSON**-Format. Deshalb ist im `requests`-Paket direkt eine Funktion integriert, mit der sich Antworten in diesem Format ganz leicht in Python-Objekte umwandeln lassen:

In [None]:
res.json()

### 🛠️Übung: API-Antwort parsen
Schreibe ein Programm, das die API-Antwort `res.json()` mit Schleifen durchgeht und die verschiedenen Synonyme für "Test" übersichtlich ausgibt.

In [None]:
# Platz für die Aufgabe





## 12.4 URL-Parameter

Viele APIs bieten Möglichkeiten, als Teil der Anfrage verschiedene Optionen zu konfigurieren. Die gerade verwendete Synonym-API erlaubt es uns zum Beispiel, nach einem bestimmten Begriff zu suchen und das Antwort-Format zu spezifizieren. Dabei kommen **URL-Parameter** zum Einsatz: Schlüssel-Wert-Paare, die nach einem `?` direkt in die URL geschrieben werden. 

In der URL

https://www.openthesaurus.de/synonyme/search?q=test&format=application/json

sind die Parameter `q = test` und `format = application/json` enthalten.

Diese Parameter erinnern an **Dictionaries** in Python, da sie auch aus Schlüsseln und Werten bestehen. Das `requests`-Paket lässt uns deshalb "intuitiv" URL-Parameter als Python-Dictionary angeben:

In [None]:
import requests

# Der 'q'-Parameter ist der Begriff, für den Synonyme gesucht werden
parameters = {
    "q": "test",
    "format": "application/json"
}

synonyms = requests.get("https://www.openthesaurus.de/synonyme/search", parameters)
print(synonyms.json())

### 🛠️Übung: Synonymsuche
Schreibe ein Programm, das die User zunächst nach einem Suchbegriff fragt und dann die Synonym-API verwendet, um ihnen eine Liste mit Synonymen zu präsentieren.

In [None]:
# Platz für die Aufgabe


