# APIs Modules - ein erste Blick auf "Requests"

Gezielt und automatisiert Daten im Web auslesen

Zuerst installieren wir pandas und requests. Das können wir von der Command line mit den Befehlen ```pip install requests``` und ```pip install pandas``` die beiden Module installieren. Oder direkt hier in Jupyter Notebook mit ```!pip install requests``` und ```!pip install pandas```.

### Unsere Imports

In [4]:
import requests
import pandas as pd
import calendar, datetime, time
import datetime as dt

Zur Dokumentation von requestst geht es [hier lang](http://docs.python-requests.org/en/master/).

### Notes

In einer ersten Übung arbeiten wir mit [der API des USGS](https://earthquake.usgs.gov/fdsnws/event/1/#methods) arbeiten. Für die meisten API muss man sich heutezutage eine eigene API-Key kreieren. Das werden wir zu einem späteren Zeitpunkt tun. Diese API braucht keine Keys. Deshalb ist es ein gutes Kennenlernbeispiel.

Falls Probleme mit dem Output auftauchen, hier ein Work around für die Meldung, dass der Output limitiert wurde. [Reconfigure line output](https://stackoverflow.com/questions/43288550/iopub-data-rate-exceeded-when-viewing-image-in-jupyter-notebook) and [opening stuff from the command line](https://stackoverflow.com/questions/16344709/how-to-open-a-file-from-the-command-line-with-a-specified-program)

### Dokumentation 

Bevor man mit deiner API arbeitet, lohnt es sich immer zuerst, die [Dokumentation](https://earthquake.usgs.gov/fdsnws/event/1/#parameters) anzuschauen. 

### Erste Abfragen

Kleinere Abfrage. Wieviele Erdbeben hat es in einem bestimmten Zeitraum gegeben?

In [5]:
url = 'https://earthquake.usgs.gov/fdsnws/event/1/count?starttime=2017-09-20&endtime=2017-09-21'

In [6]:
response = requests.get(url)

In [7]:
response

<Response [200]>

In [8]:
response.text

'328'

Wieviele hat es letzte Nacht von 22 bis 6 Uhr morgens gegeben? Dafür müssen wir in der Dokumentation Time nachfragen.

In [9]:
url = 'https://earthquake.usgs.gov/fdsnws/event/1/count?starttime=2017-09-20&endtime=2017-09-21

SyntaxError: EOL while scanning string literal (<ipython-input-9-bf5bc0961c93>, line 1)

Wegen Zeitverschiebung Zeit anpassen.

In [None]:
url = 'https://earthquake.usgs.gov/fdsnws/event/1/count?starttime=2017-09-20T24:00:00&endtime=2017-09-21T08:00:00'

In [None]:
response = requests.get(url)
response.text

### Grosse, komibinierte Abfrage

Details zu allen Erbeben in den über drei Tage, 17-9-2017 bis 21-9-2017.

In [None]:
url1 = 'https://earthquake.usgs.gov/fdsnws/event/1/query?format=geojson'

In [None]:
urlzeit = '&starttime=2017-09-17T24:00:00&endtime=2017-09-21T08:00:00'

In [None]:
url + urlzeit

In [None]:
response = requests.get(url1+urlzeit)
response.text

Alle Erbeben mit den ungefähren Koordinaten von Mexiko. [Hier könnte man die ungefähr nachschlagen.](http://www.latlong.net/)

In [None]:
urlloc = '&minlatitude=13&maxlatitude=33&minlongitude=-120&maxlongitude=-85'

In [None]:
url1+urlzeit+urlloc

In [None]:
response = requests.get(url1+urlzeit+urlloc)
response.text

Dieser Wulst lässt sich aber ziemlich schwer lesen. Deshalb müssen wir das zuerst umformatieren und dann verstehen, wie das ganze strukturiert ist. 

In [None]:
response.json()

In [None]:
dct = response.json()

Um sicher zu gehen, prüfen wir nochmals den Datentyp.

In [None]:
type(dct)

In [None]:
len(dct)

Schauen wir uns alle keys und values an

In [None]:
for key in dct:
    print(key)

Features interessiert uns.

In [None]:
type(dct['features'])

In [None]:
len(dct['features'])

Schauen wir uns das erste Element an

In [None]:
for key in dct['features'][0]:
    print(key)

In [None]:
dct['features'][0]['properties']


Lesen wir folgendes aus:
1. Type
2. Magnitude
4. Örtlichkeit
5. Time 

In [None]:
earthquakes = []

for elem in dct['features']:
    
    t = elem['properties']['type']
    m = elem['properties']['mag']
    p = elem['properties']['place']
    tm = elem['properties']['time']
    
    mini_dict = {'Type': t,
                 'Mag': m,
                 'Place': p,
                 'Time': tm}
    
    earthquakes.append(mini_dict)

Dealing with Unix time

In [None]:
earthquakes

In [None]:
earthquakes = []

for elem in dct['features']:
    t = elem['properties']['type']
    m = elem['properties']['mag']
    p = elem['properties']['place']
    
    #Ints bearbeiten, die letzten drei Stellen abschneiden
    tm = str(elem['properties']['time'])[:-3]
        
    mini_dict = {'Type': t,
                 'Mag': m,
                 'Place': p,
                 'Time': tm}
    
    earthquakes.append(mini_dict)

In [None]:
zahl = 12121323234234234324234

In [None]:
temp = datetime.datetime.fromtimestamp(1386181800).strftime('%Y-%m-%d %H:%M:%S')

In [None]:
temp

In [None]:
str(zahl)

In [None]:
dt(int(str(zahl)[:-3]))

In [None]:
dt(int(str(zahl)[:-3])) 

In [None]:
earthquakes

### Erste Erfahrung mit Pandas

In [None]:
pd.DataFrame(earthquakes)

In [None]:
df = pd.DataFrame(earthquakes)

In [None]:
df.sort_values(by='Mag', ascending=False)

Speichern wir das ab.

In [None]:
df.to_csv('erdbeben.csv')