# Übung 6
## Programmieren gegen REST-API  -- hier Google flights api

Sebastian Schmid S0543196

Aufgabe war das programmieren gegen die Google Flights API

### Beantworten	Sie	folgende	Frage	stichpunktartig:	
1. Für	welche	REST	API	haben	Sie	sich	entschieden	und	welche	Daten	planen	Sie	
    1. In	welchem	Format
    1. mit	 welchem	 Filter	 zu	 ziehen	 und	 darzustellen	 (Bsp.	 Produktkategorie	 mit	 Anzahl	 Produkte	je	Kategorie)?
    
2. Wie	 wird	 die	 Semantik	 der	 Datenrepräsentation	 beschrieben	 (gar	 nicht,	 per	 xsd,	 ...) und inwieweit	waren	Sie	auf	die	Dokumentation	angewiesen	bei	der	Implementierung?
3. Welchen	 Zyklus	 würden	 Sie	 für	 Updates	 Ihrer	 Daten	 für	 sinnvoll	 halten?	Wie	 würden	 Sie	 das	realisieren?

### Anworten

* 1 Google Flight API
* 1.A.: JSON -> Python -> Pandas Dataframe 
* 1.B.: Dataframes erlauben Dynamisches filtern der Inhalte
* 2  Keine Datenrepresentation da JSON
* 3 Per Suchabfrage neues Update -- Zwischenabfragen nicht notwendig

### Verwendete Bibliotheken
- **pandas** *Extrahieren der Datenstruktur in Dataframe*
- **requests** *Aufbauen des Requests.*
- **json**  *Umwandeln zwischen Objektstruktur und JSON*

In [1]:
import pandas as pd
import requests
import json

### Definition der URL

* api_key wird über URL mitgeliefert. 

In [2]:
baseurl = "https://www.googleapis.com/qpxExpress/v1/trips"
api_key = "AIzaSyDhcip9AYydMUbrjCCd8NhD4qOkePYENxw"
searchurl = baseurl + "/search?key=" + api_key

### Generieren der Daten für den Request

* json.dumps erlaubt einfaches Umwandeln der Objektstruktur in JSON
* Über die Signatur der Methode lassen sich Werte der Suchabfrage ändern.

In [3]:
def generate_request_data(origin, destination, date):
    
    request_data = { "request": {     
            "passengers": { "adultCount": 1},
            "slice": [{
                    "origin": origin,
                    "destination": destination,
                    "date": date
                    }]}}
    
    return json.dumps(request_data)

### Übermitteln des Requests

* dynamisches Generieren der POST-Daten
* Header wird definiert als: *'Content-type': 'application/json'*
* Rückgabe ist der response des Servers

In [4]:
def do_request(origin, destination, date):
    
    headers = {'Content-type': 'application/json'}
    post_data = generate_request_data(origin, destination, date) 
    
    #: returning response
    return  requests.post(url=searchurl, data=post_data, headers=headers)


### Helfermethoden für das extrahieren der Subtrees

In [5]:
#: λ-expression to get all trip-options of an given response object.
extract_tripOptions = lambda response : json.loads(response.content.decode('utf-8'))['trips']['tripOption']
#: λ-expression to get the data of one specific trip
extract_tripdata = lambda i, trip : trip['slice'][0]['segment'][0]['leg'][0]  

### Suchabfrage

* Definition der veränderbaren Werte über Variablen
* Sammeln der Daten in padas.Dataframe

In [6]:
origin = 'TXL'
destination = 'CDG'
date = "2017-02-17"

response = do_request(origin, destination, date)

tripOptions = extract_tripOptions(response)

#: extract the dataframe from the Object-Structure
df = pd.DataFrame([extract_tripdata(i, trip) for i, trip in enumerate(tripOptions)])

#: hide some columns
hide_columns = ('id', 'kind', 'mileage', 'aircraft', 'destinationTerminal', 'operatingDisclosure')
df = df [ [c for c in df.columns if c not in hide_columns] ]

#: only show the direct flights
df = df[ df['destination'] == destination ]

#: timestrings to datetime
for col in ('arrivalTime', 'departureTime'):
    df[col] = pd.to_datetime(df[col])

### Ausgabe

* Ausgabe der ersten Einträge der Tabelle

In [7]:
df

Unnamed: 0,arrivalTime,departureTime,destination,duration,meal,origin
0,2017-02-17 07:40:00,2017-02-17 05:55:00,CDG,105,Refreshments,TXL
4,2017-02-17 18:55:00,2017-02-17 17:10:00,CDG,105,Refreshments,TXL
6,2017-02-17 07:20:00,2017-02-17 05:35:00,CDG,105,Snack or Brunch,TXL
7,2017-02-17 13:10:00,2017-02-17 11:25:00,CDG,105,Snack or Brunch,TXL
8,2017-02-17 10:50:00,2017-02-17 09:05:00,CDG,105,,TXL
9,2017-02-17 18:30:00,2017-02-17 16:45:00,CDG,105,Snack or Brunch,TXL
10,2017-02-17 16:05:00,2017-02-17 14:20:00,CDG,105,Snack or Brunch,TXL
