# APIs Scraping

## Requête API

In [1]:
import requests

### Requête GET

In [2]:
# Requête pour obtenir la dernière position de la station ISS depuis l'API OpenNotify
response = requests.get("http://api.open-notify.org/iss-now.json") # On ajoute après de l'API un point d'accès
# Ou endpoint qui donne accès à des informations (ici iss-now.json --> Latitude et Longitude de la station)

In [3]:
response

<Response [200]>

#### 200 - Tout est ok le serveur retourne le résultat

In [4]:
status_code = response.status_code
print(status_code)

200


#### 301 - Le serveur redirige vers un autre paramètre

#### 400 - Mauvaise requête

In [5]:
response = requests.get("http://api.open-notify.org/iss-pass.json")
status_code = response.status_code
print(status_code)

400


#### 401 - Le serveur pense que vous n'êtes pas identifié

#### 403 - Vous n'êtes pas autorisé à accèder à l'API

#### 404 - Le serveur n'a pas trouvé la ressource

In [6]:
response = requests.get("http://api.open-notify.org/iss-pass")
status_code = response.status_code
print(status_code)

404


## Paramètres de requête

In [7]:
# Latitude et longitude de la ville de Paris
parameters = {"lat": 48.87, "lon": 2.33}

In [8]:
# http://api.open-notify.org/iss-pass.json?lat=48.87&lon=2.33

In [9]:
response = requests.get("http://api.open-notify.org/iss-pass.json", params = parameters)

In [10]:
content = response.content # On récupère le contenu
print(content)

b'{\n  "message": "success", \n  "request": {\n    "altitude": 100, \n    "datetime": 1630870494, \n    "latitude": 48.87, \n    "longitude": 2.33, \n    "passes": 5\n  }, \n  "response": [\n    {\n      "duration": 444, \n      "risetime": 1630881283\n    }, \n    {\n      "duration": 637, \n      "risetime": 1630886949\n    }, \n    {\n      "duration": 656, \n      "risetime": 1630892743\n    }, \n    {\n      "duration": 654, \n      "risetime": 1630898570\n    }, \n    {\n      "duration": 655, \n      "risetime": 1630904385\n    }\n  ]\n}\n'


In [11]:
# Latitude et longitude de la ville de San Francisco
parameters_sf = {"lat": 37.78, "lon": -122.41}
response = requests.get("http://api.open-notify.org/iss-pass.json", params = parameters_sf)

content = response.content # On récupère le contenu
print(content)

b'{\n  "message": "success", \n  "request": {\n    "altitude": 100, \n    "datetime": 1630870495, \n    "latitude": 37.78, \n    "longitude": -122.41, \n    "passes": 5\n  }, \n  "response": [\n    {\n      "duration": 530, \n      "risetime": 1630908927\n    }, \n    {\n      "duration": 653, \n      "risetime": 1630914651\n    }, \n    {\n      "duration": 566, \n      "risetime": 1630920536\n    }, \n    {\n      "duration": 490, \n      "risetime": 1630926460\n    }, \n    {\n      "duration": 573, \n      "risetime": 1630932303\n    }\n  ]\n}\n'


## Format JSON

##### Librairie JSON:

In [12]:
# dumps -- prends en entrée un objet Python et retourne une chaîne de caractères
# loads -- prends en entrée une chaîne de caractères JSON et retourne un objet Python (listes, dictionnaires)

### Exemple

In [13]:
# Soit une liste de sports
sports = ["Tennis", "Foot", "Triathlon"]
print(sports)

['Tennis', 'Foot', 'Triathlon']


In [14]:
print(type(sports))

<class 'list'>


In [15]:
# importer le librairie Json
import json

In [16]:
# Méthode json.dumps pour convertir en chaîne de caractères
sports_string = json.dumps(sports)
print(sports_string)

["Tennis", "Foot", "Triathlon"]


In [17]:
print(type(sports_string))

<class 'str'>


In [18]:
# Convertir sports_string en liste -- méthode json.loads

In [19]:
sports2 = json.loads(sports_string)
print(type(sports2))

<class 'list'>


### Training

In [20]:
# soit le dictionnaire contenant le nombre de licenciés pour quelques sports en France en 2016
sports_number = {
    "Football":1962241,
    "Tennis":1039337,
    "Equitation":663194,
    "Basketball":641367
}

In [21]:
sports_number_string = json.dumps(sports_number)
print(sports_number_string)
print(type(sports_number_string))

{"Football": 1962241, "Tennis": 1039337, "Equitation": 663194, "Basketball": 641367}
<class 'str'>


In [22]:
sports_number_2 = json.loads(sports_number_string)
print(sports_number_2)
print(type(sports_number_2))

{'Football': 1962241, 'Tennis': 1039337, 'Equitation': 663194, 'Basketball': 641367}
<class 'dict'>


## Obtenir un JSON depuis une requête

In [23]:
# méthode json()

In [24]:
# Reprenons notre requête avec les coordonnées de Paris
parameters = {"lat":48.87, "lon":2.33}
response = requests.get("http://api.open-notify.org/iss-pass.json", params = parameters)

In [25]:
# Obtenir un objet Python
json_data = response.json()
print(type(json_data))

<class 'dict'>


In [26]:
print(json_data)

{'message': 'success', 'request': {'altitude': 100, 'datetime': 1630870494, 'latitude': 48.87, 'longitude': 2.33, 'passes': 5}, 'response': [{'duration': 444, 'risetime': 1630881283}, {'duration': 637, 'risetime': 1630886949}, {'duration': 656, 'risetime': 1630892743}, {'duration': 654, 'risetime': 1630898570}, {'duration': 655, 'risetime': 1630904385}]}


In [27]:
first_pass_duration = json_data["response"][0]["duration"]
print(first_pass_duration)

444


## Type de contenu

In [28]:
# .headers

In [29]:
print(response.headers)

{'Server': 'nginx/1.10.3', 'Date': 'Sun, 05 Sep 2021 19:58:19 GMT', 'Content-Type': 'application/json', 'Content-Length': '518', 'Connection': 'keep-alive', 'Via': '1.1 vegur'}


In [30]:
content_type = response.headers["Content-Type"]
print(content_type)

application/json


## Trouver le nombre de personnes dans l'espace

### Training

In [39]:
# Appeler l'API
response = requests.get("http://api.open-notify.org/astros.json")
# Obtenir un objet Python
json_data = response.json()
print(json_data)

{'people': [{'name': 'Mark Vande Hei', 'craft': 'ISS'}, {'name': 'Oleg Novitskiy', 'craft': 'ISS'}, {'name': 'Pyotr Dubrov', 'craft': 'ISS'}, {'name': 'Thomas Pesquet', 'craft': 'ISS'}, {'name': 'Megan McArthur', 'craft': 'ISS'}, {'name': 'Shane Kimbrough', 'craft': 'ISS'}, {'name': 'Akihiko Hoshide', 'craft': 'ISS'}, {'name': 'Nie Haisheng', 'craft': 'Tiangong'}, {'name': 'Liu Boming', 'craft': 'Tiangong'}, {'name': 'Tang Hongbo', 'craft': 'Tiangong'}], 'number': 10, 'message': 'success'}


In [40]:
in_space_count = json_data["number"]
print(in_space_count)

10
