# APIs Scraping
## Introduction aux APIs et requêtes APIs
### Qu'est-ce qu'une API
API : Application Program Interface
Ensemble d'outils et méthodes qui autorisent différentes appliccations à interragir entre elles ==> récyoérer de ka data dynamiquement

### Contenu du fichier
- Requête API
    - Requête get
- Codes status
    - 200 - 400 - 301 - 404 - 401 -403
- Paramètres de requête
- Exercice
- Formation JSON : 2 fonctions (dumps et loads)
    - exemple
    - exercice
    - obtenir un JSON depuis une requête
    - type de contenu
    - trouver le nombre de personnes dans l'espace
    - authentification sur l'API Github

## Requête API

In [15]:
import requests

#### Requête GET

In [16]:
# Requête pour obtenir la denière position de la station ISS depuis l'API OpenNotify
response = requests.get("http://api.open-notify.org/iss-now.json") #iss-now.json latitude et longitude de la station ISS

## Codes statut

In [17]:
response

<Response [200]>

#### 200 - Tout est OK, le serveur retourne le résultat

In [18]:
status_code = response.status_code
print(status_code)

200


#### 400 - Mauvaise requête

#### 301 - Le serveur redirige vers un autre paramètre

#### 404 - Indique que si le serveur lui-même est accessible, la page spécifique affichant l’erreur ne l’est pas - le serveur n'a pas trouvé la ressource, en l'occurence, le point d'accès

In [21]:
response = requests.get("http://api.open-notify.org/iss-pass.json")
status_code = response.status_code
print(status_code)

404


#### 401 - Le serveur pense que vous n'êtes pas identifié

#### 403 - Pas autorisé à accédre à l'API

## Paramètres de requête

#### La prédiction ISS Pass a été supprimée de l'API
Real time current ISS location and number of people in space will continue to operate.

In [22]:
 # Latitude et longitude de la ville Paris
parameters = {"lat":48.77, "lon":2.33}

In [23]:
# http://api.open-notify.org/iss-pass.json?lat=48.81&lon=2.33

In [31]:
response = requests.get("http://api.open-notify.org/iss-pass.json",
                       params=parameters) # ceci permettait de questionner l'API - information par rapport à Paris +++

In [32]:
response = requests.get("http://api.open-notify.org/iss-now.json")

In [33]:
content = response.content # on récupère SEULEMENT le contenu concernant la position de la station ISS, on ne peut plus
print(content)

b'{"message": "success", "timestamp": 1671031205, "iss_position": {"latitude": "-34.3583", "longitude": "176.5738"}}'


## Exercice 

In [None]:
import requests

parameters = {"lat":37.77493,"lon":-122.41942}
response = requests.get("http://api.open-notify.org/iss-pass.json",
                       params=parameters)

content = response.content # La 'prédiction ISS Pass' a été supprimée de l'API, on ne peut donc plus afficher de résultats
print(content)

## Formation JSON

#### Librairie json: elle a deux fonctions

- dumps -- méthode prenant en entrée un objet Python et retourne une chaîne de caractères
- loads -- prend en entrée une chaîne de caractères JSON et retourne un objet Python (listes, dictionnaires...)

#### Exemple

In [36]:
# Soit une liste de sports
sports = ["Tennis", "Foot", "Triathlon"]
print(sports)

['Tennis', 'Foot', 'Triathlon']


In [37]:
print(type(sports))

<class 'list'>


In [38]:
import json

In [42]:
# Méthode json.dumps pour convertir en chaîne de caractères
sports_string = json.dumps(sports)
print(sports_string)

["Tennis", "Foot", "Triathlon"]


In [43]:
print(type(sports_string))

<class 'str'>


In [44]:
# Convertir sports_string en liste -- méthode json.loads
sports2 = json.loads(sports_string)
print(type(sports2))

<class 'list'>


#### Exercice

In [46]:
# soit le dictionnaire contenant le nombre de licenciés pour quelques sports en France en 2016
sports_number = {
    "Football":1962241,
    "Tennis":1039337,
    "Equitaton":663194,
    "Basketball":641367
}

In [49]:
import json

In [50]:
sports_number_string = json.dumps(sports_number)
print(sports_number_string)
print(type(sports_number_string))

{"Football": 1962241, "Tennis": 1039337, "Equitaton": 663194, "Basketball": 641367}
<class 'str'>


In [51]:
sports_number_list = json.loads(sports_number_string)
print(sports_number_list)
print(type(sports_number_list))

{'Football': 1962241, 'Tennis': 1039337, 'Equitaton': 663194, 'Basketball': 641367}
<class 'dict'>


### Obtenir un JSON depuis une requête

In [52]:
# méthohde json()

In [None]:
##################################################################################################################
######## La 'prédiction ISS Pass' a été supprimée de l'API, on ne peut donc plus afficher de résultats ###########
########                           ce qui suit est un exemple                                          ###########
##################################################################################################################

# Reprenons notre requête avec les coordonnées de Paris
import requests

parameters = {"lat":48.87,"lon":2.33}
response = requests.get("http://api.open-notify.org/iss-pass.json",
                       params=parameters)

# Obtenir un objet Python
json_data = response.json()
print(type(json_data)) # ==> Ce qui devrait nous retourner <class 'dict'>

In [54]:
# Pour contrer le fait de ne plus avoir d'informations, création du dico que retournait l'API auparavant
json_data = {"message":"success",
            "request":{
                "latitude":48.87,
                "datetime":1500633026,
                "passes":5,
                "altitude":100,
                "longitude":2.33
            },
             "response":[
                 {"duration":201,
                  "risetime":1500666997},
                 {"duration":588,
                  "risetime":1500678273},
                 {"duration":636,
                  "risetime":1500684075},
                 {"duration":641,
                  "risetime":1500689873},
                 ]
}

In [55]:
print(json_data)

{'message': 'success', 'request': {'latitude': 48.87, 'datetime': 1500633026, 'passes': 5, 'altitude': 100, 'longitude': 2.33}, 'response': [{'duration': 201, 'risetime': 1500666997}, {'duration': 588, 'risetime': 1500678273}, {'duration': 636, 'risetime': 1500684075}, {'duration': 641, 'risetime': 1500689873}]}


In [61]:
all_pass = json_data['response']
print(all_pass)

[{'duration': 201, 'risetime': 1500666997}, {'duration': 588, 'risetime': 1500678273}, {'duration': 636, 'risetime': 1500684075}, {'duration': 641, 'risetime': 1500689873}]


In [62]:
first_pass = json_data['response'][0]
print(first_pass)

{'duration': 201, 'risetime': 1500666997}


In [63]:
first_pass_duration = json_data['response'][0]['duration']
print(first_pass_duration)

201


### Type de contenu

Lorsqu'on fait une requête GET le serveur nous fournit :
- un code statut
- de la data (des données)
- et des métadatas qui contiennent des infos telles que comment a été généré la donnée et comment la décoder
- on obtient cette information .headers - censé nous retourner une dictionnaire

Encore une fois, la 'prédiction ISS Pass' a été supprimée de l'API, par conséquent, on va créer le dictionnaire qu'il nous aurait retourné

In [None]:
print(response.headers) # toujours notre exemple avec les coordonnées de Paris aurait dû nous retourner le dico suivant

In [64]:
dico_headers = {
    "Via":"1.1 vegur",
    "Content-Length":'518',
    "Server":"nginx/1.10.3",
    "Date":"fri, 21 Jul 2017 11:07:25 GMT",
    "Connection":'keep-alive',
    "Content-Type":"application/json"
}

In [None]:
content_type = response.headers['Content-Type']
# devrait nous retourner
# application/json

### Trouver le nombre de personnes dans l'espace

- assigner le résultat à la variable in_space_count
- afficher le résultat

In [None]:
import requests

parameters = {"lat":37.77493,"lon":-122.41942}
response = requests.get("http://api.open-notify.org/iss-pass.json",
                       params=parameters)

content = response.content

In [90]:
import requests

in_space = requests.get("http://api.open-notify.org/astros.json")
json_data = in_space.json()
print(type(json_data))
print("Le type de données retournées est : {}")#.format(json_data_type)
print("############################################################################################################################")
print("Affichage du contenu de ce qui devrait être un dictionnaire")
print(json_data)
print("############################################################################################################################")
in_space_count = json_data['number']
print("Il y a {} personnes dans l'espace".format(in_space_count))

<class 'dict'>
Le type de données retournées est : {}
############################################################################################################################
Affichage du contenu de ce qui devrait être un dictionnaire
{'message': 'success', 'people': [{'name': 'Sergey Prokopyev', 'craft': 'ISS'}, {'name': 'Dmitry Petelin', 'craft': 'ISS'}, {'name': 'Frank Rubio', 'craft': 'ISS'}, {'name': 'Nicole Mann', 'craft': 'ISS'}, {'name': 'Josh Cassada', 'craft': 'ISS'}, {'name': 'Koichi Wakata', 'craft': 'ISS'}, {'name': 'Anna Kikina', 'craft': 'ISS'}, {'name': 'Fei Junlong', 'craft': 'Shenzhou 15'}, {'name': 'Deng Qingming', 'craft': 'Shenzhou 15'}, {'name': 'Zhang Lu', 'craft': 'Shenzhou 15'}], 'number': 10}
############################################################################################################################
Il y a 10 personnes dans l'espace


### Authentification sur l'API Github

In [1]:
import requests

In [2]:
# Création dictionnaire contenant le token
headers = {"authorization": "token  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"}

In [4]:
# Requête GET
response = requests.get("https://github.com/Didier7B0/UDEMY_Training_Github",
                       headers=headers)

In [5]:
print(response)

<Response [200]>


In [6]:
print(response.json)

<bound method Response.json of <Response [200]>>
