<h1> - Qu'est qu'une API ? </h1>

Une API (Application Program Interface), est un ensemble d'outils et méthodes qui autorisent différentes applications à interragir entre elles pour récupérer des données dynamiquement
    
- Pacerelle entre utilisateurs et fournisseurs de données
- Normalisation des données 

![SAG_API_Portal_KD_1_Large_tcm416-160297.png](attachment:SAG_API_Portal_KD_1_Large_tcm416-160297.png)

Exemples : <br>
- https://openweathermap.org/current (peut servir pour un assistant en ligne conseillant la manière de s'habiller en fonction de la meteo) <br>
- https://developers.google.com/maps/documentation/javascript/examples/layer-traffic (service de livraison indiquant en temps réel l'heure de d'arrivée du colis en fonction du trafic) <br>
- https://ressources.data.sncf.com/explore/?sort=modified (site d'annonce immobilière indiquant la fiabilité de la ligne sncf à proximité du logement) <br>

- http://open-notify.org/ : position de la station ISS depuis l'API OpenNotify

Ce que nous allons tester : https://ressources.data.sncf.com/explore/dataset/ponctualite-mensuelle-transilien/information/?sort=date <br>

L'API en question : https://ressources.data.sncf.com/api/records/1.0/search/?dataset=ponctualite-mensuelle-transilien&sort=date&facet=date&facet=service&facet=ligne

<h2> 1-  Qu'est ce que le format Json ? </h2>

JavaScript Object Notation (JSON) est un format de données textuelles dérivé de la notation des objets du langage JavaScript. Il permet de représenter de l’information structurée : <br>

- {...} : les accolades définissent un objet. <br>
- "clé":"valeur" : Les guillemets (double-quotes) et les double-points définissent un couple clé/valeur (on parle de membre). <br>
- [...] : Les crochets définissent un tableau (ou array en anglais)

![json.PNG](attachment:json.PNG)

Exemple de formatter json pour voir la structure d'un fichier json: 

https://jsonformatter.curiousconcept.com/

<h2> 2- Comment requêter une API en python ? </h2>

On requête une API avec la méthode requests.get(). 
Ceci nous retoune un code status: 

- code 200 - tout est OK : le serveur retourne le résultat
- code 301 - Le serveur redirige vers un autre paramètre
- code 400 - Mauvaise requête
- code 401 - Usager pas authentifié 
- code 403 - Pas d'authorisation pour accèder à l'API
- code 404 - Serveur n'a pas trouvé la ressource 

In [23]:
url = 'https://ressources.data.sncf.com/api/records/1.0/search/?dataset=ponctualite-mensuelle-transilien&sort=date&facet=date&facet=service&facet=ligne'
print(url)

https://ressources.data.sncf.com/api/records/1.0/search/?dataset=ponctualite-mensuelle-transilien&sort=date&facet=date&facet=service&facet=ligne


In [24]:
import requests # librairie pour récupérer des données web
data = requests.get(url)
data

<Response [200]>

On nous retourne une réponse "200". 

In [25]:
test = requests.get('https://ressources.data.sncf.com/api/records/1.0/')
test
#https://fr.wikipedia.org/wiki/Liste_des_codes_HTTP

<Response [404]>

In [26]:
data.headers

{'Server': 'nginx', 'Date': 'Wed, 24 Jun 2020 02:34:23 GMT', 'Content-Type': 'application/json; charset=utf-8', 'Transfer-Encoding': 'chunked', 'Connection': 'keep-alive', 'X-RateLimit-Remaining': '19999', 'Content-Language': 'fr', 'Content-Security-Policy': "frame-ancestors 'none', upgrade-insecure-requests", 'Access-Control-Max-Age': '1000', 'Vary': 'Accept-Language, Cookie, Host', 'Access-Control-Allow-Headers': 'Authorization, X-Requested-With, Origin, ODS-API-Analytics-App, ODS-Widgets-Version, Accept', 'X-RateLimit-Limit': '20000', 'Cache-Control': 'no-cache, no-store, max-age=0, must-revalidate', 'X-Frame-Options': 'DENY', 'Access-Control-Allow-Methods': 'POST, GET, OPTIONS', 'Access-Control-Allow-Origin': '*', 'X-RateLimit-Reset': '2020-06-25 00:00:00+00:00', 'X-UA-Compatible': 'IE=edge', 'Strict-Transport-Security': 'max-age=15778800', 'X-XSS-Protection': '1; mode=block', 'X-Content-Type-Options': 'nosniff', 'Referrer-Policy': 'strict-origin-when-cross-origin', 'Content-Encodi

In [27]:
data.content
#https://jsonformatter.curiousconcept.com/

b'{"nhits": 1092, "parameters": {"dataset": "ponctualite-mensuelle-transilien", "timezone": "UTC", "rows": 10, "sort": ["date"], "format": "json", "facet": ["date", "service", "ligne"]}, "records": [{"datasetid": "ponctualite-mensuelle-transilien", "recordid": "e3ca9caa413e468992d7fd87a7cb4492e688391d", "fields": {"service": "Transilien", "ponctualite": 89.1155910695, "ligne": "P", "nom_de_la_ligne": "Paris Est", "nombre_de_voyageurs_a_l_heure_pour_un_voyageur_en_retard": 8.2, "date": "2020-02", "id": "TRA_11"}, "record_timestamp": "2020-03-26T08:36:21.479000+00:00"}, {"datasetid": "ponctualite-mensuelle-transilien", "recordid": "d1ac8bdb0f73d1937dfdd849008c67d824d12f80", "fields": {"service": "RER", "ponctualite": 80.0245907009, "ligne": "B", "nom_de_la_ligne": "RER B", "nombre_de_voyageurs_a_l_heure_pour_un_voyageur_en_retard": 4.0, "date": "2020-02", "id": "TRA_2"}, "record_timestamp": "2020-03-26T08:36:21.479000+00:00"}, {"datasetid": "ponctualite-mensuelle-transilien", "recordid":

<h2> 3- Transformer du Json en Dataframe </h2>

- utilisation de la librairie json 
- transformation en dictionnaire 

In [28]:
import json
data = requests.get(url)
data = json.loads(data.content)
print(type(data))
data

<class 'dict'>


{'nhits': 1092,
 'parameters': {'dataset': 'ponctualite-mensuelle-transilien',
  'timezone': 'UTC',
  'rows': 10,
  'sort': ['date'],
  'format': 'json',
  'facet': ['date', 'service', 'ligne']},
 'records': [{'datasetid': 'ponctualite-mensuelle-transilien',
   'recordid': 'e3ca9caa413e468992d7fd87a7cb4492e688391d',
   'fields': {'service': 'Transilien',
    'ponctualite': 89.1155910695,
    'ligne': 'P',
    'nom_de_la_ligne': 'Paris Est',
    'nombre_de_voyageurs_a_l_heure_pour_un_voyageur_en_retard': 8.2,
    'date': '2020-02',
    'id': 'TRA_11'},
   'record_timestamp': '2020-03-26T08:36:21.479000+00:00'},
  {'datasetid': 'ponctualite-mensuelle-transilien',
   'recordid': 'd1ac8bdb0f73d1937dfdd849008c67d824d12f80',
   'fields': {'service': 'RER',
    'ponctualite': 80.0245907009,
    'ligne': 'B',
    'nom_de_la_ligne': 'RER B',
    'nombre_de_voyageurs_a_l_heure_pour_un_voyageur_en_retard': 4.0,
    'date': '2020-02',
    'id': 'TRA_2'},
   'record_timestamp': '2020-03-26T08:36:21

- json_normalize de pandas : normalisation du dictionnaire en dataframe

In [29]:
from pandas.io.json import json_normalize
dataSet = json_normalize(data)
dataSet

Unnamed: 0,facet_groups,nhits,parameters.dataset,parameters.facet,parameters.format,parameters.rows,parameters.sort,parameters.timezone,records
0,"[{'facets': [{'count': 156, 'path': '2013', 's...",1092,ponctualite-mensuelle-transilien,"[date, service, ligne]",json,10,[date],UTC,[{'datasetid': 'ponctualite-mensuelle-transili...


- Besoin de cibler l'information que nous souhaitons extraire 

In [30]:
from pandas.io.json import json_normalize
dataSet = json_normalize(data['facet_groups'])
dataSet

Unnamed: 0,facets,name
0,"[{'count': 156, 'path': '2013', 'state': 'disp...",date
1,"[{'count': 84, 'path': 'A', 'state': 'displaye...",ligne
2,"[{'count': 672, 'path': 'Transilien', 'state':...",service


- nos informations sont en fait dans "records":

In [31]:
from pandas.io.json import json_normalize
dataSet = json_normalize(data['records'])
dataSet.head()

Unnamed: 0,datasetid,fields.date,fields.id,fields.ligne,fields.nom_de_la_ligne,fields.nombre_de_voyageurs_a_l_heure_pour_un_voyageur_en_retard,fields.ponctualite,fields.service,record_timestamp,recordid
0,ponctualite-mensuelle-transilien,2020-02,TRA_11,P,Paris Est,8.2,89.115591,Transilien,2020-03-26T08:36:21.479000+00:00,e3ca9caa413e468992d7fd87a7cb4492e688391d
1,ponctualite-mensuelle-transilien,2020-02,TRA_2,B,RER B,4.0,80.024591,RER,2020-03-26T08:36:21.479000+00:00,d1ac8bdb0f73d1937dfdd849008c67d824d12f80
2,ponctualite-mensuelle-transilien,2020-02,TRA_3,C,RER C,5.0,83.249107,RER,2020-03-26T08:36:21.479000+00:00,7d5a5e3b47377fe2d3b1bace0a30cd24c9c6c28d
3,ponctualite-mensuelle-transilien,2020-02,TRA_4,D,RER D,5.4,84.303784,RER,2020-03-26T08:36:21.479000+00:00,dbaa40e0c3171a8aa7f78f750def9e9ecddeeed3
4,ponctualite-mensuelle-transilien,2020-02,TRA_7,J,Paris Saint-Lazare Nord,6.6,86.879927,Transilien,2020-03-26T08:36:21.479000+00:00,ce640871d72650586d9e629800c7a645630b5895


- On recombine toutes nos opérations dans la même cellule: 

In [32]:
url = 'https://ressources.data.sncf.com/api/records/1.0/search/?dataset=ponctualite-mensuelle-transilien&rows=10000&sort=date&facet=date&facet=service&facet=ligne'
data = requests.get(url)
data = json.loads(data.content)
dataSet = json_normalize(data['records'])
dataSet

Unnamed: 0,datasetid,fields.date,fields.id,fields.ligne,fields.nom_de_la_ligne,fields.nombre_de_voyageurs_a_l_heure_pour_un_voyageur_en_retard,fields.ponctualite,fields.service,record_timestamp,recordid
0,ponctualite-mensuelle-transilien,2020-02,TRA_11,P,Paris Est,8.2,89.115591,Transilien,2020-03-26T08:36:21.479000+00:00,e3ca9caa413e468992d7fd87a7cb4492e688391d
1,ponctualite-mensuelle-transilien,2020-02,TRA_2,B,RER B,4.0,80.024591,RER,2020-03-26T08:36:21.479000+00:00,d1ac8bdb0f73d1937dfdd849008c67d824d12f80
2,ponctualite-mensuelle-transilien,2020-02,TRA_3,C,RER C,5.0,83.249107,RER,2020-03-26T08:36:21.479000+00:00,7d5a5e3b47377fe2d3b1bace0a30cd24c9c6c28d
3,ponctualite-mensuelle-transilien,2020-02,TRA_4,D,RER D,5.4,84.303784,RER,2020-03-26T08:36:21.479000+00:00,dbaa40e0c3171a8aa7f78f750def9e9ecddeeed3
4,ponctualite-mensuelle-transilien,2020-02,TRA_7,J,Paris Saint-Lazare Nord,6.6,86.879927,Transilien,2020-03-26T08:36:21.479000+00:00,ce640871d72650586d9e629800c7a645630b5895
5,ponctualite-mensuelle-transilien,2020-02,TRA_8,K,Paris Nord Crépy,13.6,93.155073,Transilien,2020-03-26T08:36:21.479000+00:00,b3b761104b344ee43021eba8b62f7508bd881883
6,ponctualite-mensuelle-transilien,2020-02,TRA_9,L,Paris Saint-Lazare Sud,12.9,92.802218,Transilien,2020-03-26T08:36:21.479000+00:00,2f788526d83da3d84f69ed26168c6c6d487a5636
7,ponctualite-mensuelle-transilien,2020-02,TRA_10,N,Paris Montparnasse,11.7,92.125579,Transilien,2020-03-26T08:36:21.479000+00:00,734bf9691277c2358fddbd6989be12d6bda70e64
8,ponctualite-mensuelle-transilien,2020-02,TRA_12,R,Paris Sud Est,4.2,80.723333,Transilien,2020-03-26T08:36:21.479000+00:00,87efde538b409fb86d7c9539c1603d03f39ef636
9,ponctualite-mensuelle-transilien,2020-02,TRA_13,U,La Verrière - La Défense,3.7,78.641513,Transilien,2020-03-26T08:36:21.479000+00:00,16d750296f81ed1537d168bbd8dc1db858884933


<h2> 4- Dynamiser le paramétrage de vos appels API </h2>

- dans l'exemple précédent, on est dépendant d'un formulaire en ligne
- besoin de comprendre le paramétrage d'une API
- on va prendre la racine de l'url et on va pousser un dictionnaire au moment de l'appel pour ajouter nos paramètres dans l'URL

In [33]:
url = 'https://ressources.data.sncf.com/api/records/1.0/search/'
parametres = {
    'dataset': 'ponctualite-mensuelle-transilien',
    'rows':'100',
    'sort':'date',
    'facet': 'date',
    'facet': 'service',
    'facet': 'ligne',
}
data = requests.get(url, params=parametres)
data = json.loads(data.content)
dataSet = json_normalize(data['records'])
dataSet

#http://docs.python-requests.org/en/master/user/quickstart/#make-a-request (pour gestion login/mdp, clé API...)

Unnamed: 0,datasetid,fields.date,fields.id,fields.ligne,fields.nom_de_la_ligne,fields.nombre_de_voyageurs_a_l_heure_pour_un_voyageur_en_retard,fields.ponctualite,fields.service,record_timestamp,recordid
0,ponctualite-mensuelle-transilien,2020-02,TRA_11,P,Paris Est,8.2,89.115591,Transilien,2020-03-26T08:36:21.479000+00:00,e3ca9caa413e468992d7fd87a7cb4492e688391d
1,ponctualite-mensuelle-transilien,2020-02,TRA_2,B,RER B,4.0,80.024591,RER,2020-03-26T08:36:21.479000+00:00,d1ac8bdb0f73d1937dfdd849008c67d824d12f80
2,ponctualite-mensuelle-transilien,2020-02,TRA_3,C,RER C,5.0,83.249107,RER,2020-03-26T08:36:21.479000+00:00,7d5a5e3b47377fe2d3b1bace0a30cd24c9c6c28d
3,ponctualite-mensuelle-transilien,2020-02,TRA_4,D,RER D,5.4,84.303784,RER,2020-03-26T08:36:21.479000+00:00,dbaa40e0c3171a8aa7f78f750def9e9ecddeeed3
4,ponctualite-mensuelle-transilien,2020-02,TRA_7,J,Paris Saint-Lazare Nord,6.6,86.879927,Transilien,2020-03-26T08:36:21.479000+00:00,ce640871d72650586d9e629800c7a645630b5895
5,ponctualite-mensuelle-transilien,2020-02,TRA_8,K,Paris Nord Crépy,13.6,93.155073,Transilien,2020-03-26T08:36:21.479000+00:00,b3b761104b344ee43021eba8b62f7508bd881883
6,ponctualite-mensuelle-transilien,2020-02,TRA_9,L,Paris Saint-Lazare Sud,12.9,92.802218,Transilien,2020-03-26T08:36:21.479000+00:00,2f788526d83da3d84f69ed26168c6c6d487a5636
7,ponctualite-mensuelle-transilien,2020-02,TRA_10,N,Paris Montparnasse,11.7,92.125579,Transilien,2020-03-26T08:36:21.479000+00:00,734bf9691277c2358fddbd6989be12d6bda70e64
8,ponctualite-mensuelle-transilien,2020-02,TRA_12,R,Paris Sud Est,4.2,80.723333,Transilien,2020-03-26T08:36:21.479000+00:00,87efde538b409fb86d7c9539c1603d03f39ef636
9,ponctualite-mensuelle-transilien,2020-02,TRA_13,U,La Verrière - La Défense,3.7,78.641513,Transilien,2020-03-26T08:36:21.479000+00:00,16d750296f81ed1537d168bbd8dc1db858884933


In [34]:
import pandas as pd
dataSet["fields.date"] = pd.to_datetime(dataSet["fields.date"])
dataSet

Unnamed: 0,datasetid,fields.date,fields.id,fields.ligne,fields.nom_de_la_ligne,fields.nombre_de_voyageurs_a_l_heure_pour_un_voyageur_en_retard,fields.ponctualite,fields.service,record_timestamp,recordid
0,ponctualite-mensuelle-transilien,2020-02-01,TRA_11,P,Paris Est,8.2,89.115591,Transilien,2020-03-26T08:36:21.479000+00:00,e3ca9caa413e468992d7fd87a7cb4492e688391d
1,ponctualite-mensuelle-transilien,2020-02-01,TRA_2,B,RER B,4.0,80.024591,RER,2020-03-26T08:36:21.479000+00:00,d1ac8bdb0f73d1937dfdd849008c67d824d12f80
2,ponctualite-mensuelle-transilien,2020-02-01,TRA_3,C,RER C,5.0,83.249107,RER,2020-03-26T08:36:21.479000+00:00,7d5a5e3b47377fe2d3b1bace0a30cd24c9c6c28d
3,ponctualite-mensuelle-transilien,2020-02-01,TRA_4,D,RER D,5.4,84.303784,RER,2020-03-26T08:36:21.479000+00:00,dbaa40e0c3171a8aa7f78f750def9e9ecddeeed3
4,ponctualite-mensuelle-transilien,2020-02-01,TRA_7,J,Paris Saint-Lazare Nord,6.6,86.879927,Transilien,2020-03-26T08:36:21.479000+00:00,ce640871d72650586d9e629800c7a645630b5895
5,ponctualite-mensuelle-transilien,2020-02-01,TRA_8,K,Paris Nord Crépy,13.6,93.155073,Transilien,2020-03-26T08:36:21.479000+00:00,b3b761104b344ee43021eba8b62f7508bd881883
6,ponctualite-mensuelle-transilien,2020-02-01,TRA_9,L,Paris Saint-Lazare Sud,12.9,92.802218,Transilien,2020-03-26T08:36:21.479000+00:00,2f788526d83da3d84f69ed26168c6c6d487a5636
7,ponctualite-mensuelle-transilien,2020-02-01,TRA_10,N,Paris Montparnasse,11.7,92.125579,Transilien,2020-03-26T08:36:21.479000+00:00,734bf9691277c2358fddbd6989be12d6bda70e64
8,ponctualite-mensuelle-transilien,2020-02-01,TRA_12,R,Paris Sud Est,4.2,80.723333,Transilien,2020-03-26T08:36:21.479000+00:00,87efde538b409fb86d7c9539c1603d03f39ef636
9,ponctualite-mensuelle-transilien,2020-02-01,TRA_13,U,La Verrière - La Défense,3.7,78.641513,Transilien,2020-03-26T08:36:21.479000+00:00,16d750296f81ed1537d168bbd8dc1db858884933


In [35]:
import matplotlib.pyplot as plt
ligneN = dataSet[dataSet["fields.ligne"] == "N"]
plt.plot(ligneN['fields.date'], ligneN['fields.ponctualite'])
plt.show()


To register the converters:
	>>> from pandas.plotting import register_matplotlib_converters
	>>> register_matplotlib_converters()


<Figure size 640x480 with 1 Axes>

In [36]:
ligneN

Unnamed: 0,datasetid,fields.date,fields.id,fields.ligne,fields.nom_de_la_ligne,fields.nombre_de_voyageurs_a_l_heure_pour_un_voyageur_en_retard,fields.ponctualite,fields.service,record_timestamp,recordid
7,ponctualite-mensuelle-transilien,2020-02-01,TRA_10,N,Paris Montparnasse,11.7,92.125579,Transilien,2020-03-26T08:36:21.479000+00:00,734bf9691277c2358fddbd6989be12d6bda70e64
25,ponctualite-mensuelle-transilien,2019-11-01,TRA_10,N,Paris Montparnasse,10.4,91.196207,Transilien,2020-03-26T08:36:21.479000+00:00,5ac16dcf56540d662228062721f10ec55f573372
36,ponctualite-mensuelle-transilien,2019-10-01,TRA_10,N,Paris Montparnasse,7.2,87.7447,Transilien,2020-03-26T08:36:21.479000+00:00,73a61567facf6f9ea3492a8e1f75c5013eda19c2
48,ponctualite-mensuelle-transilien,2019-09-01,TRA_10,N,Paris Montparnasse,13.7,93.200408,Transilien,2020-03-26T08:36:21.479000+00:00,f4651b95f2321e8edda2225c2a6a4f97120d263a
53,ponctualite-mensuelle-transilien,2019-08-01,TRA_10,N,Paris Montparnasse,20.1,95.268348,Transilien,2020-03-26T08:36:21.479000+00:00,4309f58c93e44bc400a798c4df22d77ad697bc2b
65,ponctualite-mensuelle-transilien,2019-07-01,TRA_10,N,Paris Montparnasse,12.2,92.4517,Transilien,2020-03-26T08:36:21.479000+00:00,92a279af53854fe2b4e5365292a8112992e3c747
90,ponctualite-mensuelle-transilien,2019-06-01,TRA_10,N,Paris Montparnasse,12.2,92.417499,Transilien,2020-03-26T08:36:21.479000+00:00,7021a0ea33d82c1b621ad125695b26836ffa4c0b
95,ponctualite-mensuelle-transilien,2019-05-01,TRA_10,N,Paris Montparnasse,15.9,94.098834,Transilien,2020-03-26T08:36:21.479000+00:00,964c508d377800fd030f3b9a3a955523cfe9870d


<h2> 4- Authentification sur une API </h2>

<h3> 4.1- Exemple sur notre compte Github  </h3>

Utiliser une clé token pour se connecter sur notre compte github

In [37]:
import requests
# Création dictionnaire contenant le token
headers= {"Authorization":"token e3f2a1652a3fa882951e38e90966131c3810a2cd"}
response = requests.get("http://api.github.com/users/guimeto", 
                       headers=headers)
data = json.loads(response.content)
data

{'login': 'guimeto',
 'id': 33063781,
 'node_id': 'MDQ6VXNlcjMzMDYzNzgx',
 'avatar_url': 'https://avatars3.githubusercontent.com/u/33063781?v=4',
 'gravatar_id': '',
 'url': 'https://api.github.com/users/guimeto',
 'html_url': 'https://github.com/guimeto',
 'followers_url': 'https://api.github.com/users/guimeto/followers',
 'following_url': 'https://api.github.com/users/guimeto/following{/other_user}',
 'gists_url': 'https://api.github.com/users/guimeto/gists{/gist_id}',
 'starred_url': 'https://api.github.com/users/guimeto/starred{/owner}{/repo}',
 'subscriptions_url': 'https://api.github.com/users/guimeto/subscriptions',
 'organizations_url': 'https://api.github.com/users/guimeto/orgs',
 'repos_url': 'https://api.github.com/users/guimeto/repos',
 'events_url': 'https://api.github.com/users/guimeto/events{/privacy}',
 'received_events_url': 'https://api.github.com/users/guimeto/received_events',
 'type': 'User',
 'site_admin': False,
 'name': 'Guillaume Dueymes',
 'company': 'UQAM',
 

<h3> 4.1.1- Requête POST pour créer un objet   </h3>

Créer un objet sur le serveur API. On va l'utiliser pour créer un repertoire sur notre github.
Pour cela on va utiliser un dictionnaire 

payload = {"name":"test", "description":"ceci est la descroption du repository"}
 
requests.post("https://api.github.com/users/repos", json = payLoad)

In [38]:
import requests
payload ={"name": "api-test"}

response = requests.post("https://api.github.com/user/repos", json = payload, 
                       headers=headers)
status = response.status_code
print(status)

201


<h3> 4.1.2- Requête PATCH/PUT pour mettre à jour  un objet   </h3>

- patch pour modifier un objet de notre repertoire
- put changer complètement l objet

In [39]:
payload = {"name": "api","description":"formation udemy"}

response = requests.patch("https://api.github.com/repos/guimeto/api-test", 
                        json = payload, headers=headers)

status = response.status_code

print(status)

200


<h3> 4.1.3- Requête Delete pour supprimer un objet   </h3>

- requête qui permet de supprimer un objet du serveur 

In [40]:
response = requests.delete("https://api.github.com/repos/guimeto/api-test",headers=headers)
status = response.status_code
print(status)

204


<h3> 4.2- Authentification à l'API Reddit  </h3>

https://www.reddit.com/ 

L'objectif de ce cas pratique est d'explorer l'API de Reddit. 

In [41]:
import requests
import requests.auth

On utilise la méthode HTTPBasicAuth de la librairie requests.auth pour ajouter les identifiants de notre script

- JSON pour JavaScript Object Notation est un format léger permettant de stocker et véhiculer des données. Souvent utilisé lorsque de la donnée est envoyée d'un serveur vers une page web.

- headers est un paramètre d'en-tête de l'API qui fournit des informations à l'API. En gros ce sont les méta-données associées.

- params est la variable des paramètres, détermine le type d'action ou de données que vous voulez pour l'API, chaque paramètre a un nom, une valeur, etc..


In [42]:
client_auth = requests.auth.HTTPBasicAuth('dfFles6s7uYTsA','YYSza1ZRnt-Y7dv6ZwGw8hPMkV0') 

# on ajoute l'identifiant et le mot de pass de notre compte Reddit
post_data = {"grant_type":"password","username":"guimeto","password":"Timili2020!"}

headers = {'User-agent':'Formation API'} # Ajout d'un nom pour l'identification

response = requests.post("https://www.reddit.com/api/v1/access_token", auth=client_auth, data=post_data,
                        headers=headers)        # On génère un token avec tous les infos précédentes
response.json()

{'access_token': '22219994584-YL3uF4iiv6BQtj3bog5khmYdehU',
 'token_type': 'bearer',
 'expires_in': 3600,
 'scope': '*'}

In [43]:
headers = {"authorization":"bearer 22219994584-cKbZX-DCkx8_fgsl2Un5d4O4Mxo", "User-agent":"Formation API"}

params = {"t":"day"}                                    # parametre pour filtrer le dernier jour


# requete get avec les parametres headers et params
response = requests.get("https://oauth.reddit.com/r/python/top", 
                        headers=headers, params=params) # on selectionne les commentaires python les plus polpulaires

python_top=response.json()
print(python_top)

{'kind': 'Listing', 'data': {'modhash': None, 'dist': 25, 'children': [{'kind': 't3', 'data': {'approved_at_utc': None, 'subreddit': 'Python', 'selftext': '', 'author_fullname': 't2_1dz2epbq', 'saved': False, 'mod_reason_title': None, 'gilded': 0, 'clicked': False, 'title': "Wrote a script that downloads r/wallpaper's hottest 100 images and cycles through them as a wallpaper!", 'link_flair_richtext': [], 'subreddit_name_prefixed': 'r/Python', 'hidden': False, 'pwls': 6, 'link_flair_css_class': 'made-this', 'downs': 0, 'top_awarded_type': None, 'hide_score': False, 'name': 't3_hei6kg', 'quarantine': False, 'link_flair_text_color': 'dark', 'upvote_ratio': 0.98, 'author_flair_background_color': None, 'subreddit_type': 'public', 'ups': 1194, 'total_awards_received': 0, 'media_embed': {}, 'author_flair_template_id': None, 'is_original_content': False, 'user_reports': [], 'secure_media': {'reddit_video': {'fallback_url': 'https://v.redd.it/pxn50vuyvo651/DASH_720?source=fallback', 'height': 7

<h3> 4.2.1- Obtenir le post avec le plus de votes  </h3>

Nous avons extrait précédemment un dictionnaire concernant tous les derniers posts sur Python. 

In [44]:
python_top['data']['children']

[{'kind': 't3',
  'data': {'approved_at_utc': None,
   'subreddit': 'Python',
   'selftext': '',
   'author_fullname': 't2_1dz2epbq',
   'saved': False,
   'mod_reason_title': None,
   'gilded': 0,
   'clicked': False,
   'title': "Wrote a script that downloads r/wallpaper's hottest 100 images and cycles through them as a wallpaper!",
   'link_flair_richtext': [],
   'subreddit_name_prefixed': 'r/Python',
   'hidden': False,
   'pwls': 6,
   'link_flair_css_class': 'made-this',
   'downs': 0,
   'top_awarded_type': None,
   'hide_score': False,
   'name': 't3_hei6kg',
   'quarantine': False,
   'link_flair_text_color': 'dark',
   'upvote_ratio': 0.98,
   'author_flair_background_color': None,
   'subreddit_type': 'public',
   'ups': 1194,
   'total_awards_received': 0,
   'media_embed': {},
   'author_flair_template_id': None,
   'is_original_content': False,
   'user_reports': [],
   'secure_media': {'reddit_video': {'fallback_url': 'https://v.redd.it/pxn50vuyvo651/DASH_720?source=fal

On va créer une boucle qui va parcourir la liste précédente pour trouver la maximum de ups

In [45]:
# on cherche l article id avec le plus de ups
python_top_articles = python_top['data']['children']
most_upvoted = ""
most_upvotes = 0 
for article in python_top_articles:
    ar = article['data']
    if ar["ups"] >= most_upvotes:
        most_upvoted = ar["id"]
        most_upvotes = ar["ups"]

- Voici le nombre de votes maximals pour un article: 

In [46]:
print(most_upvotes) # le plus de votes 

1194


- Voici l'article correspondant au maximum de votes: 

In [47]:
print(most_upvoted) # article correspondant

hei6kg


<h3> 4.2.2- Obtenir les commentaires du post ayant le plus de vote  </h3>

- chemin accès: /r/{subreddit}/comments/{article}  ici subreddit c est python 
https://www.reddit.com/r/Python/comments/hei6kg/

In [48]:
response = requests.get("https://oauth.reddit.com/r/Python/comments/hei6kg/", 
                        headers=headers) # on selection les commentaires python les plus polpulaires
comments=response.json()
print(comments)

[{'kind': 'Listing', 'data': {'modhash': None, 'dist': 1, 'children': [{'kind': 't3', 'data': {'approved_at_utc': None, 'subreddit': 'Python', 'selftext': '', 'user_reports': [], 'saved': False, 'mod_reason_title': None, 'gilded': 0, 'clicked': False, 'title': "Wrote a script that downloads r/wallpaper's hottest 100 images and cycles through them as a wallpaper!", 'link_flair_richtext': [], 'subreddit_name_prefixed': 'r/Python', 'hidden': False, 'pwls': 6, 'link_flair_css_class': 'made-this', 'downs': 0, 'top_awarded_type': None, 'parent_whitelist_status': 'all_ads', 'hide_score': False, 'name': 't3_hei6kg', 'quarantine': False, 'link_flair_text_color': 'dark', 'upvote_ratio': 0.98, 'author_flair_background_color': None, 'subreddit_type': 'public', 'ups': 1192, 'total_awards_received': 0, 'media_embed': {}, 'author_flair_template_id': None, 'is_original_content': False, 'author_fullname': 't2_1dz2epbq', 'secure_media': {'reddit_video': {'fallback_url': 'https://v.redd.it/pxn50vuyvo651/

In [49]:
## Extraire le commentaire le plus populaire

In [50]:
comments[1]['data']['children']

[{'kind': 't1',
  'data': {'total_awards_received': 0,
   'approved_at_utc': None,
   'ups': 49,
   'awarders': [],
   'mod_reason_by': None,
   'banned_by': None,
   'author_flair_type': 'text',
   'removal_reason': None,
   'link_id': 't3_hei6kg',
   'author_flair_template_id': None,
   'likes': None,
   'replies': '',
   'user_reports': [],
   'saved': False,
   'id': 'fvrducb',
   'banned_at_utc': None,
   'mod_reason_title': None,
   'gilded': 0,
   'archived': False,
   'no_follow': False,
   'author': '_Red-Riot_',
   'can_mod_post': False,
   'send_replies': True,
   'parent_id': 't3_hei6kg',
   'score': 49,
   'author_fullname': 't2_4e3nvcob',
   'report_reasons': None,
   'approved_by': None,
   'all_awardings': [],
   'subreddit_id': 't5_2qh0y',
   'body': 'Woaaaaah, amazing. I love that my wallpaper changes so this is great',
   'edited': False,
   'downs': 0,
   'author_flair_css_class': None,
   'is_submitter': False,
   'collapsed': False,
   'author_flair_richtext': [],

In [51]:
# on cherche le commentaire avec le plus de votes
python_top_comments = comments[1]['data']['children']
most_upvoted_comment = ""
most_upvotes_comment = 0 
for comment in python_top_comments:
    ar = comment['data']
    if ar["ups"] >= most_upvotes_comment:
        most_upvoted_comment = ar["id"]
        most_upvotes_comment
        
print(most_upvotes_comment)
print(most_upvoted_comment)

0
fvs5s9c
