In [8]:
#! pip install pyensae

# Récupération des données : connexion à l'API Pocket

D'abord il faut s'[authentifier](https://getpocket.com/developer/docs/authentication)

Protocole utilisé ici : [OAUTH2](https://tools.ietf.org/html/rfc6749) (très classique). 

<img src="./screen_oauth2.png"/>

6 étapes donc avant d'avoir le droit de récupérer les données. Souvent, il existe une librairie python. C'est notre cas : https://github.com/rakanalh/pocket-api.

In [11]:
! pip install pocket

Collecting pocket
  Downloading pocket-0.3.6.zip
Building wheels for collected packages: pocket
  Running setup.py bdist_wheel for pocket ... [?25l- done
[?25h  Stored in directory: /home/athean/.cache/pip/wheels/a2/18/f6/b62078897287ce7a098f848b34e9b077fff2e8614b215226a6
Successfully built pocket
Installing collected packages: pocket
Successfully installed pocket-0.3.6


### Etape 0 : Récupérer un "consumer_key"

On l'a fait pour vous. Normalement, c'est ici que cela se passe : https://getpocket.com/developer/apps/new

In [63]:
CONSUMER_KEY = "71238-e0134275725b685b40df1383"

### Etape 1 : Obtenir un code d'authorisation => get_request_token

In [64]:
import pocket
from pocket import Pocket

REDIRECT_URI = "http://localhost:8888/notebooks/M%C3%A9thodes%20de%20traitement%20des%20donn%C3%A9es%20textuelles.ipynb"
REQUEST_TOKEN = Pocket.get_request_token(consumer_key=CONSUMER_KEY, redirect_uri=REDIRECT_URI)
print(request_token)

00588893-4723-424c-33a1-3bcfd2


### Etape 2: Authoriser l'accès

In [67]:
url = "https://getpocket.com/auth/authorize?request_token={0}&redirect_uri={1}".format(REQUEST_TOKEN, REDIRECT_URI)
print("Aller à l'url : \n" + url)

Aller à l'url : 
https://getpocket.com/auth/authorize?request_token=bc7fc7cb-5b5b-5c54-2181-dc13b4&redirect_uri=http://localhost:8888/notebooks/M%C3%A9thodes%20de%20traitement%20des%20donn%C3%A9es%20textuelles.ipynb


In [58]:
import sys, os, subprocess

if sys.platform=='win32':
    os.startfile(url)
elif sys.platform=='darwin':
    subprocess.Popen(['open', url])
else:
    try:
        subprocess.Popen(['xdg-open', url])
    except OSError:
        print('Please open a browser on: ' + url)

### Etape 3: Récupérer le token d'accès

In [68]:
USER_CREDENTIALS = Pocket.get_credentials(consumer_key=CONSUMER_KEY, code=REQUEST_TOKEN)
print(USER_CREDENTIALS)

{'username': 'elodie.royant@tagerstreet.com', 'access_token': 'caa5c4fb-9b2c-d9b8-0da9-630e35'}


In [70]:
ACCESS_TOKEN = user_credentials['access_token']
print(ACCESS_TOKEN)

caa5c4fb-9b2c-d9b8-0da9-630e35


### Etape 4: Récupérer les données

In [71]:
pocket_instance = pocket.Pocket(CONSUMER_KEY, ACCESS_TOKEN)

<pocket.Pocket at 0x7fbac5741e10>

In [72]:
pocket_items = pocket_instance.get()

In [73]:
pocket_items

({'complete': 1,
  'error': None,
  'list': {'1003565100': {'excerpt': "Ionic est un framework qui va vous permettre de créer des applications mobiles en utilisant des technologies Web. Ionic se base pour cela sur d'autres frameworks / technologies qui ont fait leurs preuves.  Avant de pouvoir commencer, il nous faut évidemment commencer par installer l'outil.",
    'favorite': '0',
    'given_title': 'Tutoriel Vidéo Apache Cordova Ionic Framework',
    'given_url': 'https://www.grafikart.fr/tutoriels/cordova/ionic-framework-641',
    'has_image': '0',
    'has_video': '0',
    'is_article': '1',
    'is_index': '0',
    'item_id': '1003565100',
    'resolved_id': '1003565100',
    'resolved_title': 'Tutoriel Vidéo Apache CordovaIonic Framework',
    'resolved_url': 'https://www.grafikart.fr/tutoriels/cordova/ionic-framework-641',
    'sort_id': 389,
    'status': '0',
    'time_added': '1486852472',
    'time_favorited': '0',
    'time_read': '0',
    'time_updated': '1486852480',
   

# Traitement des données textuelles : expressions régulières

# Méthodes simples de classification automatique de documents : tf-idf

# Méthodes d'accélération de calcul : numba, cython

# Solutions de traitement de gros volumes de données: cytoolz, serialisation, dask

In [10]:
#Séance 5 : distinguer le type de texte en fonction des documents html => webscraping. API : créer sa propre api. A voir aussi : d'autres exemples d'API : se connecter à github. Se connecter à l'API SNCF. etc.'

In [None]:
#Séance 6 : 