# Exploration des données forums de la France Insoumise

Nous utiliserons le package python [pandas](https://pandas.pydata.org/) pour manipuler les données.

Les fichiers `csv` sont dispos dans le drive de datapol (voire doc « table des données »). Par commodité nous avons converti les données en dataframe pandas et exporté le tout en dump pickle.

## Prise en main 

Commençons par charger les données en mémoire dans un dataframe.

In [None]:
import pandas as pd
import pandas_fi

from IPython.display import display, HTML

df = pd.read_pickle('pickle_pandas_fi.bz', 'bz2')
#ou si vous avez les fichiers csv
#df = pandas_fi.load_data('./csv')
df[:10] #les 10 premières lignes — attention pas dans l'ordre chronologique

Pour améliorer l'affichage on peut sélectionner les colonnes à afficher.
Que la colonne 'content' par exemple.

In [None]:
df.content[:10]

Ou 'date', 'content' et 'file'.

Cette fois on va trier les données par date. Et on va en profiter pour ajuster la largeur des colonnes.

In [None]:
pd.set_option('display.max_colwidth', 200)
df_sorted = pandas_fi.date_sort(df)
df_sorted[['date', 'content', 'file']][:10]

On peut aussi soigner l'affichage avec display

In [None]:
display(df)

## Tri sur le contenu

La fonction `pandas_fi.regex_filter` va nous permettre de chercher un motif dans le contenu des posts.

Ici les "flexions" de "stenchon", avec malheureusement le bruit lié aux URL.

In [10]:
pd.set_option('display.max_colwidth', 200)
res = pandas_fi.regex_filter(df, 'stenchon\w+\W')
display(pandas_fi.date_sort(res)[['date', 'content', 'file']])

Unnamed: 0,date,content,file
700376,2016-11-22,YES=OUI CANCHON !!! https://image.noelshack.com/minis/2016/47/1479834384-cantstenchonthemelenchon.png,jvc.csv
696634,2016-11-29,MÉLENCHON a commenté la vidéo de MisterJday https://www.youtube.com/watch?v=RbmQMM7nZkc&feature=youtu.be Regardez http://image.jeuxvideo.com/smileys_img/4.gif https://image.noelshack.com/minis/20...,jvc.csv
694349,2016-11-30,Trop de stenchonneries On arrête de stenchon svp,jvc.csv
692399,2016-12-02,Les idiots utiles du Stenchonisme http://image.jeuxvideo.com/smileys_img/39.gif Ils se sont fait stenchoned en beauté http://jv.stkr.fr/p/st/1jnc,jvc.csv
684145,2016-12-11,"Bon les kheys, je termine ma journée spéciale montages crétins par un joli wallpaper full HD rien que pour vos beaux yeux : https://image.noelshack.com/minis/2016/49/1481414525-the-unstenchonable...",jvc.csv
684127,2016-12-11,Message à caractère informatif. Les stickers info / anti hoax : https://image.noelshack.com/minis/2016/47/1479686838-l-europe.png https://image.noelshack.com/minis/2016/47/1479685739-candidat-100...,jvc.csv
684102,2016-12-11,Ce talent https://image.noelshack.com/minis/2016/49/1481414525-the-unstenchonables.png http://jv.stkr.fr/p/st/1jne,jvc.csv
682979,2016-12-12,"Putain, on vient de me signaler que mon joli montage a été utilisé par un fanasciste (C’est un concept à moi, ça dénonce à la fois les fascistes et les fanatiques). https://image.noelshack.com/mi...",jvc.csv
682867,2016-12-12,"tronchedemoine qui vient désormais tous les soirs prendre sa dose quotidienne de baffes. https://image.noelshack.com/minis/2016/45/1478828676-melenchon.png Tous les complotards, les p'tits bras, ...",jvc.csv
682710,2016-12-13,Les unstenchonables c'est quand même une sacrée perle. On a atteint un niveau de meme inégalé. Je sais qu'un meme a déjà été élu président des États-Unis mais je commence de plus en plus à penser...,jvc.csv
