# Annotation

## 1- présentation du package pigeon

Pigeon est un widget simple qui vous permet d'annoter rapidement un ensemble de données d'exemples non étiquetés dans votre bloc-notes Jupyter.

Pigeon prend actuellement en charge les annotations pour les tâches de classification (ensemble d'étiquettes), les tâches de régression (int/float range) ou les tâches de sous-titrage (texte de longueur variable). Tout ce qui peut être affiché sur Jupyter (texte, images, audio, graphiques, etc.) peut être affiché par pigeon en fournissant l'argument approprié.

In [44]:
## installation du package pigeon
#!pip install pigeon-jupyter
#!pip install google_play_scraper
from pigeon import annotate

In [45]:
## installation des packages
import pandas as pd
import logging
from google_play_scraper import Sort, reviews_all

In [46]:
pd.options.mode.chained_assignment =None
pd.set_option('display.max_rows',4000)
pd.set_option('display.max_columns',None)

## 2- Jeu de données

Le jeu de données porte sur les avis des clients de MTN

In [47]:
# scraping des jeux de données
def avis_app_(url) -> pd.DataFrame:
    """
    scrappe les avis laissés 
    sur le site de cette url
    """
    try:
        avis = reviews_all(url,
                           sleep_milliseconds=0,  # par défaut à 0
                           lang='fr',  # par défaut à 'en'
                           country='cm',  # par défaut à 'us'
                           sort=Sort.MOST_RELEVANT,  # par défaut sur Sort.MOST_RELEVANT
                           filter_score_with=None  # par défaut sur Aucun (signifie tous les scores)
                           )
        data_avis_app_ = pd.DataFrame.from_records(avis)
        return data_avis_app_
    except Exception as e:
        logging.error("Scrapping avis_app_ ERROR:  : {}".format(e))
        raise e

In [48]:
URL_MTN = 'com.mtn1app'
data_avis_mtn = avis_app_(URL_MTN)
data_avis_mtn.head(2)

Unnamed: 0,reviewId,userName,userImage,content,score,thumbsUpCount,reviewCreatedVersion,at,replyContent,repliedAt
0,gp:AOqpTOHkLT8cSu4Z9ILCg7Di-xP_baWiz7fweJhSLvw...,koyine ka,https://play-lh.googleusercontent.com/a-/AOh14...,"C'est une honte pour MTN, la quasi-totalité de...",1,43,3.0.4,2022-02-28 20:01:58,,
1,gp:AOqpTOFIN9_J9F0dg-f9uNd_sW08AUxTxfr27XXNSOL...,Cléopas KOTIN,https://play-lh.googleusercontent.com/a-/AOh14...,Impossible de me connecter pour faire mes tran...,1,24,3.0.4,2022-03-08 06:22:04,,


## Présention de quelques avis

In [49]:
data_avis_mtn["content"][0]

"C'est une honte pour MTN, la quasi-totalité des APPLIS & SERVICES MTN ne fonctionne plus, si vous ne pouvez plus vous adaptés alors vendez l'entreprise à des gens qui ont la capacité de fournir a ces clients des services qui fonctionne"

In [50]:
data_avis_mtn["content"][1]

"Impossible de me connecter pour faire mes transactions Momo normalement. Redirigé sur MTN Momo, tout aussi Nul. *Décommande l'appli"

In [51]:
data_avis_mtn["content"][2]

'Je le désinstalle en même temps. Très nul'

## Annotation des avis

In [52]:
annotations_avis = annotate(
  examples = list(data_avis_mtn.content),
  options=['positive', 'negative', 'neutre']
)

HTML(value='0 examples annotated, 3861 examples left')

HBox(children=(Button(description='positive', style=ButtonStyle()), Button(description='negative', style=Butto…

Output()

In [53]:
annotations_avis

[("C'est une honte pour MTN, la quasi-totalité des APPLIS & SERVICES MTN ne fonctionne plus, si vous ne pouvez plus vous adaptés alors vendez l'entreprise à des gens qui ont la capacité de fournir a ces clients des services qui fonctionne",
  'negative'),
 ("Impossible de me connecter pour faire mes transactions Momo normalement. Redirigé sur MTN Momo, tout aussi Nul. *Décommande l'appli",
  'negative'),
 ('Je le désinstalle en même temps. Très nul', 'negative'),
 ("L'application est assez top, mais ne peut être utilisée que si on possède un forfait internet ce qui n'est pas cool vu que ces services sont supposés être gratuits. Chez le concurrent il suffit juste d'activer les données mobile pour y avoir accès pas besoin de forfait internet. Merci de revoir cela encore please 🙏",
  'positive'),
 ("Pratique l'application, nous louons vos efforts. Mais elle reste à améliorer. Par exemple il n'est pas possible de balancer d'un numéro à un autre pour ceux qui ont un portable double sim (2 s

In [54]:
df = pd.DataFrame(annotations_avis, columns = ["content", "annotation"])
df.head()

Unnamed: 0,content,annotation
0,"C'est une honte pour MTN, la quasi-totalité de...",negative
1,Impossible de me connecter pour faire mes tran...,negative
2,Je le désinstalle en même temps. Très nul,negative
3,"L'application est assez top, mais ne peut être...",positive
4,"Pratique l'application, nous louons vos effort...",neutre


In [55]:
df

Unnamed: 0,content,annotation
0,"C'est une honte pour MTN, la quasi-totalité de...",negative
1,Impossible de me connecter pour faire mes tran...,negative
2,Je le désinstalle en même temps. Très nul,negative
3,"L'application est assez top, mais ne peut être...",positive
4,"Pratique l'application, nous louons vos effort...",neutre
5,Avant j'utilisais bien cet appli. Aujourd'hui ...,positive
6,L'application est un bon début et reste perfec...,neutre
7,Bonsoir MTN J'ai passé une commande d'un route...,negative
8,J'utilise l'application chaque et je suis sati...,positive
9,Une très belle application. Mais assez d'insuf...,neutre


## Autres exemples 

In [56]:
from IPython.display import display, Image
annotations = annotate(
  ['image1.jpg', 'image2.jpg', "image3.jpg"],
  options=['cat', 'lion', 'dog'],
  display_fn=lambda filename: display(Image(filename))
)

HTML(value='0 examples annotated, 4 examples left')

HBox(children=(Button(description='cat', style=ButtonStyle()), Button(description='lion', style=ButtonStyle())…

Output()

Annotation done.


In [57]:
annotations

[('image1.jpg', 'cat'), ('image2.jpg', 'dog'), ('image3.jpg', 'lion')]

In [58]:
?annotate