# Annotation

## 1- pr√©sentation du package pigeon

Pigeon est un widget simple qui vous permet d'annoter rapidement un ensemble de donn√©es d'exemples non √©tiquet√©s dans votre bloc-notes Jupyter.

Pigeon prend actuellement en charge les annotations pour les t√¢ches de classification (ensemble d'√©tiquettes), les t√¢ches de r√©gression (int/float range) ou les t√¢ches de sous-titrage (texte de longueur variable). Tout ce qui peut √™tre affich√© sur Jupyter (texte, images, audio, graphiques, etc.) peut √™tre affich√© par pigeon en fournissant l'argument appropri√©.

In [44]:
## installation du package pigeon
#!pip install pigeon-jupyter
#!pip install google_play_scraper
from pigeon import annotate

In [45]:
## installation des packages
import pandas as pd
import logging
from google_play_scraper import Sort, reviews_all

In [46]:
pd.options.mode.chained_assignment =None
pd.set_option('display.max_rows',4000)
pd.set_option('display.max_columns',None)

## 2- Jeu de donn√©es

Le jeu de donn√©es porte sur les avis des clients de MTN

In [47]:
# scraping des jeux de donn√©es
def avis_app_(url) -> pd.DataFrame:
    """
    scrappe les avis laiss√©s 
    sur le site de cette url
    """
    try:
        avis = reviews_all(url,
                           sleep_milliseconds=0,  # par d√©faut √† 0
                           lang='fr',  # par d√©faut √† 'en'
                           country='cm',  # par d√©faut √† 'us'
                           sort=Sort.MOST_RELEVANT,  # par d√©faut sur Sort.MOST_RELEVANT
                           filter_score_with=None  # par d√©faut sur Aucun (signifie tous les scores)
                           )
        data_avis_app_ = pd.DataFrame.from_records(avis)
        return data_avis_app_
    except Exception as e:
        logging.error("Scrapping avis_app_ ERROR:  : {}".format(e))
        raise e

In [48]:
URL_MTN = 'com.mtn1app'
data_avis_mtn = avis_app_(URL_MTN)
data_avis_mtn.head(2)

Unnamed: 0,reviewId,userName,userImage,content,score,thumbsUpCount,reviewCreatedVersion,at,replyContent,repliedAt
0,gp:AOqpTOHkLT8cSu4Z9ILCg7Di-xP_baWiz7fweJhSLvw...,koyine ka,https://play-lh.googleusercontent.com/a-/AOh14...,"C'est une honte pour MTN, la quasi-totalit√© de...",1,43,3.0.4,2022-02-28 20:01:58,,
1,gp:AOqpTOFIN9_J9F0dg-f9uNd_sW08AUxTxfr27XXNSOL...,Cl√©opas KOTIN,https://play-lh.googleusercontent.com/a-/AOh14...,Impossible de me connecter pour faire mes tran...,1,24,3.0.4,2022-03-08 06:22:04,,


## Pr√©sention de quelques avis

In [49]:
data_avis_mtn["content"][0]

"C'est une honte pour MTN, la quasi-totalit√© des APPLIS & SERVICES MTN ne fonctionne plus, si vous ne pouvez plus vous adapt√©s alors vendez l'entreprise √† des gens qui ont la capacit√© de fournir a ces clients des services qui fonctionne"

In [50]:
data_avis_mtn["content"][1]

"Impossible de me connecter pour faire mes transactions Momo normalement. Redirig√© sur MTN Momo, tout aussi Nul. *D√©commande l'appli"

In [51]:
data_avis_mtn["content"][2]

'Je le d√©sinstalle en m√™me temps. Tr√®s nul'

## Annotation des avis

In [52]:
annotations_avis = annotate(
  examples = list(data_avis_mtn.content),
  options=['positive', 'negative', 'neutre']
)

HTML(value='0 examples annotated, 3861 examples left')

HBox(children=(Button(description='positive', style=ButtonStyle()), Button(description='negative', style=Butto‚Ä¶

Output()

In [53]:
annotations_avis

[("C'est une honte pour MTN, la quasi-totalit√© des APPLIS & SERVICES MTN ne fonctionne plus, si vous ne pouvez plus vous adapt√©s alors vendez l'entreprise √† des gens qui ont la capacit√© de fournir a ces clients des services qui fonctionne",
  'negative'),
 ("Impossible de me connecter pour faire mes transactions Momo normalement. Redirig√© sur MTN Momo, tout aussi Nul. *D√©commande l'appli",
  'negative'),
 ('Je le d√©sinstalle en m√™me temps. Tr√®s nul', 'negative'),
 ("L'application est assez top, mais ne peut √™tre utilis√©e que si on poss√®de un forfait internet ce qui n'est pas cool vu que ces services sont suppos√©s √™tre gratuits. Chez le concurrent il suffit juste d'activer les donn√©es mobile pour y avoir acc√®s pas besoin de forfait internet. Merci de revoir cela encore please üôè",
  'positive'),
 ("Pratique l'application, nous louons vos efforts. Mais elle reste √† am√©liorer. Par exemple il n'est pas possible de balancer d'un num√©ro √† un autre pour ceux qui ont un p

In [54]:
df = pd.DataFrame(annotations_avis, columns = ["content", "annotation"])
df.head()

Unnamed: 0,content,annotation
0,"C'est une honte pour MTN, la quasi-totalit√© de...",negative
1,Impossible de me connecter pour faire mes tran...,negative
2,Je le d√©sinstalle en m√™me temps. Tr√®s nul,negative
3,"L'application est assez top, mais ne peut √™tre...",positive
4,"Pratique l'application, nous louons vos effort...",neutre


In [55]:
df

Unnamed: 0,content,annotation
0,"C'est une honte pour MTN, la quasi-totalit√© de...",negative
1,Impossible de me connecter pour faire mes tran...,negative
2,Je le d√©sinstalle en m√™me temps. Tr√®s nul,negative
3,"L'application est assez top, mais ne peut √™tre...",positive
4,"Pratique l'application, nous louons vos effort...",neutre
5,Avant j'utilisais bien cet appli. Aujourd'hui ...,positive
6,L'application est un bon d√©but et reste perfec...,neutre
7,Bonsoir MTN J'ai pass√© une commande d'un route...,negative
8,J'utilise l'application chaque et je suis sati...,positive
9,Une tr√®s belle application. Mais assez d'insuf...,neutre


## Autres exemples 

In [56]:
from IPython.display import display, Image
annotations = annotate(
  ['image1.jpg', 'image2.jpg', "image3.jpg"],
  options=['cat', 'lion', 'dog'],
  display_fn=lambda filename: display(Image(filename))
)

HTML(value='0 examples annotated, 4 examples left')

HBox(children=(Button(description='cat', style=ButtonStyle()), Button(description='lion', style=ButtonStyle())‚Ä¶

Output()

Annotation done.


In [57]:
annotations

[('image1.jpg', 'cat'), ('image2.jpg', 'dog'), ('image3.jpg', 'lion')]

In [58]:
?annotate