![Callysto.ca Banner](https://github.com/callysto/curriculum-notebooks/blob/master/callysto-notebook-banner-top.jpg?raw=true)

# Les messages et l'inclusion<br><br>Pratiquer

Bienvenue à ce notebook Jupyter. Ce notebook est gratuit et fait partie de la collection de Callysto, un projet promouvant la science des données dans les salles de classe de la 5e à la 12e année.

Dans ce notebook, nous utiliserons le python pour réaliser les différentes étapes d'analyse des données afin d'interpréter les données et de les représenter par les visualisations. Le python est un langage de programmation qui nous permet de communiquer avec l'ordinateur. Le python contient la langue anglaise, mais la grammaire diffère considérablement.

## La démarche: les étapes d'analyses des données
1. **Questionner** - Formuler la question de recherche.
2. **Sélectionner** - Trouver les bibliothèques de python et les sources de données pour répondre à la question de recherche.
3. **Organiser** - Mettre en forme les données afin de les préparer pour l'exploration.
4. **Explorer** - Analyser les données et les représenter par les visualisations.
5. **Interpréter** - Expliquer les observations obtenues à partir des visualisations.
6. **Communiquer** - Tirer une conclusion à la question, basée sur l'interprétation des données.
<br><br>

## Questionner

Le but est de définir une communauté ou un endroit et de collecter des données sur les messages d'inclusion dans l'endroit.

✏️ Cliquez ici pour un espace pour formuler la(les) question(s) sur les messages. 






## Sélectionner

### Le chargement des bibliothèques

Les bibliothèques sont les outils qui permettent à manipuler plus facilement le langage de programmation python.

Vous trouverez les notes sur le code dans la cellule en italique vert après le `#`.

In [None]:
# Pour la manipulation de tableaux, importez la bibliothèque pandas sous l'alias pd
import pandas as pd

# Pour les visualisations, importez les bibliothèques plotly express sous l'alias px et plotly graph objects sous l'alias go
import plotly.express as px
import matplotlib.pyplot as plt

# Pour les nuage de mots
from wordcloud import WordCloud

# Tapez shift + return/enter pour charger les bibliothèques

## Organiser

✏️ Cliquez ici pour un espace pour définir les variables afin de répondre à votre question de recherche. 





Prenez des notes sur la collecte des données à la main, dans une feuille de calcul, ou même dans la cellule de code ci-dessous. 

Quand vous avez fini de collecter des données, essayez de les regrouper pour rendre l'analyse plus facile. Par exemple, nous pouvons regrouper un guichet automatique et un écran dans un nouveau groupe *électronique* pour le type de message. Ce regroupement nous donnera les fréquences plus élevées dans la colonne.

💻 Tapez les données pour créer l'ensemble de données `data` dans la cellule de code ci-dessous. Vous compterez vos observations sur les messages dans un tableau comme tel.

In [None]:
# Initialisez la liste. Mettez vos propres données
data = [
    ["1", "LRT", "mardi", "bienvenue", "multilingue", "un guichet automatique", "oui"],
    ["2", "LRT", "vendredi", "invitation", "l'anglais", "une affiche", "oui"],
    [" ", " ", " ", " ", " ", " ", " "],
    [" ", " ", " ", " ", " ", " ", " "],
    [" ", " ", " ", " ", " ", " ", " "]
]

# Créez le sous-ensemble de données. Mettez vos propres colonnes
df = pd.DataFrame(data, 
                  columns=["Observation", 
                           "Endroit", 
                           "Jour", 
                           "Message", 
                           "Langue(s)", 
                           "Type de message", 
                           "Inclusion"])

# Affichez le sous-ensemble de données
df

# Tapez shift + return/enter pour charger l'ensemble de données

In [None]:
# Si vous avez créé une feuille de calcul, téléversez le fichier dans le dossier `data` et importez votre fichier csv avec le code ci-dessous
#df = pd.read_csv('data/messages.csv')

## Explorer

💻 Commençons par visualiser les fréquences de l'ensemble de données dans un diagramme de catégories. Le diagramme représente les fréquences pour chaque variable catégorique (chaque colonne) et ses catégories. Lorsque l'ensemble de données ne contient que des mots, nous choisirons des diagrammes qui montra les fréquences de ces mots. Le diagramme de catégories est interactif, et vous pouvez déplacer les colonnes pour réorganiser vos données.

In [None]:
px.parallel_categories(df)

# Tapez shift + return/enter pour charger la cellule et afficher le diagramme

💻 Codons une carte thermique avec les fréquences de deux colonnes visées.

In [None]:
# Voici le code pour la définition des variables pour un carte thermique
px.density_heatmap(df, 
            x="Message", # Mettez une colonne pour l'axe des x
            marginal_x="histogram",
            y="Inclusion", # Mettez une colonne pour l'axe des y
            marginal_y="histogram",
            title=" ") # Ajoutez un titre pour le diagramme

# Tapez shift + return/enter pour charger la cellule et afficher le diagramme

💻 Créez un histogramme pour une variable dans la cellule de code ci-dessous.

In [None]:
px.histogram(df,
        x="Inclusion", # Changez les variables x
        title="") # Ajoutez un titre pour le diagramme

# Tapez shift + return/enter pour charger la cellule et afficher le diagramme   

## Interpréter

🔎 Quelles sont les tendances similaires et différentes?

🔎 Quels pourraient être les impacts à court et à long terme?

🔎 Comment pouvez-vous considérer les responsabilités individuelles et collectives?

## Communiquer

✏️ Cliquez ici pour un espace pour écrire une conclusion 







💻 Créez un nuage de mots dans la cellule de code ci-dessous pour exprimer vos idées.

In [None]:
# Initialisez la liste. Mettez vos propres données. 
# Si vous avez pris des notes sur les messages des observations, vous pouvez les incorporer ici.
# Décidez sur une échelle pour le sentiment 1 = un peu, 2 = pas mal, 3 = ni ici ni là, 4 = assez, 5 = beaucoup

texte = [
    ["1", "Bonjour", 3],
    ["2", "C'est beau!", 4],
    ["3", "C'est ça", 2],
    ["4", "Bilingue :)", 5],
    ["5", "Dommage", 1] # Ajoutez plus de données, si c'est nécessaire
]

# Créez le sous-ensemble de données. Mettez vos propres colonnes
texte = pd.DataFrame(texte, 
                  columns=["Observation", 
                           "Mots",
                          "Sentiment"])

# Affichez le sous-ensemble de données
texte

# Tapez shift + return/enter pour charger l'ensemble de donner

In [None]:
# Voici la définition de la variable `mots`
mots = texte.set_index("Mots")["Sentiment"].to_dict()

In [None]:
# Voici le code pour un nuage de mots

wc = WordCloud(background_color="white", # La couleur du fond d'image
               colormap="rainbow", # Spécifiez d'autres couleurs telles que "hot","Reds","rainbow"
              ) 
wc.fit_words(mots) # Voici l'affichage des mots de la variable `texte`
plt.imshow(wc) #  L'affichage des couleurs
plt.axis("off") # Les axes fermés

plt.title(" ") # Ajoutez un titre

plt.show() # L'affichage du nuage des mots

# La fin

[![Callysto.ca License](https://github.com/callysto/curriculum-notebooks/blob/master/callysto-notebook-banner-bottom.jpg?raw=true)](https://github.com/callysto/curriculum-notebooks/blob/master/LICENSE.md)