![Callysto.ca Banner](https://github.com/callysto/curriculum-notebooks/blob/master/callysto-notebook-banner-top.jpg?raw=true)

# Les messages d'exclusion<br><br>Les crimes haineux d√©clar√©es au Canada en 2020

Bienvenue √† ce notebook Jupyter. Ce notebook est gratuit et fait partie de la collection de Callysto, un projet promouvant la science des donn√©es dans les salles de classe de la 5e √† la 12e ann√©e.

Dans ce notebook, nous utiliserons le python pour r√©aliser les diff√©rentes √©tapes d'analyse des donn√©es afin d'interpr√©ter les donn√©es et de les repr√©senter par les visualisations. Le python est un langage de programmation qui nous permet de communiquer avec l'ordinateur. Le python contient la langue anglaise, mais la grammaire diff√®re consid√©rablement.

Pour d√©marrer le notebook et effectuer le code dans toutes les cellules, cliquez sur `Cell` dans le menu et s√©lectionnez `Run All`. Retournez en haut da la page apr√®s le chargement des cellules.

![instructions](https://github.com/callysto/data-viz-of-the-week/blob/main/images/instructions.png?raw=true)

Veuillez envoyer un courriel √† l'adresse contact@callysto.ca si vous rencontrez des probl√®mes avec le notebook.
<br><br>

## La d√©marche: les √©tapes d'analyses des donn√©es
1. **Questionner** - Formuler la question de recherche.
2. **S√©lectionner** - Trouver les biblioth√®ques de python et les sources de donn√©es pour r√©pondre √† la question de recherche.
3. **Organiser** - Mettre en forme les donn√©es afin de les pr√©parer pour l'exploration.
4. **Explorer** - Analyser les donn√©es et les repr√©senter par les visualisations.
5. **Interpr√©ter** - Expliquer les observations obtenues √† partir des visualisations.
6. **Communiquer** - Tirer une conclusion √† la question, bas√©e sur l'interpr√©tation des donn√©es.
<br><br>

## Questionner

**Comment d√©termine-t'on l'impact des messages sur les perceptions d'identit√©?**
<br><br>

## S√©lectionner

### Le chargement des biblioth√®ques

Les biblioth√®ques sont les outils qui permettent √† manipuler plus facilement le langage de programmation python.

Vous trouverez les notes sur le code dans la cellule en italique vert apr√®s le `#`.

In [None]:
# Pour la manipulation de tableaux, importez la biblioth√®que pandas sous l'alias pd
import pandas as pd

# Pour la manipulation de chiffres, importez la biblioth√®que numpy sous l'alias np
import numpy as np

# Pour les visualisations, importez la biblioth√®que plotly express sous l'alias px
import plotly.express as px

### La source de donn√©es

üìï 

[Licence du gouvernement ouvert ‚Äì Canada](https://ouvert.canada.ca/fr/licence-du-gouvernement-ouvert-canada)

Statistique Canada. (2023). Crimes haineux d√©clar√©s par la police, selon le type de motif, Canada (certains services de police). [Jeu de donn√©es 35-10-0066-01]. https://www150.statcan.gc.ca/t1/tbl1/fr/tv.action?pid=3510006601

Informations suppl√©mentaires : https://www150.statcan.gc.ca/n1/pub/85-002-x/2022001/article/00005-fra.htm
<br><br>

### Le chargement des donn√©es

Nous acc√©dons aux donn√©es en format csv (comma-separated values) et les chargeons avec la biblioth√®que pandas en utilisant la fonction `read_csv`.

Le fichier `2014-2020-langue-haine.csv` dans le dossier `data` rapporte les nombres et les pourcentages par l'ann√©e des crimes haineux rapport√©es au Canada selon le type de motif entre 2014 et 2020.

Nous chargeons l'ensemble de donn√©es dans la variable `data` et nous utilisons pandas sous l'alias `pd` pour lire √† travers la fonction `read_csv`.

In [None]:
# Pour le chargement de donn√©es en format csv, un format d√©limit√© par des virgules
data = pd.read_csv("data/2014-2020-langue-haine.csv")
data

L'ensemble de donn√©es `data` fait 414 lignes et 6 colonnes, ce qui fait 2 484 points de donn√©es.

## Organiser

üìï Revenons √† la question de recherche de l'impact des messages sur l'identit√©, il faut identifier et comprendre les variables li√©es afin d'organiser les donn√©es pour l'exploration.

Pour examiner l'impact des crimes haineux, nous viserons les types de motif afin de passer les variables repr√©sentantes de l'identit√© par ces motifs.

### La d√©fintion des crimes haineux du jeu de donn√©es

¬´ Un crime haineux d√©clar√© par la police est une infraction criminelle commise contre une personne ou un bien et motiv√©e par la haine de la race, de l‚Äôorigine nationale ou ethnique, de la langue, de la couleur, de la religion, du sexe, de l‚Äô√¢ge, de l‚Äôincapacit√© mentale ou physique, de l‚Äôorientation sexuelle, ou de l‚Äôidentit√© ou expression de genre, ou de tout autre facteur semblable. ¬ª

üîé Quels sont les impacts potentiels de la repr√©sentation des donn√©es de ces crimes?

D√©finissons les sous-ensembles de donn√©es pour chaque indicateur. 

Nous utilisons `df` pour d√©signer le sous-ensemble, ou le **d**ata**f**rame, suivant d'une description pour nous donner `df_langue_haine_crimes`, `df_langue_haine_race_2020`, et `df_langue_haine_2020`, `df_langue_haine_langue`, et `df_appartenance_Canada`. Cette pratique nous aiderons √† suivre tous les sous-ensembles ; les ensembles de donn√©es commencent avec `data`.

Nous d√©finissons les sous-ensembles par les param√®tres. Nous d√©finissons les param√®tres en limitant les donn√©es dans les colonnes avec les op√©rateurs:

| Op√©rateurs utilis√©s |   |
|---|---|
|==|est √©gal √†|
|!=|n'est pas √©gal √†|
|&|et|


#### Le sous-ensemble `df_langue_haine_crimes`

In [None]:
df_langue_haine_crimes = data.loc[lambda df: (df["P√âRIODE DE R√âF√âRENCE"]==2020) &(df["CAT√âGORIE"] != "Crimes") &(df["TYPE DE MOTIF"].isin(["Race ou origine ethnique", "Religion", "Orientation sexuelle", "Langue", "Incapacit√©", "Sex et genre", "√Çge" ,"Autre facteur semblable", "Motivation inconnue"]))];
df_langue_haine_crimes.head()

#### Le sous-ensemble `df_langue_haine_race_2020`

In [None]:
df_langue_haine_race_2020 = data.loc[lambda df: (df["P√âRIODE DE R√âF√âRENCE"]==2020) &(df["CAT√âGORIE"] == "Race ou origine ethnique") &(df["TYPE DE MOTIF"] != "Race ou origine ethnique")];
df_langue_haine_race_2020.head()

#### Le sous-ensemble `df_langue_haine_2020`

In [None]:
df_langue_haine_2020 = data.loc[lambda df: (df["P√âRIODE DE R√âF√âRENCE"]==2020) &(df["CAT√âGORIE"] == "Langue") &(df["TYPE DE MOTIF"] != "Langue")];
df_langue_haine_2020

#### Le sous-ensemble `df_langue_haine_langue`

In [None]:
df_langue_haine_langue = data.loc[lambda df: (df["CAT√âGORIE"].isin(["Langue"])) &(df["TYPE DE MOTIF"] != "Langue")];
df_langue_haine_langue.head()

#### Le sous-ensemble `df_langue_haine_langue_race`

In [None]:
df_langue_haine_langue_race = data.loc[lambda df: (df["CAT√âGORIE"].isin(["Langue", "Race ou origine ethnique"])) &(df["TYPE DE MOTIF"] != "Langue") &(df["TYPE DE MOTIF"] != "Race ou origine ethnique")];
df_langue_haine_langue_race.head()

## Explorer

### Crimes haineux au Canada en 2020

üìï Nous commen√ßons en situant la cat√©gorie Langue parmi les autres cat√©gories des crimes haineux d√©clar√©s par la police au Canada en 2020.

In [None]:
# Voici les mesures de tendances centrales pour le nombre des crimes haineux d√©clar√©s par la police au Canada en 2020
df_langue_haine_crimes["NOMBRE"].describe()

üîé Quelle est la moyenne? Quelle est la m√©diane?

üîé Quelles sont les valeurs minimum et maximum? Calculez l'√©tendue dans la cellule de code ci-dessous. Quel pourrait √™tre l'impact que repr√©sente l'√©tendue?

In [None]:
# Soustrayez la valeur maximum de la valeur minimum
10-4

In [None]:
data_crimes_bandes = px.bar(df_langue_haine_crimes, x="NOMBRE", 
                            y="CAT√âGORIE", barmode="group", 
                            title=" ", # Tapez un titre pour le diagramme entre les guillemets
                            color_discrete_sequence=px.colors.diverging.Portland)
data_crimes_bandes.update_layout(autosize=True, height=500)
data_crimes_bandes.update_layout(yaxis={"categoryorder":"total ascending"})
data_crimes_bandes.show()

üîé Quelles sont les cat√©gories qui sont plus de la m√©diane? O√π se situe la langue?

üîé Selon les donn√©es, comment est-ce les autres reconnaissent nos identit√©s?

üîé Quel titre donneriez-vous √† la visualisation? Que signifie votre titre?

In [None]:
data_crimes_bandes = px.bar(df_langue_haine_race_2020, x="NOMBRE", 
                            y="TYPE DE MOTIF", barmode="group", 
                            title="Crimes haineux au Canada contre la race ou l'origine ethnique en 2020", 
                            color_discrete_sequence=px.colors.diverging.Portland)
data_crimes_bandes.update_layout(autosize=True, height=500)
data_crimes_bandes.update_layout(yaxis={"categoryorder":"total ascending"})
data_crimes_bandes.show()

In [None]:
data_crimes_bandes = px.bar(df_langue_haine_2020, x="NOMBRE", 
                            y="TYPE DE MOTIF", 
                            barmode="group", 
                            title="Crimes haineux contre la langue au Canada en 2020", 
                            color_discrete_sequence=px.colors.diverging.Portland)
data_crimes_bandes.update_layout(autosize=True, height=500)
data_crimes_bandes.update_layout(yaxis={"categoryorder":"total ascending"})
data_crimes_bandes.show()

üîé Comment est-ce que les identit√©s (ethno)linguistiques sont repr√©sent√©es par les donn√©es?

üîé Comment comparent ces nombres aux mesures de tendances centrales pour le nombre des crimes haineux d√©clar√©s par la police au Canada en 2020?

üîé Comment est-ce que ces diagrammes se comparent √† ceux des langues et du sentiment d'appartenance et les minorit√©s visibles?

üîé Quelle est une raison plausible pour expliquer la fr√©quence de crimes contre les personnes qui parlent l'anglais?

üîé Avez-vous d'autres questions √† poser?

### Crimes haineux au Canada de 2014 au 2022, selon le type de motif

In [None]:
langue_haine_pourcentage_lignes = px.line(df_langue_haine_langue, x="P√âRIODE DE R√âF√âRENCE", 
                                          y="POURCENTAGE CRIMES", 
                                          color="TYPE DE MOTIF", 
                                          title=" ", # Tapez un titre pour le diagramme entre les guillemets
                                          color_discrete_sequence=px.colors.diverging.Portland)
langue_haine_pourcentage_lignes.show()

In [None]:
langue_haine_nombre_lignes = px.line(df_langue_haine_langue, 
                                     x="P√âRIODE DE R√âF√âRENCE", 
                                     y="NOMBRE", 
                                     color="TYPE DE MOTIF", 
                                     title=" ", # Tapez un titre pour le diagramme entre les guillemets
                                     color_discrete_sequence=px.colors.diverging.Portland)
langue_haine_nombre_lignes.show()

üîé Comparez les deux diagrammes √† lignes bris√©es pour les m√™mes types de motifs. Pourquoi sont-ils diff√©rents?

In [None]:
langue_race_haine_pourcentage_lignes = px.line(df_langue_haine_langue_race, 
                                               x="P√âRIODE DE R√âF√âRENCE", 
                                               y="POURCENTAGE CRIMES", 
                                               color="TYPE DE MOTIF", 
                                               title=" ", # Tapez un titre pour le diagramme entre les guillemets
                                               color_discrete_sequence=px.colors.diverging.Portland)
langue_race_haine_pourcentage_lignes.show()

In [None]:
langue_race_haine_nombre_lignes = px.line(df_langue_haine_langue_race, 
                                          x="P√âRIODE DE R√âF√âRENCE", 
                                          y="NOMBRE", 
                                          color="TYPE DE MOTIF", 
                                          title=" ", # Tapez un titre pour le diagramme entre les guillemets
                                          color_discrete_sequence=px.colors.diverging.Portland)
langue_race_haine_nombre_lignes.show()

üîé Comparez les deux diagrammes √† lignes bris√©es pour les m√™mes types de motifs. Pourquoi sont-ils diff√©rents? Vous pouvez cliquer sur la l√©gende interactive pour viser les types de motif.

üîé Quel titres donneriez-vous aux visualisations? Que signifient vos titres?

## Interpr√©ter

üîé Quelles sont les tendances similaires et diff√©rentes?

üîé Quels messages pourraient symboliser les motifs?

üîé Quels pourraient √™tre les impacts √† court et √† long terme de ces relations?

üîé Comment pouvons-nous consid√©rer les responsabilit√©s individuelles et collectives?

## Communiquer

üìï Lorsque les donn√©es sont sensibles, il est utile de les situer plus largement et faire des recommandations.

| Matrice d'interpr√©tation |   |   |
|---|---|---|
||R√©sultats n√©gatives|R√©sultats positives|
|Conclusions n√©gatives|Manque d'am√©lioration<br>Perspective n√©gative|Possibilit√© d'am√©lioration<br>Perspective positive|
|Conclusions positives|Possibilit√© de d√©t√©rioration<br>Perspective d'action|Manque de d√©t√©rioration<br>Perspective de stabilisation et/ou d'am√©lioration|



üîé Comment est-ce que l'exploration des donn√©es vous a aid√© √† d√©terminer l'impact des messages sur les perceptions d'identit√©?

üîé Selon vous, quels sont les r√©sultats qui ont le plus d'impact? Expliquez les conclusions √† partir de la matrice d'interpr√©tation. Si vous avez des recommandations, proposez-les.

üîé Avez-vous toujours des questions sur les messages sur les perceptions d'identit√©? Quelles sont vos questions? Quels types de donn√©es pourraient aborder vos questions?

# La fin

[![Callysto.ca License](https://github.com/callysto/curriculum-notebooks/blob/master/callysto-notebook-banner-bottom.jpg?raw=true)](https://github.com/callysto/curriculum-notebooks/blob/master/LICENSE.md)