# Introduction à l'analyse de données

## Module 1 : Révision Python et introduction au Markdown

### Par Nicolas Corneau-Tremblay

# Plan du module
***

1. Qu'est-ce que Python?
2. Conda et Anaconda
3. Jupyter Notebook
4. Notions de base
5. Types de données
6. *if/if...else/elif*
7. Boucle *for*
8. Fonction
9. Classe
10. Module
11. Introduction au Markdown
12. Questions
13. Devoir

# 1.1 Qu'est-ce que Python?
***

- Langage de programmation multifonction développé par **Guido van Rossum**.
- Langage de programmation interprété (VS compilé).
- Première version sortie en 1991.
- Deux versions utilisées de Python : 2.7 et **3.6**.
- Site web de [Python](https://www.python.org/).

# 1.2 Conda et Anaconda*
***

## Conda
- Un *package manager*.
- Provient d'un projet de la communauté Python.
- Supporte maintenant une multitude de langages (R, Ruby, Java, etc.).

## Anaconda 
- Distribution de logiciels.
- Vient avec conda, Python (2 ou 3), Jupyter et de nombreux *packages*.
- Installation : [ici](https://www.anaconda.com/download/#macos).

*<sub>Pour en savoir davantage sur la distinction entre Conda et Anaconda, voir [ce lien](https://jakevdp.github.io/blog/2016/08/25/conda-myths-and-misconceptions/) (en anglais).<sub>

# 1.3 Jupyter Notebook
***

- Application web permettant de programmer, d'effectuer de la visualisation, etc. (les présentes diapositives ont été faites à l'aide de Jupyter).
- Interface simple et pratique.
- Permet le partage de fichiers de code facilement (Attention : le travail long devra être fait avec Jupyter).
- Exemple...

# 1.4 Notions de base
***
- Variable

Une variable est un endroit réservé dans la mémoire de l'ordinateur pour stocker des valeurs.

- Assignation à une variable


In [28]:
x = 5
x

5

- Demande d'aide

In [29]:
help(print)

Help on built-in function print in module builtins:

print(...)
    print(value, ..., sep=' ', end='\n', file=sys.stdout, flush=False)
    
    Prints the values to a stream, or to sys.stdout by default.
    Optional keyword arguments:
    file:  a file-like object (stream); defaults to the current sys.stdout.
    sep:   string inserted between values, default a space.
    end:   string appended after the last value, default a newline.
    flush: whether to forcibly flush the stream.



- Commentaires.

Les commentaires sont **essentiels** et **nécessaires** afin de documenter votre code et de le rendre compréhensible pour les autres (ou pour votre vous futur).

Réflexion : je n'ai pas encore croisé un fichier de code trop documenté.

In [30]:
# Ceci est un commentaire

- Impression du contenu d'une variable

In [31]:
print("'x' prend la valeur", x, "!")

'x' prend la valeur 5 !


## 1.5 Types de données

***

Les variables peuvent avoir différents types.

- Nombre (*integer, float, complex*)

In [1]:
# entier (integer)
dix_sept = 17

# réel(float)
pi = 3.14159265359

# nombre complexe (complex)
rc_moins_un = complex(1., -1.)

print(dix_sept, pi, rc_moins_un)

17 3.14159265359 (1-1j)


Un mot au passage sur la définition des noms de variables. Deux standards prédominent en programmation :

1. [*Camel case*](https://fr.wikipedia.org/wiki/Camel_case). Exemple : `DixSept = 17`
2. [*Snake case*](https://fr.wikipedia.org/wiki/Snake_case). Exemple : `dix_sept = 17`

Dans ce cours, peu importe lequel vous choisissez, en autant que vous soyez constant dans votre choix.

- Booléen (*boolean*)

Vrai ou faux

Permet par exemple de définir une variable  `femme` = {0, 1}.

Permet également de vérifier et d'introduire des conditions.

In [33]:
vitesse = 110
dessus_de_la_limite = vitesse > 100
print(dessus_de_la_limite)

# 0/1
dessus_de_la_limite + 1

True


2

- chaine de caractères (*string*)

In [2]:
#courte
carac_court = "Chaine de caractères."
print(carac_court)

#longue
carac_long = '''
Longue
chaine
de
caractères.
'''

print(carac_long)

Chaine de caractères.

Longue
chaine
de
caractères.



Possibilité d'utiliser les guillemets doubles (") ou les guillemets simples (') pour définir une chaine de caractères, en autant qu'ils balancent.

In [3]:
chien = "Wouf!"
chat = 'Miaou!'
print(chien, chat)

Wouf! Miaou!


- Liste (*list*)

Structure de données formée par une collection d'items.

Définie par des crochets : [ ].

In [1]:
boisson = ["lait", "jus", "eau"]

prix = [3.49, 3.99, 1.99]

breuvages = [boisson, prix]

print("Le", breuvages[0][0], "coûte", breuvages[1][0], "$.")

Le lait coûte 3.49 $.


À noter que Python commence à compter à partir de 0 et non de 1.

À noter également que la liste "breuvages" et composée elle-même de listes, `boisson` et `prix`. Toutefois, ces deux listes ne peuvent être référencées par leur nom une fois intégrées dans la liste `breuvages`. Cela doit être fait à l'aide de leur position.

Il est possible de réassigner une valeur à l'intérieur d'une liste ou d'en ajouter une nouvelle.

In [2]:
breuvages[0][1] = "boisson gazeuse"
print(breuvages[0])

['lait', 'boisson gazeuse', 'eau']


In [3]:
breuvages[0].insert(1, "thé glacé")
print(breuvages[0][:3])
print(breuvages[0][3:])

['lait', 'thé glacé', 'boisson gazeuse']
['eau']


L'expression list`.insert` est une **méthode**. Une méthode est une fonction, dans ce cas-ci permettant d'insérer un nouvel élément dans une liste à une position précise. Pour connaitre les méthodes associées à un objet : `help`(objet) (par exemple, dans ce cas, `help(list)`).

L'expression `:3` désigne tout ce qui précède l'élément en position 3 (excluant celui) de la liste. À l'inverse, l'expression `3:` désigne tout ce qui suit l'élément en position 3 (incluant celui-ci) de la liste.

- *tuple*

Une liste, mais immuable.

Défini par des parenthèses : ()

In [38]:
saveur = ("frambroise", "fraise", "pomme")
saveur[0]

'frambroise'

À noter que pour faire référence à un élément dans un tuple, il faut tout de même utiliser les crochets.

In [39]:
saveur[0] = "baies des champs"

TypeError: 'tuple' object does not support item assignment

- Dictionnaire (*dictionary*)

Structure de données non-ordonnée mettant en lien une **clé** (*key*) et une **valeur** (*value*) dans une relation clé-valeur.

Les clés doivent être uniques; elles sont utilisées pour référer les éléments du dictionnaire (contrairement aux positions pour les listes et les *tuples*)

Les valeurs peuvent prendre n'importe quelle forme : nombre, liste, fonction, etc.

Un dictionnaire est défini par des accolades : { }

In [4]:
villes = {"New-York" : ["États-Unis", 8.5],
         "Montréal": ["Canada", 1.7],
         "Berlin" : ["Allemagne", 3.5]}
print(villes["New-York"])
print(villes["New-York"][1])

['États-Unis', 8.5]
8.5


In [5]:
villes["Ouagadougou"] = ["Burkina Faso", 2.2]
print(villes)

{'New-York': ['États-Unis', 8.5], 'Montréal': ['Canada', 1.7], 'Berlin': ['Allemagne', 3.5], 'Ouagadougou': ['Burkina Faso', 2.2]}


Pour obtenir les clés d'un dictionnaire, utiliser dict`.key`. 

Pour obtenir les valeurs d'un dictionnaire, utiliser dict`.values`.

In [6]:
print(villes)

{'New-York': ['États-Unis', 8.5], 'Montréal': ['Canada', 1.7], 'Berlin': ['Allemagne', 3.5], 'Ouagadougou': ['Burkina Faso', 2.2]}


In [7]:
print(villes.keys())

dict_keys(['New-York', 'Montréal', 'Berlin', 'Ouagadougou'])


In [8]:
print(villes.values())

dict_values([['États-Unis', 8.5], ['Canada', 1.7], ['Allemagne', 3.5], ['Burkina Faso', 2.2]])


- Incertain du type de données d'une variable? Utiliser `type`.

In [43]:
x = 11
y = 11.1
z = [11]
print("x:", type(x), "y:", type(y), "z:", type(z))

x: <class 'int'> y: <class 'float'> z: <class 'list'>


## 1.6 *if/if...else/elif*
***

- Le mot-clé `if` permet d'effectuer une action lorsqu'une condition est respectée.


In [44]:
age = 35
if age >= 18:
    print("Tu es majeur.")

Tu es majeur.


À noter, l'indentation est nécessaire pour que ce code fonctionne :

In [45]:
age = 35
if age >= 18:
print("Tu es majeur.")

IndentationError: expected an indented block (<ipython-input-45-3b47a7d69716>, line 3)

Python est très sensible à l'indentation $\rightarrow$ Être vigilant lorsque l'on écrit des conditions, des boucles, des fonctions, etc.

- Les mots-clés `if...else` permettent d'effectuer une action lorsqu'une condition est respectée, mais indiquent également quoi faire lorsque cette condition ne l'est pas.

In [46]:
age = 17
if age >= 18 :
    print("Tu es majeur.")
else :
    print("Tu es mineur.")

Tu es mineur.


- Le mot-clé `elif` peut accompagner `if` et permettre d'introduire plusieurs conditions afin de déterminer l'action à effectuer.    

In [47]:
age = 20
if age >= 21 :
    print("Tu es majeur.")
elif age < 21 and age >= 18 :
    print("Tu es majeur au Québec, mais pas en Ontario.")
else :
    print("Tu es mineur.")

Tu es majeur au Québec, mais pas en Ontario.


Dans l'exemple précédent, le mot-clé `and` a été utilisé pour imposer simultanément deux contraintes : si ton âge est de moins de 21 ans ET supérieur ou égal à 18 ans.

Pour imposer des contraintes alternatives, il faut plutôt utiliser le mot-clé `or`.

In [6]:
age = 19
if age >=21 or age<18 :
    print("Ton statut légal est le même au Québec qu'en Ontario.")
else :
    print("Ton statut diffère entre le Québec et l'Ontario.")

Ton statut diffère entre le Québec et l'Ontario.


## 1.7 Boucle *for*

***

- Une boucle permet de créer un processus itératif.
- Exemple : Effectuer une opération sur tous les éléments d'une liste ou pour une série de nombres.
- Une boucle est généralement implémentée à l'aide du mot clé `for`.

In [9]:
# Exemple : cout total des breuvages
# recréer la liste breuvages
boisson = ["lait", "jus", "eau"]
prix = [3.49, 3.99, 1.99]
breuvages = [boisson, prix]

# y ajouter un nombre par breuvage
nombres = [2, 1, 3]
breuvages.append(nombres)
print(breuvages)

cout_total = 0
for boisson in range(0, len(breuvages[0])):
    cout_total += breuvages[1][boisson]*breuvages[2][boisson]
    
print("Les boissons coûtent au total", cout_total, "$")

[['lait', 'jus', 'eau'], [3.49, 3.99, 1.99], [2, 1, 3]]
Les boissons coûtent au total 16.94 $


Également, l'opérateur `+=` permet d'additionner une nouvelle valeur à une variable déjà existante.

Il serait aussi possible d'écrire `cout_total = cout_total + breuvages[1][boisson]*breuvages[2][boisson]` afin d'obtenir le même résultat.

## 1.8 Fonction

***

- Une fonction effectue une ou plusieurs actions.
- Permet de réutiliser du code afin de reproduire systématiquement la même action.
- Par exemple, `print` et `type` sont des fonctions.
- Possibilité d'écrire ses propres fonctions $\rightarrow$ très utile pour éviter le copier-coller et lors de la correction d'erreurs!
- Pour définir une fonction, utiliser le mot-clé `def`.
- Contient généralement un ou des paramètres (mais pas obligatoirement) $\rightarrow$ intrants de la fonction.
- Retourne généralement une valeur à l'aide du mot-clé `return` $\rightarrow$ extrants de la fonction.

In [10]:
# Exemple : transformer du texte
def carac_cool(string):
    '''
    fonction qui rend une chaine de caractère "cool"!
    '''
    temp = list(string)

    for lettres in range(0, len(temp)) :
        if lettres % 2 == 0 :
            temp[lettres] = temp[lettres].upper()
        else :
            continue
            
    output = "".join(temp)
    
    return output

Expliquer ce que fait une fonction au début de celle-ci est considéré comme une bonne pratique. Écrire des fonctions courtes n'effectuant qu'une seule action est une autre bonne pratique.

In [11]:
carac_cool("Bonjour à toutes et à tous!")

'BoNjOuR À ToUtEs eT À ToUs!'

- Pour des fonctions très courtes, il est possible d'utiliser le mot-clé `lambda` pour créer des fonctions anonymes.

In [52]:
au_cube = lambda x : x**3
au_cube(9)

729

## 1.9 Classe

***

Une classe est un concept.

Permet d'imposer une structure similaire afin de créer des objets.

Composée de trois éléments :

1. Constructeur
2. Attributs
2. Méthodes


Ce que l'on appelle une fonction s'appelle ainsi lorsqu'elle se trouve en dehors d'une classe. Une fonction à l'intérieur d'une classe est une méthode (voir par exemple list`.insert` vue précédemment).

Ce que l'on appelle une variable s'appelle ainsi lorsqu'elle se trouve en dehors d'une classe. Une variable à l'intérieur d'une classe est un attribut.

In [1]:
# Exemple de classe
class Ami :
    '''
    Classe définissant un ami selon son prénom, son nom de famille,
    son numéro de téléphone et son courriel.
    '''
    # Constructeur
    def __init__(self, prenom, nom_famille, telephone, courriel) :
        
        print("Un nouvel ami!")
        
        # Attributs
        self.prenom = prenom
        self.nom_famille = nom_famille
        self.telephone = telephone
        self.courriel = courriel
        
    # Méthodes
    def information(self) :
        info = "%s %s. Telephone : %s, Courriel : %s" % \
        (self.prenom, self.nom_famille, self.telephone, self.courriel)
        return info

À noter, le charactère `\` est utilisé dans la définition de la fonction `information` afin de poursuivre le code sur la ligne suivante.

In [3]:
# Définition d'un ami : TC
TC = Ami("Tom", "Cruise", "555-418-5432", "t_cruise_MI@gmail.com")

Un nouvel ami!


In [4]:
# Information de TC
print(TC.information())

Tom Cruise. Telephone : 555-418-5432, Courriel : t_cruise_MI@gmail.com


In [5]:
# Modification des attributs de TC
TC.nom_famille = "Hanks"
print(TC.information())

Tom Hanks. Telephone : 555-418-5432, Courriel : t_cruise_MI@gmail.com


Les classes sont utilisées en **programmation orientée objet** (POO), un paradigme de programmation.

Pour en savoir davantage sur la POO : [Wikipédia](https://fr.wikipedia.org/wiki/Programmation_orient%C3%A9e_objet).

## 1.10 Module

***

- Un module est un fichier contenant un ensemble de fonctions pouvant être utilisées.
- Pour utiliser un module, il faut d'abord le charger à l'aide du mot-clé `import`.
- Les fonctions qu'il contient peuvent ensuite être utilisées, généralement avec un préfixe.

In [57]:
# Exemple de module
import os
os.getcwd()

'/Users/nct/Dropbox (CEDIA)/ULaval/GPL-3008/Module 1 - Python'

- Les modules peuvent aussi avoir des *alias*, notamment lorsque leur nom est trop long. Dans ce cas, l'*alias* est utilisé comme préfixe.
- Des standards existent dans la communauté Python pour les modules les plus fréquents (NumPy, Pandas, etc.).

In [58]:
# Exemple d'alias
import numpy as np
import pandas as pd

- Pour plus d'informations sur un module, encore une fois utiliser `help`.

- Plusieurs modules seront utilisés dans le cadre de ce cours. Ils seront présentés en temps et lieu.

## 1.11 Introduction au Markdown

***

- Le Markdown est un langage de balisage léger, c'est-à-dire un langage permettant la rédaction et la lecture de texte dans un éditeur de texte (e.g. Notepad, TextWrangler, etc.).
- Il a été créé en 2004 par John Gruber.
- L'objectif de ce langage est de pouvoir lire le langage directement, sans formatage.
- Il est aisément converti en HTML, par exemple.
- Ce langage sera utile dans le travail long (également, le texte dans les diapositives du cours est entièrement en Markdown).

Quelques règles de formatage :

\# permetant d'introduire un titre, \## un sous-titre, etc.

# Titre

\*italique\* permet d'écrire en italique : *italique*.

\*\*gras\*\* permet d'écrire en gras : **gras**.

\*\*\*italique et gras\*\*\* permet d'écrire en italique et en gras : ***italique et gras***.

\`code\` permet d'écrire du code : `code`.

\- permet de faire une liste non numérotée.
- Mot 1.
- Mot 2.

\1. permet de faire une liste numérotée.

1. Un.
2. Deux.

## 1.12 Questions

***

Si vous avez des questions (et vous allez en avoir!), plusieurs options existent, entre autres:

1. Forum du site de cours
    - Avantages : D'autres étudiants ou moi-même pouvons répondre, en français et permet des questions spécifiques.
    - Inconvénients : Le forum ne sera pas toujours là!
2. Google
    - Avantages : Toujours disponible et large communauté à travers le monde.
    - Inconvénients : En anglais, requièrt un effort plus grand et les réponses sont parfois moins spécifiques.
    
Les questions sont évidemment **toujours** bienvenues sur le forum.

Sachez que faire de la programmation, c'est tomber sur des bogues et tenter de les résoudre!





## 1.13 Devoir

***

Pour le travail long, voici le devoir de cette semaine :

1. Télécharger et installer Anaconda.
2. Se familiariser avec l'environnement Jupyter.
3. Réviser les notions de Python couvertes.
4. Explorer le Markdown dans Jupyter.