# Python 1 - Notes de cours

<img style="float: left;" src="images/logo.png">

### CSD - Comité Science de Données HEC
##### Préparées par Samuel Tremblay, VP-Éducation 2019-2020
#### Sommaire
1. Structures de données de base
    * Chaînes de caractères
    * Listes
    * Uplets (*tuples*) 
    * Dictionnaires
2. Structures de données avancées
    * Matrices (*arrays*) ```NumPy```
    * Tableaux de données (*data frames*) ```Pandas```
3. Importation de données 
    * À l'aide de ```NumPy```
    * À l'aide de ```Pandas```
4. Écriture de données
    * À l'aide de ```NumPy```
    * À l'aide de ```Pandas```
    
### Chaînes de caractères
Les chaînes de caractères sont une composante essentielle de la programmation. Elles permettent de stocker de l'information lisible par l'humain : des caractères. Elles sont créées grâce aux opérateurs ```''``` et ```""```, qui produisent un résultat équivalent. Celles-ci peuvent être vues sous forme matricielle et possèdent de nombreuses méthodes intéressantes que nous regarderons.

In [39]:
# 1. Elles ont une forme matricielle
ma_chaine = 'Stella est un chat'
print('Propriété 1\n', ma_chaine[:6] + ma_chaine[6:])

Propriété 1
 Stella est un chat


In [43]:
# 2. Méthode strip() retire les espaces au début et à la fin de la chaîne
ma_chaine = ' Stella est un chat'
print('Méthode strip()\n', ma_chaine, '\n', ma_chaine.strip())

Méthode strip()
  Stella est un chat   
 Stella est un chat


In [44]:
# 3. Méthode upper() retourne la chaîne mise en majuscules
print('Méthode upper()\n', ma_chaine, '\n', ma_chaine.upper())

Méthode upper()
  Stella est un chat   
  STELLA EST UN CHAT  


In [45]:
# 4. Méthode lower() retourne la chaîne mise en minuscules
print('Méthode upper()\n', ma_chaine, '\n', ma_chaine.lower())

Méthode upper()
  Stella est un chat   
  stella est un chat  


In [47]:
# 5. Méthode replace() remplace une expression par une autre
print('Méthode upper()\n', ma_chaine, '\n', ma_chaine.replace('Stella', 'Théo'))

Méthode upper()
  Stella est un chat   
  Théo est un chat  


In [50]:
# 6. Méthode split() retourne la chaîne séparée dans une liste en fonction du séparateur désiré
print('Méthode upper()\n', ma_chaine.strip().split(' '))

Méthode upper()
 ['Stella', 'est', 'un', 'chat']


### Listes
Les listes sont la principale structure de données de Python. Elles sont créées grâce aux crochets `[]` et possèdent plusieurs caractéristiques intéressantes que nous démontrerons :
1. Elles sont ordonnées
2. Elles peuvent contenir n'importe quel objet
3. On y accède en utilisant leur index
4. Elles peuvent être imbriquées
5. Elles sont mutables

In [55]:
# 1. Elles sont ordonnées
ma_liste = ['chat', 'chien']
print('Propriété 1\n', ma_liste[0] == ma_liste[1])

Propriété 1
 False


In [40]:
# 2. Elles peuvent contenir n'importe quel objet
ma_liste = ['chat', 0.3, False]
print('Propriété 2\n', ma_liste)

Propriété 2
 ['chat', 0.3, False]


In [41]:
# 3. On y accède en utilisant leur index
print('Propriété 3\n', ma_liste[0], ma_liste[-3], ma_liste[0:1])

Propriété 3
 chat chat ['chat']


In [42]:
# 4. Elles peuvent être imbriquées
ma_liste = ['chat', ['chien']]
print('Propriété 4\n', ma_liste[0], ma_liste[1][0])

Propriété 4
 chat chien


In [44]:
# 5. Elles sont mutables
ma_liste[1] = 'meow'
print('Propriété 5 (assignation)\n', ma_liste)
ma_liste.append('chien') # Méthode append(x)
print('Propriété 5 (append)\n', ma_liste)
ma_liste.pop(-2)         # Méthode pop(x)
print('Propriété 5 (pop)\n', ma_liste)

Propriété 5 (assignation)
 ['chat', 'meow']
Propriété 5 (append)
 ['chat', 'meow', 'chien']
Propriété 5 (pop)
 ['chat', 'chien']


### Uplets
Les uplets sont similaires aux listes sur de nombreuses propriétés, outre le fait qu'ils sont immuables. Ainsi, il est possible de les concaténer mais pas de leur assigner de nouvelles valeurs. Ils sont produits grâce à l'opérateur `()` et sont souvent le produit de fonctions.

In [45]:
# 1. Ils sont ordonnées
mon_uplet = ('chat', 'chien')
print('Propriété 1\n', mon_uplet[0] == mon_uplet[1])

Propriété 1
 False


In [46]:
# 2. Ils peuvent contenir n'importe quel objet
mon_uplet = ('chat', 0.3, False)
print('Propriété 2\n', mon_uplet)

Propriété 2
 ('chat', 0.3, False)


In [47]:
# 3. On y accède en utilisant leur index
print('Propriété 3\n', mon_uplet[0], mon_uplet[-3], mon_uplet[0:1])

Propriété 3
 chat chat ('chat',)


In [10]:
# 4. Ils peuvent être imbriqués
mon_uplet = ('chat', ('chien',)) # Remarquer la virgule après un uplet d'un seul item
print('Propriété 4\n', mon_uplet[0], mon_uplet[1][0])

Propriété 4
 chat chien


In [53]:
# 5 Ils sont immuables
mon_uplet[1] = 'meow'

TypeError: 'tuple' object does not support item assignment

### Dictionnaires
Les dictionaires sont un ensemble de données sans ordre particulier, mutable, indexé et imbriquable. Ils sont créés grâce à l'opérateur ```{}``` et possèdent des binômes « clé : valeur ». Il est également possible d'utiliser la fonction ```dict(clé = valeur)``` pour les créer. Noter ici (1) l'utilisation du ```=``` plutôt que du ```:``` ainsi que (2) l'absence des guillemets pour la création des clés. On y accède en utilisant une clé, grâce à la forme suivante : ```dict['clé']```. Cela retourne alors la valeur. 

In [26]:
# 1. Ils n'ont pas d'ordre particulier
mon_dict = {
    'race' : 'bengal',
    'nom' : 'Stella',
    'age' : 5,
    'male' : False
}
print('Propriété 1 (opérateur {})\n', mon_dict)
mon_dict = dict(race = 'bengal', nom = 'Stella', age = 5, male = False)
print('Propriété 1 (fonction dict)\n', mon_dict)
print('Propriété 1 (sans ordre) \n') 
print(mon_dict[0])

Propriété 1 (opérateur {})
 {'race': 'bengal', 'nom': 'Stella', 'age': 5, 'male': False}
Propriété 1 (fonction dict)
 {'race': 'bengal', 'nom': 'Stella', 'age': 5, 'male': False}
Propriété 1 (sans ordre) 



KeyError: 0

In [27]:
# 2. Ils sont indexés et mutables
print('Propriété 2 (indexation)\n', mon_dict['race'])
mon_dict['race'] = 'inconnue'
print('Propriété 2 (assignation)\n', mon_dict['race'])
mon_dict.pop('race')
print('Propriété 2 (supression)\n', mon_dict)
mon_dict['pelage'] = 'brun tigré'
print('Propriété 2 (ajout)\n', mon_dict)

Propriété 2 (indexation)
 bengal
Propriété 2 (assignation)
 inconnue
Propriété 2 (supression)
 {'nom': 'Stella', 'age': 5, 'male': False}
Propriété 2 (ajout)
 {'nom': 'Stella', 'age': 5, 'male': False, 'pelage': 'brun tigré'}


In [28]:
# 3. Ils peuvent être imbriquées
mon_dict = {
    'Stella' : {
        'race' : 'bengal',
        'âge' : 5
    },
    'Théo' : {
        'race' : 'inconnue',
        'âge' : 2
    }
}
print('Propriété 3\n', mon_dict['Stella']['race'])

Propriété 3
 bengal


### Exercises - Structures de données de base
#### 1. Chaînes de caractères
a) Assigner à une variable ```x``` la phrase suivante : HEC Montréal est un établissement universitaire québécois situé à Montréal (Canada).

b) Supprimer tout ce qui n'est pas une lettre, en conservant les espaces.

c) Remplacer les lettres majuscules par des minuscules.

d) Séparer les mots de la phrase et les mettre dans une liste ```y```.
#### 2. Listes


#### 3. Uplets

#### 4. Dictionnaires

In [65]:
x = "HEC Montréal est un établissement universitaire québécois situé à Montréal (Canada)."
x = x.replace('(', '').replace(')', '').replace('.', '')
x = x.lower()
y = x.split()
print(y)

['hec', 'montréal', 'est', 'un', 'établissement', 'universitaire', 'québécois', 'situé', 'à', 'montréal', 'canada']
