# Introduction

Python est un langage de programmation, sa première version date du début des années 90. C'est un lanagage haut niveau, ceci signifie que les mot-clés sont souvent issus de la langue anglaise ou encore qu'il y a beaucoup d'abstractions, ce qui rend son apprentissage plus *simple*. Par exemple, les développeurs n'ont pas à gérer la mémoire en Python. `malloc`, `alloc`, tout ça on oublie.

Le langage est extrêmement polyvalent, on peut l'utiliser pour faire des serveurs web, des logiciels ou encore de la science de données, c'est ce dernier domaine qui nous intéresse dans ce cours.

Attention, la syntaxe du Python peut être déroutante de prime à bord, en Python pas d'accolades ({}) ou de point-virgules ( ; ) pour grouper les instructions, les imbrications sont faites avec des espaces (qui peuvent être remplacés par des "tabulations").

Le cours étant dédié à l'univers du Big Data, nous n'allons pas faire du Python de façon _traditionnelle_, en tant normal, il nous faudrait créer des fichiers avec l'extension ".py" et les compiler, mais grâce à **Jupyter Notebook**, nous allons pouvoir faire du Python de façon beaucoup plus conviale et interactive. Par ailleurs Jupyter Notebook est un outil très utilisé en data-science.

Jupyter notebook propose des avantages non négligeables comme la possibilité de formatter du texte grace au markdown, c'est d'ailleurs avec ce langage de mise en page qu'est écrit ce que vous lisez.
- [Voir la documentation du markdown](https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet)

Les notebooks servent également à coder en Python, compiler le code et voir le résultat. Pratique.

Ce logiciel fonctionne avec un système de cellules, le texte que vous lisez présentement est dans une cellule (écrite en markdown), il existe deux types de cellules :
- "markdown" pour le texte
- "code" pour coder en Python

Pour ajouter une nouvelle cellule rien de plus simple, il suffit de sélectionner le type de cellule que vous souhaiter ajouter (en bas de cellule ou tout en haut de l'interface).

![alt text](ajout-cellule.jpg)

Les cellules de type "Code" doivent être compilées pour voir le résultat

Sachez qu'il est également possible d'exécuter une cellule avec le raccourci clavier `maj` + `entrée`. Par défaut, c'est la cellule courante/active qui est executée, il est possible d'en exécuter plusieurs en même temps en sélectionnant plusieurs cellules en maintenant la touche `maj`.

Il y a d'autres options dans la barre d'outils, on ne va pas toutes les lister, à vous d'expérimenter. En tous les cas ,les trois fonctionnalités listées sont celles qu'on utilisera le plus.

P.-S. : Pour éditer une cellule markdown, il vous suffit de double-cliquer dessus.

P.-S. 2 : Il est possible d'utiliser jupyter sous VS Code, en revanche, il vous faudra utiliser une extension appelée "Jupyter" et le fonctionnement reste peu ou prou le même, on crée des cellules, on les lance...

# Initiation à Python

Avant toute chose, nous faisons du Python 3, version la plus moderne (2022) du langage, **avant de recopier du code trouvé sur le web assurez-vous bien que c'est bien du code Python 3 et non Python 2**, car la syntaxe, sur certains points a changé entre les versions.

# Variables

Le typage des variables n'est pas obligatoire en Python, mieux encore, il n'est pas utile de déclarer les variables, il n'y a pas de mot-clé comme `var` ou `let` comme en javascript, une variable est déclarée à sa première apparition dans le code. A noter que le nom des variables est sensible à la casse. Ainsi déclarer une variable qui s'appelle "uneVar", n'est pas la même chose que "unevar".

Par convention, les variables/fonctions/méthodes en Python sont écrites en "snake case" ceci signifie donc que les mots des fonctions et variables sont écrits en minuscules et séparés par des tirets bas (_). On écrira plutôt "une_var" au lieu de "unevar" pour respecter la convention Pyhon.

- [Voir documentation sur la snake case](https://fr.wikipedia.org/wiki/Snake_case)

In [2]:
# Exemples (le caractère "#" permet de définir un commentaire)

premiere_var = "Ma première valeur" # Ici on déclare une chaîne de caractères
un_entier = 5 # Ici un entier
une_liste = [45, "bonjour", 87, "90"] # Ici une liste
un_booleen_vrai = True # La majuscule est très importante
un_booleen_faux = False # La majuscule est très importante

var1, var2 = 1, 2 # on déclare deux variables sur la même ligne

90


Il est même possible de concatener les variables avec le caractère `+`

In [1]:
ma_premiere_chaine = "Bonjour"
ma_seconde_chaine = "Tout le monde"

# Et ici on affiche tout avec un espace entre les deux chaînes
ma_premiere_chaine + " " + ma_seconde_chaine

# On peut être un peu plus malin et utiliser les f-strings, de ce fait, l'exemple précédent peut s'écrire de la façon suivante
f"{ma_premiere_chaine} {ma_seconde_chaine}"
# Pratique, non ?

'Bonjour Tout le monde'

# A vous de coder

Déclarez des variables répondant aux critères suivants (une ligne une variable) :
- Un nombre décimal
- Une chaîne de caractères
- Une liste de nombres entiers
  - (Une variable) contenant la deuxième valeur de votre liste
  - (Une variable) contenant la dernière valeur de votre liste
    - Notez que votre code doit fonctionner quelque soit la longueur de la liste. Ne mettez pas un index en dur.
- Un dictionnaire / tableau associatif (vous allez devoir chercher sur le web la réponse)

Affichez le résultat avec la fonction `print()`. Il faudra également penser à compiler en faisant la combinaison de touches `maj` + `entrée` ou cliquer sur le bouton "exécuter" placé plus haut.

## Fonction print()
La fonction print() est une fonction de base dans le langage Python, elle permet d'afficher le contenu de variables. Cette fonction peut prendre plusieurs paramètres, nous pouvons donc écrire `print(maVar)` ou bien `print(maVar1, maVar2)`. Il est même possible de définir le séparateur entre chaque variable avec le paramètre `sep`, ainsi si l'exemple précédent `print(maVar1, maVar2)` affichera le résultat des deux variables côte-à-côte en rajoutant `sep=' '` chaque valeur sera séparée par un espace.

- [Voir documentation fonction print() - anglais](https://docs.python.org/3/library/functions.html#print)
- [Voir exemples d'utilisations de la fonction print() - anglais](https://realpython.com/python-print/)

```python
# Exemple d'utilisation de la fonction print()
print("Hello world")
```

#### **N'oubliez pas de sauvegarder**

In [8]:
# Codez ici

Bravo, vous avez écrit avec brio vos premières lignes en Python. La fonction `print()` nous sera très utile pour débugger. **Jupyter propose également la fonction `display()`**, le rôle est identique à `print()` sauf que l'affichage est parfois plus élégant notamment sur les DataFrame, mais on verra plus tard les DataFrame.

# Un dictionnaire / tableau associatif

Un tableau associatif est une structure très utile pour stocker des données qui vont ensemble, cette structure est composée de clés-valeurs où les clés, contrairement aux tableaux classiques, sont des chaînes de caractères (et parfois des entiers) ce qui rend leur structuration plus ordonnée. 

Dans un tableau associatif, il est possible d'accéder à une valeur via la clé de l'index. Considérons le dictionnaire suivant :
```python
voiture = {
    "marque": "Porsche",
    "modele": "Panamera",
    "prix": 50000
}
```
Si je veux accéder à la valeur placée pour la clé "marque", il faudra écrire `voiture["marque"]`.

- [Voir documentation sur les dictionnaires en Python - anglais](https://www.w3schools.com/python/python_dictionaries.asp)

# A vous de coder

- Utiliser la fonction `print()` ou `display()` pour afficher une valeur du dictionnaire que vous avez crée précédemment.

#### **N'oubliez pas de sauvegarder**

# if... else et boucle for

In [2]:
a = 33
b = 200

if b > a:
    print("b est plus grand que a")
elif b == a:
    print("b et a sont égaux")
else:
    print("a est plus grand que b")

b et a sont égaux


La structure if...else ce n'est pas uniquement comparer si un nombre est plus grand qu'un autre, il est également possible de comparer sur d'autres critères.


Comme dit précédemment le Python, par son côté haut niveau, s'approche beaucoup de la langue anglaise au niveau de sa syntaxe. Ainsi, en Python, les opérateurs logiques `ET` et `OU`, qui prennent souvent la forme de `&&` ou `||` en programmation, sont écrits `and` et `or`. On peut donc écrire la chose suivante :

In [7]:
# On déclare deux entiers.
# Pour rappel, pas de "var", "int" ou autre pour déclarer une variable en Python
a = 33 
b = 200

# Notre structure if/else n'a pas d'accolades ({}), elle est structurée grâce aux espaces / tabulations
if b > 0 and a > 0:
    print("b et a sont strictement positifs")
else:
    print("b et a ne sont pas strictement positifs")
# Remplacez "and" par "or" pour tester le "ou" logique

b et a sont strictement positifs


Pour les boucles, il n'y a qu'une seule instruction possible : `for in:`, elle permet de parcourir des tableaux ou encore des chaînes de caractères (quelque soit le langage de programmation, une chaîne de caractères est en fait un tableau).

In [6]:
liste_fruits = ["pêche", "banane", "ananas"]
# ici on liste et "print()" tous les éléments de la liste "liste_fruits"
for fruit in liste_fruits:
    print(fruit)

# Si on souhaite récupérer également l'index des éléments, on peut utiliser la fonction enumerate() sur la liste
for index, fruit in enumerate(liste_fruits):
    print(f"{index} - {fruit}")

pêche
banane
ananas
0 - pêche
1 - banane
2 - ananas


Pour fonctionner de façon plus conventionnelle, comme un `for(var i = 0; i < limite; i++){}`, on utilise toujours la fonction `for in:` mais accompagnée de la fonction `range()`. Dans son utilisation la plus basique la fonction va prendre un seul et unique paramètre et retourner un `range` (type de variable) content une liste d'entiers compris entre 0 et le chiffre mis en paramètre.

In [4]:
# Va lister toutes les valeurs entre 0 et 6, 0 inclus
for chiffre in range(6):
    print(chiffre)

Si on place un deuxième paramètre à la fonction `range()`, il est possible de définir nous-même les bornes, de ce fait, en écrivant `range(1, 11)`, on demande à lister tous les **entiers** compris entre 1 et 11, le deuxième paramètre étant toujours exclu.
Il est possible de passer un troisième et dernier paramètre qui va définir le pas d'avancement, on peut donc définir un `range()` où on avance de 5 en 5 ou encore de 20 en 20, par défaut le pas de la fonction `range()` est de 1. Enfin, en mettant une valeur négative pour le pas et inversant les bornes, il est possible de compter à l'envers, ainsi en écrivant `range(7, 0, -2)`, nous listerons tous les chiffres de 7 à 1 avec un pas d'avancement de deux.

Notez que le résultat de la fonction `range()` n'est pas affichable dans la fonction `print()`.

# A vous de coder

Déclarez des boucles répondant aux critères suivants (une ligne une boucle) :
- Une boucle qui affiche (print) tous les éléments d'une liste (que vous aurez définie)
- Une boucle qui affiche (print) tous les entiers de 0 à 99 (inclus)
- Une boucle qui affiche (print) tous les entiers de 0 à 1 000 avec un pas de 100
- Une boucle qui affiche (print) tous les entiers de 800 à -500 avec un pas de 2

Note : La fonction `print()` doit se trouver dans la boucle pour ainsi afficher toutes les valeurs.

**Pensez bien à rajouter une cellule de type "code" en appuyant sur le bouton "+" en haut à gauche**

On peut mettre en application ce que nous avons vu précédemment (boucles et liste) en ajoutant au fur et à mesure des données dans une liste grâce à la méthode `append()`. Ce qui nous donne le code suivant.

```python
liste = [45, 10, 80]
for i in range(0, 100, 10):
    liste.append(i)
# Notre tableau a 10 nouvelles entrées
print(liste) 
```

# Tableau de dictionnaires

Nous avons vu précédemment les dictionnaires et les tableaux, le mélange des deux (tableau de dictionnaire) est une structure très utile pour stocker plusieurs dictionnaires qui sont identiques, par "identiques" on entend que tous les dictionnaires ont les mêmes clés. Le tableau de dictionnaires n'est pas sans rappeler un tableur où les dictionnaires seraient des lignes et les clés des colonnes. 

Nous allons beaucoup utiliser cette structure, il est donc très important de la comprendre. Nous allons partir avec le tableau de dictionnaires suivant :

```python
liste_voitures = [
    {
        "marque": "Porsche",
        "modele": "Panamera",
        "prix": 50000,
        "annee": 2015
    },
    {
        "marque": "Tesla",
        "modele": "S",
        "prix": 100000,
        "annee": 2018
    },
    {
        "marque": "Toyota",
        "modele": "Rav4",
        "prix": 35000,
        "annee": 2014
    },
    {
        "marque": "Ford",
        "modele": "F-150",
        "prix": 30500,
        "annee": 2011
    },
    {
        "marque": "Kia",
        "modele": "Niro",
        "prix": 42160,
        "annee": 2019
    }
]
```

# A vous de coder

Déclarez des boucles et variables répondant aux critères suivants (une ligne une boucle) :
- Une boucle qui affiche (print) uniquement les clés "prix" et "modele" d'un véhicule
- Une variable qui affiche (print) le dernier dictionnaire
- Une variable qui affiche (print) le modèle du troisième dictionnaire

**Pensez bien à rajouter une cellule de type "code" en appuyant sur le bouton "+" en haut à gauche**
**Récupérez la variable liste_voitures au-dessus pour la coller dans la cellule type code**

In [None]:
# Codez ici

# Fonctions

Comme tout langage de programmation, il est également possible en Python d'écrire des fonctions, le mot-clé est `def`. Etant donné qu'en Python, il n'y a pas d'accolades ({}) ou de point-virgules ( ; ) pour définir les instructions dans le code, **il faut mettre le contenu de la fonction en retrait par rapport au mot-clé "def", ceci est fait grâce à la touche tabulation** (la touche à gauche de la touche "A" de votre clavier). Exemple :

```python
# Après le mot-clé "def", il faut définir le nom de la fonction (obligatoire) et faire suivre de ":"
def my_function(): 
  print("Je suis une fonction") # Devant cette ligne, il y a une tabulation
```
La fonction peut ensuite être appelée de la façon suivante `ma_fonction()`.

Bien évidemment, une fonction peut prendre des paramètres, il est donc possible d'écrire la chose suivante :

```python
def my_function_with_parameters(a, b):
  print("Je suis une fonction qui prend deux paramètres")
```
Ci-dessus on définit une fonction appelée "my_function_with_parameters" acceptant deux paramètres appelés a et b respectivement.

Enfin notez qu'une fonction définit une scope, une portée, une variable définie dans une fonction n'est pas accessible à l'extérieur, il est en de même pour la boucle `for` et la structure `if, elif, else`. Par ailleurs, en Python, si vous appelez une fonction avec des paramètres manquants, une erreur sera levée par le compilateur. Vous ne pouvez donc pas faire la chose suivante :

```python
def bye(prenom):
  return f"Au revoir {prenom}"

# La ligne suivante va lever une erreur 
# car il n'y a pas de paramètres alors que la signature de la fonction "au_revoir" en possède
# Les paramètres sont considérés comme étant obligatoires en Python
au_revoir()
```

Comme les autres langages de programmation, on utilise le mot-clé `return` pour retourner le résultat d'une fonction. Pour rappel, retourner le résultat d'une fonction est préférable à la modification de variables globales, et ce, pour éviter les effets de bord.

Dernier point : créer une fonction vide va forcément lever une erreur. Ainsi écrire la chose suivante n'est pas correct :
```python
# NE PAS ECRIRE LA CHOSE SUIVANTE
def error():
```


# A vous de coder

Ecrire du code correspondant aux critères suivants : 
- Une fonction qui prend en paramètre un entier et le multiplie par lui-même
- Une fonction qui prend en paramètres deux chaînes de caractères et souhaite bonjour à cette personne
- Une fonction qui prend en paramètres une chaîne de caractères et la retourne à l'envers
- Une fonction qui prend en paramètres deux entiers, les divise et retourne en résultat l'entier le plus proche.
  - Par exemple, si la fonction divise 5 par 3, la fonction doit retourner 2
- Une fonction qui prend en paramètres deux entiers, les multiplie et retourne **toujours** un **produit strictement positif** 
- Une fonction qui prend en paramètres deux entiers, les divise et retourne le reste
- Une fonction qui prend en paramètres deux entiers qui les multiplie **sans utiliser** l'opérateur de multiplication

Note : la fonction `print()` **ne doit pas être dans la fonction que vous écrivez,** votre fonction (et ses paramètres) doit être dans la fonction `print()`. Par exemple :
```python
print(my_fonction(param1, param2))
```
Vos fonctions doivent impérativement **retourner le résultat de l'opération**. Ainsi, **vous ne devez pas écrire la chose suivante** :
```python
def my_fonction(argument):
    print(argument())
```

Il faudra également penser à compiler en faisant la combinaison de touches `maj` + `entrée` ou cliquer sur le bouton "exécuter" placé plus haut.

In [10]:
# Codez ici 

3

Il est également possible de définir une valeur par défaut pour un paramètre d'une fonction. On procède comme ceci
```python
def params_default(a = 5, b = 4):
  print("Je suis une fonction qui prend deux paramètres", a, b)
# Lorsque la fonction params_default est appelée sans paramètres, les paramètres a et b prendront comme valeur 5 et 4 respectivement.
```
**Notez qu'en Python, lorsqu'on appelle une fonction sans paramètres alors que sa signature en contient, une erreur sera levée.**

Ceci met fin à ce TP concernant l'apprentissage Python.