# Introduction

Python est un langage de programmation, sa première version date du début des années 90. C'est un lanagage haut niveau, ceci signifie donc que les mot-clés sont souvent issus de la langue anglaise ou encore qu'il y a beaucoup d'abstractions, par exemple, les développeurs n'ont pas à gérer la mémoire en Python. `malloc`, `alloc`, tout ça on oublie.

Le langage est extrêmement polyvalent et est utilisable surtout les systèmes d'exploitation aussi bien sur PC, tablette ou encore smartphone.

Attention, la syntaxe du Python peut être déroutante de prime à bord, en Python pas d'accolades ({}) ou de point-virgules ( ; ), l'imbrication est faite avec des espaces (qui peuvent être remplacés par des "tabulations").

Le cours étant dédié à l'univers du Big Data, nous n'allons pas faire du Python de façon _traditionnelle_, en tant normal, il nous faudrait créer des fichiers avec l'extension ".py" et les compiler, mais grâce à **Jupyter Notebook**, nous allons pouvoir faire du Python de façon beaucoup plus conviale et interactive. Par ailleurs Jupyter Notebook est un outil très utilisé en data-science.

Jupyter notebook propose des avantages non négligeables comme la possibilité de formatter du texte grace au markdown.
- [Voir la documentation du markdown](https://github.com/adam-p/markdown-here/wiki/Markdown-Cheatsheet)

Les notebooks servent également de lieu pour coder en Python, compiler le code et voir le résultat. Pratique.

Ce logiciel fonctionne avec un système de cellules, le texte que vous lisez présentement est dans une cellule (écrite en markdown), chaque cellule peut être d'un type bien spécifique.

![alt text](https://raw.githubusercontent.com/DanYellow/cours/main/big-data-s4/travaux-pratiques/numero-4/ressources/liste-types-cellules.jpg)

Seul les deux premiers types nous seront utiles :
- "markdown" pour le texte
- "code" pour coder en Python


Pour ajouter une nouvelle cellule rien de plus simple, il suffit d'appuyer sur l'icône "+" en haut.

![alt text](https://raw.githubusercontent.com/DanYellow/cours/main/big-data-s4/travaux-pratiques/numero-4/ressources/ajout-cellule.jpg)

Enfin, dernière fonctionnalité de barre d'outils que nous allons utiliser souvent le bouton "exécuter".

![alt text](https://raw.githubusercontent.com/DanYellow/cours/main/big-data-s4/travaux-pratiques/numero-4/ressources/executer-cellule.jpg)

Sachez qu'il est également possible d'exécuter une cellule avec le raccourci clavier `maj` + `entrée`. Par défaut, c'est la cellule courante/active qui est executée, il est possible d'en exécuter plusieurs en même temps en sélectionnant plusieurs cellules en maintenant la touche `maj`.

Il y a d'autres options dans la barre d'outils, on ne va pas toutes les lister, à vous d'expérimenter. En tous les cas ,les trois fonctionnalités listées sont celles qu'on utilisera le plus.

P.-S. : Pour éditer une cellule markdown, il vous suffit de double-cliquer dessus.

P.-S. 2 : Il est possible d'utiliser jupyter sous VS Code, en revanche, il vous faudra utiliser une extension appelée "Jupyter".

# Variables

Le typage des variables n'est pas obligatoire en Python, mieux encore, il n'est pas utile de déclarer les variables, il n'y a pas de mot-clé comme `var` ou `let` comme en javascript, une variable est déclarée à sa première déclaration. A noter que le nom des variables est sensible à la casse. Ainsi déclarer une variable qui s'appelle "A", n'est pas la même chose que "a".

Par convention, les variables en Python sont écrites en "snake case" ceci signifie donc que les mots sont écrits en minuscules et séparés par des tirets bas (_). 

- [Voir documentation sur la snake case](https://fr.wikipedia.org/wiki/Snake_case)

In [2]:
# Exemples (le caractère "#" permet de définir un commentaire)

premiere_var = "Ma première valeur" # Ici on déclare une chaîne de caractères
un_entier = 5 # Ici un entier
un_tableau = [45, "bonjour", 87, "90"] # Ici un tableau

[45, 'bonjour', 87, '90']

Il est même possible de concatener les variables avec le caractère `+`

In [4]:
ma_premiere_chaine = "Bonjour"
ma_seconde_chaine = "Tout le monde"

# Et ici on affiche tout avec un espace entre les deux chaînes
ma_premiere_chaine + " " + ma_seconde_chaine

'Bonjour Tout le monde'

# A vous de coder

Déclarez des variables répondant aux critères suivants (une ligne une variable) :
- Un nombre décimal
- Une chaîne de caractères
- Un tableau de nombres entiers
- Un dictionnaire / tableau associatif (vous allez devoir chercher sur le web la réponse)

Affichez le résultat avec la fonction `print()`. Il faudra également penser à compiler en faisant la combinaison de touches `maj` + `entrée` ou cliquer sur le bouton "exécuter" placé plus haut.

#### **N'oubliez pas de sauvegarder**

In [1]:
# Exemple d'utilisation de la fonction print()
print("Hello world")

Hello world


Bravo, vous avez écrit avec brio vos premières lignes en Python. La fonction `print()` nous sera très utile pour débugger. **Jupyter propose également la fonction `display()`**, le rôle est identique à `print()` sauf que l'affichage est parfois plus élégant notamment sur les DataFrame, mais ça on le verra plus tard.

# Un dictionnaire / tableau associatif

Un tableau associatif est un structure très utile pour stocker des données qui font ensemble, cette structure est composée de clé-valeur où les clés, contrairement aux tableaux classiques, sont des chaînes de caractères (et parfois des entiers) ce qui rend leur structuration plus ordonnée. En contrepartie, les tableaux associatif ne permettent pas vraiment d'ordonner les données.

Dans un tableau associatif, il est possible d'accéder à une valeur via la clé de l'index. Considérons le dictionnaire suivant :
```
voiture = {
    marque: "Porsche",
    modele: "Panamera",
    prix: 50000
}
```
Si je veux accéder à valeur placée pour la clé "marque", il faudra écrire `voiture["marque"]`.

- [Voir documentation sur les dictionnaires en Python - anglais](https://www.w3schools.com/python/python_dictionaries.asp)

# A vous de coder

- Utiliser la fonction `print()` ou `display()` pour afficher une valeur du dictionnaire que vous avez crée précédemment.

#### **N'oubliez pas de sauvegarder**

# if... else et boucle for

In [5]:
a = 33
b = 200

if b > a:
    print("b est plus grand que a")
else:
    print("a est plus grand que b")

b est plus grand que a


La structure if...else ce n'est pas uniquement comparer si un nombre est plus grand qu'un autre, il est également possible de comparer sur d'autres critères.


Comme dit précédemment le Python, par son côté haut niveau, s'approche beaucoup de la langue anglaise au niveau de sa syntaxe. Ainsi, en Python, les opérateurs logiques `ET` et `OU`, qui prennent souvent la forme de `&&` ou `||` en programmation, sont écrits `and` et `or`. On peut donc écrire la chose suivante.

In [7]:
# On déclare deux entiers.
# Pour rappel, pas de "var", "int" ou autre pour déclarer une variable en Python
a = 33 
b = 200

if b > 0 and a > 0:
    print("b et a sont strictement positifs")
else:
    print("b et a ne sont pas strictement positifs")
# Remplacez "and" par "or" pour tester le "ou" logique

b et a sont strictement positifs


Pour les boucles, il n'y a qu'une seule instruction possible : `for in:`, elle permet de parcourir des tableaux ou encore des chaînes de caractères (quelque soit le langage de programmation, une chaîne de caractères est en fait un tableau).

In [10]:
liste_fruits = ["pêche", "banane", "ananas"]
# ici on liste et "print()" tous les éléments du tableau "liste_fruits"
for fruit in liste_fruits:
    print(fruit)

pêche
ananas


Pour fonctionner de façon plus conventionnelle, comme un `for(var i = 0; i < limite; i++){}`, on utilise toujours la fonction `for in:` mais accompagnée de la fonction `range()`. Dans son utilisation la plus basique la fonction va prendre un seul et unique paramètre et retourner un `range` (type de variable) content une liste d'entiers compris entre 0 et le chiffre mis en paramètre.

In [14]:
# Va lister toutes les valeurs entre 0 et 6, 0 inclus
for chiffre in range(6):
    print(chiffre)

0
1
2
3
4
5


Si on place un deuxième paramètre à la fonction `range()`, il est possible de définir nous-même les bornes, de ce fait, en écrivant `range(1, 11)`, on demande à lister tous les entiers compris entre 1 et 11, le deuxième paramètre étant toujours exclu.
Enfin, il est possible de passer un troisième et dernier paramètre qui va définir le pas d'avancement, on peut donc définir un `range()` où on avance de 5 en 5 ou encore de 20 en 20, par défaut le pas de la fonction `range()` est de 1.

Notez que le résultat de la fonction `range()` n'est pas affichable dans la fonction `print()`.

# A vous de coder

Déclarez des boucles répondant aux critères suivants (une ligne une boucle) :
- Une boucle qui affiche (print) les éléments d'un tableau au fur et à mesure
- Une boucle qui affiche (print) les entiers de 0 à 99 (inclus) au fur et à mesure
- Une boucle qui affiche (print) les entiers de 0 à 1 000 au fur et à mesure avec un pas de 100

**Pensez bien à rajouter une cellule de type "code" en appuyant sur le bouton "+" en haut à gauche**

# Tableau de dictionnaires

Nous avons vu précédemment les dictionnaires et les tableaux, le mélange des deux (tableau de dictionnaire) est une structure très utile pour stocker plusieurs dictionnaires qui identiques, par identiques on entend que tous les dictionnaires ont les mêmes clés. Le tableau de dictionnaires n'est pas sans rappeler un tableur où les dictionnaires seraient des lignes et les clés des colonnes. 

Nous allons beaucoup utiliser cette structure, il est donc très important de la comprendre. Nous allons partir avec le tableau de dictionnaires suivant

```
liste_voitures = [
    {
        marque: "Porsche",
        modele: "Panamera",
        prix: 50000
    },
    {
        marque: "Tesla",
        modele: "S",
        prix: 100000
    },
    {
        marque: "Toyota",
        modele: "Rav4",
        prix: 35000
    },
    {
        marque: "Ford",
        modele: "F-150",
        prix: 30000
    }
]
```

# A vous de coder

Déclarez des boucles répondant aux critères suivants (une ligne une boucle) :
- Une boucle qui affiche (print) uniquement la clé "prix" d'un véhicule
- Une boucle qui affiche (print) les entiers de 0 à 99 (inclus) au fur et à mesure
- Une boucle qui affiche (print) les entiers de 0 à 1 000 au fur et à mesure avec un pas de 100

**Pensez bien à rajouter une cellule de type "code" en appuyant sur le bouton "+" en haut à gauche**

# Fonctions

Comme tout langage de programmation, il est également possible en Python d'écrire des fonctions, le mot-clé est `def`. Etant donné qu'en Python, il n'y a pas d'accolades ({}) ou de point-virgules ( ; ) pour définir les instructions dans le code, il faut mettre le contenu de la fonction en retrait par rapport au mot-clé "def", ceci est fait grâce à la touche tabulation (la touche à gauche de la touche "A" de votre clavier). Exemple :

```python
# Après le mot-clé "def", il faut définir le nom de la fonction (obligatoire) et faire suivre de ":"
def ma_fonction(): 
  print("Je suis une fonction")
```
La fonction peut ensuite être appelée de la façon suivante `ma_fonction()`.

Bien évidemment, une fonction peut prendre des paramètres, il est donc possible d'écrire la chose suivante :

```python
def ma_fonction_avec_paramtres(a, b):
  print("Je suis une fonction qui prend deux paramètres")
```
Ci-dessus on définit une fonction appelée "ma_fonction_avec_paramtres" acceptant deux paramètres appelés a et b respectivement.

Enfin notez qu'une fonction définit une scope, une variable définie dans une fonction n'est pas accessible à l'extérieur d'une fonction n'est pas accessible à l'extérieur, il est en de même pour la boucle for et la structure if/else. Aussi, en Python, si vous appelez une fonction avec des paramètres manquants

# A vous de coder

Ecrire du code correspondant aux critères suivants : 
- Une fonction qui prend en paramètre un entier et le multiplie par lui-même et print() le résultat
- Une fonction qui prend un paramètre un nom et un prénom et retourne la concaténation des deux chaînes.
- Une fonction qui prend en paramètre une chaîne de caractères et la retourne à l'envers et print() le résultat
- Une fonction qui prend en paramètre deux entiers, les divise et retourne en résultat l'entier le plus proche. Par exemple, si la fonction divise 5 par 3, la fonction doit retourner 2.

N'oubliez pas d'appeler les fonctions et d'en afficher le résultat avec la fonction `print()`. Il faudra également penser à compiler en faisant la combinaison de touches `maj` + `entrée` ou cliquer sur le bouton "exécuter" placé plus haut.

Il est également possible de définir une valeur par défaut pour un paramètre d'une fonction. On procède comme ceci
```python
def params_defaut(a = 5, b = 4):
  print("Je suis une fonction qui prend deux paramètres", a, b)
# Lorsque la fonction params_default est appelée sans paramètres, les paramètres a et b prendront comme valeur 5 et 4 respectivement.
```

Ceci met fin à ce TP concernant l'apprentissage Python.