# Tutoriel d'introduction à Python

## Choix des outils

Nous allons travailler en Jupyter-notebook au cours du semestre et nous reposer sur des packages scientifiques (numpy, matplotlib).

### Etrangement, nous allons donc taper du code dans un navigateur web !!

* C'est contre nature...
* ... Mais c'est très simple à lancer et ça permet de se focaliser sur les algorithmes

### Nous allons faire du python... Mais avec des outils de haut niveau.

* Le fait d'exploiter très largement ```numpy``` permet d'avoir une syntaxe et une logique assez différentes de l'UE L1 *Eléments de programmation* que certains d'entre vous suivent en parallèle.
* Il reste évidemmment une base python à connaitre (variable, clause, boucle, etc...) sur laquelle les messages entre les UE peuvent diverger. Les divergences nous semblent malgré tout minimes et acceptables par les étudiants avec la certitudes que les UEs suivantes de programmation leur permettront de tout faire rentrer dans l'ordre.

## Pré-requis et lancement de l'UE.

L'UE L1 Data-sciences est pensée pour les étudiants ayant déjà fait du python. Ainsi, l'usage des variables, la syntaxe des clauses et boucles est traitée rapidement pour la mise à niveau de ceux qui ont des lacunes ou qui ont passé une année sans pratique. Les prérequis de l'UE sont très légers mais néanmoins non négligeables pour quelqu'un qui n'aurait jamais programmé.

Les consignes générales sont les suivantes:

1. pour travailler dans de bonnes conditions, commencer par installer un environnement de développement python sur votre machine personnelle.
    * Option simple, Anaconda https://www.anaconda.com/products/individual
        * C'est lourd (~500Mo) mais tout est inclus (python, packages scientiques) et ça marche sur linux, mac ou windows
        * Il y a plein de tutoriel pour lancer l'environnement, par exemple: https://openclassrooms.com/fr/courses/6204541-initiez-vous-a-python-pour-lanalyse-de-donnees/6204548-installez-python-et-anaconda
    * Option -un peu- plus complexe: travailler dans un environnement plus riche type visual studio code: https://code.visualstudio.com/docs/datascience/jupyter-notebooks
1. Travailler très sérieusement cette première séance pour pouvoir accéder à la suite de l'UE.
1. Interroger votre chargé de TD et vos collègues de promotion pour dépasser cette étape technique.



# Usage (basique) des notebooks

Les notebooks sont composés de cellules de textes & images (comme celle-ci) et de cellule de code qui sont exécutables. Nous parlerons indifféremment de bloc, cellule ou boite dans la suite.

**[Commande de base]** Dans l'environnement notebook, il faut taper SHIFT + RETURN pour exécuter le contenu d'une *boite*

**[Autres commandes]** Les menus ci-dessus (associés à des raccourcis claviers) permettent de créer de nouvelles boites, d'en supprimer et de les inverser (flèches).

* Tester ces différentes fonctionnalités: créer puis supprimer une boite, sélectionner une boite et la faire monter ou descendre.


Vérifiez toujours que vous êtes en python **3** (en haut à droite) dans le cadre des TME

## Types de base python et commande d'affichage
Les variables ont un type (entier, réel, etc...), mais ce type est inféré par python et non déclaré

Toutes les lignes ou fin de lignes commençant par # sont des commentaires qui ne sont pas interprétés par python

In [1]:
a = 1 # python sait qu'il s'agit d'un entier, la valeur est stockée dans a
print(a) # affichage
a = 45 # la valeur précédente est perdue, a vaut maintenant 45
print(a)

# Vérifier que vous êtes en mesure:
#   (1) d'exécuter cette boite de code
#   (2) de voir où s'affichent les résultats (1 et 45) => Normalement, immédiatement sous la boite

1
45


In [2]:
b = 18.5 # création d'un réel
b = b + a # récupération, manipulation, etc...
print(b)

63.5


In [None]:
# chaine de caractères: on peut utiliser les " ou les '
s  = "Bonjour et bienvenu à la formation continue"
s2 = 'une autre chaine'
print(s)
# une chaine de caractères est un tableau...
# récupération du 3ème caractère (Attention, les indices commencent à 0)
print("Le 3ème caractère est : ", s[2])
###
message = "tutoriel python"
# affichage formatté
print("a = {}, mess = {}".format(a,message))
print("a ", a, " ", message)

### Principal risque avec les notebooks:

La pile python dépend de l'ordre d'execution des boites... Garre aux mauvaises surprises.

L'exemple ci-dessous illustre ce risque:

1. exécution de A puis B puis C: affichage = 2
1. exécution de B puis A puis C OU A puis B puis de nouveau A puis C: affichage = 1

In [5]:
# boite A
v=1

In [3]:
# boite B
v=2

In [6]:
# boite C
print(v)

1


### Les fonctions mathématiques avancées

Pour plus d'informations:
* https://docs.python.org/3/library/math.html
* https://docs.python.org/3/library/random.html

**ATTENTION:** ces fonctions sont très utiles... Mais très rapidement, nous allons travailler dans l'univers ```numpy``` où les fonctions mathématiques sont redéfinies.

1. Passer rapidement sur la boite ci-dessous
1. Noter dans un coin de votre tête l'usage de ces fonctions
1. Se rappeler que dans la suite de l'UE, les fonctions random, cos, sin, ... seront celles de numpy et pas celles du python de base.

Les tutoriels sont donc assez denses et demandent de la prise de recul pour ne pas s'emmêler entre les différentes bibliothèques.

In [8]:
# récupération de valeurs et opérateurs spécifiques
# ... Pour lesquels il faut charger des bibliothèques spécifiques. 
import math 

print(math.pi)
theta = math.pi/3 # une variable comme une autre, nous sommes libre du choix des variables
print(math.cos(theta))

# générer des nombres aléatoires
import random
r = random.random() # entre 0 et 1
print(r)
r2 = random.randint(2, 33)
print(r2)

# exécuter plusieurs fois cette boite pour vérifier que les tirages aléatoires sont bien différents à chaque fois.

3.141592653589793
0.5000000000000001
0.7239620887242425
16


### Les listes et les dictionnaires

Les listes et dictionnaires jouent un role très important en python, nous allons étudier cela maintenant

Toutes les informations sur: https://docs.python.org/3/tutorial/datastructures.html

Note: comme dans l'immense majorité des langages de programmation, les indices de listes/tableaux démarrent à $0$ et se terminent à $longueur-1$. <BR>
```
maliste = [5, 6, 2]
maliste[0] # =5
maliste[1] # =6
maliste[2] # =2
maliste[3] # ERREUR: la case n'existe pas !
```

<font color='red'> **ATTENTION:**</font> comme pour la boite précédente, il faut maitriser les listes... mais nous allons rapidement passer à un usage des matrices ```numpy```. Il ne faudra pas confondre les objets listes et matrices !!!

In [3]:
# création d'une liste:
maliste = [] # equivalent de maliste = list()
print(maliste)
# ajout d'un élément
maliste.append(12)
# fusion de deux listes
listefus = maliste + [4, 6, 8]
print(listefus)
# récupération de la longueur d'une liste:
print(len(listefus))
# modification d'une valeur dans la liste:
listefus[0] = -1
print(listefus)
# suppression d'une valeur dans la liste (par indice)
listefus.pop(1)
print(listefus)
# suppression d'une valeur dans la liste (par valeur)
listefus.remove(8)
print(listefus)

[]
[12, 4, 6, 8]
4
[-1, 4, 6, 8]
[-1, 6, 8]
[-1, 6]


In [None]:
# Opérateur sur les listes
print(sum(listefus))
# trouver tous les éléments uniques d'une liste => créer un set (= ensemble de valeur unique), cf les structures de données en L2
print(set([2,15,3,9,2,15,15,15]))
# ordonner
li = [2,15,3,9,2,15,15,15]
li.sort()
print(li)
# compter un élément d'une liste:
print([2,15,3,9,2,15,15,15].count(15))

### Type de base *vs* objets


La programmation objet et les pointeurs sont des concepts avancés en programmation... On les utilise cependant implicitement dès qu'on commence à programmer. Les concepts suivants sont donc difficiles à appréhender et un peu hors du programme de l'UE: c'est un premier contact avec ce concept.

In [5]:
# les types de base (entier, réel, etc) se comportent de manière intuitive:
a = 2
b = a
a = 18 # aucun impact sur b
print(a,b)

# ATTENTION, les listes sont des objets != type de base:
li_a = [2, 4, 6, 8]
li_b = li_a # il n'y a qu'une liste... partagée entre deux variables li_a et li_b
li_b.append(12) # modification de l'objet partagé
print("li_a:" , li_a) # on peut acceder à l'objet par la variable li_a...
print("li_b:" , li_b) # ... ou la variable li_b => C'est le même objet.

# Pour eviter cela, on peut explicitement dupliquer l'objet
li_c = li_a.copy() # li_c est alors complètement différent de li_a
li_c.append(42)
print("li_a:" , li_a) # li_a inchangée
print("li_c:" , li_c) # li_c compte un élément de plus

18 2
li_a [2, 4, 6, 8, 12]
li_b [2, 4, 6, 8, 12]
li_a [2, 4, 6, 8, 12]
li_c [2, 4, 6, 8, 12, 42]


### Dictionnaire

Le dictionnaire est une structure de données importante. En python, elle est même centrale. L'idée est d'associer une clé et une valeur
```
clé 1 => valeur 1
clé 2 => valeur 2
etc...
```

C'est une manière élégante de stocker des informations. On peut ajouter des clés (en écriture), modifier la valeur associée à une clé (toujours en écriture) ou lire la valeur associée à une clé (lecture)

In [9]:
# dictionnaire = table de hash
# construction
mondico = {'champ1': 23, 'champ2': [12, 9.5]}
# Récupération d'une valeur
print("Accès à la valeur associée à 'champ' => " , mondico['champ1'])
# ajout d'un champ
mondico['champ3'] = 65
print("dictionnaire modifié:", mondico)

Accès à la valeur associée à 'champ' =>  23
dictionnaire modifié: {'champ1': 23, 'champ2': [12, 9.5], 'champ3': 65}


## Boucles et tests

Pour écrire des algorithmes, nous devons faire des boucles sur des structures de données et tester des grandeurs...

Pas d'accolades en python: les blocs de code sont délimités par des tabulations (ou 4 espaces).

In [None]:
# Comment marche un if
i=0
if i<30:
    i = i + 10;
    print("i est inferieur a trente")
else:                                 # le else est optionnel 
    print("i est superieur a trente")

i=0
if i==1:
    print("cas 1")
elif i==2:
    print("cas 2")

# appartenance à une liste
a = 12
li = [8,10,12,14]
if a in li:
    print("trouvé !")

In [15]:
# Egalité entre objet 
# Notion objet = un peu hors programme... Mais néanmoins important car ça a un impact direct sur les tests d'égalité
# Heureusement, en python avec les listes, ça se passe bien (= conforme à l'intuition)

#Egalité référentielle (il n'y a qu'un objet)
l1 = l2 = [1,2]
# ou bien
l1 = [1,2]
l2 = l1

print("l1 == l2", l1 == l2) # True => Intuitif

# cas DIFFICILE
# Construction de deux objets distincts mais contenant les mêmes valeurs
l1 = [1,2]
l2 = [1,2]

print("l1 == l2", l1 == l2) # True => python fait bien un test pour vérifier si tous les éléments sont égaux


l1 == l2 True
l1 == l2 True


In [16]:
# Construction d'un boucle for:
for i in range(10): # sol 1: range => i va prendre les valeurs entre 0 et 9
    print(i) # ATTENTION: l'indentation donne la portée de la boucle
print('===') # je suis sorti de la boucle (parce que mon code est revenu à gauche)
# vous pouvez tester le décalage de cette dernière commande pour voir la différence

li = [12, 43, 90, 1, 6] 
for i in li:        # sol 2: parcours des valeurs d'une liste
    print(i)

0
1
2
3
4
5
6
7
8
9
===
12
43
90
1
6


In [None]:
# les autres boucles
i = 0
while i<10: # tant que i inférieur à 10
    i = i+1
    print(i)

## Opérateurs logiques

Les principaux opérateurs sont ```and```, ```or``` et ```not```.

In [17]:
print(True and False)
# False
print(not False)
# True
print(True or False)
# True

True

## Les boucles de compréhension

On peut s'amuser à créer des boucles directement dans les listes

  (1) C'est assez illisible et pas recommandé dans un premier temps
  
  (2) C'est très rapide en python par rapport à une boucle traditionnelle: on s'en sert régulièrement ensuite.

In [18]:
# création de listes en utilisant des boucles imbriquées:
a = [n for n in range(10)]
m = [[n+m*10 for n in range(5)] for m in range(5)]
print(a)
print(m)

# les creations complexes... Par exemple: tous les entiers jusqu'à 20 sauf ceux qui divisent 2 ou 3
a = [n for n in range(20) if n%2 != 0 and n%3 !=0]
print(a)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[[0, 1, 2, 3, 4], [10, 11, 12, 13, 14], [20, 21, 22, 23, 24], [30, 31, 32, 33, 34], [40, 41, 42, 43, 44]]
[1, 5, 7, 11, 13, 17, 19]


## Définition de nouvelle fonction

Pour pouvoir refaire plusieurs fois des opérations complexes, il faut factoriser le code dans une fonction puis faire appel à cette fonction plusieurs fois.

Par exemple, le calcul d'un angle entre 2 vecteurs en 2 dimensions:
$$ \widehat{\vec{u},\vec{v}} = \text{acos}\left (\frac{\vec{u}\cdot \vec{v}}{\|\vec{u}\|\|\vec{v}\|}\right), \qquad \vec{u}\cdot \vec{v} = u_{x}v_{x} + u_{y}v_{y}, \qquad \|\vec{u}\| = \sqrt{u_{x}u_{x} + u_{y}u_{y}}$$

In [9]:
# travail amont : bien identifier les entrées et les sorties
# je veux travailler sur deux vecteurs (qui seront ici des listes de 2 valeurs)
def calcul_angle(u, v):
    """                  
    Manuel de la fonction
    Calcul de l'angle entre le vecteur u et le vecteur v. u et v dans R^2
    """
    return math.acos( (u[0]*v[0]+u[1]*v[1]) / (math.sqrt(u[0]*u[0]+u[1]*u[1]) * math.sqrt(v[0]*v[0]+v[1]*v[1])))

# test de la nouvelle fonction (qui sera accessible partout dans la suite)
print(calcul_angle([0,1], [2, 0]))

# affichage de l'aide si vous avez mis les bons commentaires
help(calcul_angle)

1.5707963267948966
Help on function calcul_angle in module __main__:

calcul_angle(u, v)
    Manuel de la fonction
    Calcul de l'angle entre le vecteur u et le vecteur v



## Usage de fonctions définies dans un fichier .py

Note pour les séances ultérieures, NE PAS FAIRE DANS LA PREMIERE SEANCE

Il est possible de mixer du python classique avec un usage notebook. Celà devient même essentiel quand les programmes se complexifient.

1. Avec n'importe quel éditeur, créer le fichier `mesfonctions.py` contenant le code suivant:
```python
# fichier mesfonctions.py
import numpy as np
def gererate_ones(n):
    return [1]*n # une liste de 1 de taille n
```
1. Sauver le fichier `mesfonctions.py dans le même répertoire que le notebook
1. Exécuter le code de la boite ci-dessous

In [5]:
from mesfonctions import *

a = gererate_ones(12)
print(a)

[1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1. 1.]
