# Jupyter Notebook 


Jupyter se lance depuis une ligne de commande 

```
jupyter notebook
```

La commande lance un serveur accessible à l'adresse 'http://localhost:8888'
la commande génére également un token de sécurité.


Un notebook est composé de plusieurs cellules. La cellule actuelle est une cellule texte qui peut être mise en forme en utilisant le langage *markdown*. La cellule ci-dessous est une cellule de code qui peut s'éxecuter 

- **alt + entrée** : exécute la cellule et créé une nouvelle cellule en dessous
- **ctrl + entrée** : exécute la cellule et reste dessus
- **shift + entrée** : exécute la cellule et passe à la cellule existante en dessous

In [1]:
print('hello world')

hello world


Différents raccourcis claviers existent et sont accessible dans le menu d'aide.

**Jupyter notebook servira aux supports de cours.**

Vous pouvez en apprendre plus grâce à google, et au lien suivant : https://jupyter-notebook-beginner-guide.readthedocs.io/en/latest/

# A propos de python

- **Généraliste** : nombreux domaines d’application (calcul scientifique, administration système, développement web...)
- **Multi paradigme** : un paradigme est un ensemble de règles grammaticales et d'outils permettant au développeur de décrire des algorithmes. Exemples de paradigmes applicables à Python : impératif (la structure du code est découpée en procédures, souvent appelées fonctions, qui peuvent s'appeler entre elles), fonctionnel (imbrication de fonctions), orienté objet.
- **Langage de haut niveau** : gestion mémoire automatique, contrairement au langage C.
- Très grande bibliothèque standard dont plusieurs **bibliothèques scientifiques** : SciPy, NumPy, Matplotlib... C'est un langage qui peut interagir avec d'autres langages, avec des bases de données (SQL), des fichiers de données (documents ascii, cvs, xml, images...).
- Syntaxe orientée sur la **lisibilité du code** : claire, aérée, concise. (voir la [PEP8](https://www.python.org/dev/peps/pep-0008/) pour les standards du langages)
- **Plusieurs contextes d’utilisation** : Interface interactive (shell) > scripts > programmes > bibliothèques (modules).
- **Gratuit**, open-source avec une grande communauté (beaucoup de documentation en ligne anglophone ou francophone

## Syntaxe de base

Python est un langage de programmation complet, avec de nombreux concepts et subtilités. Le but de ce cours n'est pas de faire un cours sur python, mais d'en savoir suffisamment pour être opérationnel ou au moins comprendre les codes que nous exploiterons pour illustrer les notions de Data Science. Nous insisterons principalement sur les points suivants :

- Types de données de base
- Structures de données standards
- Fonctions
- Controle de flux


### Types de base

In [2]:
type(1)

int

In [3]:
type(1.)

float

In [4]:
type("1")

str

In [5]:
type(1+1j)

complex

In [6]:
type(True)

bool

Les **opérateurs de comparaison** permettent d'obtenir un booléen : 
- `==` (strictement égale à) ; 
- `!=` (différent de) ; 
- `>`  (strictement supérieur à) ; 
- `<`  (strictement inférieur à) ; 
- `>=` (supérieur ou égale à) ; 
- `<=` (inférieur ou égale à).

In [7]:
type(1 > 0)

bool

### Structures de données

#### Liste

In [8]:
ma_liste = [1,2,3]

In [9]:
type(ma_liste)

list

In [10]:
ma_liste[0]

1

In [11]:
ma_liste[-1]

3

In [12]:
len(ma_liste)

3

In [13]:
ma_liste.append(4)

In [14]:
print(ma_liste)

[1, 2, 3, 4]


#### Tuple

In [15]:
mon_tuple = (1, 2, 3)

In [16]:
mon_tuple[0]

1

In [17]:
mon_tuple.append(4)

AttributeError: 'tuple' object has no attribute 'append'

A la différence d'une liste, un tuple est immuable, on ne peut pas le modifier une fois instancié.

Prendre le temps de lire les erreurs que renvoie python est souvent très instructif.

#### Set

In [18]:
liste_avec_doublons = [1,1,1,2,2,2]
mon_set = set(liste_avec_doublons)
print(mon_set)

{1, 2}


Un set est un ensemble d'objets uniques.

In [19]:
mon_set_2 = {1,3}
print(mon_set.intersection(mon_set_2)) #intersection entre mon_set et mon_set_2
print(mon_set.difference(mon_set_2))
print(mon_set.union(mon_set_2))

{1}
{2}
{1, 2, 3}


#### Dictionnaire

Les structures précédentes permettent de regrouper plusieurs éléments, avec un accès séquentiel. Les dictionnaires vont plus loin en ajoutant une structuration supplémentaire. Il s'agit d'une table de hachage, associant un élément à une clé, qui permet d'y accéder directement.

In [20]:
mon_dict = {'A':1, 'B':2}
print(mon_dict)

{'A': 1, 'B': 2}


In [21]:
mon_dict['C'] = 3
print(mon_dict)

{'A': 1, 'B': 2, 'C': 3}


In [22]:
mon_dict.keys()

dict_keys(['A', 'B', 'C'])

In [23]:
mon_dict.items()

dict_items([('A', 1), ('B', 2), ('C', 3)])

### Controle de flux

<font color="red">Remarque</font> : l'indentation est très importante en Python ! De plus, elle rend le code plus lisible.

#### Conditions

In [24]:
a = 2
if a > 0 :
    b = 1
elif a == 0 :
    b = 0
else :
    b = -1

print("Comme a vaut", a, " alors b vaut", b)

Comme a vaut 2  alors b vaut 1


#### Boucles

In [25]:
for i in range(10):
    print(i)

0
1
2
3
4
5
6
7
8
9


In [26]:
for i in range(0,10,2):
    print(i)

0
2
4
6
8


In [27]:
for i in ma_liste:
    print(i)

1
2
3
4


In [28]:
for k,v in mon_dict.items():
    print(k,v)

A 1
B 2
C 3


### Fonctions

In [29]:
def increment_de_un(a):
    return a + 1

In [30]:
increment_de_un(1)

2

In [31]:
for i in range(5):
    if i % 2 == 0:
        print(increment_de_un(i))

1
3
5


### Modules

La commande `import` permet 

- Modules par défaut (https://docs.python.org/3/library/index.html)
- librairies externe qu'on installe : nous verrons les exemples des librairies scientifiques `numpy`, `sklean`, etc
- ou vos propres modules

In [32]:
import math 
math.sqrt(4)

2.0

On peut également importer des éléments spécifiques de la librairie

In [33]:
from math import sqrt
sqrt(4)

2.0

Notez la différence entre les 2 commandes. Dans le premier cas, nous important le module math, et la méthode sqrt y est rattachée, tandis que dans le deuxième cas, nous importons directement la méthode sqrt. Il est possible également de définir des alias pour des raisons de clarté, ou pour ne pas polluer le namespace.

In [34]:
from math import sqrt as racine
racine(4)

2.0