# Rappel / mise à niveau à niveau python pour le data scientist

## Alexander Buchholz, alexander.buchholz@ensae.fr, doctorant en fin de thèse à l'ENSAE

Les élements de ce cours : https://github.com/alexanderbuchholz/formation_utt

Formation de 3 jours à 4 heures
* Basé sur des notebook ipython/ jupyter
* Rappel de base de python
* Calcul numérique avec numpy
* Le module scipy pour les distributions
* Visualisation avec matplotlib et seaborn
* Stocker et traiter ses données avec pandas
* Pour aller plus loin: notre premier modèle machine learning en utilisant sklearn
* Si on a le temps : SQL

Approache interactive:
J'explique et vous lancez les programmes en même temps pour voir comment ça fonctionne



D'autres resources: 
* https://github.com/paris-saclay-cds/python-workshop/blob/master/Day_1_Scientific_Python/01-numpy-introduction.ipynb
* https://www.kaggle.com/learn/python

Je recommande les tutoriels de kaggle, ils sont très bien fait et assez facile à suivre !

https://www.kaggle.com/learn/overview

Le livre "Python Data Science Handbook" de Jake VanderPlas, gratuit en ligne, assez complèt

https://jakevdp.github.io/PythonDataScienceHandbook/


On utilisera python 2.7

Installer python et jupyter sur votre machine:

De préference par anaconda : https://www.anaconda.com/

# C'est parti ! 

In [None]:
first_string = "Bonjour tout le monde!"
print(first_string)

In [None]:
type(first_string)

Combien de charactère ? 

In [None]:
len(first_string) # affiche le nombre de charactère

In [None]:
first_string+" Vous etes prets ?" # concatener des strings

Les autres types: numeriques, listes, dictionnaires

In [None]:
a_int = 10
type(a_int)

In [None]:
b_numerique = 2.5
type(b_numerique)

In [None]:
a_int/b_numerique

Mais attention à la division int/int

In [None]:
10/4

Les listes

In [None]:
first_list = [4, 5., 6]
type(first_list), len(first_list)

### Mannipuler les listes: 

In [None]:
first_list.append(7.)
print first_list

Un autre piège dans python : 

In [None]:
second_list = first_list
print(second_list)

In [None]:
second_list[0] = 'a'
print first_list

second_list "pointe" vert first list, on a modifié first list!

La compréhension de liste, un outil très pratique !

In [None]:
list_of_numbers = range(12) # pour gener une sequence
list_of_numbers_added = [i_number**2 for i_number in list_of_numbers ]

In [None]:
list_of_numbers_added

In [None]:
# on peut faire la meme chose avec une boucle for:
list_of_numbers_added_loop = []
for i_number in list_of_numbers:
    list_of_numbers_added_loop.append(i_number**2)
list_of_numbers_added_loop

En python les boucles sont lents !

A eviter si possible ! 

### Maintenant les fonctions:

In [None]:
# passons par des fonctions maintenant
def squared_number_loop(max_number):
    list_numbers = []
    for i_number in range(max_number):
        list_numbers.append(i_number**2)
    return list_numbers

def squared_number_list_comp(max_number):
    list_of_numbers = [i_number**2 for i_number in range(max_number) ]
    return list_of_numbers
print squared_number_loop(12)
print squared_number_list_comp(12)
      

Comparons la vitesses des deux:

In [None]:
%timeit squared_number_loop(12)

In [None]:
%timeit squared_number_list_comp(12)

Deux mots en plus sur les fonctions:

In [None]:
def function_with_keywords(mots1, mots2=""):
    print mots1+mots2
function_with_keywords('Hello')
function_with_keywords('Hello', mots2=' my friend')

## Les boucles while

In [None]:
i_iter = 0
while i_iter < 5: # on evalue tant que la condition est juste
    print i_iter
    i_iter += 1 # une autre façon d'écrire i_iter = i_iter + 1


## Un point fort de python : iterer au sein des iterables 
Un exemple:

In [None]:
list_to_iterate = [[1,2,3], [4,5,6], [7,8,9]]

for inner_list in list_to_iterate:
    for element in inner_list:
        print element

## Les booléen et les condidition

In [None]:
a = 2
if a == 0:
    print 'le numero vaut zero'
elif a == 1: 
    print 'le numero vaut un'
else:
    print 'le numero vaut ni zero ni un'

les dictionnaires : votre structure par défaut si vous données commencent à devenir compliquées

In [None]:
dict_telefon = {'alex' : '0633', 'marie' : '0755', 'pierre' : '9867'} # basé sur la structure clé : entrée

In [None]:
# pour acceder les elements: 
print dict_telefon['alex']
# pour en ajouter:
dict_telefon['alice'] = '4423'

In [None]:
# on lance les appels: 
for key, item in dict_telefon.items():
    print 'J\'appelle %s avec le numero %s'  %(key, item) # permet d'inserer les elements

## Des libraries outils: pickle, os, sys

On va dabord afficher notre structure de dossier et créer un nouveau dossier, puis le supprimer

In [None]:
import os
#import sys
import pickle
#help(pickle)
print os.getcwd()
current_dir = os.getcwd()
string_for_new_directory = "/test_folder_1"
# on va créer un nouveau fichier
os.mkdir(current_dir+string_for_new_directory)
# on affiche la liste des tous les éléments dans le fichier actuel
print os.listdir(current_dir)

# on peut aussi le supprimer
os.rmdir(current_dir+string_for_new_directory)

print os.listdir(current_dir)
# le ficher n'est plus là !

Maintenant on va enregistrer des objets python à l'aide du module pickle

In [None]:
bonjour_string = 'Bonjour, vous etes toujours la ?'
pickle.dump(bonjour_string, file('bonjour_string.pkl', "wb"))
#help(pickle.dump)
print os.listdir(current_dir)

quel_string = pickle.load(file('bonjour_string.pkl', "rb"))
print quel_string

# ou plus propre : ça permet de refermer la connection vers le fichier après utilisation
with file('bonjour_string.pkl', "rb") as file_to_load:
    quel_string_2 = pickle.load(file_to_load)
    print quel_string_2

## La programmation orientée objet

In [None]:
class compte_bancaire(object):
    """
    un compte bancaire
    """
    def __init__(self, name, montant_initial):
        """
        l'initialization, on crée une instance de la classe 'compte_bancaire'
        on a besoin du nom et du montant initial
        """
        assert type(name) is str
        assert type(montant_initial) is float or type(montant_initial) is int
        
        self.name = name
        self.montant_initial = montant_initial
        self.montant_courant = montant_initial
        
    def depot_darget(self, montant):
        self.montant_courant += montant
        print 'Vous avez deposer %s euro et votre montant courant et maintant de %s euro' % (montant, self.montant_courant)
    def retrait_darget(self, montant):
        self.montant_courant -= montant
        print 'Vous avez retirer %s euro et votre montant courant et maintant de %s euro' % (montant, self.montant_courant)
        if self.montant_courant < 0: 
            print 'Attention! Vous etes dans le négatif!'

class compte_bancaire_gold(compte_bancaire):
    def payer_par_carte_de_credit(self, montant):
        self.montant_courant -= montant
        print 'Vous avez payé avec votre carte %s euro et votre montant courant et maintant de %s euro' % (montant, self.montant_courant)

In [None]:
compte_alex = compte_bancaire('alex', 100)
compte_alex.depot_darget(10)
compte_alex.retrait_darget(120)
compte_alex.payer_par_carte_de_credit(10)

In [None]:
compte_alex.montant_courant

## Exercise 1: 
Ecrire une pemiere fonction qui construit un dictionnaire de longeur N, avec les clés str(i) et i va de 0 a N-1 et les valeurs qui equivant i^3
Puis ecrire une deuxieme fonction qui parcours le dictionnaire et qui ajoute à chaque valeurs impaires + 1 (on se retrouve à la fin avec un dictionnaire qui contient que des valeurs paire). 
Lancer et visualiser pour N = 5, N = 10.

## Exercise 2: 
Modifier les dictionnaire dict_telefon et en faire un dictionnaire de dictionnaire, a chaque personne sera associé un numbero de telephone et une adresse mail. Pour les addresse mail utiliser nom@dataspecialiste.ai. 
Puis ecrire une fonction qui écrit un texte de la forme 
"bonjour x, j'ai essayé de vous joindre sous l'adresse xxx et le numero yyyy. Pourriez vous me rappeller svp?"

### Pour les rapides: 
Pour encore aller plus loin créer un fichier appart que vous importez. Google est votre ami pour toute question de programmation!