# Rappel pour Python

Revoyons quelques concepts de base avec Python.

* **Usage de `help`.**    
    Au besoin, afin d'obtenir de l'information sur l'usage et les paramètres d'une fonction, utilisez help (ex: help(range)).


In [1]:
help(range)

Help on class range in module builtins:

class range(object)
 |  range(stop) -> range object
 |  range(start, stop[, step]) -> range object
 |  
 |  Return an object that produces a sequence of integers from start (inclusive)
 |  to stop (exclusive) by step.  range(i, j) produces i, i+1, i+2, ..., j-1.
 |  start defaults to 0, and stop is omitted!  range(4) produces 0, 1, 2, 3.
 |  These are exactly the valid indices for a list of 4 elements.
 |  When step is given, it specifies the increment (or decrement).
 |  
 |  Methods defined here:
 |  
 |  __bool__(self, /)
 |      self != 0
 |  
 |  __contains__(self, key, /)
 |      Return key in self.
 |  
 |  __eq__(self, value, /)
 |      Return self==value.
 |  
 |  __ge__(self, value, /)
 |      Return self>=value.
 |  
 |  __getattribute__(self, name, /)
 |      Return getattr(self, name).
 |  
 |  __getitem__(self, key, /)
 |      Return self[key].
 |  
 |  __gt__(self, value, /)
 |      Return self>value.
 |  
 |  __hash__(self, /)
 |

* **Structure `list`, fonction `range`**.    
    Créez une liste croissante des nombres allant de 0 à 10. Créez une liste décroissante des mêmes nombres.


In [5]:
l1 = range(11)
l2 = range(10,-1,-1)

print(l1)
print(l2)

range(0, 11)
range(10, -1, -1)


* **Structure `for`**.        
    Additionnez les listes terme à terme: essayez avec l'opérateur +. Que se passe-t'il? Faites-le maintenant avec une boucle for.


In [8]:
l3 = []
for i,j in zip(l1,l2):
    l3.append(i+j)
print(l3)

[10, 10, 10, 10, 10, 10, 10, 10, 10, 10, 10]


* **Structure `def`**.      
    Voici comment on pourrait définir une fonction "plus un":

        def plus_un(s):
            s = s + 1
            return s

    Notez l'importance de l'indentation!

# Numpy: manipulations de base

*Note:* Si vous êtes familier avec matlab, cette [page web](http://www.scipy.org/NumPy_for_Matlab_Users) vous permettra de voir les principales correspondances matlab/numpy en terme de syntaxe.



### Manipulations de base

Commençons par quelques manipulations de base.

* Avec la fonction `arange` de numpy, créez un tableau d'éléments 0 à 10 exclusivement.

In [None]:
import numpy as np
t = None

* Déterminez le type du tableau avec la fonction `type`. Déterminez maintenant le type d'un élément du tableau (utilisez l'opérateur []). Affichez la dimension du tableau (qui est de type tuple): `print(le_tableau.shape`.)

* Accédez aux éléments 3 à 6 à l'aide de l'opérateur «:».

* Maintenant, créez un second tableau de 10 éléments, cette fois-ci en convertissant une liste d'éléments (x = [1,2,3,...]) en tableau à l'aide de la fonction array. 


In [None]:
x = [0,1,2,3,4,5,6,7,8,9]

Remarquez que vous pouvez maintenant utiliser l'opérateur + pour faire une addition terme à terme des deux tableaux. 
* faisez un addition des listes pythons avec `+`
* faisez un addition des `np.array` avec `+`

Subtilité à garder à l'esprit: numpy contient à la fois une classe ndarray et une classe matrix qui, bien évidemment, se comportent différemment. Par exemple, l'opérateur * est, dans le premier cas, une multiplication terme à terme, tandis qu'il consiste en une multiplication matricielle dans le second cas.
* faisez un multiplication des 1D np.array * np.array, utilisez `t`
* faisez un multiplication des 2D np.matrix * np.matrix, utilisez `m`
* faisez np.dot des 2D np.array, np.array, utilisez `t2`

In [None]:
# experiments avec +

# experiments avec *
m = np.matrix(t).reshape(2,5)
t2 = t.reshape(2,5)

* Modifiez la dimension de l'un de vos tableaux : (tab.shape = 2,3). Que se passe-t'il? Essayer avec (tab.shape = 2,5). Confirmez la nouvelle dimension à l'aide de la fonction shape.

### Statistiques

Nous allons maintenant générer quelques données et en vérifier les statistiques.

* Créez un tableau de dimension 100 lignes par 2 colonnes. Vous pouvez utiliser la fonction ones ou zeros.


* Remplissez chacune de ces colonnes avec des échantillons tirés de deux gaussiennes. 
  * Pour se faire, utilisez la fonction normal afin de générer d'abord 100 observations de moyenne 0 et d'écart type 1. Utilisez help afin de connaître les paramètres de la fonction normal. 
  * Remplissez la première colonne (tableau[:,0]) à l'aide de ces observations. Si vous avez de la difficulté, regardez quelle est la dimension des différents tableaux avec la fonction shape.
  * Faites de même pour la deuxième colonne, mais cette fois-ci avec une gaussienne de moyenne 0 et d'écart-type 5.


* Validez vos données à l'aide des fonctions mean et std. Faites-le en utilisant l'argument axis.

# On s'amuse avec des fleurs

Nous allons maintenant nous intéresser à un jeu de données réelles, bien que petit. Il s'agit d'[iris](http://en.wikipedia.org/wiki/Iris_flower_data_set), disponible [ici](http://www.iro.umontreal.ca/%7Edift3395/files/iris.txt). Commencez par télécharger le fichier et le mettre dans le mêne dossier que ce fichier notebook, puis chargez le jeu de données avec la fonction numpy loadtxt :

 

In [None]:
iris = 

### Travailler avec des `array` numpy

Vous avez maintenant accès à un *array* nommé iris.

* imprimez les dimensions avec `shape`
* visualisez des éléments du jeu de données

L'accès aux éléments d'une matrice numpy se fait de manière similaire à une liste python, à la différence qu'on peut accèder à un élément de la sous liste directement.
* imprimez le premier element du `list l` avec `[][]`
* imprimez le premier element de `np.array nl` avec `[,]`

In [None]:
l = [[0,1,3],
     [4,5,6],
     [7,8,9]]
nl = np.array(l)

L'avantage est qu'on peut déterminer des intervales de manière beaucoup plus efficace. Il est maintenant possible d'utiliser l'opérateur «`:`» pour définir un intervale sur toutes les sous listes en même temps
* imprimez les elements 4,5,7,8 de `np.array` utilisant `[:]`

In [None]:
# tous les elements
print(nl)
print(nl[0:,:3])

# 4,5,7,8 avec un list
print([arr[:2] for arr in l[1:]])

# 4,5,7,8 avec numpy array

Le jeu de données comporte 150 exemples: 50 pour chaque classe. Chaque rangée correspond à un exemple - quatre traits/caractéristiques/features, plus la classe/le label/l'étiquette soit ("1", "2", ou "3").
 
* Accèdez à la 23e rangée de l'`array` iris

* Accèdez à la 3e colonne


* Maintenant, Accèdez aux éléments des rangées 0 à 9 en ne prenant que les colonne 1 et 2

L'index négatif peut être utilisé pour parti de la fin plutôt que du début d'une liste. 
* Accèdez à la dernière rangée


On peut aussi utiliser l'index négatif pour définir des intervales avec l'opérateur «`:`». Cela s'applique autant pour les index des listes python que pour les `array` numpy.
* Utilisez judicieusement l'index pour accèder à la rangée 23 et toutes ses colonnes sauf la dernière

### Quelques fonctions utiles de numpy

Nous poursuivons avec le jeu de données iris (cf section précédente). Assurez-vous que vous comprenez les fonctions suivantes en les exécutant. Elles seront utiles pour la suite.

**sum** : Somme des éléments d'un vecteur/matrice        
> `axis` spécifie sur quelle "dimension" il faut faire l'opération

In [None]:
np.sum(iris)
np.sum(iris,axis=0)
np.sum(iris,axis=1) 

**min**, **max** : Valeure(s) minimale(s) ou maximale(s) d'un vecteur/matrice
> Véfiriez l'effet d'`axis` dans ce cas ci

In [None]:
np.min(iris)
np.min(iris,axis=1)
np.min(iris,axis=0)

np.max(iris,axis=0)

**argmax**, **argmin** : Index de(s) valeur(s) minimale(s) ou maximale(s) d'un vecteur/matrice

In [None]:
np.argmin(iris)
np.argmin(iris,axis=1)
np.argmin(iris,axis=0)

np.argmax(iris,axis=0)

**abs** : Valeur absolue

In [None]:
np.abs(iris[:,1:4])

** \*\* ** : exposant

In [None]:
iris[0,:-1]**4.5

** shuffle ** : Trier aléatoirement les éléments d'une séquence/vecteur



In [None]:
seq = np.arange(10)
np.random.shuffle(seq)

Il y a beaucoup d'autres fonctions mathématiques utiles : numpy.mean, numpy.std, numpy.cov, numpy.dot, numpy.invert, numpy.unique, numpy.vsplit, numpy.vstack, numpy.hsplit, numpy.hstack. Testez les pour mieux les comprendres ou regardez la [documentation](http://docs.scipy.org/doc/numpy/reference/index.html)

# Dessiner des fleurs avec Matplotlib

La librairie `matplotlib` sert à créer des graphiques. Voici différentes fonction pratiques pour visualiser un ensemble de données comme `iris`.

Si on veut afficher des graphiques à l'intérieur d'un notebook, il est important d'ajouter la ligne suivante qui sera valide pour toute les cellules de code suivantes. 

In [None]:
%pylab inline

Histogramme d'éléments d'un vecteur

In [None]:
import pylab
pylab.hist(iris[:,2])

Afficher un nuage de points ("scatterplot")

In [None]:
pylab.scatter(iris[:,2],iris[:,3])

Afficher un nuage de points ("scatterplot")

In [None]:
pylab.scatter(iris[:,2],iris[:,3],c=iris[:,-1])

Exemple plus compliqué

In [None]:
support = linspace(-3,3,100) # linspace va generer un vecteur de 100 nombres entre -3 et 3
fn = sin(support) 
bruit = randn(100)*0.1 # bruit Gaussien, moyenne=0, variance= sqrt(0.1)
pylab.plot(support, fn) 
pylab.plot(support, fn + bruit,'--')
pylab.grid(True) # affiche un grille
pylab.xlabel('x')
pylab.ylabel('f')
pylab.legend(('f(x) sans bruit','f(x) avec bruit'))

### Ce n'est qu'un début

Vous possédez maintenant quelques notions de base, mais il vous faudra davantage pour être à l'aise. Il vous faut donc adopter une approche exploratrice: feuilletez les tutoriels!