## Traitement des données avec Python pour comprendre comment ça marche

### Lire un fichier
Pour ouvrir un fichier, il faut commencer par créer un objet python $\texttt{f}$ (par exemple) représentant le fichier créé et le
mettant en état de lecture avec l'option $\texttt{'r'}$ et comme c'est l'option par défaut, il suffit d'écrire : $\texttt{f= open('nomFichier')}$ où $\texttt{'nomFichier'}$ désigne le nom avec l'extension.  
Pour le lire, on utilise la méthode $\texttt{read : f.read()}$  
Voyons cela sur un exemple. Exécuter les cellules :


In [6]:
f = open('baselog.csv',encoding = 'UTF8') # ou open('baselog.csv', 'r',encoding='UTF8')
contenu = f.read()
f.close() # un fichier ouvert doit être toujours fermé

In [7]:
contenu

'nom,login\nColette,claudine\nde Beauvoir,deux\nDuras,hiroshima\nEco,rose\nKafka,proces\nOrwell,1984\nProust,perdu\nSagan,tristesse\nSartre,neant\nTolkien,anneau\nVian,ecume\nYourcenar,hadrien\n'

In [8]:
print(contenu)

nom,login
Colette,claudine
de Beauvoir,deux
Duras,hiroshima
Eco,rose
Kafka,proces
Orwell,1984
Proust,perdu
Sagan,tristesse
Sartre,neant
Tolkien,anneau
Vian,ecume
Yourcenar,hadrien



On a ainsi récupérer le texte sous forme d’une chaîne de caractères, ce qui n’est pas très pratique pour traiter le fichier.

### Lire un fichier CSV avec le module csv
Pour traiter des données numériques qui sont enregistrées dans un fichier dont l'extension $\texttt{.csv}$, il est fortement conseillé d'avoir enregistré le fichier au format csv avec l'encodage UTF-8 et un point pour le séparateur décimal si on souhaite faire des calculs avec les données.  
Le module $\texttt{csv}$ est un des modules qui permet de lire un fichier CSV et de le "transformer" en liste que l'on peut ensuite manipuler.   
Voyons cela sur un exemple. Exécuter les cellules :

In [9]:
import csv
f = open('baselog.csv',encoding = 'UTF8')
r = csv.reader(f)
Log = list(r)
f.close()

In [None]:
Log

On récupère ainsi une liste de listes : la liste de toutes les lignes de la table, chaque ligne étant une liste et chaque élément de cette dernière est de type chaîne.  
Plus précisément, un élément de $\texttt{Log}$ obtenu par l'instruction $\texttt{Log[i]}$ (où $\texttt{i}$ est l'indice de l'élément) correspond à une
ligne de la table.  
L'instruction $\texttt{len(Log)}$ qui renvoie la longueur de la liste $\texttt{Log}$ correspond donc au nombre de lignes de la table.   
L'instruction $\texttt{len(Log[0])}$ qui renvoie la longueur du premier élément de la liste $\texttt{Log}$, correspond donc au nombre de colonnes de la table.  
Enfin, une cellule de la table sera accessible par $\texttt{Log[i][j]}$ où $\texttt{i}$ est l'indice de la ligne et $\texttt{j}$ celui de la colonne.  
On rappelle que les indices des éléments d'un liste $\texttt{L}$ commence à 0 jusqu'à $\texttt{len(L)}$.   
Exécuter la cellule :

In [10]:
nblignes = len(Log) ; print("le nombre de lignes est ", nblignes)
nbcolonnes = len(Log[0]) ;  print("le nombre de colonnes est ", nbcolonnes)
Ligne1=Log[0] ; print(Ligne1)
Ligne3=Log[2] ; print(Ligne3)

le nombre de lignes est  13
le nombre de colonnes est  2
['nom', 'login']
['de Beauvoir', 'deux']


A quoi correspond les éléments de la liste Ligne1 ?

Pour récupérer, par exemple, la première colonne autrement dit la liste des éléments d'indice 0 de chaque ligne qui dans notre exemple correspond à l'identifiant $\texttt{'nom'}$, on peut utiliser la fonction suivante :

In [11]:
def Colonne(L,j):
#renvoie la liste des éléments de la colonne d'indice j de la table L
    C=[]
    nblignes=len(L)
    for i in range(nblignes):
        C.append(L[i][j])
    return(C)

In [None]:
# Autre version :
def Colonne(L,j):
    C=[]
    for ligne in L :
        C.append(ligne[j])
    return(C)

Expliquer "en langage naturel" comment opère cette fonction.    
Taper dans la ellule ci-dessous, l'instruction qui permet d'obtenir la liste des éléments de la première colonne de la table $\texttt{Log}$

### Croisement des données
<ol><li> A partir du fichier $\texttt{'basemail.csv'}$, obtenir la liste $\texttt{Mail}$ correspondant à cette table.</li></ol>

<ol start="2"><li>Vérifier que ces deux tables $\texttt{Log}$ et $\texttt{Mail}$ ont un descripteur en commun en affichant les deux listes contenant les descripteurs de celles-ci.  </li></ol>

 <ol start="3"><li> On souhaite écrire une fonction $\texttt{loginPass(adressemail)}$ qui prend en paramètre la chaine adressemail et renvoie le login et le mot de passe correspondant. Compléter :</li></ol>
 
*On rappelle que la méthode index pour les listes permet d'obtenir l'indice d'un élément d'une liste*

In [None]:
def loginPass(adressemail) :
    CmailMail = Colonne(Mail,0) # on récupère la liste des éléments de la colonne
    #qui contient les mails dans la liste Mail
    CnomMail =       # on récupère la liste des éléments de la colonne
    #qui contient les noms dans la liste Mail
    indiceLmail = CmailMail.index(adressemail) #on obtient l'indice de la ligne
    #où se trouve adressemail dans CmailMail
    lenom = CnomMail[indiceLmail] #on obtient le nom correspondant à adressemail
    lemotdepasse = Mail[indiceLmail][2] #.......................
    CnomLog =        #on récupère la liste des éléments de la colonne
    #qui contient les noms dans la liste Log
    indiceLlog =      #on obtient l'indice de la ligne
    #où se trouve lenom dans CnomLog
    lelogin =  #on obtient le mot de passe correspondant à lenom
    return(lelogin,lemotdepasse)

<ol start="4"><li>Quel est le login et le mot de passe du détenteur de l'adresse 'mp@chez.moi' ?</li></ol>

## Représenter des données

Les données ont été stockées dans trois listes : $\texttt{Smart, Classique}$ et $\texttt{Aucun}$  


In [None]:
from matplotlib.pyplot import *
Annee=[2011,2012,2013,2014,2015,2016,2017,2018]
Smart=[17,29,39,46,58,65,73,75]
Classique=[67,59,50,43,34,28,21,19]
Aucun=[15,12,11,11,8,7,6,6]

In [None]:
title('Évolution équipement en smarthphone')
bar(Annee,Smart)
show()

In [None]:
title('Évolution équipement en téléphonie mobile')
plot(Annee,Smart,'b' ,label='smartphone' )
plot(Annee,Classique,'r',label='mobile classique')
plot(Annee,Aucun,'gold',label='pas de mobile')
legend()
show()

#### Pour sauvegarder vos figures :

savefig('image.png', dpi = 600) : fixe la résolution.
savefig('image.png', transparent = True) : fond transparent.
savefig('image, format = 'pdf') : indique le format. Les formats supportés sont : png, pdf, eps, svg, sinon le format est deviné d'après l'extension du fichier.

In [None]:
title('Évolution équipement en smarthphone')
bar(Annee,Smart,color='r')
savefig('graphe1.png')