# TD 4 : Modules, fichiers, expressions régulières (correction)

Plan

- [Exercice 1 : Excel → Python → Excel](#exo1)
- [Exercice 2 : trouver un module (1)](#exo2)
- [Exercice 3 : trouver un module (2)](#exo3)
- [Exercice 4 : son propre module](#exo4)
- [Exercice 5 : chercher un motif dans un texte](#exo5)
- [Exercice 6 : chercher un autre motif dans un texte](#exo6)

<h3 id="exo1">Exercice 1 : Excel $\rightarrow$ Python $\rightarrow$ Excel</h3>
    
Il faut télécharger le fichier [seance4_excel.xlsx](http://www.xavierdupre.fr/enseignement/complements/seance4_excel.xlsx) puis l'enregistrer au formet **texte (séparateur : tabulation) (*.txt)**. On rappelle les étapes de l'exercice :

- enregistrer le fichier au format texte,
- le lire sous python
- créer une matrice carrée 3x3 où chaque valeur est dans sa case (X,Y),
- enregistrer le résultat sous format texte,
- le récupérer sous Excel.    

In [3]:
with open ("seance4_excel.txt", "r") as f :
    mat = [ row.strip(' \n').split('\t') for row in f.readlines() ]
    
mat = mat [1:]
res = [ [ None ] * 3 for i in range(5) ] 
for i,j,v in mat :
    res [ int(j)-1 ] [ int (i)-1 ] = float(v)

with open ("seance4_excel_mat.txt", "w") as f :
    f.write ( '\n'.join ( [   '\t'.join( [ str(x) for x in row ] ) for row in res ] ) )    

Il est très rare d'écrire ce genre de code. En règle générale, on se sert de modules déjà existant comme [pandas](http://pandas.pydata.org/), [xlrd](http://www.python-excel.org/) et  [openpyxl](http://pythonhosted.org/openpyxl/). Cela évite la conversion au format texte :

In [12]:
import pandas
df = pandas.read_excel("seance4_excel.xlsx", sheetname="Feuil1")
mat = df.pivot("X", "Y", "value")
mat.to_excel("seance4_excel_mat.xlsx")
mat

Y,1.0,2.0,3.0,4.0,5.0
X,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1
1,0,-1,-2,-3,-4.0
2,1,0,-1,-2,-3.0
3,2,1,0,-1,


C'est un peu plus rapide.

<h3 id="exo2">Exercice 2 : trouver un module (1)</h3>

Le module [random](https://docs.python.org/3.4/library/random.html) est celui qu'on cherche.

In [1]:
import random
alea = [ random.random() for i in range(10) ]
print (alea)
random.shuffle(alea)
print (alea)

[0.5765074301255028, 0.36269681540173804, 0.09688986134602329, 0.8822835641174932, 0.3875897036752274, 0.8916283649070885, 0.9604405677906747, 0.4765011038606005, 0.23665904987815278, 0.3694280926485696]
[0.8822835641174932, 0.4765011038606005, 0.3875897036752274, 0.8916283649070885, 0.3694280926485696, 0.09688986134602329, 0.36269681540173804, 0.9604405677906747, 0.5765074301255028, 0.23665904987815278]


<h3 id="exo3">Exercice 3 : trouver un module (2)</h3>

Le module [datetime](https://docs.python.org/3.4/library/datetime.html) permet de faire des opérations sur les dates.

In [2]:
from datetime import datetime
date1 = datetime(2013,9,9)
date0 = datetime(2013,8,1)
print (date1 - date0)
birth = datetime (1975,8,11)
print (birth.weekday())  # lundi

39 days, 0:00:00
0


<h3 id="exo4">Exercice 4 : son propre module</h3>

On effectue le remplacement ``if __name__ == "__main__":``  par ``if True :`` :

In [33]:
# fichier monmodule.py
import math

def fonction_cos_sequence(seq) :
    return [ math.cos(x) for x in seq ]

if __name__ == "__main__" :
    print ("ce message n'apparaît que ce programme est le point d'entrée")
    
    # et une petite astuce quand on travaille sous notebook
    code = """
        # -*- coding: utf-8 -*-
        import math
        def fonction_cos_sequence(seq) :
            return [ math.cos(x) for x in seq ]        
        if True :
            print ("Ce message n'apparaît que ce programme est le point d'entrée.")
        """.replace("        ","")
    with open("monmodule2.py", "w", encoding="utf8") as f : f.write(code)

ce message n'apparaît que ce programme est le point d'entrée


In [34]:
import monmodule2
print("*")
print ( monmodule.fonction_cos_sequence ( [ 1, 2, 3 ] ) )

Ce message n'apparaît que ce programme est le point d'entrée.
*
[0.5403023058681398, -0.4161468365471424, -0.9899924966004454]


Le message ``ce message n'apparaît que ce programme est le point d'entrée`` apparaît maintenant alors qu'il n'apparaissait pas avec la version de l'énoncé. Comme il apparaît après ``*``, cela montre que cette ligne est exécutée si le module est importé.

In [35]:
import monmodule2

Si on importe le module une seconde fois, le message n'apparaît plus : le langage Python a détecté que le module avait déjà été importé. Il ne le fait pas une seconde fois.

<h3 id="exo5">Exercice 5 : chercher un motif dans un texte</h3>

L'expression régulière est ``je .{1,60}``. Le symbol ``.`` signifie n'importe quel caractère. Suivi de ``{1,60}`` veut dire n'importe quel caractère répété entre 1 et 60 fois.

In [19]:
import pyensae, re
discours = pyensae.download_data('voeux.zip', website = 'xd')

exp = re.compile ("je .{1,60}", re.IGNORECASE)
for fichier in discours :
    print("----",fichier)
    with open(fichier,"r") as f : text = f.read()
    je = exp.findall(text)    
    for t in je :
            print (t)

---- VOEUX01.txt
je pense aussi à nos compatriotes de Toulouse, mais également d
je veux dire, en ce 31 décembre, la solidarité et l'amitié de l
je sais que vous voulez faire vivre les valeurs qui sont celles
je souhaite une bonne et heureuse année.
---- VOEUX05.txt
je pense d'abord à toutes celles et à tous ceux qui connaissent
Je pense aussi à nos soldats qui sont engagés sur tous les cont
je veux dire à la famille de Bernard PLANCHE, que les pouvoirs 
je prendrai rapidement des initiatives pour relancer la constru
---- VOEUX06.txt
je pense d'abord à toutes celles et à tous ceux qui sont victim
Je veux aussi saluer avec respect et reconnaissance nos soldats
je me bats pour qu'elle prenne toute sa place dans ce nouveau m
Je me bats pour que chaque Français, pour que chaque jeune en p
je voudrais que les choses avancent plus vite, et qu'elles avan
je m'y engagerai pleinement. Je voudrais vous dire ce soir quel
Je sais les souffrances et les difficultés auxquelles certains 
Je connais v

<h3 id="exo6">Exercice 6 : chercher un autre motif dans un texte</h3>

Pour les mots _securite_ ou _insecurite_, on construit l'expression :

In [24]:
import pyensae, re
discours = pyensae.download_data('voeux.zip', website = 'xd')

exp = re.compile ("(.{1,15}(in)?sécurité.{1,50})", re.IGNORECASE)
for fichier in discours :
    print("----",fichier)
    with open(fichier,"r") as f : text = f.read()
    je = exp.findall(text)    
    for t in je :
            print (t)

---- VOEUX01.txt
("enacée quand l'insécurité progresse, quand l'exercice des libertés, la qual", 'in')
---- VOEUX05.txt
----

 VOEUX06.txt
("traites, notre sécurité sociale se réforment et c'est la garantie de leur", '')
("rvice, pour la sécurité, pour l'emploi, pour le pouvoir d'achat et que ce", '')
(" l'énergie, la sécurité, l'immigration. N'oublions jamais que l'Europe, c", '')
---- VOEUX07.txt
---- VOEUX08.txt
('vie pour notre sécurité et pour la paix. Je veux penser à leurs familles ', '')


---- VOEUX09.txt
('garantir notre sécurité.', '')
---- VOEUX74.txt
---- VOEUX75.txt
---- VOEUX79.txt
----

 VOEUX83.txt
("tres : plus de sécurité, des banlieues rénovées et plus d'enfants dans no", '')
---- VOEUX87.txt
---- VOEUX89.txt
(' de paix et de sécurité.', '')
---- VOEUX90.txt
(' du Conseil de sécurité, organe suprême des Nations unies. A ce titre, no', '')
(' du Conseil de sécurité, y compris le recours éventuel à la force. Voilà ', '')
(" d'Israël à la sécurité, ni le droit des Palestiniens à posséder une patr", '')
---- VOEUX94.txt
