In [60]:
import pandas as pd
import pickle
from __future__ import print_function

In [61]:
regles="MGC-160104-01-N-paradigmes-ext-Regles"

In [62]:
class formesPatron:
    '''
    Accumulateur de formes correspondant à un patron pour calcul de la Généralisation Minimale (cf. MGL)
    '''
    def __init__(self):
        self.formes=[]

#    def __repr__(self):
#        return ','.join(self.calculerGM())
        
    def ajouterForme(self,forme):
        self.formes.append(forme)
        
    def calculerGM(self):
        minLongueur=len(min(self.formes, key=len))
        maxLongueur=len(max(self.formes, key=len))
        if debug: print (minLongueur, maxLongueur, file=logfile)
        positions=[]
        if maxLongueur>minLongueur:
            positions.append("*")
        for i in xrange(minLongueur, 0, -1):
            phonemes=set([x[-i] for x in self.formes])
            if debug: print (phonemes, file=logfile)
            if "." in phonemes:
                positions.append(".")
            else:
                positions.append("".join(fs.lattice[phonemes].extent))
        return patron2regexp(positions)

class pairePatrons:
    '''
    Accumulateur de triplets (f1,f2,patron) correspondant à une paire pour calcul des Généralisations Minimales (cf. MGL)
    '''
    def __init__(self,case1,case2):
        self.patrons1={}
        self.patrons2={}
        self.case1=case1
        self.case2=case2

#    def __repr__(self):
#        return ','.join(self.calculerGM())
        
    def ajouterFormes(self,forme1,forme2,patron):
#        print (forme1,forme2,patron, file=logfile)
        patron12=patron
        (pat1,pat2)=patron.split("-")
        patron21=pat2+"-"+pat1
#        print (patron12,patron21, file=logfile)
        if not patron12 in self.patrons1:
            self.patrons1[patron12]=formesPatron()
        self.patrons1[patron12].ajouterForme(forme1)
        if not patron21 in self.patrons2:
            self.patrons2[patron21]=formesPatron()
        self.patrons2[patron21].ajouterForme(forme2)
        
        
    def calculerGM(self):
        resultat1={}
        for patron in self.patrons1:
            if debug: print ("patron1", patron, file=logfile)
            resultat1[patron]=self.patrons1[patron].calculerGM()
        resultat2={}
        for patron in self.patrons2:
            if debug: print ("patron2", patron, file=logfile)
            resultat2[patron]=self.patrons2[patron].calculerGM()
        return (resultat1,resultat2) 

In [63]:
class paireClasses:
    def __init__(self,case1,case2):
        self.case1=case1
        self.case2=case2
        self.nom=case1+"-"+case2
        self.classes1=classesPaire(case1,case2)
        self.classes2=classesPaire(case2,case1)

    def ajouterPatron(self,n,patron,motif):
        if n==1:
            self.classes1.ajouterPatron(patron,motif)
        elif n==2:
            self.classes2.ajouterPatron(patron,motif)
        else:
            print ("le numéro de forme n'est pas dans [1,2]",n, file=logfile)

    def ajouterPaire(self,forme1,forme2):
        self.classes1.ajouterPaire(forme1,forme2)
        self.classes2.ajouterPaire(forme2,forme1)
        
    def calculerClasses(self):
        return(self.classes1,self.classes2)

    
class classesPaire:
    '''
    Gestion des patrons, des classes et des transformations
    
    ajouterPatron : ajoute un patron et son motif associé (MGL)
    ajouterPaire : ajoute une paire de formes, calcule la classe de la forme1 et la règle sélectionnée
    sortirForme : cacule les formes de sortie correspondant à la forme1 avec leurs coefficients respectifs
    '''
    def __init__(self,case1,case2):
        self.case1=case1
        self.case2=case2
        self.nom=case1+"-"+case2
        self.classe={}
        self.nbClasse={}
        self.patrons={}
        self.entree={}
        self.sortie={}
    
    def ajouterPatron(self,patron,motif):
        self.patrons[patron]=motif
        (entree,sortie)=patron.split("-")
        self.entree[patron]=entree.replace(u".",u"(.)")
        self.sortie[patron]=remplacementSortie(sortie)
    
    def ajouterPaire(self,forme1,forme2):
        '''
        on calcule la classe de la paire idClasseForme et la règle sélectionnée
        on incrémente le compteur de la classe et celui de la règle sélectionnée à l'intérieur de la classe
        '''
        classeForme=[]
        regleForme=""
        for patron in self.patrons:
            if re.match(self.patrons[patron],forme1):
                classeForme.append(patron)
                '''
                le +"$" permet de forcer l'alignement à droite pour les transformations suffixales
                '''
                if forme2==re.sub(self.entree[patron]+"$",self.sortie[patron],forme1):
                    regleForme=patron
        idClasseForme=", ".join(classeForme)
        if not idClasseForme in self.classe:
            self.classe[idClasseForme]={}
            self.nbClasse[idClasseForme]=0
        if not regleForme in self.classe[idClasseForme]:
            self.classe[idClasseForme][regleForme]=0
        self.nbClasse[idClasseForme]+=1
        self.classe[idClasseForme][regleForme]+=1

    def sortirForme(self,forme):
        classeForme=[]
        sortieForme={}
        for patron in self.patrons:
            if re.match(self.patrons[patron],forme):
                classeForme.append(patron)
        if classeForme:
            idClasseForme=", ".join(classeForme)
            if idClasseForme in self.nbClasse:
                nTotal=self.nbClasse[idClasseForme]
                for patron in self.classe[idClasseForme]:
                    sortie=re.sub(self.entree[patron]+"$",self.sortie[patron],forme)
                    sortieForme[sortie]=float(self.classe[idClasseForme][patron])/nTotal
            else:
                print (forme, file=logfile)
                print ("pas de classe",idClasseForme, file=logfile)
                print ("%.2f par forme de sortie" % (float(1)/len(classeForme)), file=logfile)
                nTotal=len(classeForme)
                for patron in classeForme:
                    sortie=re.sub(self.entree[patron]+"$",self.sortie[patron],forme)
                    sortieForme[sortie]=float(1)/nTotal
        else:
            print (forme, file=logfile) 
            print ("pas de patron", file=logfile)
        return sortieForme
        

In [64]:
with open("2015-Data/"+regles+'.pkl', 'rb') as input:
    classesFinales = pickle.load(input)

In [65]:
longueur=0
nbPaires=0
print ("longueur=%d"%longueur)
for paire,valeur in sorted(classesFinales.items(),key=lambda x: len(x[1].entree.keys())):
    transformations=valeur.entree.keys()
    if len(transformations)!=longueur:
        print ("%d paires pour %d transformation(s)"%(nbPaires,longueur))
        longueur=len(transformations)
        nbPaires=0
        print ()
        print ("longueur=%d"%longueur)
    else:
        nbPaires+=1
    print ("%s => %s :"%paire, valeur.entree.keys(), len(valeur.classe))
print ("%d paires pour %d transformation(s)"%(nbPaires,longueur))

longueur=0
ps3P => is1P : [] 0
is1P => pc2P : [] 0
is1P => fi2P : [] 0
is1P => ppMP : [] 0
fi1P => is1P : [] 0
ai2S => is1P : [] 0
pc3P => is1P : [] 0
ii2P => is1P : [] 0
is1P => ai1P : [] 0
is1S => is1P : [] 0
is1P => fi1P : [] 0
is1P => ai2P : [] 0
ps1P => is1P : [] 0
ai2P => is1P : [] 0
is1P => ppFP : [] 0
is1P => ii1P : [] 0
ppMP => is1P : [] 0
is1P => fi2S : [] 0
ppFP => is1P : [] 0
is1P => is3P : [] 0
ai3P => is1P : [] 0
is1P => ii2P : [] 0
is1P => ai2S : [] 0
ai1P => is1P : [] 0
fi2P => is1P : [] 0
is1P => ps3P : [] 0
fi2S => is1P : [] 0
ps2P => is1P : [] 0
is1P => ps1P : [] 0
pc2P => is1P : [] 0
is1P => pc2S : [] 0
is1P => ps1S : [] 0
is1P => ai3P : [] 0
is1P => is1S : [] 0
is3S => is1P : [] 0
ps1S => is1P : [] 0
is1P => ppFS : [] 0
is3P => is1P : [] 0
ii1P => is1P : [] 0
pc2S => is1P : [] 0
ppFS => is1P : [] 0
is1P => is3S : [] 0
is1P => ps2P : [] 0
is1P => pc3P : [] 0
44 paires pour 0 transformation(s)

longueur=1
ii3S => ii3P : ['-'] 1
is1P => pP : [u'asj\xf4-\xe2'] 1
ppFP =

In [57]:
classesFinales[paire].classe

{u'-dy': {u'-dy': 6},
 u'-e': {u'-e': 208},
 u'-e, -': {'-': 6},
 u'-e, -, -t': {u'-e': 1, u'-t': 6},
 u'-e, -, -t, -vi': {u'-vi': 2},
 u'-e, -, -t, i-je': {'-': 7, u'-e': 1, u'-t': 3, u'i-je': 4},
 u'-e, -dy': {u'-dy': 1, u'-e': 7},
 u'-e, -je, -ty, -t': {u'-je': 1},
 u'-e, -t': {u'-t': 6},
 u'-e, -t, -ky': {u'-ky': 1},
 u'-e, -t, -vi, je-iz': {u'je-iz': 1},
 u'-e, -t, i-je': {u'-t': 1},
 u'-e, -t, i-je, i-y': {u'i-je': 1, u'i-y': 1},
 u'-e, -ti': {u'-e': 4, u'-ti': 1},
 u'-e, -ti, -dy': {u'-dy': 2, u'-e': 9, u'-ti': 1},
 u'-e, -ti, -dy, r-Ert': {u'r-Ert': 2},
 u'-e, -ti, -vi, -dy': {u'-e': 1, u'-vi': 1},
 u'-e, -ti, 9.-O.t, -dy': {u'9.-O.t': 1},
 u'-e, -ty': {u'-ty': 1},
 u'-e, -ty, -, -t, i-je': {u'i-je': 2},
 u'-e, -ty, -t': {u'-t': 3},
 u'-e, -y': {u'-y': 1},
 u'-e, E.-9.e': {u'-e': 18, u'E.-9.e': 14},
 u'-e, e-Ee, -t': {u'e-Ee': 1},
 u'-e, j\xea-9ny, -t': {u'j\xea-9ny': 11},
 u'-e, o.-O.e': {u'o.-O.e': 11},
 u'-i, -e': {u'-i': 3},
 u'-je': {u'-je': 2},
 u'-je, -ty': {u'-ty': 2},
