# Chapitre 10 : "Programmation avancée" - solutions

---

<table class="appbclp1">
<tr> <td style="font-weight: bold!;">auteurs :</td><td style="text-align: left!;">Laurent Pointal &lt;<a href="mailtp:laurent.pointal@limsi.fr">laurent.pointal@limsi.fr</a>&gt; &amp; Bob Cordeau &lt;<a href="pycours@kordeo.eu">pycours@kordeo.eu</a>&gt; </td> </tr>
<tr> <td style="font-weight: bold!;">licence :</td><td style="text-align: left!;">Creative Commons Attribution-ShareAlike 4.0 International Public License (CC BY-SA 4.0) </td> </tr>
<tr> <td style="font-weight: bold!;">source :</td><td style="text-align: left!;"><a href="https://github.com/lpointal/appbclp">https://github.com/lpointal/appbclp</a></td> </tr>
<tr> <td style="font-weight: bold!;">description :</td><td style="text-align: left!;">Les programmes dans ce Notebook Jupyter servent de support au livre <span style="font-style: italic!;">« Python 3 - Apprendre à  programmer dans l'écosystème Python»</span>, édition Dunod, dans lequel les différentes sections sont expliquées </td> </tr>
<tr> <td style="font-weight: bold!;">url :</td><td style="text-align: left!;"><a href="https://www.dunod.com/sciences-techniques/python-3">https://www.dunod.com/EAN/9782100809141</a></td> </tr>
</table>

---

### exo10_01

In [None]:
# exo10_01

print([(i+3 if i>= 8 else i) for i in range(1, 21, 2)])

### exo10_02

In [None]:
# exo10_02

print(sum([i for i in range(10)]))

### exo10_03

In [None]:
# exo10_03

print([i+j for i in "abc" for j in "de"])

### exo10_04

In [None]:
# exo10_04

# import ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
from pprint import pprint  # améliore l'affichage

# Définition de fonction ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
def compterMots(fic):
    freq = dict()
    with open(fic, encoding='utf8') as f:
        for ligne in f:
            listeMots = ligne.split()
            
            for mot in listeMots:
                if mot in freq:
                    freq[mot] += 1
                else:
                    freq[mot] = 1
    return freq

# programme principal =========================================================
freq_mots = compterMots("../data/indata_exo05_bateauivre.txt")

pprint(freq_mots)

On remarque que le split a découpé sur les espaces… et a donc laissé collé aux mots les signes syntaxiques (`,`, `;`, `.`…). Et on signale la classe [`Counter`](https://docs.python.org/3/library/collections.html#collections.Counter) du module `collections` qui permet de compter des occurrences d'apparitions d'informations.

### exo10_05

In [None]:
# exo10_05

# Procédure
def affiche(m):
    "Affichage d'une matrice."
    for i in range(n):
        print("\t", m[i])
        
# programme principal -----------------------------------------------
n = 5  # dimension des matrices carrees

# initialisation des 3 matrices:
# on prépare les trois listes qui seront remplies avec des sous-listes
m1, m2, m3 = [None] * n, [None] * n, [None] * n
for i in range(n):
    m1[i], m2[i], m3[i] = [0] * n, [0] * n, [0] * n
    
# calcul des matrices
k = 2
for i in range(n):
    for j in range(n):
        # matrice d'éléments pairs
        m1[i][j] = k
        k += 2
        
        # matrice identité
        if i == j:
            m2[i][j] = 1  
        
        # calcul de m3
        m3[i][j] = m1[i][j] - m2[i][j]  

# Affichages
print("m1 :")
affiche(m1)
print("\nm2 :")
affiche(m2)
print("\nm3 = m1 - m2 :")
affiche(m3)

### exo10_06

In [None]:
# exo10_06
"""
    Exercice adapté du MOOC bioinformatique de François Rechenmann & Thierry Parmentelat (inria)
    https://www.fun-mooc.fr/courses/course-v1:inria+41003+selfpaced/about
"""

# Table du code génétique (correspondance codon -> acide aminé)
lookup_table = {
    'UUU': 'F', 'UCU': 'S', 'UAU': 'Y', 'UGU': 'C',
    'UUC': 'F', 'UCC': 'S', 'UAC': 'Y', 'UGC': 'C',
    'UUA': 'L', 'UCA': 'S', 'UAA': '#', 'UGA': '#',
    'UUG': 'L', 'UCG': 'S', 'UAG': '#', 'UGG': 'W',
    'CUU': 'L', 'CCU': 'P', 'CAU': 'H', 'CGU': 'R',
    'CUC': 'L', 'CCC': 'P', 'CAC': 'H', 'CGC': 'R',
    'CUA': 'L', 'CCA': 'P', 'CAA': 'Q', 'CGA': 'R',
    'CUG': 'L', 'CCG': 'P', 'CAG': 'Q', 'CGG': 'R',
    'AUU': 'I', 'ACU': 'T', 'AAU': 'N', 'AGU': 'S',
    'AUC': 'I', 'ACC': 'T', 'AAC': 'N', 'AGC': 'S',
    'AUA': 'I', 'ACA': 'T', 'AAA': 'K', 'AGA': 'R',
    'AUG': 'M', 'ACG': 'T', 'AAG': 'K', 'AGG': 'R',
    'GUU': 'V', 'GCU': 'A', 'GAU': 'D', 'GGU': 'G',
    'GUC': 'V', 'GCC': 'A', 'GAC': 'D', 'GGC': 'G',
    'GUA': 'V', 'GCA': 'A', 'GAA': 'E', 'GGA': 'G',
    'GUG': 'V', 'GCG': 'A', 'GAG': 'E', 'GGG': 'G',
}


# Définition de fonction ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
def translate_rna_to_amino_acids(rna):
    """
    Traduction d'un brin d'ARN en une chaine encodant les acides aminés correspondants. 
    
    L'ARN en entrée est découpé en groupes de 3 bases nucléiques (codon).
    Les lettres superflues en fin de chaine sont ignorées.
    """

    # initialisation : la variable 'offset' indique le début d'un codon
    offset = 0
    longueur = len(rna)
    resultat = ''
    # la boucle principale
    while offset <= longueur - 3:
        codon = rna[offset:offset+3]
        resultat += lookup_table[codon]
        offset += 3  # groupe suivant
    return resultat


# Programme principal =========================================================
with open("../chapitre_10/indata_exo10_adn.txt", encoding='utf8') as f:
    dna = f.read()

rna = dna.replace('T', 'U')  # passage ADN => ARN

# affichages
print("dna :", dna)
print("rna :", rna)
print("\nTraduction en acides aminés :")
print(translate_rna_to_amino_acids(rna))

### exo10_07

In [None]:
# exo10_07
"""
    Exercice adapté du MOOC bioinformatique de François Rechenmann & Thierry Parmentelat (inria)
    https://www.fun-mooc.fr/courses/course-v1:inria+41003+selfpaced/about
"""

# import ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
from pprint import pprint


# Définition de fonction ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
def indexMots(seq):
    """Retourne le dictionnaire index de la séquence."""
    lng = len(seq)
    d = dict()

    for i in range(lng - 2):
        triplet = seq[i:i+3]
        r = seq.find(triplet)
        while r != -1:   # il peut y en avoir plusieurs...
            # on stocke "r+1" pour respecter la convention algo
            d.setdefault(triplet, set()).add(r+1)
            r = seq.find(triplet, r+1)

    return d

# Programme principal =========================================================
s = 'TTGATCGTATGTCGTCAT'
pprint(indexMots(s))  # affiche le dictionnaire ordonné suivant les triplets

### exo10_08

In [None]:
# exo10_08

# Import ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
import re
from pprint import pprint


# Programme principal =========================================================
motif = re.compile(r'\d+')
freq = {}

with open('../data/indata_exo10_re.txt', encoding='utf8') as f:
    for ligne in f:
        nombres = motif.findall(ligne)
        for nombre in nombres:
            chiffre = nombre[0]
            if chiffre != '0':
                try:
                    freq[chiffre] += 1
                except:
                    freq[chiffre] = 1

pprint(freq)

### exo10_09

In [None]:
# exo10_09
"""
    Exercice adapté du MOOC bioinformatique de François Rechenmann & Thierry Parmentelat (inria)
    https://www.fun-mooc.fr/courses/course-v1:inria+41003+selfpaced/about
"""

# Définition de fonction ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
def hamming(dna1, dna2):
    length = min(len(dna1), len(dna2))
    return sum(n1 != n2 for n1, n2 in zip(dna1[:length], dna2[:length]))


# Programme principal =========================================================
s1 = 'TTGCATTGCTTAGGCATA'
s2 = 'TTGCGTTGCTTAGCCATA'
s3 = 'TTGCAGTCCTTAGGCATT'

d1, d2, d3 = hamming(s1, s2), hamming(s2, s3), hamming(s1, s3)
print(f"D({'s1'}, {'s2'}) = {d1}")
print(f"D({'s2'}, {'s3'}) = {d2}")
print(f"D({'s1'}, {'s3'}) = {d3}")

print('\nInégalité triangulaire :')
print('\td1 + d2 =', d1 + d2)
print('\td3      =', d3)

### exo10_10

In [None]:
# exo10_10

# Définition de fonction ~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~~
def hamming(s, t):
    if len(s) == 0:
        return len(t)
    elif len(t) == 0:
        return len(s)
    else:
        distance = 0

    if s[-1] != t[-1]:
        distance = 1

    return min(hamming(s[:-2], t) + 1,
               hamming(s, t[:-2]) + 1,
               hamming(s[:-2], t[:-2]) + distance)

# Programme principal ========================================================
s1 = input('Entrez une chaîne : ')
s2 = input('Entrez une seconde chaîne : ')

print(f'\nDistance de Hamming entre {s1} et {s2} : {hamming(s1, s2)}')

### exo10_11

**La permutation**

Pour construire la permutation sur les chaînes, nous allons commencer "petit" et voir comment construire l'algorithme. La permutation de deux caractères `"ab"` est simple : `"ab"`, `"ba"`. La permutation de trois caractères `"abc"` est déjà plus longue : `"abc"`, `"acb"`, `"bac"`, `"bca"`, `"cab"`, `"cba"`. Nous pouvons remarquer que dans le résultat on a pris et placé en tête tour à tour *un des caractères*, puis ajouté derrière les *permutations des caractères restants*. Nous avons là un joli cas généralisable en *fonction récursive*.

Pour compléter, il est possible de construire la permutation sous forme de listes `list`, auquel cas il sera possible d'avoir des valeurs permutées identiques (vu qu'on autorise que certains chiffres soient égaux), ou sous forme d'ensembles `set` où ça ne sera pas possible. Pour notre exercice, nous n'avons pas besoin de dénombrer le nombre combinaisons, il est donc intéressant d'utiliser des `set` afin de limiter l'[explosion combinatoire](https://fr.wikipedia.org/wiki/Explosion_combinatoire) du traitement.

In [None]:
# exo10_11

def permut(s):
    "Retourne l'ensemble des permutations possibles différentes."
    if len(s) == 1:                   # cas d'arrêt de récursion
        return set([s])
    else:
        res = set()
        for i in range(len(s)):
            debut = s[i]              # le caractère de tête
            reste = s[:i] + s[i+1:]   # les caractères restants
            for resteperm in permut(reste):
                res.add(debut + resteperm)
        return res
    
def permut_int4(n):
    "Retourne la liste des permutations possibles des chiffres d'un entier."
    lst = []
    nstr = "{:04d}".format(n)  # assure 4 chiffres (zéros en tête si besoin)
    for v in permut(nstr):
        lst.append(int(v))
    return lst
    
def entier4ok(n):
    "Vérifie entier de 4 chiffres pas tous identiques."
    return (1000 <= n < 10000) and (n not in
            [1111, 2222, 3333, 4444, 5555, 6666, 7777, 8888, 9999])

# La saisie contrôlée
nb4 = 0   # valeur invalide pour entrer dans la boucle
while not entier4ok(nb4):
    nb4 = int(input("Saisir entier (4 chiffres pas tous égaux) :"))

print(nb4, end=' ')
nbcoups = 0
while nb4 != 6174:
    permutations= permut_int4(nb4)
    nbcoups += 1
    PP = min(permutations)
    PG = max(permutations)
    nb4 = PG - PP
    print("=> ({}-{}) = {}".format(PG, PP, nb4), end=' ')
print()
print("Obtenu 6174 en ", nbcoups, "coups")