---

# Langages de script - Python
## Cours 7.1 — Exercices
### M2 Ingénierie Multilingue - INaLCO

---

- Loïc Grobol <loic.grobol@gmail.com>
- Yoann Dupont <yoa.dupont@gmail.com>

## Un peu de traitement de chaînes

Écrire un script python qui lit un fichier ligne par ligne et affiche pour chaque ligne

- `a` si la ligne contient la chaîne `spam`
- `b` si la ligne contient au plus 5 caractères et finit par un `z`
- Si la ligne contient une adresse mail de la forme `x.y@z.t`, afficher cette adresse
- `d` si les trois premiers caractères sont les mêmes que les trois derniers et dans le même ordre
- `e` si la ligne est un palindrôme, i.e. si la lire de gauche à droite ou de droite à gauche donne le même résultat, e.g. `pyttyp`
- `NOPE` sinon

Ne pas tenir compte du caractère de fin de ligne

Lancez votre script sur [7.0-testcase.txt](/data/7.0-testcase.txt), vous devriez obtenir le même résultat que [7.0-target.txt](/data/7.0-target.txt)

## Un peu de classe

**Note** si vous modifiez des cellules pour une question, assurez vous que ça ne casse pas vos solutions pour les questions précédentes, n'hésitez pas à relancer tous le notebook pour vous en assurer.

Voici une classe `Word` de base qui représente un mot (avec pas beaucoup de features).

In [None]:
class Word:
    """Un mot dans un texte"""
    def __init__(self, form):
        self.form = form
    
    def to_string(self):
        """Renvoie une représenation sous forme de chaîne de caractères
        
        >>> w = Word("spam")
        >>> w.to_string()
        "spam"
        """
        return self.form

    def is_same(self, other):
        """Vérifie si `self` et `other` (un autre mot) ont la même forme"""
        return self.form == other.form

w = Word("tofu")
print(w.to_string())

x = Word("tofu")
print(w is x)  # Ce n'est pas le même objet
print(w.is_same(x))


1. À vous d'écrire une classe `Sentence` qui s'initialise à partir d'une liste de `Word` et a elle aussi une méthode `to_string` qui renvoie une représentation qui va bien et une méthode `is_same` pour vérifier qu'elle a le même contenu qu'une autre phrase.

In [None]:
class Sentence:
    """Une phrase"""

    def to_string(self):
        """Renvoie une représentation sous forme de chaîne de caractères
        
        >>> s = Sentence([Word(token) for token in "we are the knights who say Ni !".split()])
        >>> s.to_string()
        "we are the knights who say Ni !"
        """
        # À vous de l'écrire
        pass

    def is_same(self, other):
        pass

In [None]:
s = Sentence([Word(token) for token in "we are the knights who say Ni !".split()])
print(s.to_string())

t = Sentence([Word(token) for token in ["we", "are", "the", "knights", "who", "say", "Ni", "!"]])
print(t is s)
print(t.is_same(s))

Les morceaux de code dans les docstrings sont des [doctests](https://docs.python.org/3/library/doctest.html), c'est une façon de combiner de la documentation et des tests au même endroit, on en trouve plus trop dans la nature aujoud'hui mais ce fut assez pratique et élégant dans une époque lointaine et plus civilisée.

3. Créez une classe `Span` qui représentera des empans de texte et modifiez la classe `Sentence` pour que l'exemple ci-dessous marche

In [None]:
class Span:
    """Un empan de texte"""
    pass

sp = Span([Word("knights"), Word("who"), Word("say")])
assert sp.to_string() == "knights who say"
sp.is_same(s.slice(3, 6))

**Note** Do not Repeat Yourself est un bon conseil

4. Maintenant que vous êtes des pythonista aguerri⋅e⋅s on va pouvoir faire du code moins moche: transformez les classes précédentes pour que le code suivant marche

In [None]:
assert str(w) == "tofu"

In [None]:
assert w == x

In [None]:
assert str(s) == "we are the knights who say Ni !"

In [None]:
assert s == t

In [None]:
sq = s[3:6]
assert sq == sp

5. Une dernière subtilité, comme c'est fatigant de construire une `Sentence` à la mano, faites marcher cette cellule

In [None]:
u = Sentence.from_string("we are the knights who say Ni !")
assert u == s