# Morisien

L’objectif consiste à transcrire phonétiquement [une liste de noms](../data/morisien-names.csv) en *morisien* (créole mauricien), et de rajouter un champ dans le fichier avec le résultat. Pour parvenir au résultat, on vous fournit [un ensemble de règles](../data/mauritian-rules.txt) à suivre.

Par exemple, si l’on considère le premier nom de la liste, *absanteism*, on repère la règle suivante :

```txt
an->ã/_D|#
```

Cette règle nous indique que la suite de caractères `an` se prononce `ã` si elle est suivie d’une lettre parmi la classe `D` ou si elle termine la forme. Cette classe `D` est définie plus bas dans le fichier :
```txt
D=bcdfghklmprstvxzʃʒŋɲʒʁ
```

Il s’agit de la seule règle à s’appliquer, de telle manière que la transcription phonologique de *absanteism* devient *absãteism*.

Comment implémenter cette règle en Python ?

In [None]:
name = 'absanteism'
D = 'bcdfghklmprstvxzʃʒŋɲʒʁ'

# What is the position of the substring 'an'?
pos = name.find('an')
# The substring is indeed in the name
if pos != -1 and (
    # If substring is either at terminal position
    name.endswith('an') or
    # or two characters behind a D-class character
    name[pos + 2] in D
):
    # … apply the substitution
    name = name.replace('an', 'ã')

print(name)

Un moyen d’optimiser le code serait d’encapsuler cette procédure à l’intérieur d’une fonction :

In [None]:
def rule_27(word, follow):
    """Finds the position of 'an' in a string,
    and applies a substitution with 'ã'.
    
    word -- the string to manipulate
    follow -- characters authorized to follow 'an'
    """
    pos = word.find('an')
    if pos != -1 and (
        word.endswith('an') or
        word[pos + 2] in follow
    ):
        word = word.replace('an', 'ã')

        return word

word = 'absanteism'
D = 'bcdfghklmprstvxzʃʒŋɲʒʁ'

word = rule_27(word, D)

print(word)

Cette méthode se révèle fastidieuse car elle nécessite de créer une fonction par règle. Au lieu de cela, l’idéal serait de monter en abstraction afin que la fonction s’adapte à plusieurs situations. Nous pouvons revoir la conception de notre programme ainsi :

In [None]:
def apply_rule(rule, replace, word, follow):
    """Transcribe characters in a word into 
    
    rule -- characters to search for
    replace -- phonological transcription of the characters
    name -- the string to analyze
    follow -- characters authorized to follow the rule
    """
    pos = word.find(rule)
    
    if pos != -1 and (
        word.endswith(rule) or
        word[pos + 2] in follow
    ):
        word = word.replace(rule, replace)

    return word

word = 'absanteism'
D = 'bcdfghklmprstvxzʃʒŋɲʒʁ'

word = apply_rule('an', 'ã', word, D)

print(word)

Pour cet exercice, ouvrez déjà le fichier `morisien-names.csv` et :
1. essayez tout d’abord d’appliquer d’autres règles similaires aux noms qu’il contient ;
2. ensuite, pour les règles un peu plus complexes, concevez d’autres fonctions qui permettent de les résoudre ;
3. imaginez enfin comment il serait possible d’améliorer la fonction `apply_rule()` pour qu’elle s’adapte à toutes les règles.