In [1]:
def id_tokens_in_tei(chemin_entree, chemin_sortie):
    
    """
    Fonction permettant de lire un fichier XML-TEI pour cibler les
    éléments <w> et leur ajouter un @n unique, numéroté à partir de 1.
    Si on souhaite utiliser des entités, elles sont résolues dans le
    fichier de sortie, mieux vaut donc les installer ensuite.
    
    :param chemin_entree: Le chemin local du fichier XML-TEI tokenisé
        aux éléments <w> duquel on souhaite ajouter des numéros.
    :param chemin_sortie: Le chemin local auquel on souhaite écrire le
        fichier XML-TEI de sortie avec ses @n ajoutés.
    
    """

    import xml.etree.ElementTree as ET
    
    # On crée un compteur pour les numéros des tokens.
    counter = 1
        
    # On importe le XML-TEI d'entrée et on le lit.
    tree = ET.parse(chemin_entree)
    root = tree.getroot()

    # On boucle sur les éléments <w> dans l'ordre du fichier.
    for word in root.findall('.//w'):
        
        # On crée un attribut "n" avec, comme valeur, l'état actuel du compteur.
        word.set('n', str(counter))
        # On ajoute 1 au compteur pour le prochain <w>.
        counter += 1

    # On écrit le TEI obtenu dans le fichier spécifié en second paramètre.
    tree.write(chemin_sortie, xml_declaration=True, encoding="unicode")

In [2]:
# Pour exécuter la fonction, on remplace les deux chemins par ceux souhaités.

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/Morisse-TS-XML/2021-03-19_morisse_tokenise.xml',
    '/home/erminea/Documents/CONDE/Morisse-TS-XML/2021-03-19_morisse_w_numerotes.xml'
    )