In [1]:
def id_tokens_in_tei(chemin_entree, chemin_sortie):
    
    """
    Fonction permettant de lire un fichier XML-TEI pour cibler les
    éléments <w> et leur ajouter un @n unique, numéroté à partir de 1.
    Si on souhaite utiliser des entités, elles sont résolues dans le
    fichier de sortie, mieux vaut donc les installer ensuite.
    
    :param chemin_entree: Le chemin local du fichier XML-TEI tokenisé
        aux éléments <w> duquel on souhaite ajouter des numéros.
    :param chemin_sortie: Le chemin local auquel on souhaite écrire le
        fichier XML-TEI de sortie avec ses @n ajoutés.
    
    """

    import xml.etree.ElementTree as ET
    
    ET.register_namespace('', 'http://www.tei-c.org/ns/1.0')
    
    
    # On crée un compteur pour les numéros des tokens.
    counter = 1
    
    # On donne au module XML le namespace de la TEI, sans préfixe car ce sera le seul.
    # ET.register_namespace('', "http://tei-c.org/ns/1.0")
    
    # On importe le XML-TEI d'entrée et on le lit.
    tree = ET.parse(chemin_entree)
    root = tree.getroot()

    # On boucle sur les éléments <w> dans l'ordre du fichier.
    for word in root.findall('.//{http://www.tei-c.org/ns/1.0}w'):
    # for word in root.findall('.//w'):
        # Si l'élément <w> a déjà un numéro, on l'enlève pour le remplacer.
        if word.get('n'):
            del word.attrib['n']
        # On crée un attribut "n" avec, comme valeur, l'état actuel du compteur.
        word.set('n', str(counter))
        # On ajoute 1 au compteur pour le prochain <w>.
        counter += 1

    # On écrit le TEI obtenu dans le fichier spécifié en second paramètre.
    tree.write(chemin_sortie, xml_declaration=True, encoding="unicode")

In [2]:
# Pour exécuter la fonction, on remplace les deux chemins par ceux souhaités.
id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/gc_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/gc_base.xml'
    )

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/morisse_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/morisse_base.xml'
    )

"""id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/basnage_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/basnage_base.xml'
    )

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/berault_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/berault_base.xml'
    )

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/merville_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/merville_base.xml'
    )

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/pesnelle_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/pesnelle_base.xml'
    )

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/ruines_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/ruines_base.xml'
    )

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/tac_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/tac_base.xml'
    )

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/terrien_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/terrien_base.xml'
    )

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/instructions_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/instructions_base.xml'
    )

id_tokens_in_tei(
    '/home/erminea/Documents/CONDE/editions/base-version/rouille_base.xml',
    '/home/erminea/Documents/CONDE/nov-21_renum/rouille_base.xml'
    )"""

"id_tokens_in_tei(\n    '/home/erminea/Documents/CONDE/editions/base-version/basnage_base.xml',\n    '/home/erminea/Documents/CONDE/nov-21_renum/basnage_base.xml'\n    )\n\nid_tokens_in_tei(\n    '/home/erminea/Documents/CONDE/editions/base-version/berault_base.xml',\n    '/home/erminea/Documents/CONDE/nov-21_renum/berault_base.xml'\n    )\n\nid_tokens_in_tei(\n    '/home/erminea/Documents/CONDE/editions/base-version/merville_base.xml',\n    '/home/erminea/Documents/CONDE/nov-21_renum/merville_base.xml'\n    )\n\nid_tokens_in_tei(\n    '/home/erminea/Documents/CONDE/editions/base-version/pesnelle_base.xml',\n    '/home/erminea/Documents/CONDE/nov-21_renum/pesnelle_base.xml'\n    )\n\nid_tokens_in_tei(\n    '/home/erminea/Documents/CONDE/editions/base-version/ruines_base.xml',\n    '/home/erminea/Documents/CONDE/nov-21_renum/ruines_base.xml'\n    )\n\nid_tokens_in_tei(\n    '/home/erminea/Documents/CONDE/editions/base-version/tac_base.xml',\n    '/home/erminea/Documents/CONDE/nov-21_ren