# Un discours mémorable

Vous disposez d’une version trilingue anglais-français-espagnol au format TSV (*tabulated-separated values*) du discours de Barack Obama prononcé le 4 juin 2009 devant l’université du Caire, et souhaitez la transformer en un fichier au format TMX.

Chargez tout d’abord les lignes du fichier dans une variable `rows` :

In [None]:
import csv

with open('../data/obama-cairo.tsv') as csvfile:
    fieldnames = ['en', 'fr', 'es']
    reader = csv.DictReader(csvfile, delimiter='\t', fieldnames=fieldnames)
    
    rows = [row for row in reader]

Concevez à présent votre programme, sans oublier de déclarer la [DTD du format TMX](../files/tmx.dtd), présente également dans le répertoire *files* :

In [None]:
# your code here

# XML module
import xml.etree.ElementTree as ET

# open new file
with open('../data/obama-cairo.tmx', 'wb') as xmlfile:
    
    # prologue
    xmlfile.write(b'<?xml version="1.0"?>\n')
    
    # DTD
    xmlfile.write(b'<!DOCTYPE tmx SYSTEM "./tmx.dtd">\n')

    # root element to tree structure
    root = ET.Element('tmx', {'version': '1.4'})
    tree = ET.ElementTree(root)
    
    # header
    header = ET.SubElement(root, 'header', {
        'creationtool': 'python',
        'creationtoolversion': '3.7',
        'segtype': 'block',
        'o-tmf': 'undefined',
        'adminlang': 'fr',
        'srclang': 'en',
        'datatype': 'text/plain',
    })
    
    # body
    body = ET.SubElement(root, 'body')
    
    for row in rows:
        # tu
        tu = ET.SubElement(body, 'tu')
        for lang, content in row.items():
            # tuv and seg
            tuv = ET.SubElement(tu, 'tuv', { 'xml:lang': lang })
            seg = ET.SubElement(tuv, 'seg')
            seg.text = content

    # serialize tree in file
    tree.write(xmlfile)