# <center>MOD 8.4 - Représentation et manipulation de données structurées - BE 3 khaoula abouelfadl</center>

## <center style="color: #66d">Transformation XSLT, format XSL-FO, et document pdf.</center>

### 1. Informations générales

#### 1.1 Déroulement de la séance

Comme pour les séances précédentes, ce travail est à effectuer par binômes. Les binômes peuvent être les mêmes que pour l'un des BE précédents ou être recomposés pour l'occasion.

Les livrables qui vous seront demandés pour ce BE devront encore une fois être zippés _(format zip uniquement - toujours pas de formats de compression exotiques)_ et déposés sur la plateforme pédagogique dans la zone de rendu, dans l'espace réservé au BE n°3 sur le serveur moodle.

#### 1.2 Compte-rendu

Le compte-rendu sera fait comme d'habitude au format jupyter notebook.
Il devra évidemment comporter tous les liens nécessaires pour consulter les documents réalisés _(cf. questions suivantes)_ sous tous les aspects pertinents _(code source, validation, transformation...)_. Seuls les documents accessibles sous forme de liens depuis le compte-rendu seront pris en compte lors de la correction.

#### 1.3 Forme des documents produits.

Le degré de finition des documents demandés devra correspondre à des standards professionnels.

### 2. Prise en main de XSL-FO et installation de Apache fop

Le travail demandé au cours de ce BE consiste à transformer les documents XML fournis pour obtenir d'abord un document XSL-FO à l'aide d'une feuille de style XSLT, puis un rapport papier au format <tt>pdf</tt> à l'aide de l'outil "fop" (Apache Formatting Objects Processor).

#### 2.1 Prise en main de XSL-FO.

Consulter le <a href="http://dmolinarius.github.io/demofiles/mod-84/xslfo.pdf">cours sur XSL-FO</a>, puis :

__Q1. Développer une première feuille de style XSL-FO :__
<div style="background-color:#d8d8ff;padding:10px;border-radius:3px">
Créer une feuille de style XSLT nommée <a href="question-1.xsl"><tt>question-1.xsl</tt></a> qui transforme n'importe quel document XML en un document XSL-FO (toujours le même, quel que soit le contenu du document XML transformé) contenant le message "hello, world".
</div>


__Q2. Créer un premier document XSL-FO :__
<div style="background-color:#d8d8ff;padding:10px;border-radius:3px">
Implémenter la transformation XSLT d'un document XML via votre feuille de style, à l'aide d'un programme de votre choix (suggestion : python via le présent notebook) et admirer le résultat obtenu dans un fichier qui sera nommé <a href="question-1.fo"><tt>question-1.fo</tt></a>
</div>

In [7]:
# votre code ici
import lxml.etree as ET

xml=ET.parse("regularite-mensuelle-tgv.xml")
xsl=ET.parse("question-1.xsl")
transform=ET.XSLT(xsl)
result=transform(xml)

fichier=open("question-1.fo","wb")
fichier.write(ET.tostring(result, pretty_print=True, encoding='utf-8'))

388

#### 2.2 Installation et utilisation de Apache FOP.

__Q3. Obtenir un document pdf :__
<div style="background-color:#eef;padding:10px;border-radius:3px">
Installer <a href="https://xmlgraphics.apache.org/fop/">Apache FOP</a> et transformer le document <tt>question-1.fo</tt> pour obtenir <a href="question-1.pdf"><tt>question-1.pdf</tt></a>.
</div>

Exemple de fonction réalisant la transformation depuis le notebook :

In [2]:
# fonction pour lancer la transformation fop
def run_fop(filename):
    import sys
    import os.path
    import subprocess

    # nom des fichiers
    fo = "{}.fo".format(filename)
    pdf ="{}.pdf".format(filename)

    # le fichier .fo n'existe pas
    if not os.path.isfile(fo):
        print("Could not find {}".format(fo))
        return None

    # appel de fop (ajuster éventuellement le chemin d'accès à l'exécutable et au fichier de configuration)
    args = ["fop", "-c", "C:\Program Files (x86)\\fop-2.2\\fop\\conf\\fop.xconf", fo, pdf]
    return subprocess.run(args,shell=True,stderr=subprocess.PIPE)
    
# On effectue la transformation
r = run_fop('question-1')
print(r.stderr.decode('iso-8859-1'))

'fop' nest pas reconnu en tant que commande interne
ou externe, un programme exécutable ou un fichier de commandes.



In [15]:
# Méthode alternative pour lancer fop
def run_fop(filename):
    import sys
    import os.path
    import subprocess
    
    # nom des fichiers
    fo = "question-1.fo".format(filename)
    pdf ="question-1.pdf".format(filename)
    
    # le fichier .fo n'existe pas
    if not os.path.isfile(fo):
        print("Could not find the fo file".format(fo))
        return None

    # appel de fop (ajuster éventuellement le chemin d'accès à l'exécutable et au fichier de 
    args = ["C:\Program Files (x86)/fop-2.8-bin/fop-2.8/fop/fop", fo, pdf]
    return subprocess.run(args,shell=True,stderr=subprocess.PIPE)

# On effectue la transformation
r = run_fop('question-1')

### 3. Création d'un rapport

Maintenant que la chaîne de production est maîtrisée, l'objectif sera de créer un rapport au format <tt>pdf</tt>, à partir 
du document <a href="regularite-mensuelle-tgv.xml"><tt>regularite-mensuelle-tgv.xml</tt></a> fourni avec le sujet, dont la structure générale est la suivante :

__Q4. Liste des axes :__
<div style="background-color:#eef;padding:10px;border-radius:3px">
Développer une feuille de style XSL qui transforme ce document de manière à obtenir un document <tt>pdf</tt> listant le nom des axes sous forme de titres.
</div>

On nommera respectivement les documents demandés
<a href="question-4.xsl"><tt>question-4.xsl</tt></a>,
<a href="question-4.fo"><tt>question-4.fo</tt></a> et
<a href="question-4.pdf"><tt>question-4.pdf</tt></a>.

In [5]:
# votre code ici pour créer question-4.fo
import lxml.etree as ET

xml=ET.parse("regularite-mensuelle-tgv.xml")
xsl=ET.parse("question-4.xsl")
transform=ET.XSLT(xsl)
result=transform(xml)

fichier=open("question-4.fo","wb")
fichier.write(ET.tostring(result, pretty_print=True, encoding='utf-8'))

2159

In [6]:
# votre code ici pour créer question-4.pdf
def run_fop(filename):
    import sys
    import os.path
    import subprocess
    
    # nom des fichiers
    fo = "question-4.fo".format(filename)
    pdf ="question-4.pdf".format(filename)
    
    # le fichier .fo n'existe pas
    if not os.path.isfile(fo):
        print("Could not find the fo file".format(fo))
        return None

    # appel de fop (ajuster éventuellement le chemin d'accès à l'exécutable et au fichier de 
    args = ["C:\Program Files (x86)/fop-2.8-bin/fop-2.8/fop/fop", fo, pdf]
    return subprocess.run(args,shell=True,stderr=subprocess.PIPE)

# On effectue la transformation
r = run_fop('question-4')


__Q5. Page de titre :__
<div style="background-color:#eef;padding:10px;border-radius:3px">
Ajouter une page de titre. En profiter pour mentionner vos noms. Noter qu'il est en général possible de passer des variables au moteur XSLT
(cf. <a href="http://lxml.de/xpathxslt.html#stylesheet-parameters">lxml</a>),
ce qui peut faciliter entre autres l'affichage de la date d'impression.
</div>

Les documents demandés seront nommés
<a href="question-5.xsl"><tt>question-5.xsl</tt></a>,
<a href="question-5.fo"><tt>question-5.fo</tt></a> et
<a href="question-5.pdf"><tt>question-5.pdf</tt></a>.

In [17]:
# votre code ici  pour créer question-5.fo
import lxml.etree as ET

xml=ET.parse("regularite-mensuelle-tgv.xml")
xsl=ET.parse("question-5.xsl")
transform=ET.XSLT(xsl)
result=transform(xml)

fichier=open("question-5.fo","wb")
fichier.write(ET.tostring(result, pretty_print=True, encoding='utf-8'))

3371

In [18]:
# votre code ici  pour créer question-5.pdf
def run_fop(filename):
    import sys
    import os.path
    import subprocess
    
    # nom des fichiers
    fo = "question-5.fo".format(filename)
    pdf ="question-5.pdf".format(filename)
    
    # le fichier .fo n'existe pas
    if not os.path.isfile(fo):
        print("Could not find the fo file".format(fo))
        return None

    # appel de fop (ajuster éventuellement le chemin d'accès à l'exécutable et au fichier de 
    args = ["C:\Program Files (x86)/fop-2.8-bin/fop-2.8/fop/fop", fo, pdf]
    return subprocess.run(args,shell=True,stderr=subprocess.PIPE)

# On effectue la transformation
r = run_fop('question-5')

__Q6. Statistiques :__
<div style="background-color:#eef;padding:10px;border-radius:3px">
Pour chacun des couples gare de départ / gare d'arrivée, créer un tableau avec les statistiques de la ligne, en évitant que les tableaux puissent être coupés par un saut de page. Ne pas oublier d'afficher les statistiques dans l'ordre du calendrier, et non pas dans l'ordre du document source...
</div>

Les documents demandés seront nommés
<a href="question-6.xsl"><tt>question-6.xsl</tt></a>,
<a href="question-6.fo"><tt>question-6.fo</tt></a> et
<a href="question-6.pdf"><tt>question-6.pdf</tt></a>.

In [14]:
# votre code ici  pour créer question-6.fo
import lxml.etree as ET

xml=ET.parse("regularite-mensuelle-tgv.xml")
xsl=ET.parse("question-6.xsl")
transform=ET.XSLT(xsl)
result=transform(xml)

fichier=open("question-6.fo","wb")
fichier.write(ET.tostring(result, pretty_print=True, encoding='utf-8'))

76313

In [15]:
# votre code ici  pour créer question-6.pdf
def run_fop(filename):
    import sys
    import os.path
    import subprocess
    
    # nom des fichiers
    fo = "question-6.fo".format(filename)
    pdf ="question-6.pdf".format(filename)
    
    # le fichier .fo n'existe pas
    if not os.path.isfile(fo):
        print("Could not find the fo file".format(fo))
        return None

    # appel de fop (ajuster éventuellement le chemin d'accès à l'exécutable et au fichier de 
    args = ["C:\Program Files (x86)/fop-2.8-bin/fop-2.8/fop/fop", fo, pdf]
    return subprocess.run(args,shell=True,stderr=subprocess.PIPE)

# On effectue la transformation
r = run_fop('question-6')

__Q7. Commentaires :__
<div style="background-color:#eef;padding:10px;border-radius:3px">
Faire figurer les commentaires non vides là aussi dans l'ordre du calendrier.
</div>

Les documents demandés seront nommés
<a href="question-7.xsl"><tt>question-7.xsl</tt></a>,
<a href="question-7.fo"><tt>question-7.fo</tt></a> et
<a href="question-7.pdf"><tt>question-7.pdf</tt></a>.

In [15]:
# votre code ici  pour créer question-7.fo
import lxml.etree as ET

xml=ET.parse("regularite-mensuelle-tgv.xml")
xsl=ET.parse("question-7.xsl")
transform=ET.XSLT(xsl)
result=transform(xml)

fichier=open("question-7.fo","wb")
fichier.write(ET.tostring(result, pretty_print=True, encoding='utf-8'))

460750

In [16]:
# votre code ici  pour créer question-7.pdf
def run_fop(filename):
    import sys
    import os.path
    import subprocess
    
    # nom des fichiers
    fo = "question-7.fo".format(filename)
    pdf ="question-7.pdf".format(filename)
    
    # le fichier .fo n'existe pas
    if not os.path.isfile(fo):
        print("Could not find the fo file".format(fo))
        return None

    # appel de fop (ajuster éventuellement le chemin d'accès à l'exécutable et au fichier de 
    args = ["C:\Program Files (x86)/fop-2.8-bin/fop-2.8/fop/fop", fo, pdf]
    return subprocess.run(args,shell=True,stderr=subprocess.PIPE)

# On effectue la transformation
r = run_fop('question-7')

__Q8. Améliorer <i>ad libitum</i> :__
<div style="background-color:#eef;padding:10px;border-radius:3px">
Numéroter les pages, ajouter un graphique SVG par couple gare de départ / gare d'arrivée,
créer un sommaire cliquable renvoyant directement à la page concernée...
</div>

Les documents demandés seront nommés
<a href="question-8.xsl"><tt>question-8.xsl</tt></a>,
<a href="question-8.fo"><tt>question-8.fo</tt></a> et
<a href="question-8.pdf"><tt>question-8.pdf</tt></a>.

In [8]:
# votre code ici  pour créer question-8.fo
import lxml.etree as ET

xml=ET.parse("regularite-mensuelle-tgv.xml")
xsl=ET.parse("question-8.xsl")
transform=ET.XSLT(xsl)
result=transform(xml)

fichier=open("question-8.fo","wb")
fichier.write(ET.tostring(result, pretty_print=True, encoding='utf-8'))

XSLTApplyError: XPath evaluation returned no result.

In [7]:
# votre code ici  pour créer question-8.pdf
def run_fop(filename):
    import sys
    import os.path
    import subprocess
    
    # nom des fichiers
    fo = "question-8.fo".format(filename)
    pdf ="question-8.pdf".format(filename)
    
    # le fichier .fo n'existe pas
    if not os.path.isfile(fo):
        print("Could not find the fo file".format(fo))
        return None

    # appel de fop (ajuster éventuellement le chemin d'accès à l'exécutable et au fichier de 
    args = ["C:\Program Files (x86)/fop-2.8-bin/fop-2.8/fop/fop", fo, pdf]
    return subprocess.run(args,shell=True,stderr=subprocess.PIPE)

# On effectue la transformation
r = run_fop('question-8')