---
title: Tracking Changes
date: 2023-11-30 
authors:
  - name: Sébastien Boisgérault
    email: Sebastien.Boisgerault@minesparis.psl.eu
    url: https://github.com/boisgera
    affiliations:
      - institution: Mines Paris - PSL University
        department: Institut des Transformation Numériques (ITN)
github: boisgera
license: CC-BY-4.0
open_access: true
---

In order to understand how `.tldr` files are structured, we can add a new graphical objects, change some if their properties, etc. and each time we modify the document, analyze the corresponding evolution of the file.

In this notebook, we develop some tooling to help us track such changes.

## Text comparison

We define two similar versions of the "zen of Python":

In [1]:
zen_1 = """The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Errors should never pass silently.
In the face of ambiguity, refuse the temptation to guess.
There should be one obvious way to do it.
Although that way may not be obvious at first.
Now is better than never.
Although never is often better than right now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it is a good idea.
"""

In [2]:
zen_2 = """\
The Zen of Python, by Tim Peters

Beautiful is better than ugly.
Explicit is better than implicit.
Simple is better than complex.
Complex is better than complicated.
Flat is better than nested.
Sparse is better than dense.
Readability counts.
Special cases aren't special enough to break the rules.
Although practicality beats purity.
Errors should never pass silently.
Unless explicitly silenced.
In the face of ambiguity, refuse the temptation to guess.
There should be one-- and preferably only one --obvious way to do it.
Although that way may not be obvious at first unless you're Dutch.
Now is better than never.
Although never is often better than *right* now.
If the implementation is hard to explain, it's a bad idea.
If the implementation is easy to explain, it may be a good idea.
Namespaces are one honking great idea -- let's do more of those!
"""

```{exercise}
 1. Transform `zen_1` and `zen_2` into list of lines. 
 # Transformez zen_1 en liste de lignes
zen_1_lines = zen_1.splitlines()

# Transformez zen_2 en liste de lignes
zen_2_lines = zen_2.splitlines()

# Affichez les deux listes de lignes
print(zen_1_lines)

print(zen_2_lines)

 2. Use the [`difflib`](https://docs.python.org/3/library/difflib.html) module of the Python standard library to [`compare`](https://docs.python.org/3/library/difflib.html#difflib.Differ.compare) the two sequences.
 import difflib

# Transformez zen_1 et zen_2 en listes de lignes
zen_1_lines = zen_1.splitlines()
zen_2_lines = zen_2.splitlines()

# Utilisez Differ pour comparer les deux listes de lignes
differ = difflib.Differ()
comparison = differ.compare(zen_1_lines, zen_2_lines)

# Affichez la comparaison ligne par ligne
for line in comparison:
    print(line)

 3. Make a text out of the output of compare and print it.
 import difflib

# Transformez zen_1 et zen_2 en listes de lignes
zen_1_lines = zen_1.splitlines()
zen_2_lines = zen_2.splitlines()

# Utilisez Differ pour comparer les deux listes de lignes
differ = difflib.Differ()
comparison = differ.compare(zen_1_lines, zen_2_lines)

# Créez un texte à partir de la comparaison
comparison_text = '\n'.join(line for line in comparison)

# Affichez le texte de comparaison
print(comparison_text)

 4. Interpret the result and list the differences between both versions of the zen of Python. Les lignes commençant par "-" représentent des lignes présentes dans zen_1 mais absentes dans zen_2. Ce sont des suppressions. Les lignes commençant par "+" représentent des lignes présentes dans zen_2 mais absentes dans zen_1. Ce sont des ajouts. Les lignes commençant par " " représentent des lignes identiques dans les deux versions.
```

We can make our job easier if we use HTML instead of plain text to visualise the differences between the two texts.


```{exercise}
  1. Use the [HtmlDiff](https://docs.python.org/3/library/difflib.html#difflib.HtmlDiff) class of difflib to produce a `diff.html` file that represents this difference in a HTML document.
  2. Use the [webbrowser](https://docs.python.org/3/library/webbrowser.html) module of the standard library to open it!
  3. Define a `display_diff_text` function that takes two arguments `text_1` and `text_2` and automates steps 1. and 2.

Je propose ce script qui utilise la classe HtmlDiff du module difflib pour créer un document HTML (diff.html) représentant les différences entre deux textes. Il utilise également le module webbrowser pour ouvrir le fichier HTML :

import difflib
import webbrowser

def generer_html_diff(texte_1, texte_2, chemin_sortie='diff.html'):
    """
    Génère un fichier HTML diff pour les différences entre deux textes.
    
    Paramètres :
    - texte_1 (str) : Le premier texte pour la comparaison.
    - texte_2 (str) : Le deuxième texte pour la comparaison.
    - chemin_sortie (str) : Le chemin pour enregistrer le fichier HTML diff. Par défaut, 'diff.html'.
    """
    # Transformer les textes en listes de lignes
    lignes_1 = texte_1.splitlines()
    lignes_2 = texte_2.splitlines()

    # Créer un objet HtmlDiff
    differ = difflib.HtmlDiff()

    # Générer le contenu HTML diff
    contenu_html_diff = differ.make_file(lignes_1, lignes_2)

    # Enregistrer le diff HTML dans un fichier
    with open(chemin_sortie, 'w', encoding='utf-8') as fichier_html:
        fichier_html.write(contenu_html_diff)

    print(f'Fichier HTML diff enregistré : {chemin_sortie}')

```

## Comparison of JSON documents

````{exercise} Comparison of dictionnaries

 1. Create a `display_diff` function that takes two Python objects, converts them to strings then leverages `display_diff_text` to display the difference in a browser.
def display_diff(obj1, obj2):
    """
    Affiche les différences entre deux objets Python dans un navigateur.
    
    Paramètres :
    - obj1 : Le premier objet Python.
    - obj2 : Le deuxième objet Python.
    """
    # Convertir les objets en chaînes
    str_obj1 = str(obj1)
    str_obj2 = str(obj2)

    # Utiliser la fonction display_diff_text pour afficher les différences
    display_diff_text(str_obj1, str_obj2)

 2. Consider the 3 dictionaries defined by
    ```python
    d1 = {k:k+1 for k in range(100)}
    d2 = d1.copy(); d2[50] = 50
    d3 = {k:k+1 for k in range(99, -1, -1)}
    ```
    `d1` and `d2` have a slight difference and `d1` and `d2` are equal.
    Does your `display_diff` function make easy to spot where the difference is in the first case when it compares `d1` and `d2`?
    Does it make easy to see that `d1` and `d3` are equal?

        Pour rendre plus facile la détection des différences entre d1 et d2 tout en indiquant que d1 et d3 sont égaux, j'utilise la bibliothèque standard pprint. Cela va améliorer la lisibilité des différences entre les deux dictionnaires.
        import pprint

        # Définition des dictionnaires
        d1 = {k: k + 1 for k in range(100)}
        d2 = d1.copy()
        d2[50] = 50
        d3 = {k: k + 1 for k in range(99, -1, -1)}

        # Affichage des différences avec pprint
        pp = pprint.PrettyPrinter(indent=2)

        # Affichage de d1 et d2
        print("Différences entre d1 et d2 :")
        pp.pprint(d1)
        pp.pprint(d2)

        # Affichage de d1 et d3
        print("\nÉgalité entre d1 et d3 :")
        pp.pprint(d1)
        pp.pprint(d3)

  3. Investigate the [`pprint`](https://docs.python.org/3/library/pprint.html) module standard library ; use it to improve the behavior of `display_text_diff` in the two cases considered in the previous question.

  import pprint

def display_diff_text(obj1, obj2):
    """
    Affiche les différences entre deux chaînes de texte dans un navigateur.
    
    Paramètres :
    - obj1 (str) : La première chaîne de texte.
    - obj2 (str) : La deuxième chaîne de texte.
    """
    # Convertir les chaînes en objets Python
    eval_obj1 = eval(obj1)
    eval_obj2 = eval(obj2)

    # Utiliser pprint pour améliorer la lisibilité
    pp = pprint.PrettyPrinter(indent=2)

    # Afficher les différences
    print("Différences entre les objets :")
    pp.pprint(eval_obj1)
    pp.pprint(eval_obj2)

````
 

```{exercise} tldraw documents comparator
Implement a function `tldraw_diff` that takes as argument two filenames that refer to tldraw documents and display their differences in the browser.
Avec les fonctions prédéfinies précédemment :
import difflib
import webbrowser
import json
import pprint

def generer_html_diff(texte_1, texte_2, chemin_sortie='diff.html'):
    """
    Génère un fichier HTML diff pour les différences entre deux textes.
    
    Paramètres :
    - texte_1 (str) : Le premier texte pour la comparaison.
    - texte_2 (str) : Le deuxième texte pour la comparaison.
    - chemin_sortie (str) : Le chemin pour enregistrer le fichier HTML diff. Par défaut, 'diff.html'.
    """
    lignes_1 = texte_1.splitlines()
    lignes_2 = texte_2.splitlines()
    differ = difflib.HtmlDiff()
    contenu_html_diff = differ.make_file(lignes_1, lignes_2)
    with open(chemin_sortie, 'w', encoding='utf-8') as fichier_html:
        fichier_html.write(contenu_html_diff)
    print(f'Fichier HTML diff enregistré : {chemin_sortie}')

def afficher_diff(filename_1, filename_2):
    """
    Affiche les différences entre deux documents tldraw dans un navigateur.
    
    Paramètres :
    - filename_1 (str) : Le chemin vers le premier document tldraw.
    - filename_2 (str) : Le chemin vers le deuxième document tldraw.
    """
    with open(filename_1, 'r', encoding='utf-8') as fichier_1:
        contenu_1 = fichier_1.read()

    with open(filename_2, 'r', encoding='utf-8') as fichier_2:
        contenu_2 = fichier_2.read()

    generer_html_diff(contenu_1, contenu_2)

    # Ouvrir le fichier HTML diff généré dans le navigateur web par défaut
    webbrowser.open('diff.html')
```