# Create Figures

The purpose of this notebook is to create the figures shown in the article.

In [1]:
# ---------------------------- PREPARING NOTEBOOK ---------------------------- #
# Autoreload
%load_ext autoreload
%autoreload 2

# Random seed
import numpy as np
np.random.seed(42)

# External modules
import os
from IPython.display import display

# Set global log level
import logging
logging.basicConfig(level=logging.INFO)
os.environ['TOKENIZERS_PARALLELISM'] = 'false'

# Define PWD as the current git repository
import git
repo = git.Repo('.', search_parent_directories=True)
pwd = repo.working_dir
os.chdir(pwd)

# import

## Loading the data

### [Metrics](d_Metrics.ipynb)

In [2]:
import pandas as pd

path = os.path.join(pwd, "results", "text_simplification", "Metrics", "metrics.csv")
metrics_df = pd.read_csv(path, index_col=0, header=0)
display(metrics_df)

Unnamed: 0_level_0,Accuracy,Similarity (BERT),Similarity (BLEU),Similarity (ROUGE),Score (BERT),Score (BLEU),Score (ROUGE)
Model,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1
GPT-4,0.282885,0.885688,0.012408,0.388889,0.42881,0.023774,0.327524
GPT-4 Zero-Shot,0.264515,0.934294,0.09424,0.875,0.412301,0.138968,0.406227
GPT Fine-Tuned,0.260539,0.914014,0.041305,0.705882,0.405493,0.071305,0.3806
Mistral-7B Fine-Tuned,0.259603,0.913803,0.074866,0.87037,0.404338,0.116217,0.399923
GPT Zero-Shot,0.25593,0.933759,0.134486,1.0,0.401747,0.17632,0.407555
Mistral-7B Zero-Shot,0.243506,0.93116,0.294438,0.884615,0.386055,0.266561,0.38189
GPT-4o Zero-Shot,0.235041,0.890117,0.095618,0.0,0.371884,0.135936,0.0
Perfect Meaning,0.208649,1.0,0.98,1.0,0.34526,0.344048,0.34526
Davinci Fine-Tuned,0.206041,0.827054,0.007003,0.526316,0.329896,0.013546,0.296147
Perfect Simplification,0.199412,0.809957,8.2e-05,0.0,0.320031,0.000164,0.0


In [3]:
path = os.path.join(pwd, "results", "text_simplification", "Metrics", "example.csv")
example_df = pd.read_csv(path, index_col=0, header=0)
display(example_df)

Unnamed: 0,Original,Simplified,Accuracy,Similarity,Score (BERT)
GPT-4,Les parlements nationaux jouent un rôle crucia...,Les parlements font les lois importantes qui a...,0.291402,0.86339,0.435738
Mistral-7B Zero-Shot,"Pour faire un parallèle avec le sport, on joue...","Pour comparer avec le sport, on utilise sa têt...",0.22178,0.990615,0.362421
Mistral-7B Fine-Tuned,"Les sénateurs, investis par le suffrage univer...","Les sénateurs, élus par un groupe de personnes...",0.325289,0.950589,0.484711
GPT-4 Zero-Shot,"Pourtant, son état tourna vite à la mauvaise g...","Cependant, elle est rapidement devenue très ma...",0.279539,0.80764,0.415326
GPT-4o Zero-Shot,"En ce temps-là, on ne connaissait pas ces scan...","À l'époque, il n'y avait pas de congés de mate...",0.314558,0.930798,0.470211
GPT Fine-Tuned,"Qrand elle essaya de I'approcher, il détaaie c...","Quand elle a essayé de s'approcher de lui, il ...",0.268324,0.85694,0.408682
GPT Zero-Shot,"Sûr et certain, ils n'éprouvaient aucun orguei...",Ils ne ressentaient aucun sentiment de fierté ...,0.319234,0.897428,0.470944
Davinci Fine-Tuned,Appuyez-vous sur l’ensemble du paragraphe.,Cet paragraphe à écrit beaucoup de choses ense...,0.144998,0.717327,0.241234
Perfect Meaning,– Dessine -moi un mouton… J’ai sauté sur mes p...,– Dessine -moi un mouton… J’ai sauté sur mes p...,0.217641,1.0,0.35748
Perfect Simplification,Des ingrats : une personne ingrate est une per...,Elle fais ses devoirs puis prépare le dîner et...,0.285162,0.870493,0.429594


### [Iterative Simplification](g_IterativeSimplification.ipynb)

In [4]:
path = os.path.join(
    pwd,
    "results",
    "text_simplification",
    "IterativeSimplification",
    "iterative_simplification_bert.csv",
)
iterative_simplification_bert_df = pd.read_csv(path, header=0)
display(iterative_simplification_bert_df.head())

Unnamed: 0,Original,Difficulty,Simplified_0,Similarity_0,Difficulty_0,Simplified_1,Similarity_1,Difficulty_1,Simplified_2,Similarity_2,...,Difficulty_4,Simplified_5,Similarity_5,Difficulty_5,Simplified_6,Similarity_6,Difficulty_6,Simplified_7,Similarity_7,Difficulty_7
0,"Car, en principe, la plus grande complication ...",C2,"En gros, quand un phénomène est très complexe,...",0.898099,B2,"En gros, quand quelque chose est très difficil...",0.878792,B1,"Si quelque chose est très dur à comprendre, c'...",0.878495,...,B1,"Si quelque chose est difficile à comprendre, c...",0.873884,B1,"Si quelque chose est difficile à comprendre, c...",0.874343,B1,"Si quelque chose est difficile à comprendre, c...",0.873884,B1
1,"En même temps que les idées, la mode, les crit...",C2,"À la même époque, les idées, les tendances ves...",0.966206,C1,"À la même époque, les Français partagent leurs...",0.914253,B1,"À cette époque, les Français partagent beaucou...",0.83755,...,B1,"À cette époque, les Français font la même chos...",0.847136,B1,"À cette époque, les Français font comme les au...",0.779732,B1,"À cette époque, les Français font comme les au...",0.779732,B1
2,Car souvent dans l'une on trouve égaré un jour...,C2,"Parfois, on se retrouve dans une situation où ...",0.859254,B2,"Parfois, on se retrouve dans une situation où ...",0.935319,B1,"Parfois, une journée spéciale change tout. On ...",0.898948,...,B1,"Quand il fait beau, on est content. On parle d...",0.835624,B1,"Quand il fait beau, on est heureux. On parle d...",0.838614,B1,"Quand il fait beau, on est content. On parle d...",0.835624,B1
3,"Une telle discussion n'a, d'ailleurs, d'intérê...",C2,Discuter de cette question n'a d'intérêt que p...,0.908204,B1,Parler de cette question n'a pas beaucoup d'im...,0.859258,B1,Parler de cette question n'est pas très import...,0.846823,...,B1,Parler de cette question n'est pas très import...,0.846823,B1,Parler de cette question n'est pas très import...,0.846823,B1,Parler de cette question n'est pas très import...,0.846823,B1
4,"Asiles, fermes, bistrots, musées s'entrecroise...",C2,"Des endroits comme les asiles, les fermes, les...",0.96416,B2,"Les endroits où l'on se retrouve, comme les li...",0.915314,B1,"Les endroits où on va, comme les écoles et les...",0.899529,...,B1,"Les endroits où on va sont amusants, comme les...",0.861041,B1,"Les endroits où on va sont amusants, comme les...",0.861041,B1,"Les endroits où on va sont amusants, comme les...",0.861041,B1


In [5]:
path = os.path.join(
    pwd,
    "results",
    "text_simplification",
    "IterativeSimplification",
    "iterative_simplification_label.csv",
)
iterative_simplification_label_df = pd.read_csv(path, header=0)
display(iterative_simplification_label_df.head())

Unnamed: 0,Original,Difficulty,Simplified_0,Similarity_0,Difficulty_0,Simplified_1,Similarity_1,Difficulty_1,Simplified_2,Similarity_2,...,Difficulty_4,Simplified_5,Similarity_5,Difficulty_5,Simplified_6,Similarity_6,Difficulty_6,Simplified_7,Similarity_7,Difficulty_7
0,La possibilité reconnue d'une semblable classi...,C2,Si on reconnaît qu'il est possible de classer ...,0.869201,B2,Si on sait que les choses peuvent être classée...,0.859032,B2,Si on sait que les choses peuvent être regroup...,0.856817,...,B1,Si on voit que des choses sont dans le même or...,0.8646,B1,Si on voit que des choses sont dans le même or...,0.8646,B1,Si on voit que des choses sont dans le même or...,0.8646,B1
1,"Après avoir suffisamment considéré, du point d...",C2,Après avoir réfléchi à la philosophie de la ch...,0.903888,B2,Après avoir pensé à la chimie et à sa place da...,0.877416,B1,"Après avoir pensé à la chimie, on peut voir qu...",0.882841,...,B1,"Après avoir pensé à la chimie, on peut voir qu...",0.871217,B1,"Après avoir pensé à la chimie, on peut voir qu...",0.871217,B1,"Après avoir pensé à la chimie, on peut voir qu...",0.871217,B1
2,"Ainsi, le nom systématique de chaque corps, en...",C2,"Par conséquent, le nom scientifique de chaque ...",0.923035,C1,"Donc, le nom scientifique d'un élément chimiqu...",0.927395,B2,"Donc, le nom scientifique d'un élément chimiqu...",0.907611,...,B2,"Donc, le nom scientifique d'un élément chimiqu...",0.888731,B2,"Donc, le nom scientifique d'un élément chimiqu...",0.888731,B2,"Donc, le nom scientifique d'un élément chimiqu...",0.888731,B2
3,"On ne saurait douter, néanmoins, que l'expérim...",C2,Il est clair que les expériences ont joué un r...,0.87598,B1,On peut voir que les expériences ont aidé beau...,0.743205,B1,Les expériences ont beaucoup aidé à faire mieu...,0.670202,...,B1,Les expériences nous enseignent à jouer avec d...,0.669911,B2,Les jouets nous apprennent à jouer de nouvelle...,0.624711,B1,Les jouets nous enseignent à jouer différemment.,0.661513,B2
4,L'activité dépendante présuppose un rapport de...,C2,"Si on travaille pour quelqu'un, on doit suivre...",0.905465,B1,"Si on travaille pour quelqu'un, on doit faire ...",0.86829,A2,"Si on travaille pour quelqu'un, on doit faire ...",0.86829,...,A2,"Si on travaille pour quelqu'un, on doit faire ...",0.86829,A2,"Si on travaille pour quelqu'un, on doit faire ...",0.86829,A2,"Si on travaille pour quelqu'un, on doit faire ...",0.86829,A2


## Figures

### [Metrics](d_Metrics.ipynb)

In [6]:
# Mute pandas warning
import warnings
import seaborn as sns

warnings.simplefilter(action="ignore", category=FutureWarning)
warnings.simplefilter(action="ignore", category=UserWarning)


# Bold best results
def highlight_best(x):
    # Create empty dataframe
    df = pd.DataFrame("", index=x.index, columns=x.columns)

    # Highlight best results
    for metric in [
        "Simplification Accuracy",
        "Semantic Similarity",
        "Weighted-Score",
    ]:
        df[metric].loc[x[metric].idxmax()] += "font-weight: bold; color: #FF9999;"

    # Make some rows index italic
    # for model in [
    #     "GPT-4",
    # ]:
    #     df.loc[model] += "font-style: italic;"

    return df


df = metrics_df.copy()

# Keep only useful columns
df = df[["Accuracy", "Similarity (BERT)", "Score (BERT)"]]
# Drop rows
df = df.drop(index=["Perfect Meaning", "Perfect Simplification"])

# Rename columns
df = df.rename(
    columns={
        "Accuracy": "Simplification Accuracy",
        "Similarity (BERT)": "Semantic Similarity",
        "Score (BERT)": "Weighted-Score",
    }
)

# Rename rows
df = df.rename(
    index={
        "Mistral-7B": "Mistral-7B Fine-Tuned",
        "Perfect Meaning": "Perfect Similarity",
    }
)

# Drop First row
df = df.drop(index=["GPT-4"])

# Sort by accuracy
df = df.sort_values(by=["Weighted-Score"], ascending=False)

# Add a column "context" to the index (multi-index)
df.index = pd.MultiIndex.from_tuples(
    [(model, "empty") for model in df.index], names=["Modèle", "Context"]
)


styled_df = (
    df.style.background_gradient(cmap=sns.light_palette("green", as_cmap=True))
    .apply(highlight_best, axis=None)
    .applymap_index(lambda v: "font-weight: bold;", axis="columns")
    .applymap_index(lambda v: "font-weight: bold;", axis="rows")
    .format(decimal=".", thousands=",", precision=2)
)
display(styled_df)
path = os.path.join(pwd, "figures", "text_simplification", "metrics.tex")
if not os.path.exists(os.path.dirname(path)):
    os.makedirs(os.path.dirname(path))
latex = styled_df.to_latex(
    caption=("Metrics for the text simplification task."),
    clines="skip-last;data",
    convert_css=True,
    position_float="centering",
    multicol_align="|c|",
    hrules=True,
)

# Add \begin{adjustbox}{center}
latex = latex.replace(
    "\\begin{tabular}", "\\begin{adjustbox}{center}\n\\begin{tabular}"
).replace(
    "\\end{tabular}",
    f"\\end{{tabular}}\n\\label{{tab:simplification_metrics}}\n\\end{{adjustbox}}",
)

# Force position of table
latex = latex.replace("\\begin{table}", "\\begin{table}[!h]")

print(latex)

Unnamed: 0_level_0,Unnamed: 1_level_0,Simplification Accuracy,Semantic Similarity,Weighted-Score
Modèle,Context,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1
GPT-4 Zero-Shot,empty,0.26,0.93,0.41
GPT Fine-Tuned,empty,0.26,0.91,0.41
Mistral-7B Fine-Tuned,empty,0.26,0.91,0.4
GPT Zero-Shot,empty,0.26,0.93,0.4
Mistral-7B Zero-Shot,empty,0.24,0.93,0.39
GPT-4o Zero-Shot,empty,0.24,0.89,0.37
Davinci Fine-Tuned,empty,0.21,0.83,0.33


\begin{table}[!h]
\centering
\caption{Metrics for the text simplification task.}
\begin{adjustbox}{center}
\begin{tabular}{llrrr}
\toprule
 &  & \bfseries Simplification Accuracy & \bfseries Semantic Similarity & \bfseries Weighted-Score \\
Modèle & Context &  &  &  \\
\midrule
\bfseries GPT-4 Zero-Shot & \bfseries empty & {\cellcolor[HTML]{008000}} \color[HTML]{F1F1F1} \bfseries \color[HTML]{FF9999} 0.26 & {\cellcolor[HTML]{008000}} \color[HTML]{F1F1F1} \bfseries \color[HTML]{FF9999} 0.93 & {\cellcolor[HTML]{008000}} \color[HTML]{F1F1F1} \bfseries \color[HTML]{FF9999} 0.41 \\
\cline{1-5}
\bfseries GPT Fine-Tuned & \bfseries empty & {\cellcolor[HTML]{108810}} \color[HTML]{F1F1F1} 0.26 & {\cellcolor[HTML]{2C962C}} \color[HTML]{F1F1F1} 0.91 & {\cellcolor[HTML]{138913}} \color[HTML]{F1F1F1} 0.41 \\
\cline{1-5}
\bfseries Mistral-7B Fine-Tuned & \bfseries empty & {\cellcolor[HTML]{138913}} \color[HTML]{F1F1F1} 0.26 & {\cellcolor[HTML]{2C962C}} \color[HTML]{F1F1F1} 0.91 & {\cellcolor[HTML]{1

In [7]:
# -------------------------- EXAMPLE SIMPLIFICATION -------------------------- #
df = example_df.copy()

# Remove GPT-4, Perfect Meaning and Perfect Simplification
df = df.drop(index=["GPT-4", "Perfect Meaning", "Perfect Simplification"])


def highlight_best(x):
    # Create empty dataframe
    df = pd.DataFrame("", index=x.index, columns=x.columns)

    # Highlight best results
    for metric in [
        "Accuracy",
        "Similarity",
        "Score",
    ]:
        df[metric].loc[x[metric].idxmax()] += "font-weight: bold; color: #FF9999;"

    # Make some rows index italic
    for model in [
        "GPT-4",
        "Perfect Similarity",
        "Perfect Simplification",
    ]:
        df.loc[model] += "font-style: italic;"

    return df


# Rename columns
df = df.rename(
    columns={
        "Score (BERT)": "Score",
    }
)

# Rename rows
df = df.rename(
    index={
        "Mistral-7B": "Mistral-7B Fine-Tuned",
        "Perfect Meaning": "Perfect Similarity",
    }
)

# Cut the text to 125 characters
df["Original"] = df["Original"].str.slice(0, 200) + "..."
df["Simplified"] = df["Simplified"].str.slice(0, 200) + "..."

# Keep only latex compatible characters
df["Original"] = df["Original"].str.replace("_", "\_")
df["Simplified"] = df["Simplified"].str.replace("_", "\_")

styled_df = (
    df.style.applymap_index(lambda v: "font-weight: bold;", axis="columns")
    .applymap_index(lambda v: "font-weight: bold;", axis="rows")
    .format(decimal=".", thousands=",", precision=2)
)
display(styled_df)
path = os.path.join(pwd, "figures", "text_simplification", "example.tex")
if not os.path.exists(os.path.dirname(path)):
    os.makedirs(os.path.dirname(path))
latex = styled_df.to_latex(
    caption=("Example of simplification for the text simplification task."),
    clines="skip-last;data",
    convert_css=True,
    position_float="centering",
    multicol_align="|c|",
    hrules=True,
)

# Add \begin{adjustbox}{center}
latex = latex.replace(
    "\\begin{tabular}", "\\begin{adjustbox}{center}\n\\begin{tabular}"
).replace(
    "\\end{tabular}",
    f"\\end{{tabular}}\n\\label{{tab:simplification_example}}\n\\end{{adjustbox}}",
)

# Force position of table
latex = latex.replace("\\begin{table}", "\\begin{table}[!h]")

# Faire des retours de chariot automatiques avec tabularx
latex = latex.replace("lX", "lX@{}")

print(latex)

Unnamed: 0,Original,Simplified,Accuracy,Similarity,Score
Mistral-7B Zero-Shot,"Pour faire un parallèle avec le sport, on joue avec sa tête, on ne court plus après tous les ballons!» La retraite, les quintaux d'aujourd'hui l'imaginent actif e, forcément active....","Pour comparer avec le sport, on utilise sa tête, on ne court plus après tous les ballons! La retraite, les quintaux d'aujourd'hui l'imaginent actif, forcément actif....",0.22,0.99,0.36
Mistral-7B Fine-Tuned,"Les sénateurs, investis par le suffrage universel indirect de tous les droits et obligations attachés à la fonction parlementaire, sont élus pour six ans par un collège électoral de plus de 160 000 él...","Les sénateurs, élus par un groupe de personnes choisies pour représenter le peuple, ont le pouvoir de décider des lois pendant six ans....",0.33,0.95,0.48
GPT-4 Zero-Shot,"Pourtant, son état tourna vite à la mauvaise gros- sesse....","Cependant, elle est rapidement devenue très malade....",0.28,0.81,0.42
GPT-4o Zero-Shot,"En ce temps-là, on ne connaissait pas ces scandaleux congés de maternités; quatre semaines avant I'accouchement, six semaines après; ou vice versa....","À l'époque, il n'y avait pas de congés de maternité comme aujourd'hui; quatre semaines avant la naissance et six semaines après, ou l'inverse....",0.31,0.93,0.47
GPT Fine-Tuned,"Qrand elle essaya de I'approcher, il détaaie comme s'il avait mauvaise conscience....","Quand elle a essayé de s'approcher de lui, il a détourné son regard comme s'il se sentait coupable....",0.27,0.86,0.41
GPT Zero-Shot,"Sûr et certain, ils n'éprouvaient aucun orgueil de leur héritage africain....",Ils ne ressentaient aucun sentiment de fierté pour leur héritage africain....,0.32,0.9,0.47
Davinci Fine-Tuned,Appuyez-vous sur l’ensemble du paragraphe....,"Cet paragraphe à écrit beaucoup de choses ensemble, alors je veux que tu me dises cela en d'autres mots.C'est l'équipe de Grands Espaces qui organise ce festival. Ils veulent que vous veniez voir tout...",0.14,0.72,0.24


\begin{table}[!h]
\centering
\caption{Example of simplification for the text simplification task.}
\begin{adjustbox}{center}
\begin{tabular}{lllrrr}
\toprule
 & \bfseries Original & \bfseries Simplified & \bfseries Accuracy & \bfseries Similarity & \bfseries Score \\
\midrule
\bfseries Mistral-7B Zero-Shot & Pour faire un parallèle avec le sport, on joue avec sa tête, on ne court plus après tous les ballons!» La retraite, les quintaux d'aujourd'hui l'imaginent actif e, forcément active.... & Pour comparer avec le sport, on utilise sa tête, on ne court plus après tous les ballons! La retraite, les quintaux d'aujourd'hui l'imaginent actif, forcément actif.... & 0.22 & 0.99 & 0.36 \\
\bfseries Mistral-7B Fine-Tuned & Les sénateurs, investis par le suffrage universel indirect de tous les droits et obligations attachés à la fonction parlementaire, sont élus pour six ans par un collège électoral de plus de 160 000 él... & Les sénateurs, élus par un groupe de personnes choisies pour représent

### [Iterative Simplification](g_IterativeSimplification.ipynb)

In [8]:
from matplotlib import pyplot as plt
import matplotlib

matplotlib.use("pgf")
matplotlib.rcParams.update(
    {
        "pgf.texsystem": "pdflatex",
        "font.family": "serif",
        "text.usetex": True,
        "pgf.rcfonts": False,
        "font.size": 10,
    }
)

df = iterative_simplification_label_df.copy()

# Add Similarity column
df["Similarity"] = 1
# Only keep useful columns
difficulty = df[["Difficulty"] + [f"Difficulty_{i}" for i in range(8)]]
similarity = df[["Similarity"] + [f"Similarity_{i}" for i in range(8)]]

# Convert CECRL to int
difficulty_map = {
    "A1": 1,
    "A2": 2,
    "B1": 3,
    "B2": 4,
    "C1": 5,
    "C2": 6,
}
difficulty = difficulty.replace(difficulty_map)

# Mean and std
difficulty_mean = difficulty.mean().reset_index(drop=True)
difficulty_std = difficulty.std().reset_index(drop=True)
similarity_mean = similarity.mean().reset_index(drop=True)
similarity_std = similarity.std().reset_index(drop=True)

# Plot both curves on the same graph
fig, ax1 = plt.subplots()

color = "tab:red"
ax1.set_xlabel("Simplification step")
ax1.set_ylabel("Difficulty", color=color)
ax1.plot(
    range(9),
    difficulty_mean,
    marker="o",
    linestyle="--",
    color=color,
    label="Difficulty",
)
ax1.fill_between(
    range(9),
    difficulty_mean - difficulty_std,
    difficulty_mean + difficulty_std,
    color=color,
    alpha=0.2,
)
ax1.tick_params(axis="y", labelcolor=color)
# Set yticks precision to int
ax1.set_yticklabels(["A2", "B1", "B2", "C1", "C2"])
ax1.yaxis.set_major_locator(plt.MaxNLocator(integer=True))

# Add values on top of each point
last = 6
for i, txt in enumerate(difficulty_mean):
    if i == 0:
        continue
    if round(difficulty_mean[i], 2) == last:
        continue
    ax1.annotate(
        f"{difficulty_mean[i]:.2f}",
        (i, difficulty_mean[i]),
        textcoords="offset points",
        xytext=(-5, -20),
        ha="center",
    )
    last = round(difficulty_mean[i], 2)


ax2 = ax1.twinx()
color = "tab:blue"
ax2.set_ylabel("Similarity", color=color)
ax2.plot(
    range(9),
    similarity_mean,
    marker="o",
    linestyle="--",
    color=color,
    label="Similarity",
)
ax2.fill_between(
    range(9),
    similarity_mean - similarity_std,
    similarity_mean + similarity_std,
    color=color,
    alpha=0.2,
)
ax2.tick_params(axis="y", labelcolor=color)

# Add values on top of each point
last = 1
for i, txt in enumerate(similarity_mean):
    if i == 0:
        continue
    if round(similarity_mean[i], 2) == last:
        continue
    ax2.annotate(
        f"{similarity_mean[i]:.2f}",
        (i, similarity_mean[i]),
        textcoords="offset points",
        xytext=(10, 15),
        ha="center",
    )
    last = round(similarity_mean[i], 2)

# Legend
fig.legend(loc="upper right", ncol=1, bbox_to_anchor=(0.87, 0.95))
fig.tight_layout()
# Set size inches
plt.gcf().set_size_inches(8, h=8 / 1.618)

plt.show()

# Save figure
path = os.path.join(
    pwd, "figures", "text_simplification", "iterative_simplification.pgf"
)
if not os.path.exists(os.path.dirname(path)):
    os.makedirs(os.path.dirname(path))
plt.savefig(path, bbox_inches="tight")

# Display latex code
with open(path, "r") as file:
    pgf = file.read()
print(pgf)

%% Creator: Matplotlib, PGF backend
%%
%% To include the figure in your LaTeX document, write
%%   \input{<filename>.pgf}
%%
%% Make sure the required packages are loaded in your preamble
%%   \usepackage{pgf}
%%
%% Also ensure that all the required font packages are loaded; for instance,
%% the lmodern package is sometimes necessary when using math font.
%%   \usepackage{lmodern}
%%
%% Figures using additional raster images can only be included by \input if
%% they are in the same directory as the main LaTeX file. For loading figures
%% from other directories you can use the `import` package
%%   \usepackage{import}
%%
%% and then include the figures with
%%   \import{<path to file>}{<filename>.pgf}
%%
%% Matplotlib used the following preamble
%%   \def\mathdefault#1{#1}
%%   \everymath=\expandafter{\the\everymath\displaystyle}
%%   
%%   \makeatletter\@ifpackageloaded{underscore}{}{\usepackage[strings]{underscore}}\makeatother
%%
\begingroup%
\makeatletter%
\begin{pgfpicture}%
\pgfpa