linogaliana
diff --git a/‎_quarto.yml
Lines changed: 1 addition & 1 deletion b/‎_quarto.yml
Lines changed: 1 addition & 1 deletion
diff --git a/‎build/tweak_markdown.py
Lines changed: 1 addition & 0 deletions b/‎build/tweak_markdown.py
Lines changed: 1 addition & 0 deletions
diff --git a/‎content/course/NLP/01_intro/index.qmd
Lines changed: 1 addition & 1 deletion b/‎content/course/NLP/01_intro/index.qmd
Lines changed: 1 addition & 1 deletion
diff --git a/‎content/course/NLP/02_exoclean/index.qmd
Lines changed: 3 additions & 3 deletions b/‎content/course/NLP/02_exoclean/index.qmd
Lines changed: 3 additions & 3 deletions
diff --git a/‎content/course/NLP/03_lda/index.qmd
Lines changed: 5 additions & 3 deletions b/‎content/course/NLP/03_lda/index.qmd
Lines changed: 5 additions & 3 deletions
diff --git a/‎content/course/NLP/04_word2vec/index.qmd
Lines changed: 4 additions & 4 deletions b/‎content/course/NLP/04_word2vec/index.qmd
Lines changed: 4 additions & 4 deletions
diff --git a/‎content/course/NLP/06_elastic/functions.py
Lines changed: 0 additions & 113 deletions b/‎content/course/NLP/06_elastic/functions.py
Lines changed: 0 additions & 113 deletions
@@ -9,7 +9,7 @@ jupyter: python3
 
 wrap: preserve
 keep-ipynb: true
-#cache: true
+cache: true
 
 format:
   hugo:
 
@@ -28,6 +28,7 @@ def write_file(filename, content):
 
 def clean_write_file(fl):
     content = read_file(fl)
+    content = re.sub(r"(“|”)",'"',content)
     print(f"File: {fl}")
     add_text = '\n\n<script src="https://d3js.org/d3.v7.min.js"></script>\n<script src="https://cdn.plot.ly/plotly-latest.min.js"></script>'
     yaml, text = content.split('---\n', 2)[1:]
 
@@ -17,7 +17,7 @@ summary: |
   où le ratio signal/bruit est faible, il est nécessaire de mettre
   en oeuvre une série d'étapes de nettoyage de texte. Ce chapitre va
   explorer quelques méthodes classiques de nettoyage en s'appuyant
-  sur le Comte de Monte Cristo. 
+  sur le _Comte de Monte Cristo_ d'Alexandre Dumas. 
 ---
 
 ```{python}
 
@@ -13,12 +13,12 @@ categories:
   - Exercice
 type: book
 summary: |
-  Ce chapitre continue de présenter l'approche de data-cleaning
-  du NLP en s'appuyant sur le corpus de trois auteurs
+  Ce chapitre continue de présenter l'approche de __nettoyage de données__ 
+  du `NLP` en s'appuyant sur le corpus de trois auteurs
   anglo-saxons : Mary Shelley, Edgar Allan Poe, H.P. Lovecraft.
   Dans cette série d'exercice nous mettons en oeuvre de manière
   plus approfondie les différentes méthodes présentées
-  précedemment
+  précedemment.
 ---
 
 ```{python}
 
@@ -13,9 +13,11 @@ tags:
 categories:
   - Tutoriel
 summary: |
-  Le modèle Latent Dirichlet Allocation (LDA) est un modèle probabiliste génératif qui permet
-  de décrire des collections de documents de texte ou d’autres types de données discrètes. LDA fait
-  partie d’une catégorie de modèles appelés “topic models”, qui cherchent à découvrir des structures
+  Le modèle [Latent Dirichlet Allocation (LDA)](https://fr.wikipedia.org/wiki/Allocation_de_Dirichlet_latente)
+  est un modèle probabiliste génératif qui permet
+  de décrire des collections de documents de texte ou d’autres types de données discrètes.
+  La `LDA` fait
+  partie d’une catégorie de modèles appelés _"topic models"_, qui cherchent à découvrir des structures
   thématiques cachées dans des vastes archives de documents.
 ---
 
 
@@ -14,13 +14,13 @@ categories:
   - Tutoriel
 summary: |
   Pour pouvoir utiliser des données textuelles dans des algorithmes
-  de machine learning, il faut les vectoriser, c'est à dire transformer
+  de _machine learning_, il faut les vectoriser, c'est à dire transformer
   le texte en données numériques. Dans ce TP, nous allons comparer
   différentes méthodes de vectorisation, à travers une tâche de prédiction :
-  peut-on prédire un auteur littéraire à partir d'extraits de ses textes ?
-  Parmi ces méthodes, on va notamment explorer le modèle Word2Vec, qui
+  _peut-on prédire un auteur littéraire à partir d'extraits de ses textes ?_
+  Parmi ces méthodes, on va notamment explorer le modèle `Word2Vec`, qui
   permet d'exploiter les structures latentes d'un texte en construisant
-  des word embeddings (plongements de mots).
+  des _word embeddings_ (plongements de mots).
 eval: false
 ---