Possible fix of #2 #18

tianyikillua · 2016-12-28T19:50:46Z

Résultat : http://www.litianyi.me/ceseda

Règles constatées du fichier brut Markdown généré :

Si on a un article en section # Article L/R/R*/D123-1 (le niveau n'est pas important ici)
Alors dans le corps on l'utilise comme L/R/R*/D. 123-1 (ajout d'un .)

Quelques mauvais formattages ponctuels ont été corrigés.

Méthode

Cf. https://kramdown.gettalong.org/converter/html.html et http://stackoverflow.com/questions/6695439/how-to-link-to-a-named-anchor-in-multimarkdown

# Article L123-1 a pour lien interne (#article-l123-1)
## Article L123-1 a aussi pour lien interne (#article-l123-1)
# Article R*123-1 a pour lien interne (#article-r123-1)

Perspective

Un (seul) bémol de l'implémentation présentée ici : parfois dans le corps on fait référence à un article disons L. 123-1 provenant d'un autre code. Si par chance dans notre code en question on a aussi le même article # Article L123-1, ainsi tous les L. 123-1 dans le corps vont être transformés en hyperliens vers l'article du code. Exemple : rechercher

article L. 821-1 du code de la sécurité sociale

dans http://www.litianyi.me/ceseda.

La résolution de ce bug n'est pas triviale à ma première humble vue (vérifier si dans le corps l'article n'est pas suivi par du ?).

tianyikillua · 2016-12-28T20:01:38Z

On peut voir dans le corps que l'on dit aussi souvent "article L. 123-1" du présent code. Ainsi même si l'article L. 123-1 est suivi par un du, il faut encore vérifier s'il n'était pas suivi par du présent code...

Ainsi tous les liens dans http://www.litianyi.me/ceseda fonctionnent.

Seb35

C’est globalement ok pour l’ajouter, il faudrait surtout rajouter le switch (avec par défaut pas d’ajout de liens) et corriger le petit bug.

Seb35 · 2017-02-05T19:20:33Z

marcheolex/exporter.py

+    for ligne in lignes:
+        info = ligne.partition('# Article ')[2]
+        if info:
+            ind = re.search('\d', info).start()


Ce passage bugue lorsqu’il n’y a pas de chiffre, par exemple « Article Annexe II » (code la propriété intellectuelle, version consolidée au 20 novembre 1998).

Seb35 · 2017-02-05T19:21:33Z

marcheolex/exporter.py

+                                '(#article-' + type_article_lien + num_article + ')'
+            for symbole in [' ', ',', '.']:  # rechercher des mots exacts
+                contenu = contenu.replace(article + symbole, article_avec_lien + symbole)
+    return contenu


Rajouter une fin de ligne normale dans un prochain commit

Seb35 · 2017-02-05T19:29:07Z

marcheolex/exporter.py

@@ -133,6 +134,9 @@ def creer_historique_texte(texte, format, dossier, cache):
        # Créer les sections (donc tout le texte)
        contenu = creer_sections(contenu, 1, None, versions_sections, articles, version_texte, cid, cache)

+        # Ajouter des liens internes vers articles
+        contenu = ajouter_liens_internes(contenu)


Ajouter donc un switch (~feature toggle) à cet endroit-là pour créer une option de format, cf #20.

Seb35 · 2017-02-05T19:43:44Z

marcheolex/exporter.py

+        contenu = contenu.replace(l + '. * ', l + '*. ')  # corrig. mauvais formattages
+        contenu = contenu.replace(l + '. *', l + '*. ')
+        contenu = contenu.replace(l + '.* ', l + '*. ')
+        contenu = contenu.replace(l + '.*', l + '*. ')


Je suis pas trop fan de modifier le texte, même s’il a des coquilles comme ça, mais je comprend que ça soit plus facile à manipuler pour rajouter les liens. J’hésite entre deux propositions :

conserver cette implémentation et avertir que le texte est légèrement modifié [enfin, je pense que je devrais mettre l’avertissement de toutes façon]

ajouter une option de format “conservatif ou non”, et dans ce cas j’utiliserai cette option également dans markdown.py car il y a quelques modifs aussi

Seb35 · 2017-02-05T19:54:39Z

À plus long terme, il faudra utiliser les données de liens présentes dans la base LEGI en XML, en complément et/ou en seule source de données. Mais pour ce faire, il faut stocker dans la base de données ces informations, ce qui n’est pas encore le cas.

Syntaxe : --metadonnees="lien" Les options META seront cumulables : --metadonnees="lien tdm" Cf. Issue Legilibre#20

Ignorer les articles sans chiffre comme `Article Annexe II` dans CPI

Possible fix of Legilibre#2

093710e

Échapper l'étoile * dans les liens

3288a7a

Ainsi tous les liens dans http://www.litianyi.me/ceseda fonctionnent.

Seb35 requested changes Feb 5, 2017

View reviewed changes

Seb35 mentioned this pull request Feb 5, 2017

Stocker dans la base de données certaines métadonnées #22

Closed

Seb35 mentioned this pull request Feb 20, 2017

Faire tourner Archéo Lex sur tous les codes avec une base LEGI récente #28

Closed

tianyikillua added 4 commits March 7, 2017 17:26

Merge master into ajouter-liens-internes

ea501b4

Ajouter un switch pour afficher les liens internes

44a7f42

Syntaxe : --metadonnees="lien" Les options META seront cumulables : --metadonnees="lien tdm" Cf. Issue Legilibre#20

Utiliser le switch pour les liens internes

01d5523

Ignorer les articles sans chiffre comme `Article Annexe II` dans CPI

Par défault pas d'options pour les métadonnées

36b9f62

tianyikillua force-pushed the ajouter-liens-internes branch from aad8424 to 36b9f62 Compare March 8, 2017 09:54

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Possible fix of #2 #18

Possible fix of #2 #18

tianyikillua commented Dec 28, 2016 •

edited

Loading

tianyikillua commented Dec 28, 2016 •

edited

Loading

Seb35 left a comment

Seb35 Feb 5, 2017

Seb35 Feb 5, 2017

Seb35 Feb 5, 2017

Seb35 Feb 5, 2017

Seb35 commented Feb 5, 2017

Possible fix of #2 #18

Are you sure you want to change the base?

Possible fix of #2 #18

Conversation

tianyikillua commented Dec 28, 2016 • edited Loading

Règles constatées du fichier brut Markdown généré :

Méthode

Perspective

tianyikillua commented Dec 28, 2016 • edited Loading

Seb35 left a comment

Choose a reason for hiding this comment

Seb35 Feb 5, 2017

Choose a reason for hiding this comment

Seb35 Feb 5, 2017

Choose a reason for hiding this comment

Seb35 Feb 5, 2017

Choose a reason for hiding this comment

Seb35 Feb 5, 2017

Choose a reason for hiding this comment

Seb35 commented Feb 5, 2017

tianyikillua commented Dec 28, 2016 •

edited

Loading

tianyikillua commented Dec 28, 2016 •

edited

Loading