Skip to content

fix: skip Otzaria links for books imported from Sefaria#28

Merged
kdroidFilter merged 1 commit intomasterfrom
fix/skip-otzaria-links-for-sefaria-books
Jan 13, 2026
Merged

fix: skip Otzaria links for books imported from Sefaria#28
kdroidFilter merged 1 commit intomasterfrom
fix/skip-otzaria-links-for-sefaria-books

Conversation

@kdroidFilter
Copy link
Owner

Problème

Les fichiers de liens Otzaria utilisent des indices de ligne identiques pour les livres source et cible, mais cela ne tient pas compte des structures d'en-tête différentes entre les livres.

Par exemple :

  • Bereshit : index 0=titre, 1=chapitre, 2=verset 1
  • Onkelos : index 0=titre, 1=auteur, 2=chapitre, 3=verset 1

Cela a causé ~32 000 liens TARGUM en double/incorrects où le verset N d'un livre source était incorrectement lié au verset N-1 du targum.

Solution

  • Ajouter un cache sefariaBookIds qui identifie les livres importés depuis Sefaria
  • Sauter la génération de liens Otzaria pour ces livres dans processLinksForBook() et processLinkFile()
  • Sefaria fournit déjà des mappings verset-à-verset précis

Changements

  • Generator.kt : Ajout de la logique de skip pour les livres Sefaria

Test

Pour corriger une base de données existante, régénérer les liens avec :

./gradlew :SeforimLibrary:generator:generateLinks

Otzaria link files use matching line indices for source and target books,
but this doesn't account for different header structures between books
(e.g., Genesis has 2 header lines while Onkelos has 3).

This caused ~32,000 duplicate/incorrect TARGUM links where verse N of a
source book was incorrectly linked to verse N-1 of the targum.

Fix: Track books imported from Sefaria sources and skip Otzaria link
generation for these books, since Sefaria already provides accurate
verse-to-verse mappings.
@kdroidFilter kdroidFilter merged commit 0ba76bd into master Jan 13, 2026
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

1 participant