-
Notifications
You must be signed in to change notification settings - Fork 2
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Choix export et nommage des fichiers de transcription #4
Comments
J'approuve ta proposition. |
D'accord, cela me semble bien ! |
il faudrait également ajouter le numéro des images dans le nommage des fichiers afin de savoir laquelle image on a transcrit. |
Après réflexion, peut-être vaut-il mieux faire des exports en format texte brut pour le moment, afin de faciliter la relecture et l'entraide sur les transcriptions. Je ne pense pas que le format XML ALTO soit nécessairement utile à ce stade, même s'il serait bon de l'inclure en fin de projet (étant donné qu'il conserve le lien entre le texte et l'image). |
Oui effectivement c'est mieux. On fait comme cela alors. |
le nommage des fichiers est un peu ambiguë car nous ne savons pas si "transcription" fait référence à la transcription d'eScriptorium non corrigée ou bien à celle corrigée par nos propres soins selon les normes de transcription qu'on aura définies. |
En effet ! De manière plus globale, je propose que nous adoptions des conventions / une même organisation pour les dossiers également, afin de mieux nous y retrouver. Je propose cette organisation :
Et, une fois la transcription définitivement terminée et corrigée :
Qu'en pensez-vous ? |
Je suis d'accord pour les conventions de nommage. |
Cela est parfait pour moi Cécile. Juste, en ce qui concerne les fichiers de transcription brute d'eScriptorium, comment on les nomme ? Est-ce que cela irait : "Lettre-ID-date-transcriptionBrute-numéro d'image" ? |
Ok ça me va Lien pour la convention des dates. |
oui je suis d'accord avec toi Fanny |
D'accord avec toi pour les fichiers de transcription brute, j'avais en effet oublié de l'indiquer. Le format de date me semble bien (nous nous adressons avant tout à des francophones). Je propose du coup d'incorporer les tirets du bas (et de supprimer l'espace entre Lettre et l'ID, si cela vous va ?) mais de peut-être garder les tirets du milieu à l'intérieur des dates. Ce qui donnerait par exemple : LettreID_JJ-MM-AAAA_transcriptionBrute_numéroDImage |
oui c'est mieux. Cela permet de différencier l'ID de la lettre et sa date. |
Parfait pour moi ! |
Très bien, nous allons pouvoir formaliser tout cela dans un compte-rendu ! |
Il faudrait que nous nous mettions d'accord sur deux points :
le format d'export des fichiers d'eScriptorium : je vous proprose d'exporter les fichiers à la fois en format text et en format alto. Comme nous ne savons pas quelle utilité nous en aurons après, il est préférable de l'avoir sous deux formats différents. Nous pourrons affiner cela par la suite en fonction de nos besoins.
le nommage de ces fichiers: je vous propose de nommer nos fichiers de transcription de façon uniforme. Que pensez-vous de : "Lettre ID - date - transcription" ?
The text was updated successfully, but these errors were encountered: