Skip to content
New issue

Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.

By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.

Already on GitHub? Sign in to your account

Traduction : Du html à une liste de mots (partie 1) #560

Closed
marie-flesch opened this issue May 3, 2023 · 24 comments
Closed

Traduction : Du html à une liste de mots (partie 1) #560

marie-flesch opened this issue May 3, 2023 · 24 comments

Comments

@marie-flesch
Copy link
Contributor

marie-flesch commented May 3, 2023

@datalogism propose la traduction de la leçon From html to list of words, partie 1.

La traduction est terminée ; @anisa-hawes est en train d'effectuer les contrôles nécessaires. Ce sera @AlexandreWa qui effectuera le suivi éditorial de cette leçon (qui se déroulera sur le ticket de relecture, que nous ouvrironssur ce même ticket, une fois les contrôles effectués par Anisa).

@marie-flesch marie-flesch changed the title Proposition de traduction en français : du html a une liste de mots Proposition de traduction en français : du html à une liste de mots May 3, 2023
@marie-flesch marie-flesch changed the title Proposition de traduction en français : du html à une liste de mots Traduction : Du html à une liste de mots (partie 1) May 3, 2023
@anisa-hawes
Copy link
Contributor

anisa-hawes commented May 3, 2023

Merci beaucoup, @marie-flesch.

Bonjour, @AlexandreWa.

Vous trouverez les fichiers ici :

Vous pouvez parcourir l’aperçu de la soumission ici :

@AlexandreWa
Copy link
Contributor

Bonjour à toutes et à tous,

Pour information, j'ai effectué la relecture de la leçon de Célian @datalogism et je viens de lui transmettre, par mail, l'état de mes premières remarques.

@datalogism
Copy link
Contributor

Hello, je viens de corriger les remarques de @AlexandreWa qui étaient les suivantes :

  • Paragraphe 5 : "pléthore" c'est peut-être personnel, mais je trouve ce terme trop littéraire pour un tutoriel, je propose tout simplement "vous trouverez de nombreuses balises HTML"

  • Paragraphe 6 :

      "méta-données" => métadonnées
    
  • Paragraphe 9 :

      "La prochaine étape sera donc" utiliser le présent plutôt que le futur.
    
      Privilégier l'usage du mot "chevron" plutôt que "crochet" (ou les 2 ?) pour désigner les balises HTML, voir aussi https://fr.wikipedia.org/wiki/Chevron_(typographie)
    
      "nous avons fort à parier" plutôt "il y a fort à parier"
    
  • Paragraphe 18 :

      "sauvegardez le" : ajouter le tiret de la forme impérative
    
  • Paragraphe 20 :

      "Lorsque vous lancez", je suggère "Lorsque vous exécutez"
    
      " Si tout est bon cela nous renverra bien le contenu de la transcription de Bowsey, avec comme nous le prévoyons quelques balises HTML", plutôt "Si tout est correct cela nous renverra bien le contenu de la transcription de Bowsey, avec, comme nous le prévoyons, quelques balises HTML"
    
      "mais ne vous inquiétiez pas." doit-on insérer un point d'exclamation ?
    
      "nouveau fichier à titre de vérification." - insérer virgule : "nouveau fichier, à titre de vérification."
    
  • Paragraphe 21 :

      "nous ne sommes pas obligés" insérer écriture inclusive (je n'ai pas trouvé d'autre oubli concernant cette forme que nous avons choisie)
    
      "observez ce qu’il s’en suit" - correction "s'ensuit"
    

J'ai de plus :

  • coupé certaines phrases à rallonges
  • modifié certaines répétitions
  • remplacé les occurences de "grammaire HTML" par "syntaxe HTML" cela veux dire la même chose mais le second est plus naturel
  • supprimé l'exemple du chien évoquant un passage aussi supprimé dans la leçon précédente.

Une question à débattre :

  • l'éditeur de texte Komodo edit est évoqué, mais pour moi c'est quelque chose qui est très utilisé aujourd'hui > A supprimer ?

@AlexandreWa
Copy link
Contributor

Merci @datalogism d'avoir repris mes remarques effectuées par mail !

Concernant l'autre personne devant relire cette traduction, je l'ai contactée le 11 mai dernier et elle semble très occupée actuellement.

Je l'ai relancée la semaine dernière, elle devrait pouvoir réaliser la relecture et emmètre des remarques vers la mi-juin :)

A très vite, donc !

@marie-flesch
Copy link
Contributor Author

Bonjour tout le monde,

Voici donc mes remarques sur la leçon traduite par @datalogism.

Il s'agit principalement de problèmes mineurs de langue. Toutefois, je me demande également s'il ne serait pas bon d'indiquer clairement avec quel outil on inspecte le code HTML dans la première partie de la leçon (navigateur web ? éditeur ? ce n'est clair) et dire quelle interface on utilise pour exécuter le code. La leçon évoque Komodo Edit, mais trop tard à mon avis. C'est un problème de la leçon originale, mais je pense que c'est problématique pour les débutant.es.

Dans un message précédent, Célian écrit :

l'éditeur de texte Komodo edit est évoqué, mais pour moi c'est quelque chose qui est très utilisé aujourd'hui > A supprimer ?

Je ne comprends pas ; pourquoi le supprimer ? (je le supprimerais si ce n'était pas très utilisé ; je le mentionnerais s'il est très utilisé - on s'adresse à des débutant·es qui ne le connaissent peut-être pas très bien ). On peut aussi mentionner d'autres outils si nécessaire - je ne suis pas une pro de Python, donc je laisse l'autre évaluateur s'exprimer sur la question.

Objectifs de la leçon

  • problème avec le lien de la "transcription du procès verbal de Benjamin Bowsey". Le lien de la leçon originale est le suivant : https://www.oldbaileyonline.org/browse.jsp?id=t17800628-33&div=t17800628-33
  • il semble également que la "transcription du procès verbal de Benjamin Bowsey en 1780" soit plus une formulation plus correcte que celle utilisée.
  • " Nous réaliserons cette tâche en tirant parti d’opérateur de chaînes, de méthode de chaînes et de compétences en lecture de près."
    • Je suggère de mettre "opérateurs de chaines" (au pluriel)
    • "lecture de près" est la traduction de "close reading" qui, me semble-t-il, serait mieux traduite par "lecture attentive" (cf wikipedia).

Le défi de la leçon

  • lien vers la leçon Télécharger des pages web Python à changer : https://programminghistorian.org/fr/lecons/telecharger-des-pages-web-avec-python
  • "téléchargez et ouvrez le fichier" --> le lien renvoie vers le texte du procès, il n'y a pas de bouton pour télécharger (problème du texte original me semble-t-il). Peut-être serait-il mieux de dire "copiez le texte disponible à cette adresse" ou quelque chose comme ça. D'ailleurs, il faudra mieux décrire ce qu'il faut faire ici : où est-ce qu'on clique sur "Tools -> Web developer > Page source" ? (j'imagine que c'est depuis le navigateur web ou autre ?). Il faudrait donner des instructions pour le faire, en français.
  • à la place de "Vous remarquerez lors du parcours de ce fichier que celui-", je propose : "En parcourant le fichier, vous remarquerez" (ou "en faisant défiler...").
  • "Si vous êtes néophytes" -> à mettre au singulier.
  • "nous vous recommandons de consulter les tutoriels de la W3 School" -> pourrait-on donner un second lien en français, s'il existe de bons tutos en français ? (pas obligé, mais ça serait un plus)
  • "Si votre travail vous demande de supprimer régulièrement des balises HTML" -> "Si vous avez souvent besoin de supprimer..."

Conception de l'algorithme

§ 4

  • "il est conseillé dans un premier temps, de poser sur le papier son fonctionement, c’est une manière d’expliciter ce que l’on souhaite faire avant de traduire cela en un code informatique." Coquille : **fonctionnement". Peut-être que quelque chose comme "Il est conseillé de décrire le fonctionnement de l'algorithme : c'est une manière..." serait plus clair, je ne sais pas (l'idée du papier peut troubler un peu)

§ 5

  • "un moyen de capturer le contenu de la biographie." -> je ne sais pas d'où vient l'idée de la "biographie" ? (elle est dans le texte original, mais on parle du compte-rendu d'un procès...)

§6

  • "des informations liées à des citations". Des références ? Ici, ce serait bien de donner un exemple issu du fichier, pour les novices comprennent de quoi on parle.

§7

  • "aux transcriptions" -> à mettre au singulier. (la transcription du procès du procès)
  • "De plus, vous remarquerez que la fin de ces métadonnées correspond au début des transcriptions." -> remplacer "de plus" par "cependant" ou "toutefois" (however). "transcriptions" à mettre au singulier. Idem dans la phrase suivante.

§8

  • "Nous sommes dans notre cas plutôt chanceux" -> "Dans ce cas, nous avons de la chance" (dans une démarche inclusive)
  • " (en guise de vérification, vérifier que cela est bien le cas des procès suivant)." -> moi, ça sonne un peu comme un ordre, alors que l'anglais dit plutôt un truc du style "vous pouvez vérifier les autres procès et vous verrez que c'est la même chose"

§9

  • "il s’agit ici du DERNIER passage à la ligne " -> je mettrais "dernier" à la place, ça fait un peu bizarre en majuscules comme ça.
  • "(balise de début de paragraphe et le dernier dernier saut de ligne)" -> par cohérence (ou mettre des déterminants dans les deux cas).
  • "Il est donc souvent question de pouvoir repérer ces indices." -> peut-être que "En général, il suffit juste de bien inspecter les pages / le code HTML pour repérer ces indices" serait plus proche du texte anglais original.

§ 10

  • "les balises HTML sont toujours contenues" --> "se trouvent toujours entre deux chevrons" (pour éviter les répétitions de "contenu")
  • que “inférieur à” ou “supérieur à”. --> mettre guillemets français.

§ 13 et 14

  • dans la liste à puces, terminer tous les items par un point final.

§ 14

  • "que nous investirons ensuite' --> "avec laquelle nous pourrons faire d'autres opérations" ou autre formulation.

Isoler le contenu d'intérêt

§ 15

  • "introduites dans la leçon [Manipuler des chaînes de caractères en Python" -> enlever le crochet
  • ajout de virgule après "en Python" et à la place des deux-points -> ", notamment dans la première partie de notre algorithme, afin..."

§16

  • "Récapitulons, notre algorithme réalisera donc :" -> deux-points à la place de la virgule (ou point)
  • supprimer "réalisera donc" avant le début de la liste à puces, et écrire : "notre algorithme : chargera le texte... / cherchera, etc." (par souci de cohérence)
  • points à la fin des items.

§ 17

  • "qui renvoi" -> coquille (à deux reprises) --> "qui renvoie"
  • "Ce qui nous permettra" -> "cela nous permettra" (sinon phrase sans verbe)

$ 18

  • "(for “Old Bailey Online”)" -> guillemets français, remplacer "for" par "acronyme de Old Bailey Online", par exemple.
  • "Nous avons discuté la notion" -> "nous avons abordé la notion..."
  • "dans le tutoriel "Code Reuse and Modularity" -> a été traduit en français, remplacer le nom. https://programminghistorian.org/fr/lecons/reutilisation-de-code-et-modularite
  • "durant lequel nous avions en" -> "dans lequel nous avons..." ou quelque chose comme ça (durant donne la notion de quelque chose qui avait une durée déterminée)
  • "Saisissez ou copiez à ce titre le code suivant de votre fichier." -> je supprimerais "à ce titre"

§ 20

  • remplacer les deux-points après "un nouveau fichier" par une virgule.
  • "par la suite le code suivant :" -> perso j'enlèverais "par le suite", je trouve ça superflu.

§ 21

  • "Lorsque vous exécutez trial-content.py, cela ira" -> remplacer "cela" par "le code" ? ou bien simplement "il" ? (pareil dans la suite de la phrase)
  • "La sortie de l’éditeur de texte Komodo Edit est limité à " -> "est limitée à" + on parle de Komodo Edit seulement à ce moment du texte ; peut-être faut-il en parler avant si c'est l'outil recommandé par la leçon ?

§ 23

  • "Prenons maintenant un moment pour être sur que vous ayez bien compris comment fonctionne trial-contents.py qui est capable d’utiliser"
    • remplacer "pour être sur" par "pour nous assurer" ou une formulation épicène
    • problème de syntaxe dans la phrase ; "que vous ayez bien compris comment fait trial-contents.py pour utiliser..."
  • " La fonction stripTags du module obo.py requiert à son appel un argument." -> "la fonction prend, nécessite, a besoin d'un argument "(au choix)
  • "Pour lancer cette fonction correctement, nous avons donc besoin de lui fournir une information." --> Commencer la phrase par "En d'autres termes", comme dans la version anglaise, sinon on a l'impression que les deux phrases se répètent (c'est le cas, mais pour expliciter).
  • "Mais vous remarquerez que lorsque l’on appelle la fonction stripTags à la fin de notre programme (trialcontents.py) nous ne mentionnant pas de variable nommée “pageContents“." -> "nous ne mentionnons"
  • "les variables d’entré" -> "d'entrée"
  • "“J’aime beaucoup les chiens.” " -> guillemets français ; pas de point
  • "ce qu’il s’ensuit" -> je trouve que c'est très formel ; je mettrais à la place "ce qui se passe" ou autre formulation.
  • "(et ce qu’elle est censée faire) , " -> espace à supprimer avant virgule
  • "votre argument peut être autre chose qu’une chaîne de caractères : un entier par exemple."
    • ajout de virgule entre "entier" et "par exemple"
    • dans un souci de pédagogie, je mettrai un lien vers une page web qui explique ce qu'est un entier en programmation (en français si possible), vu que cette leçon s'adresse aux débutant.es.

Lectures suggérées

  • Mettre la référence complète de l'ouvrage de Lutz, formatée selon nos normes.
  • S'il existe une bonne référence accessible en français sur la question, l'ajouter (livre ou site web)
  • Les puces en dessous du nom de l'ouvrage devraient être de second niveau.

Synchronisation du code

  • " les codes que nous ré-investirrons fonctionneront" -> que nous utiliserons par la suite" ?

@AlexandreWa
Copy link
Contributor

Bonjour à toutes et à tous,

Merci beaucoup @marie-flesch pour ta relecture très fine.

J'en profite pour vous informer que la seconde personne à relire cette proposition de traduction est @marinagiardinetti

Elle nous fera parvenir ses remarques directement dans ce ticket, merci encore pour ton aide !

@marinagiardinetti
Copy link

Bonjour à tous et toutes,

Tout d'abord, merci @AlexandreWa pour cette introduction et pour m'avoir proposé la relecture de cette leçon.

Voici mes suggestions après relecture de la leçon « Du Html à une liste de mots ».

Concernant les grandes lignes éditoriales:

  • De même que @marie-flesch, je suggère de rendre plus clair l’outil utilisé pour inspecter le code source du document à télécharger. Je pense qu’il s’agit d’un navigateur web comme c’est un fichier HTML mais il faudrait dans ce cas détailler tous les moyens d’y parvenir en fonction du navigateur utilisé ; et peut-être laisser la traduction anglaise et française des commandes (parfois les commandes sont en anglais).

  • Concernant Komodo Edit, personnellement je n’en ai pas usage et je ne connais pas cet outil ; mais s’il est déjà utilisé dans les leçons précédents, il vaut mieux le garder dans cette leçon-ci (est-ce le cas?), dans le cas contraire, seule la notion de d’interpréter de code suffit. Néanmoins, le souci soulevé avec Komodo Edit est présent avec tous les éditeurs de texte de code (exemple: idem avec Jupyter Notebook, un avertissement apparaît lorsqu’un trop grand nombre de caractères doit être affiché en dessous de la cellule de code).

  • Concernant le fin de la leçon, le suggère d'ajouter un moyen d'exporter le texte créée sous format TXT (au plus simple) avec une simple ligne de code. Cela rendra l'utilisation des scripts peut-être plus pertinente pour l'étude de textes.

  • Pour ce qui est de l'utilisation de find() et r.find(), peut-être faudrait-il ajouter des exemples qui permettront aux lecteurs de réutiliser facilement ces commandes dans d'autres contextes?

  • Proposition d'une alternative pour parer au problème des chevrons qui peuvent être présents à l'intérieur du texte que l'on souhaite extraire : la leçon fait état de ce souci sans apporter de réponse.

Mes corrections comporteront sûrement des doublons avec ce qu'a déjà pu souligner @marie-flesch.

Pour la correction § par §:

§ 1

  • « Le défi de la leçon »: pas très idiomatique, seulement « Le défi », ou autre formulation.
  • «  Isoler le contenu d’intérêt » => « Isoler le texte des balises »: peu clair à première vue de ce que représente le "contenu d'intérêt".

§ 2 /!\ Les deux liens ne fonctionnent pas.

  • «  nous allons partir de ce que nous avons pu apprendre avec la leçon » => nous allons utiliser les compétences acquises dans la leçon »
  • « « Bowsey’s 1780 » => expliquer plus clairement le but de la leçon: « Bowsey’s 1780, dans le but de créer un texte propre et ré-utilisable »
  • « en tirant parti » => « utilisant les »
  • «  opérateurs de chaînes » = >  « opérateurs de chaînes de caractères » + préciser qu’il s’agit du language Python (peu clair)
  • « méthodes de chaînes » =>  « opérations usuelles sur des chaînes »
  • « lecture de près » => (close reading, en opposition avec Distant reading) se traduit plutôt par « lecture attentive »
  • « instructions conditionnelles » => « conditions »
  • «  sous la forme de texte long » => je ne comprends pas, signifie simplement un texte sans balises HTML? Eclaircir ce point.
  • «  servir pour les comptages » => « utile aux calculs statistiques »

§3 /!\ Le lien ne fonctionne pas

  • « Tools -> Web Developer -> Page Source » => sur Chrome en français il faut cliquer sur « Afficher -> Options pour les développeurs -> Code source ». Peu clair: quel navigateur? peut-être ajouter les différentes possibilités d’accès selon les navigateurs?
  • «  Lors du parcours de ce fichier » => « en parcourant ce fichier »
  • « Rencontrerez » => « rencontrez » car début de la phrase au présent

§4

  • « se débarrasser du HTML » => « se défaire du HTML »
  • «  cet article » => on ne parle pas d’article précédemment, peut-être intégrer le terme de ‘transcription’ ici comme il est beaucoup utilisé ensuite.

§5

  • « une procédure qui est spécifiée avec suffisamment de détail pour » => « un ensemble de procédures suffisamment détaillées pour »
  • « biographie » => la leçon n’évoque aucune biographie auparavant, de quoi s’agit-il?

§6

  • « des transcriptions » => aucun lien entre l’utilisation du mot transcription et le texte à extraire, détailler : « des transcriptions (le texte à extraire) »
  • « n’est effet visible » => « n’est visible »

§7

  • « correspond au » => peu clair, plutôt « représente le » ? En fait toute la phrase est peu claire, on ne comprends pas bien ce que cela signifie.

§8

  • « des procès suivants » => « dans les procès suivants »

§9

  • « DERNIER » => « dernier »
  • « il est donc souvent question de repérer ces indices » => « Il s’agit donc souvent de repérer ces indices »

§10

  • « Maintenant, que vous savez que les balises HTML sont toujours contenues dans une paire de chevrons. » => « Maintenant, vous savez que les balises HTML sont toujours contenues dans une paire de chevrons »
  • La fin du paragraphe fait état d’un problème/d’une exception: si le texte contient des chevrons ( < ou > ) le code ne fonctionne pas. Peut-être faut-il proposer une solution alternative, ou renvoyer vers un autre tutoriel qui pourrait apporter des solutions? Ce problème apparaît en réalité assez souvent.

§14

  • « investirons ensuite » => « utiliserons ensuite »

§17

  • « Récapitulons, notre algorithme réalisera donc… » => constitue une répétition avec le paragraphe précédent, est-il vraiment essentiel?
  • find() et .rfind() => peut-être mettre des exemples d’utilisation préalables à l’utilisation qu’il en est faite ensuite pour une meilleure compréhension?

§18

  • « nous appellerons » => « nous appelons »
  • «  inscrirons » => « inscrivons »
  • « souhaiterons » = > « souhaitons »

§19

  • « copiez à ce titre le code suivant » => « copiez le code suivant »

§21

  • « puis cela ira rechercher » => "ira chercher"

§22

  • voir au début de cette note le problème avec Komodo Edit.
  • fin du paragraphe, aucune explication sur la manière dont exporter le texte extrait, peut-être simplement une ligne de code pour enregistrer le fichier au format .TXT pour rendre les scripts décris ici plus utiles pour un travail ultérieur?

§23

  • « les variables d’entré » => « les variables d’entrée »
  • «  tant que le type de l’argument est le bon » = « tant que le type d’argument est correct »

@AlexandreWa
Copy link
Contributor

Merci beaucoup @marinagiardinetti pour ton retour rapide et très complet !

Dans le processus de relecture et de rédaction, je proposerai donc à @datalogism une synthèse de tes retours et de ceux envoyés plus haut par @marie-flesch

Cela nous permettra de dégager les lignes directrices de la leçon tout en rendant compte de vos remarques :)

@AlexandreWa
Copy link
Contributor

Bonjour tout le monde,

Comme évoqué et prévu, je reprends pour @datalogism les éléments dégagés par @marie-flesch et @marinagiardinetti de manière synthétique afin de proposer une version optimale de la leçon :

Principes éditoriaux

  • Indiquer clairement quel outil est utilisé pour inspecter le code HTML dans la première partie de la leçon : préciser donc le navigateur utilisé pour la leçon à titre informatif. De même, mettre à disposition les traductions anglaise et française des commandes.

  • Ainsi, évoquer d'emblée l'utilisation de Komodo Edit plus tôt dans la leçon et définir succinctement les fonctions du logiciel. Suggérer d'autres logiciels existants faisant le même traitement. @marinagiardinetti évoquait Jupyter Notebook, par exemple (possibilité de rappeler cet exemple au §22).

  • À la fin de la leçon, évoquer la possibilité d'exporter les résultats directement au format .txt à l'aide d'une simple ligne de code. Cela rendra l'utilisation des scripts pertinente, notamment en vue d'une étude de textes.

Objectifs de la leçon (§2)

  • Problème avec le lien de la "transcription du procès verbal de Benjamin Bowsey". Le lien de la leçon originale est le suivant : https://www.oldbaileyonline.org/browse.jsp?id=t17800628-33&div=t17800628-33
  • Proposer de formulation plus correcte : "transcription du procès verbal de Benjamin Bowsey en 1780".
  • "Nous réaliserons cette tâche en tirant parti d’opérateur de chaînes, de méthode de chaînes et de compétences en lecture de près."
  • Mettre "opérateurs de chaines" (au pluriel). Préciser qu’il s’agit d'un vocabulaire propre à Python. Le définir brièvement.
  • Remplacer "lecture de près" par "lecture attentive", traduction plus adéquate pour "close reading" (cf wikipedia).
  • "nous allons partir de ce que nous avons pu apprendre avec la leçon" => "nous allons utiliser les compétences acquises dans la leçon"
  • "Bowsey’s 1780" => expliquer plus clairement le but de la leçon: "Bowsey’s 1780, dans le but de créer un texte propre et ré-utilisable"
  • "en tirant parti" => "en utilisant les"
  • "méthodes de chaînes" => "opérations usuelles sur des chaînes"
  • " sous la forme de texte long" => plus simplement "un texte sans balises HTML" ?
  • " servir pour les comptages" => "utile aux calculs statistiques"

Le défi de la leçon (§3)

  • "Défi" : trouver un terme plus signifiant et différent d'objectif. "Enjeu" ?

  • Lien vers la leçon Télécharger des pages web Python à changer : https://programminghistorian.org/fr/lecons/telecharger-des-pages-web-avec-python

  • "Téléchargez et ouvrez le fichier" --> le lien renvoie vers le texte du procès, mais il n'y a pas de bouton pour télécharger (problème du texte original). Indiquer explicitement dans la leçon : "copiez le texte disponible à cette adresse".

  • Il faudra mieux décrire ce qu'il faut faire ici : depuis où est faire la manipulation "Tools -> Web developer > Page source". Donner des instructions pour le faire, en français.

  • À la place de "Vous remarquerez lors du parcours de ce fichier que ...", plutôt : "En parcourant le fichier, vous remarquerez" (ou "en faisant défiler...").

  • "Si vous êtes néophytes" -> à mettre au singulier.

  • Suggestion : "nous vous recommandons de consulter les tutoriels de la W3 School" -> il n'y a pas de tuto en français portant exclusivement sur le HTML, mais celui-ci l'évoque, en lien avec le CSS : https://www.w3.org/Style/Examples/011/firstcss

  • "Si votre travail vous demande de supprimer régulièrement des balises HTML" -> "Si vous avez souvent besoin de supprimer..."

  • "Lors du parcours de ce fichier" => "en parcourant ce fichier".

  • "Rencontrerez" => "rencontrez" car début de la phrase au présent.

Conception de l’algorithme (§4-14)

  • § 4 : "Il est conseillé dans un premier temps, de poser sur le papier son fonctionement, c’est une manière d’expliciter ce que l’on souhaite faire avant de traduire cela en un code informatique." Coquille : fonctionnement". Suggestion de reformulation "Il est conseillé de décrire le fonctionnement de l'algorithme : c'est une manière..." (l'idée du papier peut perturber la compréhension).
  • § 4 "se débarrasser du HTML" : trop péjoratif => plutôt "se défaire" ; "se séparer" du HTML.
  • § 4 : "cet article" => il n'est pas fait mention d’article précédemment, intégrer le terme de ‘transcription’ ici puisqu'il est beaucoup utilisé ensuite.
  • § 5 : "un moyen de capturer le contenu de la biographie." Ne pas utiliser le terme "biographie" ? (il est dans le texte original, mais on parle bien du compte-rendu d'un procès).
  • § 5 : "une procédure qui est spécifiée avec suffisamment de détail pour" => plus clair et plus simple : "un ensemble de procédures suffisamment détaillées pour".
  • §6 : "des informations liées à des citations". Des références ? Ici, il faudrait donner un exemple issu du fichier, afin que les novices puissent comprendre de quoi on parle.
  • § 6 : "des transcriptions" => aucun lien entre l’utilisation du mot transcription et le texte à extraire, détailler : "des transcriptions (le texte à extraire)"
  • § 6 : "n’est effet visible" => "n’est visible"
  • § 7 : "De plus, vous remarquerez que la fin de ces métadonnées correspond au début des transcriptions" : "correspond au" => plutôt "représente le". Reformuler la phrase qui reste assez peu claire dans ce paragraphe.
  • § 7 : "aux transcriptions" -> à mettre au singulier. (la transcription du procès du procès). Idem dans la phrase suivante.
  • § 7 : De plus, vous remarquerez que la fin de ces métadonnées correspond au début des transcriptions." -> remplacer "de plus" par "cependant" ou "toutefois".
  • § 8 : "des procès suivants" => "dans les procès suivants"
  • § 8 : "Nous sommes dans notre cas plutôt chanceux" -> "Dans ce cas, nous avons de la chance" (dans une démarche inclusive)
  • § 8 : (en guise de vérification, vérifier que cela est bien le cas des procès suivant)." -> se rapprocher de la suggestion comme en anglais avec une formulation comme "vous pouvez vérifier les autres procès et vous verrez que c'est la même chose".
  • § 9 : "DERNIER passage à la ligne" -> "dernier" suffira.
  • § 9 : "(balise de début de paragraphe et le dernier dernier saut de ligne)" -> par cohérence (ou mettre des déterminants dans les deux cas).
  • § 9 : "Il est donc souvent question de pouvoir repérer ces indices." -> peut-être que "En général, il suffit simplement de bien inspecter les pages / le code HTML pour repérer ces indices" plus proche du texte anglais original.
  • § 10 : "Maintenant, que vous savez que les balises HTML sont toujours contenues dans une paire de chevrons." formulation => "Maintenant, vous savez que les balises HTML sont toujours contenues dans une paire de chevrons"
  • § 10 : "tout ce qui est contenus" = "contenu"
  • § 10 : "les balises HTML sont toujours contenues" --> "se trouvent toujours entre deux chevrons" (pour éviter les répétitions de "contenu")
  • § 10 : que “inférieur à” ou “supérieur à”. --> mettre guillemets français.
  • § 10 : La fin du paragraphe fait état d’un problème/d’une exception: si le texte contient des chevrons ( < ou > ) le code ne fonctionne pas. Peut-être faut-il proposer une solution alternative, ou renvoyer vers un autre tutoriel qui pourrait apporter des solutions? Ce problème apparaît en réalité assez souvent.
  • § 13 : dans la liste à puces, terminer tous les items par un point final.
  • § 14 : "investirons ensuite" => "utiliserons ensuite"

Isoler le contenu d’intérêt (§15-24)

  • "Contenu d’intérêt", là aussi : trouver un terme plus signifiant. Ou plus simplement "contenu qui nous intéresse".
  • § 15 : "introduites dans la leçon [Manipuler des chaînes de caractères en Python" -> enlever le crochet ouvrant.
  • § 15 : ajout de virgule après "en Python" et à la place des deux-points -> ", notamment dans la première partie de notre algorithme, afin..."
  • § 16 : "Récapitulons, notre algorithme réalisera donc :" -> deux-points à la place de la virgule
  • § 16 : supprimer "réalisera donc" avant le début de la liste à puces, et écrire : "notre algorithme : chargera le texte... / cherchera, etc." (par souci de cohérence)
  • § 16 : points à la fin des items.
  • § 17 : 2 "qui renvoi" = "renvoie" + modifier la deuxième occurrence pour éviter la redondance.
  • § 17 : "Ce qui nous permettra" -> "cela nous permettra" (sinon phrase sans verbe)
  • § 17 : Pour l'utilisation de find() et r.find() : ajouter une phrase proposant des exemples d'utilisation.
  • § 18 : "(for “Old Bailey Online”)" -> guillemets français, remplacer "for" par "acronyme de Old Bailey Online", par exemple.
  • § 18 : "Nous avons discuté la notion" -> "nous avons abordé la notion..."
  • § 18 : "dans le tutoriel "Code Reuse and Modularity" -> a été traduit en français, remplacer le nom. https://programminghistorian.org/fr/lecons/reutilisation-de-code-et-modularite
  • § 18 : "durant lequel nous avions en" -> "dans lequel nous avons..." ou quelque chose comme ça (durant donne la notion de quelque chose qui avait une durée déterminée)
  • § 18 : "Saisissez ou copiez à ce titre le code suivant de votre fichier." -> Supprimer "à ce titre", superflu ici.
  • § 18 : "nous appellerons" => "nous appelons"
  • § 18 : "inscrirons" => "inscrivons"
  • § 18 : "souhaiterons" = > "souhaitons"
  • § 20 : remplacer les deux-points après "un nouveau fichier" par une virgule.
  • § 20 : "par la suite le code suivant :" -> supprimer "par le suite", superflu ici.
  • § 21 : "Lorsque vous exécutez trial-content.py, cela ira" -> remplacer "cela" par "le code" ou bien simplement "il" (idem dans la suite de la phrase).
  • § 21 : "ira rechercher" => "ira chercher"
  • § 21 : "La sortie de l’éditeur de texte Komodo Edit est limité à" -> "est limitée à" + on ne parle de Komodo Edit qu'à partir de ce paragraphe ; l'évoquer avant puisque c'est l'outil recommandé par la leçon (cf. remarque sur les principes éditoriaux).
  • § 22 : Évoquer l'export du texte extrait par le biais d'une simple ligne de code afin d'enregistrer le fichier au format .TXT (cf. remarque sur les principes éditoriaux).
  • § 23 : "Prenons maintenant un moment pour être sur que vous ayez bien compris comment fonctionne trial-contents.py qui est capable d’utiliser"
    • remplacer "pour être sur" par "pour nous assurer" ou une formulation épicène
    • problème de syntaxe dans la phrase ; "que vous ayez bien compris comment fait trial-contents.py pour utiliser..." : suggestion de phrase reformulée : "Prenons maintenant un moment pour nous assurer que vous avez bien compris comment fonctionne trial-contents.py, qui est capable d’utiliser..."
  • § 23 : La fonction stripTags du module obo.py requiert à son appel un argument." -> "la fonction prend, nécessite, a besoin d'un argument "(au choix)
  • § 23 : "Pour lancer cette fonction correctement, nous avons donc besoin de lui fournir une information." --> Commencer la phrase par "En d'autres termes", comme dans la version anglaise, sinon on a l'impression que les deux phrases se répètent (c'est le cas, mais pour expliciter).
  • § 23 : "Mais vous remarquerez que lorsque l’on appelle la fonction stripTags à la fin de notre programme (trialcontents.py) nous ne mentionnant pas de variable nommée “pageContents“." -> "nous ne mentionnons"
  • § 23 : "les variables d’entré" -> "d'entrée"
  • § 23 : "“J’aime beaucoup les chiens.” " -> guillemets français ; pas de point.
  • § 23 : "ce qu’il s’ensuit" -> trop formel ; plutôt "ce qui se passe", par exemple.
  • § 23 : "(et ce qu’elle est censée faire), " -> espace à supprimer avant virgule.
  • § 23 : "tant que le type de l’argument est le bon" = "tant que le type d’argument est correct"
  • § 23 : "votre argument peut être autre chose qu’une chaîne de caractères : un entier par exemple."
    • ajout d'une virgule entre "entier" et "par exemple".
    • dans un souci de pédagogie, mettre un lien vers une page web qui explique ce qu'est un entier en programmation (en français si possible), vu que cette leçon s'adresse aux débutant.es. (cf. également la même suggestion dans le §3).

Lectures suggérées

  • Mettre la référence complète de l'ouvrage de Lutz, formatée selon nos normes.
  • S'il existe une bonne référence accessible en français sur la question, l'ajouter (livre ou site web) note @AlexandreWa : j'y regarderai plus en détail :)
  • Les puces en dessous du nom de l'ouvrage devraient être de second niveau.

Synchronisation du code

  • "les codes que nous ré-investirrons fonctionneront" -> plutôt "l'important est de s’assurer que les codes que nous utiliserons par la suite fonctionneront".

J'espère que tout est clair pour toi @datalogism, pas de changement drastique du fond, mais beaucoup de petites choses à modifier !

N'hésitez pas à ajouter dans le ticket des leçons et tutoriels en français qui pourrait servir d'exercices complémentaires, W3 School ou non :)

Bon courage et à très vite,

Alexandre

@datalogism
Copy link
Contributor

Hello, merci @marinagiardinetti et @marinagiardinetti pour vos retours détaillés et bien sentis et merci à @AlexandreWa pour avoir mené cette revue. Je serai dans le rush jusqu'au 20 et entreprendrai la correction à partir du 23 juillet. Je reviens vers vous quand cela sera fait ! Bel été à tous

datalogism added a commit that referenced this issue Jul 30, 2023
Mise à jour avec prise en comptes des reviews du ticket #560
@datalogism
Copy link
Contributor

Hello je viens de finir la correction de vos remarques @marie-flesch @marinagiardinetti @AlexandreWa :)
Dans le details j'ai quelques retours à vous faire :

Principes éditoriaux

  • j'ai été plus explicite concernant le choix de l'éditeur de code, parler de Jupyter Notebook est une bonne idée, cependant la serie de la leçon dont fait partie cette leçon ne l'évoque jamais.
  • j'ai commenté le code de manière a mieux appréhender celui-ci qui est en anglais
  • je n'ai pas été plus explicite concernant l'enregistrement sous forme de fichier car c'est le sujet de la suite de la leçon (https://programminghistorian.org/en/lessons/from-html-to-list-of-words-2), Je prends donc cette remarque en compte pour la prochaine correction

Objectifs de la leçon (§2)

J* 'ai préféré " investie lors d’analyses statistiques" à " servir pour les comptages" => “utile aux calculs statistiques”

Le défi de la leçon (§3)

Il fut un temps où l’on devait rester sur des liens relatifs, n'est ce plus le cas @anisa-hawes @marie-flesch ?

Conception de l’algorithme (§4-14)

  • § 4 : “Il est conseillé dans un premier temps, de poser sur le papier son fonctionement, c’est une manière d’expliciter ce que l’on souhaite faire avant de traduire cela en un code informatique.” Coquille : fonctionnement". Suggestion de reformulation “Il est conseillé de décrire le fonctionnement de l’algorithme : c’est une manière…” (l’idée du papier peut perturber la compréhension).

pour moi l’idée du papier est importante, je l'ai simplement mieux formulé

  • § 7 : “aux transcriptions” -> à mettre au singulier. (la transcription du procès du procès). Idem dans la phrase suivante.

cette remarque m'a fait me poser une question importante ai-je bien traduit "[trial transcript]" ? @marie-flesch @AlexandreWa @marinagiardinetti, dans l'attente de votre retour je considère ici qu'il s'agi de la transcription (singulier) du procès (singulier)

Isoler le contenu d’intérêt (§15-24)

  • “Contenu d’intérêt”, là aussi : trouver un terme plus signifiant. Ou plus simplement “contenu qui nous intéresse”.

Ici renommé “Isoler le contenu de la transcription”

  • § 17 : 2 "qui renvoi" = "renvoie" + modifier la deuxième occurrence pour éviter la redondance.

corrigé mais la redondance est importante

En vous souhaitant une belle semaine,

@AlexandreWa
Copy link
Contributor

Bonjour et merci @datalogism pour ton retour :)

Je viens d'effectuer un nouveau balayage de la leçon, voici quelques remarques :

Langue :

  • Dans l'ensemble du texte : il faut utiliser une seule forme de graphie pour les acronymes comme HTML et URL. Je propose de statuer sur les majuscules pour ces deux exemples (y compris dans le titre), je n'en ai pas vu d'autres.

  • § 3 "acceder au source d’une page" => "accéder aux sources d'une page"

  • § 4 : "language" x 2 => "langage" (faux ami de l'anglais au français)

  • entre le § 4 et le § 5 : "serie" x2 => "série"

  • § 6 : "implémentée" => "implémentées"

  • § 7 : "relative ) des metadonnées" => "relatives aux métadonnées" ?

  • § 10 : "il suffit simplement de" => "il suffit de" (répétition)

  • § 14 : "la chaine pageContents" => "la chaîne pageContents"

  • § 18 : "nous utiliserons les méthode" => "nous utiliserons les méthodes"

  • § 10 : "nos fichier de travail" => "nos fichiers de travail"

  • § 19 : "qui renvois" => "qui renvoie"

  • § 20 : "réuitiliser" => "réutiliser"

  • entre le § 21 et le § 22: "converti" => "convertit"

  • entre le § 21 et le § 22: "contenut" => "contenu"

  • entre le § 21 et le § 22: "recupère" x2 => "récupère"

  • entre le § 21 et le § 22: "occurence" x2 => "occurrence"

  • entre le § 22 et le § 23: "fonctionement" => "fonctionnement"

  • § 25 : "a besoin d’être lancé" => "a besoin d’être lancée"

  • § 26 : "apprenhender" => "appréhender"

  • § 26 : "disponible" => "disponibles"

Ponctuation :

  • § 9 : "nous avons de la chance" => ajout d'une virgule juste après
  • § 11 : "symboles mathématiques" => ajout d'une virgule juste après

Liens supplémentaires

  • § 4 : Il était questions de tutoriels en français pour mieux appréhender le fonctionnement des codes HTML et CSS. Je propose d'ajouter ceux de la Mozilla Foundation : HTML et CSS. Ils sont multilingues, régulièrement mis à jour et a priori stables.

À très vite,

Alexandre

datalogism added a commit that referenced this issue Aug 14, 2023
@datalogism
Copy link
Contributor

Hello,

Merci pour ton travail vigilant @AlexandreWa, il est vrai que l'on laisse passer baucoup de choses lorsque que l'on reviens plusieurs fois sur un texte.

Tout tes correctifs ont été intégrés à l'instant !

@AlexandreWa
Copy link
Contributor

Merci @datalogism , c'est parfait. Il ne reste que les petites retouches d'orthotypographie à réaliser, et ce sera terminé. Je t'envoie un message privé à ce sujet :)

@AlexandreWa
Copy link
Contributor

Le fichier .md a bien été mis à jour avec les ajustements (désolé pour la coquille dans le commentaire !)

Tout est bon pour moi @marie-flesch @datalogism

Je reste disponible s'il reste encore d'autres éléments à modifier :)

AlexandreWa added a commit that referenced this issue Aug 18, 2023
Derniers ajustements, fin de l'étape 3 de révision pour le ticket #560
@marie-flesch
Copy link
Contributor Author

Merci @AlexandreWa ! Je prends donc le relais :)

@marie-flesch
Copy link
Contributor Author

This lesson is ready for you @anisa-hawes 😃

@anisa-hawes
Copy link
Contributor

Bonjour @datalogism.

I can see you are still working on this file, so let me know when you are finished with your edits?

Please don't worry about the adjustments to the YAML, I will take care of the final tweaks and will let you know if there is information missing.

My next steps are to complete the typesetting and create perma.cc links for the lesson.

Thank you + best,
Anisa

@datalogism
Copy link
Contributor

Thank you @anisa-hawes for your spontaneous message. I did a mistake when i tried to correct something related to the part 2. My last commit reestablished the last version, fixing that previous error.

Can you check if the problem is solved ?
I prefer to ask a second view on that fix, in case of..

@anisa-hawes
Copy link
Contributor

Of course, @datalogism. It's no problem. I'll check it all through. Please don't worry 🙂

@anisa-hawes
Copy link
Contributor

anisa-hawes commented Sep 1, 2023

Hello @marie-flesch,

This lesson is ready for your final review + transfer to Jekyll.

Preview:

http://programminghistorian.github.io/ph-submissions/fr/en-cours/traductions/du-html-a-une-liste-de-mots-1

Publisher's sustainability + accessibility actions:

  • Typesetting
  • Addition of Perma.cc links
  • Receipt of translator's copyright agreement. Hello @datalogism. I have sent you an email with this request!
  • Add doi

Editorial input to YAML:

  • Translation of avatar_alt:
  • Translation of abstract:
  • Translation of author(s) bio for ph_authors.yml

Files to be transferred to Jekyll:

Promotion:

  • Prepare announcement post
  • Prepare x2 future posts for our Twitter/Mastodon Bot

@datalogism
Copy link
Contributor

Good news thank you so much @anisa-hawes !
Sorry for it but the mail of the agreement lost himself in the shallows of my mailbox... can you resend it ?

@anisa-hawes
Copy link
Contributor

Dear @datalogism. No problem – I have re-sent this.

@marie-flesch
Copy link
Contributor Author

La leçon est publiée, bravo et merci à toutes celles et ceux qui y ont contribué ! Merci @datalogism pour la traduction, @AlexandreWa pour le suivi éditorial, @marinagiardinetti pour l'évaluation, @anisa-hawes et @spapastamkou pour le soutien technique !

Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment
Projects
None yet
Development

No branches or pull requests

5 participants