Skip to content

Pubmed XML: corrigir JournalTitle para usar journal-id[@journal-id-type="nlm-ta"] #1235

Description

@Rossi-Luciano

Descrição da tarefa

Parte de #1226.

get_journal_title em packtools/sps/formats/pubmed.py usa journal_meta.Title(xml_tree).abbreviated_journal_title, que lê abbrev-journal-title[@abbrev-type="publisher"] — a abreviação genérica da SciELO. O guia SPS 1.10 (seção <journal-meta>) diz explicitamente que o campo correto para o PubMed é journal-id[@journal-id-type="nlm-ta"] ("Usar título abreviado do periódico registrado no PubMed"), presente apenas quando o periódico é indexado no PubMed. O model journal_meta.JournalID.nlm_ta já existe e não está sendo usado.

Subtarefas

  • Alterar get_journal_title para usar journal_meta.JournalID(xml_tree).nlm_ta
  • Definir e implementar fallback quando nlm-ta estiver ausente (avaliar usar abbreviated_journal_title como fallback, já que JournalTitle é Required na DTD do PubMed)
  • Atualizar/criar testes em tests/sps/formats/test_pubmed.py cobrindo os dois casos (com e sem nlm-ta)

Considerações e notas

Bug real encontrado durante levantamento de contexto da #1226 — periódicos indexados no PubMed hoje geram JournalTitle com o valor errado.

Metadata

Metadata

Assignees

Labels

Type

No type

Fields

No fields configured for issues without a type.

Projects

No projects

Milestone

No milestone

Relationships

None yet

Development

No branches or pull requests

Issue actions