Aplica correções de ISSN na integração com DOAJ#47
Merged
gustavofonseca merged 5 commits intoscieloorg:masterfrom Jun 22, 2020
Merged
Aplica correções de ISSN na integração com DOAJ#47gustavofonseca merged 5 commits intoscieloorg:masterfrom
gustavofonseca merged 5 commits intoscieloorg:masterfrom
Conversation
added 4 commits
June 11, 2020 17:23
A base de correção é um arquivo JSONLines contendo registros retornados
do endpoint de busca do DOAJ. A idéia é que esses registros sejam
utilizados para corrigir os dados de ISSN impresso e eletrônico dos
documentos antes de enviá-los ao DOAJ, de maneira que seja aceito.
O formato de cada do registro da base de correções é:
```
{
"doaj_id": "022bf3ad951c4c5fa77a8279a59c437e",
"title": "Revista Brasileira de Medicina do Esporte",
"alternative_title": null,
"is_active": true,
"provider": "SciELO Brazil",
"issns": [
{
"type": "pissn",
"id": "1517-8692"
},
{
"type": "eissn",
"id": "1806-9940"
}
]
}
```
Este script produz uma saída JSON-Lines a partir de consulta realizada ao DOAJ por periódicos em que o termo *scielo* consta no campo `provider`. Este arquivo, aqui chamado *base de correção*, poderá ser passado como argumento para o script `exdoaj.py` onde será utilizado na correção dos metadados de ISSN antes de submeter os documentos ao DOAJ.
Member
|
@gustavofonseca olhei bem por cima por enquanto, mas pelo que entendi há comandos e/ou opções novos mas não há documentação exceto no PR e nos commits. |
Contributor
Author
Sim, de fato. Vou adicionar uma documentação básica. |
Adicionalmente o formato do arquivo README foi alterado de *rst* para *md* de forma a ser melhor exibido na interface pública do GitHub.
This file contains hidden or bidirectional Unicode text that may be interpreted or compiled differently than what appears below. To review, open the file in an editor that reveals hidden Unicode characters.
Learn more about bidirectional Unicode characters
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
Add this suggestion to a batch that can be applied as a single commit.This suggestion is invalid because no changes were made to the code.Suggestions cannot be applied while the pull request is closed.Suggestions cannot be applied while viewing a subset of changes.Only one suggestion per line can be applied in a batch.Add this suggestion to a batch that can be applied as a single commit.Applying suggestions on deleted lines is not supported.You must change the existing code in this line in order to create a valid suggestion.Outdated suggestions cannot be applied.This suggestion has been applied or marked resolved.Suggestions cannot be applied from pending reviews.Suggestions cannot be applied on multi-line comments.Suggestions cannot be applied while the pull request is queued to merge.Suggestion cannot be applied right now. Please check back later.
O que esse PR faz?
Um dos principais problemas no depósito automático de documentos no DOAJ está na validação automática feita por eles que obriga que metadados de ISSN (eletrônico e impresso) coincidam exatamente com os conhecidos por eles. É comum esta validação falhar, por diversos motivos, mas principalmente pelo desafio logístico de se manter registros íntegros entre distintas bases de dados.
Com este PR o script responsável pelo envio passa a poder receber uma base de correções que, quando passada, será utilizada para corrigir os ISSNs antes de submetere os registros ao DOAJ. Este PR também inclui o script responsável por produzir tal base de correções.
Onde a revisão poderia começar?
Sugiro que a revisão seja feita por commit-a-commit.
Como este poderia ser testado manualmente?
A geração da base de correções poderá ser testada executando:
python gen_doaj_correctionsdb.py gen-correctionsdb > /tmp/corr.jsonl.Agora, para testar o envio serão necessárias as credenciais do DOAJ. Mas de qualquer maneira o comando é:
PROCESSING_SETTINGS_FILE=myconfig.ini processing_export_doaj --corrections_db /tmp/corr.jsonl --user US3R --password P4SSW0RD -f 2009-06-01Algum cenário de contexto que queira dar?
n/a
Screenshots
n/a
Quais são tickets relevantes?
n/a
Referências
n/a