Skip to content

Aplica correções de ISSN na integração com DOAJ#47

Merged
gustavofonseca merged 5 commits intoscieloorg:masterfrom
gustavofonseca:fix-issns-doaj
Jun 22, 2020
Merged

Aplica correções de ISSN na integração com DOAJ#47
gustavofonseca merged 5 commits intoscieloorg:masterfrom
gustavofonseca:fix-issns-doaj

Conversation

@gustavofonseca
Copy link
Contributor

O que esse PR faz?

Um dos principais problemas no depósito automático de documentos no DOAJ está na validação automática feita por eles que obriga que metadados de ISSN (eletrônico e impresso) coincidam exatamente com os conhecidos por eles. É comum esta validação falhar, por diversos motivos, mas principalmente pelo desafio logístico de se manter registros íntegros entre distintas bases de dados.

Com este PR o script responsável pelo envio passa a poder receber uma base de correções que, quando passada, será utilizada para corrigir os ISSNs antes de submetere os registros ao DOAJ. Este PR também inclui o script responsável por produzir tal base de correções.

Onde a revisão poderia começar?

Sugiro que a revisão seja feita por commit-a-commit.

Como este poderia ser testado manualmente?

A geração da base de correções poderá ser testada executando:
python gen_doaj_correctionsdb.py gen-correctionsdb > /tmp/corr.jsonl.

Agora, para testar o envio serão necessárias as credenciais do DOAJ. Mas de qualquer maneira o comando é: PROCESSING_SETTINGS_FILE=myconfig.ini processing_export_doaj --corrections_db /tmp/corr.jsonl --user US3R --password P4SSW0RD -f 2009-06-01

Algum cenário de contexto que queira dar?

n/a

Screenshots

n/a

Quais são tickets relevantes?

n/a

Referências

n/a

Gustavo Fonseca added 4 commits June 11, 2020 17:23
A base de correção é um arquivo JSONLines contendo registros retornados
do endpoint de busca do DOAJ. A idéia é que esses registros sejam
utilizados para corrigir os dados de ISSN impresso e eletrônico dos
documentos antes de enviá-los ao DOAJ, de maneira que seja aceito.

O formato de cada do registro da base de correções é:

```
{
    "doaj_id": "022bf3ad951c4c5fa77a8279a59c437e",
    "title": "Revista Brasileira de Medicina do Esporte",
    "alternative_title": null,
    "is_active": true,
    "provider": "SciELO Brazil",
    "issns": [
        {
            "type": "pissn",
            "id": "1517-8692"
        },
        {
            "type": "eissn",
            "id": "1806-9940"
        }
    ]
}
```
Este script produz uma saída JSON-Lines a partir de consulta realizada
ao DOAJ por periódicos em que o termo *scielo* consta no campo `provider`. Este
arquivo, aqui chamado *base de correção*, poderá ser passado como
argumento para o script `exdoaj.py` onde será utilizado na correção dos
metadados de ISSN antes de submeter os documentos ao DOAJ.
@robertatakenaka
Copy link
Member

@gustavofonseca olhei bem por cima por enquanto, mas pelo que entendi há comandos e/ou opções novos mas não há documentação exceto no PR e nos commits.

@gustavofonseca
Copy link
Contributor Author

@gustavofonseca olhei bem por cima por enquanto, mas pelo que entendi há comandos e/ou opções novos mas não há documentação exceto no PR e nos commits.

Sim, de fato. Vou adicionar uma documentação básica.

Adicionalmente o formato do arquivo README foi alterado de *rst* para
*md* de forma a ser melhor exibido na interface pública do GitHub.
@gustavofonseca gustavofonseca merged commit 340ef57 into scieloorg:master Jun 22, 2020
Sign up for free to join this conversation on GitHub. Already have an account? Sign in to comment

Labels

None yet

Projects

None yet

Development

Successfully merging this pull request may close these issues.

2 participants