-
Notifications
You must be signed in to change notification settings - Fork 8
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
[BUG] #17
Comments
Olá @fael0306 Mujito obrigado pelo contato e pelo interesse na ferramenta. Desculpe a demora em responder. Alguma coisa aconteceu com o site da HDB que está causando esse funcionamento na pyHDB. No mês de julho vou retomar essa issue e buscar a solução. Enquanto isso, você pode tentar executar o arquivo Ele faz a busca em um acervo (pasta do jornal) ou lista de acervos. Para isso você precisa informar o número do acervo. Esse número (que geralmente representa um pasta de uma década de um determinado periódico), pode ser encontrado de algumas maneiras. 1) Buscar no código fonte da página dos resultados:Se você inspecionar a página de resultados, e buscar 2) Encontrar o número na url de um acervo:Se você clicar em um acervo na lista de resultado, abrirá a página da primeira ocorrência. Nessa url você encontra um numero entre Exemplo de execução do
|
Boa tarde, Eric. Da forma alternativa funcionou perfeitamente. Muito obrigado! Espero que consiga fazer o programa principal voltar a funcionar. Abraços. |
@fael0306 fiz algumas corresções e lancei uma nova versão. Testei no linux e no windows, ambas funcionaram normalmente. Você pode ver as informações aqui. É importante ressaltar que ao tentar raspar buscas com alguns milhares de ocorrências é mais comum encontrar erros, em função do próprio site da HDB apresentar problemas de carregamento quando utilizado em longas sequências. Minha sugestão é utilizar a pyHDB para buscas divididas por décadas e com termos que gerem menos de 1000 ocorrências de resultado. Qualquer coisa, me avise. |
Descreva o bug
O programa roda, porém, o script sempre encontra 0 ocorrências, mesmo elas existindo na Hemeroteca.
Reproduzir
Foi seguido exatamente o passo a passo solicitado. Foi feita a tentativa no Windows e no Linux, em diferentes computadores, sem sucesso.
Comportamento esperado
Era para aparecer as ocorrências na pasta, conforme a documentação. Ele sequer encontra ocorrências.
Screenshots
Desktop (por favor, preencha as seguintes informações):
The text was updated successfully, but these errors were encountered: