Skip to content

A web scraper that collects content from a webpage and converts it to an ebook.

License

Notifications You must be signed in to change notification settings

gaamelu/webscraper-to-ebook

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

7 Commits
 
 
 
 
 
 
 
 
 
 
 
 

Repository files navigation

WebScraper to Ebook

GitHub repo size GitHub language count GitHub forks

Um script python que lê uma página que contém uma lista de links e exporta todo o conteúdo dos links em um único arquivo ebook.

Ajustes e melhorias

O projeto ainda está em desenvolvimento e as próximas atualizações serão voltadas nas seguintes tarefas:

  • Improve strings concatenations of HTML header and footer.

?? Pré-requisitos

Antes de começar, verifique se você atendeu aos seguintes requisitos:

  • Você instalou a versão mais recente de Python 3.
  • As bibliotecas beautifulsoup4 e requests

?? Instalando WebScraper to Ebook

Para instalar o webscraper-to-ebook, siga estas etapas:

  1. Acesse uma pasta de sua preferência

  2. Clone o repositório

git clone https://github.com/drazyn/webscraper-to-ebook
  1. Instale as bibliotecas manualmente OU utilize a instação por requirements.txt (recomendado utilizar virutal enviroments!)
pip install requests
pip install beautifulsoup4

OU

pip install -r /path/to/webscraper-to-ebook/requirements.txt

Não esqueça de alterar o diretório do comando corretamente.

?? Contribuindo para webscraper-to-ebook

Para contribuir com webscraper-to-ebook, siga estas etapas:

  1. Bifurque este repositório.
  2. Crie um branch: git checkout -b <nome_branch>.
  3. Faça suas alterações e confirme-as: git commit -m '<mensagem_commit>'
  4. Envie para o branch original: git push origin <nome_do_projeto> / <local>
  5. Crie a solicitação de pull.

Como alternativa, consulte a documentação do GitHub em como criar uma solicitação pull.

?? Colaboradores

Agradecemos às seguintes pessoas que contribuíram para este projeto:

Foto do Drazyn no GitHub
Drazyn

?? Licença

Esse projeto está sob licença. Veja o arquivo LICENÇA para mais detalhes.

About

A web scraper that collects content from a webpage and converts it to an ebook.

Resources

License

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published