Web-Scrapper-Wikipedia

Projeto de final de período para a disciplina Teoria da Computação. O intuito deste Web Scrapper é extrair informações da página do artigo utilizando expressões regulares, foi feito o uso de outras bibliotecas para filtrar esta busca dentro da página HTML.

Requisitos do programa:

Listar os tópicos do índice do artigo
Listar todos os nomes de arquivos de imagens presentes no artigo
~~Listar todas as referências bibliográficas disponíveis na página(removido pelo professor)
Listar todos os links para outros artigos da Wikipedia citados no conteúdo do artigo

Outras funcionalidades

Verifica se a URL digitada pertence ao domínio da Wikipedia
A listagem de links externos está organizada por links existentes e inexistente(ou seja, não foi criada um artigo na wikipedia sobre o determinado assunto)

Bibliotecas utilizadas

re (regular expression)
requests
Beautiful Soup

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
README.md		README.md
exibir_imagens.py		exibir_imagens.py
exibir_links_externos.py		exibir_links_externos.py
exibir_referencias.py		exibir_referencias.py
exibir_topicos.py		exibir_topicos.py
main.py		main.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

Web-Scrapper-Wikipedia

Requisitos do programa:

Outras funcionalidades

Bibliotecas utilizadas

About

Releases

Packages

Languages

sammid37/TC

Folders and files

Latest commit

History

Repository files navigation

Web-Scrapper-Wikipedia

Requisitos do programa:

Outras funcionalidades

Bibliotecas utilizadas

About

Resources

Stars

Watchers

Forks

Releases

Packages 0

Languages

Packages