-
Notifications
You must be signed in to change notification settings - Fork 7
New issue
Have a question about this project? Sign up for a free GitHub account to open an issue and contact its maintainers and the community.
By clicking “Sign up for GitHub”, you agree to our terms of service and privacy statement. We’ll occasionally send you account related emails.
Already on GitHub? Sign in to your account
Web scraping dos dados de quantidades de disciplinas ofertadas #86
Comments
Iniciamos a busca de dados da listagem do SIGAA. Abaixo, segue o código produzido até o momento.
Colaboradores |
As partes comentadas do código acima podem ser utilizadas futuramente para acessar todas as turmas e calcular o total de turmas do departamento.
|
Para complementar o código produzido, estaremos elaborando um pequeno "tutorial" para a execução do código, mostrando quais tecnologias foram utilizadas e como realizar a instalação. |
Além disso, é possível evoluir o código com a estruturação dos dados recebidos, de modo a produzir um arquivo Json com todos os dados retirados do site, de modo a facilitar a inserção no BD. |
O seguinte vídeo possui explicações que podem ajudar no entendimento do Web Scraping utilizando o Selenium, BeautifulSoup e o Pandas. |
Co-authored-by: AdneMoretti morettiadne1@gmail.com
Código formatado de uma forma diferente, porém com as mesmas lógicas e funcionalidades, diferença para auxiliar na leitura para quem não pode participar do desenvolvimento (funcionalidades separadas em funções e variáveis melhor descritas). |
VersionamentoNa produção da primeira versão do código, foram usados os seguintes softwares:
Configuração de AmbientePara a execução do projeto, é necessário instalar o Selenium. Para tal, utilize o seguinte comando no terminal (Ubuntu/Linux):
Instale o webdriver manager:
Para instalar o urllib3 na versão correta talvez seja necessário desinstalar a versão já existente. Para isso, use o comando no terminal:
Então, instale o urllib3 com o seguinte comando:
Por fim, para verificar se as versões dos softwares instalados estão corretas, basta usar o seguinte comando e verificar a versão de cada um deles:
Código comentado
Tutorial produzido por: |
O código foi refatorado de forma a retirar quaisquer funcionalidades obsoletas (ou deprecated) e de modo a proporcionar uma melhor visualização do mesmo, comentando e separando as funcionalidades. Segue para revisão. |
Co-authored-by: oCaioOliveira <ocaio.ooliveira@gmail.com>
Seguindo o exemplo deixado pelo @oCaioOliveira, o código foi "refatorado" de modo a dividir todas as atividades em métodos e centralizar os passos da execução do código na "main()". |
RevisãoO código foi revisado e está coletando os dados normalmente, mas não está inicializando o firefox, para inicializá-lo basta retirar as linhas 13 e 14 e inserir o seguinte comando:
|
Feedback da RevisãoO Firefox é iniciado no background devido ao parâmetro "options=option" passado para o driver do mesmo. Para exibir o navegador, basta retirar este parâmetro! Todavia, com ou sem a exibição do navegador, os dados são coletados e disponibilizados normalmente, conforme citado. Abaixo, o trecho do código (linha 14) responsável por exibir ou ocultar o navegador:
Como foi passado que os dados estão sendo coletados normalmente, a issue será fechada. |
…-ofertadas Feature/(#86) qtd disciplinas ofertadas
Descrição
Realizar o scraping dos dados do SIGAA relacionados à quantidade de disciplinas ofertadas pelo departamento: FACULDADE DO GAMA - BRASÍLIA.
Tarefas
Critérios de aceitação
The text was updated successfully, but these errors were encountered: