Este repositório contém um script Python que utiliza a biblioteca Selenium para automatizar a coleta de descrições de vagas de emprego no LinkedIn. As descrições são analisadas para criar uma nuvem de palavras que destaca os termos mais frequentes nas vagas.
Certifique-se de ter os seguintes componentes instalados:
- Python (versão recomendada: 3.x)
- Chromedriver - para controlar o navegador Chrome (verifique a versão compatível com o seu navegador)
-
Clone este repositório em seu ambiente local:
git clone https://github.com/Gabbyroba/webscraplinkedinjobs.git
-
Navegue até o diretório clonado:
cd webscraplinkedinjobs
-
Instale as bibliotecas Python necessárias usando o
pip
:pip install selenium beautifulsoup4 pandas wordcloud matplotlib
-
Substitua
email@mail,com
etopsecret
pelo seu e-mail e senha do LinkedIn, respectivamente:email = "seu-email@exemplo.com" password = "sua-senha"
-
Defina o cargo e a localização desejados para a pesquisa:
position = "analista de dados" local = "brazil"
-
Certifique-se de que o caminho para o arquivo
chromedriver.exe
está corretamente definido:driver_path = "caminho/para/chromedriver.exe"
-
Execute o script:
python main.py
-
O script automatizará o processo de login no LinkedIn, pesquisa de vagas e coleta de descrições. Uma nuvem de palavras e um arquivo CSV contendo as descrições também serão gerados.
Após a execução do script, você encontrará os seguintes arquivos:
wordcloud-job.png
: Uma imagem da nuvem de palavras gerada a partir das descrições de vagas.wordcloud-job.csv
: Um arquivo CSV contendo as descrições coletadas.
- O uso de automação em sites pode violar os termos de uso. Use este script com responsabilidade e de acordo com as políticas do LinkedIn.
- Certifique-se de estar atualizado com as políticas de scraping e automação do LinkedIn.
Contribuições são bem-vindas! Se você deseja melhorar ou estender este script, sinta-se à vontade para criar um "fork" deste repositório e enviar "pull requests".