Projeto para a pratica de criação de data pipelines. Buscando os dados dos desafiantes do Brasil, e suas ultimas partidas, armazenando em um data lake local. A ideia é coletar dados dos jogadores de league of legends e analisar, um exemplo é entender nossos jogares challengers, quem sabe não só do Brasil mas de outros servers.
Link para o post explicando post
Para rodar o projeto, você precisa de um token da api da riot, neste link: riot_api você pode criar seu app e solicitar o token de desenvolvimento, caso ja tenha algum, só colocar nos .env ao longo dos diretórios e tudo certo. Por que não é somente um .env, você pode rodar a aplicação data_colector isoladamente do ETL, ou no jupyter também.
Verifique se as portas utilizadas pelos docker-compose estão livres, ou então substitua pelas portas de sua preferência.
Você pode utilizar o make para iniciar a aplicação facilmente.
make install_dependencies
make start_all
make stop
Este comando ira remover todos os dados, até mesmo os dados coletados
make remove
Caso tenha alguma duvida de quais comandos podem ser utilizados utilize:
make help
Caso não tenho mudado as portas dos containers
Spark UI: http://localhost:8080
Airflow UI: http://localhost:8088
Minio UI: http://localhost:9001
Metabase: http://localhost:3000
Jupyter: http://localhost:8888
Fique a vontade para clonar o projeto ou contribuir.