Este projeto utiliza o ambiente Databricks para realizar análises de dados relacionados ao Programa Universidade para Todos (Prouni) no Brasil. O foco principal é fornecer informações relevantes para aqueles que buscam estudar medicina no país, incluindo dados sobre bolsas disponíveis, acesso a universidades públicas e oportunidades de estudo.
O objetivo principal deste projeto é explorar e analisar dados do Prouni, com ênfase nos cursos de medicina. Isso permitirá que estudantes, candidatos a bolsas e outros interessados obtenham informações valiosas sobre o panorama educacional na área da saúde.
O projeto é desenvolvido no ambiente Databricks, utilizando a linguagem de programação PySpark. A biblioteca Pandas é integrada ao PySpark para análises mais detalhadas e manipulação eficiente dos dados. A combinação dessas tecnologias oferece um ambiente poderoso e escalável para lidar com conjuntos de dados extensos.
O repositório é organizado da seguinte forma:
-
Notebooks: Contém notebooks Databricks (.dbc) com códigos, visualizações e análises detalhadas.
-
Scripts: Armazena scripts Python necessários para pré-processamento e manipulação de dados usando a biblioteca Pandas.
-
Dados: Inclui conjuntos de dados utilizados no projeto, especialmente focados nos cursos de medicina no âmbito do Prouni.
Para executar o projeto localmente, é recomendável utilizar o ambiente Databricks. Siga as instruções apropriadas para configurar o ambiente e importar os notebooks.
- Importe os notebooks para o ambiente Databricks.
- Execute os notebooks na ordem apropriada, começando pelos notebooks de pré-processamento.
- Analise os resultados e visualizações geradas.
Contribuições são bem-vindas! Se você encontrar problemas, tiver sugestões ou quiser adicionar novos recursos, sinta-se à vontade para abrir uma issue ou enviar um pull request.
Este projeto é distribuído sob a licença MIT. Sinta-se livre para usar, modificar e distribuir conforme necessário.
Espero que este projeto forneça insights valiosos para aqueles que buscam informações sobre cursos de medicina no Brasil, contribuindo para decisões educacionais informadas e acesso a oportunidades de estudo.