Skip to content

Análise de dados do Prouni focada em cursos de medicina no Brasil, utilizando Databricks, PySpark e Pandas para fornecer insights educacionais e oportunidades de estudo.

Notifications You must be signed in to change notification settings

PATRICIAJUNQUEIRA/Databricks-PROUNI-Analise

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

2 Commits
 
 
 
 
 
 

Repository files navigation

Projeto Databricks - Análise de Dados do Prouni para Cursos de Medicina

Visão Geral

Este projeto utiliza o ambiente Databricks para realizar análises de dados relacionados ao Programa Universidade para Todos (Prouni) no Brasil. O foco principal é fornecer informações relevantes para aqueles que buscam estudar medicina no país, incluindo dados sobre bolsas disponíveis, acesso a universidades públicas e oportunidades de estudo.

Objetivo

O objetivo principal deste projeto é explorar e analisar dados do Prouni, com ênfase nos cursos de medicina. Isso permitirá que estudantes, candidatos a bolsas e outros interessados obtenham informações valiosas sobre o panorama educacional na área da saúde.

Tecnologias Utilizadas

O projeto é desenvolvido no ambiente Databricks, utilizando a linguagem de programação PySpark. A biblioteca Pandas é integrada ao PySpark para análises mais detalhadas e manipulação eficiente dos dados. A combinação dessas tecnologias oferece um ambiente poderoso e escalável para lidar com conjuntos de dados extensos.

Estrutura do Projeto

O repositório é organizado da seguinte forma:

  • Notebooks: Contém notebooks Databricks (.dbc) com códigos, visualizações e análises detalhadas.

  • Scripts: Armazena scripts Python necessários para pré-processamento e manipulação de dados usando a biblioteca Pandas.

  • Dados: Inclui conjuntos de dados utilizados no projeto, especialmente focados nos cursos de medicina no âmbito do Prouni.

Execução do Projeto

Para executar o projeto localmente, é recomendável utilizar o ambiente Databricks. Siga as instruções apropriadas para configurar o ambiente e importar os notebooks.

  1. Importe os notebooks para o ambiente Databricks.
  2. Execute os notebooks na ordem apropriada, começando pelos notebooks de pré-processamento.
  3. Analise os resultados e visualizações geradas.

Contribuições

Contribuições são bem-vindas! Se você encontrar problemas, tiver sugestões ou quiser adicionar novos recursos, sinta-se à vontade para abrir uma issue ou enviar um pull request.

Licença

Este projeto é distribuído sob a licença MIT. Sinta-se livre para usar, modificar e distribuir conforme necessário.


Espero que este projeto forneça insights valiosos para aqueles que buscam informações sobre cursos de medicina no Brasil, contribuindo para decisões educacionais informadas e acesso a oportunidades de estudo.

About

Análise de dados do Prouni focada em cursos de medicina no Brasil, utilizando Databricks, PySpark e Pandas para fornecer insights educacionais e oportunidades de estudo.

Topics

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published