Skip to content

Projeto feito para conclusão do módulo de Machine Learning 2, do Santander Coders 2023.2 | Ada

License

Notifications You must be signed in to change notification settings

brunoopinheiro/data-science-adasc20232-1115

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

13 Commits
 
 
 
 
 
 
 
 
 
 

Repository files navigation

Projeto Machine Learning 2: Ada Santander Coders 2023.2

Projeto feito para conclusão do módulo de Machine Learning 2, do Santander Coders 2023.2 | Ada Professor: Jorge Chamby-Diaz

Como executar este projeto

O projeto foi desenvolvido utilizando o ambiente base do Anaconda. Sendo necessário apenas um ambiente como o conda ou Miniconda.

Executando com VENV

Alternativamente, é possível utilizar um ambiente virtual com venv. As bibliotecas necessárias estão no arquivo requirements.txt. Basta seguir o seguinte passo a passo:

  1. No powershell, bash ou cmd, navegue até o diretório raiz do projeto.

  2. Crie um ambiente virtual com o comando

python -m venv .venv
  1. Ative o ambiente virtual. O comando pode diferir a depender do seu sistema operacional. O exemplo abaixo é para ativação via CMD
.venv\Scripts\activate.bat
  1. Instale as dependências com pip
pip install -r .\requirements.txt

Base de dados

Foram utilizadas algumas das base de dados disponibilizadas em Covid 19 BR, lida diretamente do github do projeto. Utilizando pandas, pode ser feito da seguinte forma:

pd.read_csv('https://raw.githubusercontent.com/wcota/covid19br/master/cases-brazil-states.csv')

Notebook

O notebook que contem as atividades necessárias ao projeto encontra-se na raiz deste diretório, e pode ser acessado aqui: Projeto

TO-DO:

  • Apresentação da Análise:
    • Storytelling;
    • Insights (Padrões que descrevam os elementos da base);
    • Descrição do problema;
    • Proposta de solução;
  • Entregáveis:
    • Relatório com análise exploratória de dados;
      • Descrição das variáveis (dados faltantes, tipos de dados, informações relacionadas e fontes);
      • Limpeza da base;
    • Análise Univariada e Multivariada:
      • Medidas estatísticas;
      • Comparações;
      • Tendências de crescimento ou queda;
    • Gráficos;
    • Segmentação dos dados (agrupamentos em relação a variáveis de interesse);
    • Análise Preditiva (utilzação de modelos para predizer variáveis de interesse dos problemas levantados)

About

Projeto feito para conclusão do módulo de Machine Learning 2, do Santander Coders 2023.2 | Ada

Topics

Resources

License

Stars

Watchers

Forks