Skip to content

nicolasbuen/Alura-s-Data-Science-Bootcamp

Repository files navigation

Aulas do Bootcamp de Data Science da ALURA

Sobre o Repo

Nesse repo, estão salvos todos os notebooks que utilizei durante os módulos da Alura para o acompanhamento das aulas. Inicialmente, separei o módulo em diversos notebooks diferentes, um para cada aula (como é o caso do módulo 1).
A partir do módulo 2, preferi manter apenas um notebook extenso por módulo.


Resumo de cada Módulo


  • Módulo 01: Python e pandas para análise de dados reais
    • No primeiro módulo, foram introduzidos conceitos e funções de entrada de Python, Pandas e Matplotlib para realizar a exploração de alguns dados financeiros do dataSUS. Os desafios iam desde a aquisição dos dados na plataforma do governo, a limpeza do dataset utilizando o Pandas e a criação de hipóteses.

  • Módulo 02: Visualização de dados com Seaborn e Matplotlib
    • Continuamos utilizando o mesmo dataset do dataSUS, indo um pouco mais fundo no tratamento e na manipulação dos dados para realizar análises mais complexas que a do primeiro módulo. Além disso, houve um enfoque em visualização de dados de acordo com cada tipo de váriavel, boas práticas e etc.

  • Módulo 03: Estatística com python para análise de dados
    • No módulo 3, o foco foi estatística utilizando python e bibliotecas como a Statsmodels. Trocamos o dataset para a base de dados da Pesquisa Nacional da Saúde do Escolar de 2015, a PeNSE. Muito desse módulo foi ensinado em videos da Alura+, devido ao conteúdo ser bem teórico (ao invés de ser aplicado em notebooks).

  • Módulo 04: Análise de séries temporais
    • O quarto módulo utiliza a base teórica ensinada no módulo 3 para realizar análises e previsões de séries temporais em diversos datasets diferentes. Aqui foram utilizadas libs como a Prophet, desenvolvida pelo Facebook, e a Statsmodels. Além do conteúdo do módulo, foi dado um curso de streamlit para criação de aplicações web de Data Science.

  • Módulo 05: Tratamento, análise e Machine Learning aplicado
    • Esse módulo dá início ao desenvolvimento de um projeto prático de Data Science, desde o entendimento do problema, tratamento e análise dos dados até a a solução da task usando Machine Learning. Aqui utilizamos um dataset disponibilizado pelo hospital Sírio Libanês no Kaggle sobre COVID-19.

  • Módulo 06: Modelos, métricas e validações em Machine Learning
    • Ainda utilizando um dataset disponibilizado pelo hospital Sírio Libanês no Kaggle, nesse módulo aplicamos todo nosso conhecimento para finalizar o pipeline do modelo de Machine Learning, testando algoritmos mais avançados, novas métricas de avaliação e formas mais adequadas de validação.

Releases

No releases published

Packages

No packages published