Objetivo deste repositório é compartilhar meus estudos, progresso e evolução através do conjunto de Cursos para especializar na aplicação de DataScience. O curso é oferecido pela Universidade de Michigan através da plataforma do Coursera em: Applied Data Science with Python Specialization
├── curso/ # Essa especialização faz parte de um conjunto de 5 cursos.
├── seção/ # Cada um dos cursos é separado em seções, cada seção possuí anotações no formato notebook
└── exercicios/ # Em cada seção também estará disponivel exercícios de fixação.
├── datasets/ # Os datasets usados em cada seção estão disponíveis no endereço a baixo.
└── seção/ # Datasets organizados por seção do curso
├── Projetos/ # Atividades desenvolvidas fora do curso
├── Readings/ # Alguns artigos interessantes recomendados pelo curso
└── README.md
Durante o curso é usado datasets muito grandes. Por questão de armazenamento, os datasets serão disponibizados na núvem e não nesse repositório:
https://drive.google.com/drive/folders/1PEsTsxAqi1Yf_4yrC24F65hCDBofeWT2?usp=sharing
Foram empregagas durante o curso ferramentas como:
- Python 3.8
- Jupyter Notebooks
- Bibliotecas: numpy, regex, pandas, seaborn
- Técnicas de funções lambda e manipulação de arquivos .csv;
- Realizar querys em dataframes para limpeza e processamento de dados;
- Descrever e usar as principais funcionalidades de python aplicadas em Ciências de Dados;
- Análisar distribuições, realizar amostragens e testes T.