- Foco
- Estatística Aplicada
- Data Science
- Machine Learning
- Engenharia de Dados
- Lean Six Sigma
- Formato
- Projetos práticos
- Notebooks autorais
- Companion Books
- Documentação técnica
Este repositório consolida minha jornada de aprendizado técnico e metodológico, reunindo:
- certificações formais
- projetos completos derivados de cursos
- notebooks autorais
- Companion Books escritos por mim
- práticas avançadas de ML, estatística e engenharia
- fundamentos de melhoria contínua e processos
O objetivo é demonstrar evolução contínua, conectando teoria, prática e documentação profissional.
Este stack reúne todas as tecnologias, ferramentas e metodologias utilizadas ao longo dos meus projetos profissionais (Habix + Olimpo), estudos formais (FM2S, IBM) e projetos práticos (Kaggle, Machine Learning, Engenharia de Dados).
- Python (Requests, Pandas, NumPy, PyArrow, SciPy)
- SQL avançado (CTEs, índices, funções, joins complexos)
- DAX (modelagem tabular e medidas avançadas)
- M (Power Query)
- PostgreSQL (modelagem, normalização, tuning)
- SQLServer (modelagem)
- Microsoft Fabric Lakehouse (Bronze → Silver → Gold)
- Azure Data Lake Storage Gen2
- Arquitetura Parquet
- CSV/JSON/Delta Lake (consumo e transformação)
- Pipelines Python → Parquet → ADLS → Fabric
- Pipelines Bronze/Silver/Gold
- Docker (execução isolada, reprodutibilidade)
- WSL2 (ambiente Linux para engenharia)
- GitHub Actions (CI/CD)
- Versionamento semântico (tags)
- CLI Python customizada
- Logs, rastreabilidade e governança
- Integração com APIs (ERP, CRM, cobrança, vendas)
- Projeto Sienge API Automation
- Autenticação, paginação, logs e tratamento de erros
- Pipelines de dados financeiros, comerciais e jurídicos
- Dashboards executivos (FP&A, vendas, jurídico, inadimplência)
- Modelagem tabular
- Indicadores financeiros e operacionais
- Análises de variação, projeções e cenários
- ML Intermediário (Kaggle)
- Explainability (Permutation Importance, PDP, SHAP)
- Estatística aplicada (IBM)
- Testes de hipótese, regressão, distribuições
- Pipelines e ColumnTransformer
- Jupyter Notebook
- Git LFS
- Estruturação profissional de projetos
- Documentação técnica (Companion Books)
- Lean Six Sigma (Yellow Belt – FM2S)
- DMAIC
- Análise de causa raiz (Ishikawa, 5 Porquês)
- Padronização de processos
- Melhoria contínua
- Governança de dados
Repositório: https://github.com/IncomeView/IBM_statistics
-
Descrição
- Ambiente completo de estudo, prática e documentação autoral do curso IBM.
-
Política de Conteúdo
- ✔ Notebooks autorais publicados
- ❌ Notebooks IBM (1–6) ignorados por direitos autorais
-
Tecnologias
- Python
- NumPy
- Pandas
- SciPy
- Statsmodels
- Matplotlib
- Seaborn
- Jupyter
Repositório: https://github.com/IncomeView/kaggle_machineLearningExplainability
-
Descrição
- Estudo aprofundado sobre interpretabilidade de modelos.
-
Conteúdo
- Permutation Importance
- PDPs
- SHAP Values
- Advanced SHAP
-
Companion Book
docs/machineLearningExplainability_book.md
Repositório: https://github.com/IncomeView/kaggle_intermediateMachineLearning
-
Descrição
- Estudo completo + Companion Book autoral.
-
Conteúdo
- Missing Values
- Categorical Variables
- Pipelines
- Cross-Validation
- XGBoost
- Data Leakage
-
Companion Book
docs/intermediateMachineLearning_book.md
Repositório: https://github.com/IncomeView/kaggle_dataCleaning
-
Descrição
- Projeto completo de limpeza e preparação de dados.
-
Conteúdo
- Handling Missing Values
- Scaling & Normalization
- Parsing Dates
- Character Encodings
- Inconsistent Data Entry
-
Tecnologias
- Python
- Pandas
- NumPy
- SciPy
- fuzzywuzzy
- charset-normalizer
- Seaborn
Certificação concluída em 12/03/2026
-
Descrição
- Certificação Yellow Belt com 24h de carga horária, cobrindo:
- fundamentos de melhoria contínua
- variabilidade
- análise de causa raiz
- aplicação prática do ciclo DMAIC.
- Certificação Yellow Belt com 24h de carga horária, cobrindo:
-
Conteúdo Programático
- Introdução ao Lean Seis Sigma
- Fundamentos e pilares da melhoria
- SIPOC, VOC e definição de indicadores
- Mapeamento de processos e gráficos (Pareto, frequência, tendência, dispersão)
- Análise de causa raiz (Ishikawa, 5 Porquês)
- Ferramentas de Improve (Poka Yoke, padronização)
- Controle e sustentação de melhorias
-
Aplicações práticas na minha carreira
- Redução de variabilidade
- Padronização de processos
- Melhoria contínua aplicada a operações financeiras e de dados
- Estruturação de indicadores e governança
- Machine Learning Avançado
- Deep Learning (PyTorch)
- Feature Engineering
- MLOps
- Estatística Bayesiana
- Séries Temporais
- Lean Six Sigma Green Belt
- Este repositório serve como:
- portfólio educacional
- base de estudos contínuos
- referência técnica
- documentação da minha evolução profissional
Ele complementa meus dossiês profissionais (Habix e Olimpo) e meus projetos técnicos de engenharia de dados.