⭐ Learning Journey

🎓 Formação Contínua em Dados, Estatística e Machine Learning

📘 Repositório central da minha jornada de aprendizado contínuo

Foco
- Estatística Aplicada
- Data Science
- Machine Learning
- Engenharia de Dados
- Lean Six Sigma
Formato
- Projetos práticos
- Notebooks autorais
- Companion Books
- Documentação técnica

🧩 Resumo Executivo

Este repositório consolida minha jornada de aprendizado técnico e metodológico, reunindo:

certificações formais
projetos completos derivados de cursos
notebooks autorais
Companion Books escritos por mim
práticas avançadas de ML, estatística e engenharia
fundamentos de melhoria contínua e processos

O objetivo é demonstrar evolução contínua, conectando teoria, prática e documentação profissional.

🏷️ Badges (Shields) do Repositório

🧰 Stack Técnico Consolidado da Jornada

Este stack reúne todas as tecnologias, ferramentas e metodologias utilizadas ao longo dos meus projetos profissionais (Habix + Olimpo), estudos formais (FM2S, IBM) e projetos práticos (Kaggle, Machine Learning, Engenharia de Dados).

🧩 Linguagens e Processamento

Python (Requests, Pandas, NumPy, PyArrow, SciPy)
SQL avançado (CTEs, índices, funções, joins complexos)
DAX (modelagem tabular e medidas avançadas)
M (Power Query)

🗄️ Bancos de Dados e Armazenamento

PostgreSQL (modelagem, normalização, tuning)
SQLServer (modelagem)
Microsoft Fabric Lakehouse (Bronze → Silver → Gold)
Azure Data Lake Storage Gen2
Arquitetura Parquet
CSV/JSON/Delta Lake (consumo e transformação)

🏗️ Engenharia de Dados

Pipelines Python → Parquet → ADLS → Fabric
Pipelines Bronze/Silver/Gold
Docker (execução isolada, reprodutibilidade)
WSL2 (ambiente Linux para engenharia)
GitHub Actions (CI/CD)
Versionamento semântico (tags)
CLI Python customizada
Logs, rastreabilidade e governança

🔌 Integrações e APIs

Integração com APIs (ERP, CRM, cobrança, vendas)
Projeto Sienge API Automation
Autenticação, paginação, logs e tratamento de erros
Pipelines de dados financeiros, comerciais e jurídicos

📊 Business Intelligence

Dashboards executivos (FP&A, vendas, jurídico, inadimplência)
Modelagem tabular
Indicadores financeiros e operacionais
Análises de variação, projeções e cenários

📈 Machine Learning e Estatística

ML Intermediário (Kaggle)
Explainability (Permutation Importance, PDP, SHAP)
Estatística aplicada (IBM)
Testes de hipótese, regressão, distribuições
Pipelines e ColumnTransformer

🧪 Ambiente e Ferramentas

Jupyter Notebook
Git LFS
Estruturação profissional de projetos
Documentação técnica (Companion Books)

🧭 Metodologias e Processos

Lean Six Sigma (Yellow Belt – FM2S)
DMAIC
Análise de causa raiz (Ishikawa, 5 Porquês)
Padronização de processos
Melhoria contínua
Governança de dados

🎯 Cursos, Projetos e Certificações

📊 1. Statistics for Data Science with Python — IBM

Repositório: https://github.com/IncomeView/IBM_statistics

Descrição
- Ambiente completo de estudo, prática e documentação autoral do curso IBM.
Política de Conteúdo
- ✔ Notebooks autorais publicados
- ❌ Notebooks IBM (1–6) ignorados por direitos autorais
Tecnologias
- Python
- NumPy
- Pandas
- SciPy
- Statsmodels
- Matplotlib
- Seaborn
- Jupyter

🧠 2. Machine Learning Explainability — Kaggle

Repositório: https://github.com/IncomeView/kaggle_machineLearningExplainability

Descrição
- Estudo aprofundado sobre interpretabilidade de modelos.
Conteúdo
- Permutation Importance
- PDPs
- SHAP Values
- Advanced SHAP
Companion Book
- docs/machineLearningExplainability_book.md

🤖 3. Intermediate Machine Learning — Kaggle

Repositório: https://github.com/IncomeView/kaggle_intermediateMachineLearning

Descrição
- Estudo completo + Companion Book autoral.
Conteúdo
- Missing Values
- Categorical Variables
- Pipelines
- Cross-Validation
- XGBoost
- Data Leakage
Companion Book
- docs/intermediateMachineLearning_book.md

🧹 4. Data Cleaning com Python — Kaggle Learn

Repositório: https://github.com/IncomeView/kaggle_dataCleaning

Descrição
- Projeto completo de limpeza e preparação de dados.
Conteúdo
- Handling Missing Values
- Scaling & Normalization
- Parsing Dates
- Character Encodings
- Inconsistent Data Entry
Tecnologias
- Python
- Pandas
- NumPy
- SciPy
- fuzzywuzzy
- charset-normalizer
- Seaborn

🟡 5. Lean Six Sigma – Yellow Belt (FM2S)

Certificação concluída em 12/03/2026

Descrição
- Certificação Yellow Belt com 24h de carga horária, cobrindo:
  - fundamentos de melhoria contínua
  - variabilidade
  - análise de causa raiz
  - aplicação prática do ciclo DMAIC.
Conteúdo Programático
- Introdução ao Lean Seis Sigma
- Fundamentos e pilares da melhoria
- SIPOC, VOC e definição de indicadores
- Mapeamento de processos e gráficos (Pareto, frequência, tendência, dispersão)
- Análise de causa raiz (Ishikawa, 5 Porquês)
- Ferramentas de Improve (Poka Yoke, padronização)
- Controle e sustentação de melhorias
Aplicações práticas na minha carreira
- Redução de variabilidade
- Padronização de processos
- Melhoria contínua aplicada a operações financeiras e de dados
- Estruturação de indicadores e governança

🚀 Roadmap de Aprendizado (2026–2027)

Machine Learning Avançado
Deep Learning (PyTorch)
Feature Engineering
MLOps
Estatística Bayesiana
Séries Temporais
Lean Six Sigma Green Belt

📚 Objetivo do Repositório

Este repositório serve como:
- portfólio educacional
- base de estudos contínuos
- referência técnica
- documentação da minha evolução profissional

Ele complementa meus dossiês profissionais (Habix e Olimpo) e meus projetos técnicos de engenharia de dados.

Name		Name	Last commit message	Last commit date
Latest commit History 5 Commits
README.md		README.md

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Repository files navigation

⭐ Learning Journey

🎓 Formação Contínua em Dados, Estatística e Machine Learning

📘 Repositório central da minha jornada de aprendizado contínuo

🧩 Resumo Executivo

🏷️ Badges (Shields) do Repositório