Skip to content

MmsFaria/LearningJourney

Folders and files

NameName
Last commit message
Last commit date

Latest commit

 

History

5 Commits
 
 

Repository files navigation


Learning Journey

🎓 Formação Contínua em Dados, Estatística e Machine Learning


📘 Repositório central da minha jornada de aprendizado contínuo

  • Foco
    • Estatística Aplicada
    • Data Science
    • Machine Learning
    • Engenharia de Dados
    • Lean Six Sigma
  • Formato
    • Projetos práticos
    • Notebooks autorais
    • Companion Books
    • Documentação técnica



🧩 Resumo Executivo

Este repositório consolida minha jornada de aprendizado técnico e metodológico, reunindo:

  • certificações formais
  • projetos completos derivados de cursos
  • notebooks autorais
  • Companion Books escritos por mim
  • práticas avançadas de ML, estatística e engenharia
  • fundamentos de melhoria contínua e processos

O objetivo é demonstrar evolução contínua, conectando teoria, prática e documentação profissional.



🏷️ Badges (Shields) do Repositório

Learning Journey Statistics Lean Six Sigma Machine Learning Python Status



🧰 Stack Técnico Consolidado da Jornada

Este stack reúne todas as tecnologias, ferramentas e metodologias utilizadas ao longo dos meus projetos profissionais (Habix + Olimpo), estudos formais (FM2S, IBM) e projetos práticos (Kaggle, Machine Learning, Engenharia de Dados).

🧩 Linguagens e Processamento

Python SQL DAX

  • Python (Requests, Pandas, NumPy, PyArrow, SciPy)
  • SQL avançado (CTEs, índices, funções, joins complexos)
  • DAX (modelagem tabular e medidas avançadas)
  • M (Power Query)

🗄️ Bancos de Dados e Armazenamento

PostgreSQL SQL Server Fabric Parquet

  • PostgreSQL (modelagem, normalização, tuning)
  • SQLServer (modelagem)
  • Microsoft Fabric Lakehouse (Bronze → Silver → Gold)
  • Azure Data Lake Storage Gen2
  • Arquitetura Parquet
  • CSV/JSON/Delta Lake (consumo e transformação)

🏗️ Engenharia de Dados

Docker WSL CI/CD

  • Pipelines Python → Parquet → ADLS → Fabric
  • Pipelines Bronze/Silver/Gold
  • Docker (execução isolada, reprodutibilidade)
  • WSL2 (ambiente Linux para engenharia)
  • GitHub Actions (CI/CD)
  • Versionamento semântico (tags)
  • CLI Python customizada
  • Logs, rastreabilidade e governança

🔌 Integrações e APIs

API Sienge CRM

  • Integração com APIs (ERP, CRM, cobrança, vendas)
  • Projeto Sienge API Automation
  • Autenticação, paginação, logs e tratamento de erros
  • Pipelines de dados financeiros, comerciais e jurídicos

📊 Business Intelligence

Power BI

  • Dashboards executivos (FP&A, vendas, jurídico, inadimplência)
  • Modelagem tabular
  • Indicadores financeiros e operacionais
  • Análises de variação, projeções e cenários

📈 Machine Learning e Estatística

Kaggle IBM

  • ML Intermediário (Kaggle)
  • Explainability (Permutation Importance, PDP, SHAP)
  • Estatística aplicada (IBM)
  • Testes de hipótese, regressão, distribuições
  • Pipelines e ColumnTransformer

🧪 Ambiente e Ferramentas

Jupyter GitLFS

  • Jupyter Notebook
  • Git LFS
  • Estruturação profissional de projetos
  • Documentação técnica (Companion Books)

🧭 Metodologias e Processos

Lean Six Sigma DMAIC

  • Lean Six Sigma (Yellow Belt – FM2S)
  • DMAIC
  • Análise de causa raiz (Ishikawa, 5 Porquês)
  • Padronização de processos
  • Melhoria contínua
  • Governança de dados



🎯 Cursos, Projetos e Certificações

📊 1. Statistics for Data Science with Python — IBM

Repositório: https://github.com/IncomeView/IBM_statistics

  • Descrição

    • Ambiente completo de estudo, prática e documentação autoral do curso IBM.
  • Política de Conteúdo

    • ✔ Notebooks autorais publicados
    • ❌ Notebooks IBM (1–6) ignorados por direitos autorais
  • Tecnologias

    • Python
    • NumPy
    • Pandas
    • SciPy
    • Statsmodels
    • Matplotlib
    • Seaborn
    • Jupyter

🧠 2. Machine Learning Explainability — Kaggle

Repositório: https://github.com/IncomeView/kaggle_machineLearningExplainability

  • Descrição

    • Estudo aprofundado sobre interpretabilidade de modelos.
  • Conteúdo

    • Permutation Importance
    • PDPs
    • SHAP Values
    • Advanced SHAP
  • Companion Book

    • docs/machineLearningExplainability_book.md

🤖 3. Intermediate Machine Learning — Kaggle

Repositório: https://github.com/IncomeView/kaggle_intermediateMachineLearning

  • Descrição

    • Estudo completo + Companion Book autoral.
  • Conteúdo

    • Missing Values
    • Categorical Variables
    • Pipelines
    • Cross-Validation
    • XGBoost
    • Data Leakage
  • Companion Book

    • docs/intermediateMachineLearning_book.md

🧹 4. Data Cleaning com Python — Kaggle Learn

Repositório: https://github.com/IncomeView/kaggle_dataCleaning

  • Descrição

    • Projeto completo de limpeza e preparação de dados.
  • Conteúdo

    • Handling Missing Values
    • Scaling & Normalization
    • Parsing Dates
    • Character Encodings
    • Inconsistent Data Entry
  • Tecnologias

    • Python
    • Pandas
    • NumPy
    • SciPy
    • fuzzywuzzy
    • charset-normalizer
    • Seaborn

🟡 5. Lean Six Sigma – Yellow Belt (FM2S)

Certificação concluída em 12/03/2026

  • Descrição

    • Certificação Yellow Belt com 24h de carga horária, cobrindo:
      • fundamentos de melhoria contínua
      • variabilidade
      • análise de causa raiz
      • aplicação prática do ciclo DMAIC.
  • Conteúdo Programático

    • Introdução ao Lean Seis Sigma
    • Fundamentos e pilares da melhoria
    • SIPOC, VOC e definição de indicadores
    • Mapeamento de processos e gráficos (Pareto, frequência, tendência, dispersão)
    • Análise de causa raiz (Ishikawa, 5 Porquês)
    • Ferramentas de Improve (Poka Yoke, padronização)
    • Controle e sustentação de melhorias
  • Aplicações práticas na minha carreira

    • Redução de variabilidade
    • Padronização de processos
    • Melhoria contínua aplicada a operações financeiras e de dados
    • Estruturação de indicadores e governança



🚀 Roadmap de Aprendizado (2026–2027)

  • Machine Learning Avançado
  • Deep Learning (PyTorch)
  • Feature Engineering
  • MLOps
  • Estatística Bayesiana
  • Séries Temporais
  • Lean Six Sigma Green Belt



📚 Objetivo do Repositório

  • Este repositório serve como:
    • portfólio educacional
    • base de estudos contínuos
    • referência técnica
    • documentação da minha evolução profissional

Ele complementa meus dossiês profissionais (Habix e Olimpo) e meus projetos técnicos de engenharia de dados.



About

Formação Contínua em Dados, Estatística e Machine Learning

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

 
 
 

Contributors