# 📘 Módulo 1: Fundamentos de CD4ML

Este notebook apresenta os conceitos iniciais de Continuous Delivery for Machine Learning, com foco em práticas e desafios reais de projetos de ML em produção.

## 🔍 O que é CD4ML?
CD4ML (Continuous Delivery for Machine Learning) é a prática de aplicar princípios de engenharia de software e DevOps ao ciclo de vida de Machine Learning, com foco em:

- Versionamento de dados, código e modelo
- Pipelines automatizados
- Testes em ML (unitários, de validação e de performance)
- Deploy contínuo e monitoramento de modelos


In [None]:
# Simulação de um ciclo simplificado de ML
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from joblib import dump
import pandas as pd

# Load e split
data = load_iris()
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.3, random_state=42)

# Treinamento do modelo
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Avaliação
acc = model.score(X_test, y_test)
print(f"Acurácia: {acc:.2f}")

# Exportação do modelo
dump(model, "iris_model.joblib")


## 💡 Reflexão

1. O que aconteceria se você mudasse a base de dados?
2. Como garantir que o modelo possa ser reproduzido e testado novamente?
3. Como você versionaria este modelo com dados e código?


## ✅ Checklist de Aprendizado

- [x] Entendeu o que é CD4ML
- [x] Conheceu o ciclo básico de um modelo ML
- [ ] Conectou o conceito com problemas reais de produção
