# 🧠 Tipos de Aprendizado em Machine Learning

## 🎯 Conceitos Básicos

- **Features (variáveis independentes):** atributos usados como entrada no modelo.
- **Target (label, variável dependente):** valor que queremos prever ou estimar.


## 📘 Tipos de Aprendizado

### 1. ✅ Aprendizado Supervisionado

- Usa **dados rotulados** (com target conhecido).
- O algoritmo aprende a mapear `X ➜ y`.
- Ex: Classificação de churn, previsão de faturamento.

**Fluxo típico:**
1. Dividir dados em treino/teste
2. Treinar modelo com `X_train`, `y_train`
3. Testar com `X_test`, comparar com `y_test`


In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

# Dataset supervisionado
data = load_iris()
X_train, X_test, y_train, y_test = train_test_split(data.data, data.target, test_size=0.3, random_state=42)

model = RandomForestClassifier()
model.fit(X_train, y_train)
pred = model.predict(X_test)

print(classification_report(y_test, pred, target_names=data.target_names))


### 2. 🔍 Aprendizado Não Supervisionado

- Usa **dados sem rótulo** (`y` não existe).
- O modelo encontra **padrões ou agrupamentos** nos dados.
- Ex: Segmentação de clientes, redução de dimensionalidade.


In [None]:
from sklearn.datasets import load_iris
from sklearn.cluster import KMeans
import pandas as pd

iris = load_iris()
X = iris.data

kmeans = KMeans(n_clusters=3, random_state=42)
clusters = kmeans.fit_predict(X)

# Visualização rápida
df = pd.DataFrame(X, columns=iris.feature_names)
df['cluster'] = clusters
df.head()


### 3. 🔄 Aprendizado Semi-Supervisionado

- Parte dos dados está **rotulada**, outra parte **não**.
- Útil quando rotular dados é caro ou demorado.
- Pode combinar clusterização com classificação.

### 4. 🕹️ Aprendizado por Reforço (Reinforcement Learning)

- O agente **interage com o ambiente**, recebe **recompensas** ou **punições**.
- Aprende por tentativa e erro.
- Ex: Jogos, robótica, sistemas de recomendação dinâmicos.


## 🧪 Validação e Ajustes

- Dividir os dados corretamente evita overfitting.
- Técnicas como **validação cruzada (k-fold)** são recomendadas.
- Métricas comuns: Accuracy, Precision, Recall, F1-score.

## ⚙️ Automação

- Em aprendizado semi-supervisionado, é possível:
  - Usar modelos para **rotular automaticamente** dados novos
  - Melhorar continuamente com **retraining iterativo**


## 🧩 Features vs Label

### 🔹 Features (Variáveis Independentes)
São os **atributos de entrada** que usamos para ensinar o modelo.  
Exemplos: idade, plano, tempo de uso, salário, localização, etc.

- Notação comum: `X`
- Também chamadas de: atributos, variáveis explicativas, entradas

---

### 🔸 Label (Variável Dependente)
É o **alvo que queremos prever**. O valor que o modelo aprende a estimar com base nas features.

- Notação comum: `y`
- Também chamada de: target, rótulo, classe (em classificação)

---

### 🧠 Exemplo prático

| idade | plano     | meses_ativo | churn |
|-------|-----------|-------------|--------|
| 25    | Premium   | 12          | 0      |
| 60    | Básico    | 2           | 1      |
| 40    | Intermediário | 24      | 0      |

- `X = [idade, plano, meses_ativo]` → features
- `y = [churn]` → label

O modelo vai **aprender padrões em `X` para prever `y`**.



![image.png](attachment:image.png)

# ⚙️ Tipos de Algoritmos em Machine Learning

## ✅ Supervisionados

Usam **dados rotulados** (com target conhecido). Os dois principais tipos são:

### 🔸 Regressão
- **Predição de valores contínuos**
- Ex: Preço de uma casa, valor de ações, tempo estimado
- Exemplos de algoritmos:
  - `LinearRegression`
  - `Ridge`
  - `SVR`
  - `RandomForestRegressor`

### 🔸 Classificação
- **Predição de categorias**
- Ex: Cliente vai churnar ou não? Doença: Sim ou Não?
- Exemplos de algoritmos:
  - `LogisticRegression`
  - `RandomForestClassifier`
  - `SVC`
  - `KNeighborsClassifier`

---

## 🔍 Não Supervisionados

Usam **dados não rotulados**. O objetivo é encontrar padrões ocultos nos dados.

### 🔹 Agrupamento (Clustering)
- Ex: Segmentar perfis de clientes
- Algoritmos: `KMeans`, `DBSCAN`, `AgglomerativeClustering`

### 🔹 Redução de Dimensionalidade
- Ex: Reduzir número de variáveis mantendo informação
- Algoritmos: `PCA`, `TSNE`, `UMAP`

### 🔹 Associação
- Ex: Regras de mercado: “quem compra X também compra Y”
- Algoritmos: Apriori, Eclat (via `mlxtend`)

---

## 🚀 Outras Áreas Avançadas

### 🧬 Computação Natural
- Inspirada em biologia (ex: redes neurais, algoritmos genéticos)

### ⚛️ Computação Quântica
- Usa princípios da mecânica quântica para acelerar modelos ML
- Ex: QML (Quantum Machine Learning)

---

## 🛠️ Ferramenta: Scikit-Learn

- Biblioteca padrão para ML clássico em Python
- Fornece: datasets, pré-processamento, modelos, avaliação
- Integra bem com `pandas`, `numpy`, `matplotlib`

```python
from sklearn.linear_model import LogisticRegression
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y)
model = LogisticRegression()
model.fit(X_train, y_train)


# ⚙️ Tipos de Algoritmos de Aprendizado de Máquina

## 📂 Supervisionados
- 🔹 Regressão
  - Predição de valores contínuos
- 🔹 Classificação
  - Predição de categorias ou rótulos

## 📂 Não Supervisionados
- 🔹 Agrupamento (Clustering)
- 🔹 Redução de Dimensionalidade
- 🔹 Associação (Regras de associação, análise de cestas de mercado)

## 📂 Por Reforço
- 🔹 Valor (Q-Learning)
- 🔹 Política (Policy Gradient)
- 🔹 Ator-Crítico (Actor-Critic, PPO, A3C)

## 📂 Aprendizado Profundo (Deep Learning)
- 🔹 Redes Convolucionais (CNN)
- 🔹 Redes Recorrentes (RNN, LSTM)
- 🔹 GANs (Redes Generativas Adversárias)
- 🔹 Transformers

## 📂 Computação Natural
- 🔹 Algoritmos Genéticos
- 🔹 Sistemas Imunológicos Artificiais
- 🔹 Otimização por Colônias/Enxames (PSO, ACO)
- 🔹 Computação Quântica (Quantum Machine Learning)
