# Introdução à Machine Learning

Esta aula apresenta os fundamentos da Inteligência Artificial (IA) e do Aprendizado de Máquina (Machine Learning), abordando definições, contextos históricos, paradigmas, classificações e aplicações.

## 1. Inteligência Artificial: Definição e Contexto Histórico

**Inteligência Artificial (IA)** é o campo da ciência da computação que desenvolve sistemas capazes de simular comportamentos inteligentes.

**Contexto histórico**:
- Décadas de 1950–1970: IA simbólica, regras lógicas (ex: XCON, ELIZA)
- Década de 1980: redes neurais e sistemas especialistas
- Décadas de 2000–2020: Big Data, GPUs e aprendizado profundo (Deep Learning)

**Áreas da IA**:
- Sistemas de visão computacional
- Processamento de linguagem natural (PLN)
- Robótica
- Sistemas especialistas
- Inteligência coletiva (Swarm Intelligence)
- Machine Learning (aprendizado de máquina)

<img src="https://miro.medium.com/v2/resize:fit:1400/1*IKS-FVwoCZkpm3MrnFLPbg.jpeg">

## 2. O que é Machine Learning?

**Machine Learning (ML)** é uma subárea da IA focada no desenvolvimento de algoritmos capazes de aprender a partir de dados.

### Paradigmas de Aprendizado de Máquina:
- **Simbólico**: regras, árvores de decisão
- **Conexionista**: redes neurais
- **Baseado em distância**: k-NN
- **Kernel**: SVM
- **Probabilístico**: Naive Bayes, HMMs

### Exemplo simples: modelo simbólico vs conexionista

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Carregar dados
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# Árvores de decisão
tree = DecisionTreeClassifier()
tree.fit(X_train, y_train)
acc_tree = accuracy_score(y_test, tree.predict(X_test))

# Rede Neural
mlp = MLPClassifier(max_iter=1000)
mlp.fit(X_train, y_train)
acc_mlp = accuracy_score(y_test, mlp.predict(X_test))

print(f"Acurácia - Árvore: {acc_tree:.2f} | MLP: {acc_mlp:.2f}")

## 3. Classificação dos Tipos de Aprendizado de Máquina

- **Supervisionado**: aprendizado com rótulo (ex: regressão, classificação)
- **Não supervisionado**: sem rótulos (ex: clusterização)
- **Aprendizado por reforço**: o agente aprende por tentativa e erro com base em recompensas

### Algoritmos:
- **Fortes**: capazes de resolver múltiplas tarefas complexas (ex: redes neurais profundas)
- **Fracos**: especialistas em tarefas específicas (ex: Naive Bayes, Regressão Linear)

## 4. Tarefas em Machine Learning

### Tarefas supervisionadas:
- **Classificação**: prever categorias (ex: spam vs. não spam)
- **Regressão**: prever valores contínuos (ex: preço de casas)

### Tarefas não supervisionadas:
- **Clusterização (agrupamento)**: agrupar dados semelhantes (ex: segmentos de clientes)
- **Extração de regras de associação**: descobrir relações (ex: clientes que compram X tendem a comprar Y)
- **Detecção de outliers**: identificar anomalias


<img src="https://idapgroup.com/blog/blog/wp-content/uploads/2019/11/34534-1024x427.png">

### Exemplo: Clusterização com K-Means

In [None]:
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

# Aplicar KMeans
kmeans = KMeans(n_clusters=3, random_state=0)
clusters = kmeans.fit_predict(X)

# Visualizar
plt.scatter(X[:, 0], X[:, 1], c=clusters, cmap="viridis")
plt.title("Clusterização K-Means (Iris Dataset)")
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")
plt.show()

## 5. Aplicações Reais de Machine Learning

- **Detecção de fraude**: transações bancárias e cartões de crédito
- **Sistemas de recomendação**: filmes, músicas, produtos
- **Tradução automática**: PLN, redes neurais seq2seq
- **Crédito e score**: análise de risco com regressão e árvores

---
## 📌 Conclusão

- Machine Learning é uma ferramenta poderosa para extrair valor de dados.
- Compreender os paradigmas e tarefas é fundamental para aplicar ML corretamente.
- Aplicações práticas estão em constante crescimento com o avanço de dados e hardware.

## 🧠 Exercícios Práticos

### 1. Classificação com KNN
Utilize o `KNeighborsClassifier` da scikit-learn para classificar o dataset Iris. Meça a acurácia do modelo.

### 2. Regressão Linear
Use o `LinearRegression` para prever valores de um dataset de regressão (ex: `sklearn.datasets.load_diabetes`).

### 3. Clusterização com DBSCAN
Experimente o algoritmo `DBSCAN` da scikit-learn para realizar agrupamento no dataset Iris. Visualize os resultados com `matplotlib`.

In [None]:
from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
acc_knn = accuracy_score(y_test, knn.predict(X_test))
print(f"Acurácia - KNN: {acc_knn:.2f}")

In [None]:
from sklearn.datasets import load_diabetes
from sklearn.linear_model import LinearRegression

X, y = load_diabetes(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

model = LinearRegression()
model.fit(X_train, y_train)
print("R² score (regressão):", model.score(X_test, y_test))

In [None]:
from sklearn.cluster import DBSCAN

dbscan = DBSCAN(eps=0.5, min_samples=5)
clusters = dbscan.fit_predict(X)

plt.scatter(X[:, 0], X[:, 1], c=clusters, cmap="plasma")
plt.title("DBSCAN Clustering (Iris Dataset)")
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")
plt.show()