# Introdu√ß√£o √† Machine Learning

Esta aula apresenta os fundamentos da Intelig√™ncia Artificial (IA) e do Aprendizado de M√°quina (Machine Learning), abordando defini√ß√µes, contextos hist√≥ricos, paradigmas, classifica√ß√µes e aplica√ß√µes.

## 1. Intelig√™ncia Artificial: Defini√ß√£o e Contexto Hist√≥rico

**Intelig√™ncia Artificial (IA)** √© o campo da ci√™ncia da computa√ß√£o que desenvolve sistemas capazes de simular comportamentos inteligentes.

**Contexto hist√≥rico**:
- D√©cadas de 1950‚Äì1970: IA simb√≥lica, regras l√≥gicas (ex: XCON, ELIZA)
- D√©cada de 1980: redes neurais e sistemas especialistas
- D√©cadas de 2000‚Äì2020: Big Data, GPUs e aprendizado profundo (Deep Learning)

**√Åreas da IA**:
- Sistemas de vis√£o computacional
- Processamento de linguagem natural (PLN)
- Rob√≥tica
- Sistemas especialistas
- Intelig√™ncia coletiva (Swarm Intelligence)
- Machine Learning (aprendizado de m√°quina)

<img src="https://miro.medium.com/v2/resize:fit:1400/1*IKS-FVwoCZkpm3MrnFLPbg.jpeg">

## 2. O que √© Machine Learning?

**Machine Learning (ML)** √© uma sub√°rea da IA focada no desenvolvimento de algoritmos capazes de aprender a partir de dados.

### Paradigmas de Aprendizado de M√°quina:
- **Simb√≥lico**: regras, √°rvores de decis√£o
- **Conexionista**: redes neurais
- **Baseado em dist√¢ncia**: k-NN
- **Kernel**: SVM
- **Probabil√≠stico**: Naive Bayes, HMMs

### Exemplo simples: modelo simb√≥lico vs conexionista

In [None]:
from sklearn.datasets import load_iris
from sklearn.model_selection import train_test_split
from sklearn.tree import DecisionTreeClassifier
from sklearn.neural_network import MLPClassifier
from sklearn.metrics import accuracy_score

# Carregar dados
X, y = load_iris(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

# √Årvores de decis√£o
tree = DecisionTreeClassifier()
tree.fit(X_train, y_train)
acc_tree = accuracy_score(y_test, tree.predict(X_test))

# Rede Neural
mlp = MLPClassifier(max_iter=1000)
mlp.fit(X_train, y_train)
acc_mlp = accuracy_score(y_test, mlp.predict(X_test))

print(f"Acur√°cia - √Årvore: {acc_tree:.2f} | MLP: {acc_mlp:.2f}")

## 3. Classifica√ß√£o dos Tipos de Aprendizado de M√°quina

- **Supervisionado**: aprendizado com r√≥tulo (ex: regress√£o, classifica√ß√£o)
- **N√£o supervisionado**: sem r√≥tulos (ex: clusteriza√ß√£o)
- **Aprendizado por refor√ßo**: o agente aprende por tentativa e erro com base em recompensas

### Algoritmos:
- **Fortes**: capazes de resolver m√∫ltiplas tarefas complexas (ex: redes neurais profundas)
- **Fracos**: especialistas em tarefas espec√≠ficas (ex: Naive Bayes, Regress√£o Linear)

## 4. Tarefas em Machine Learning

### Tarefas supervisionadas:
- **Classifica√ß√£o**: prever categorias (ex: spam vs. n√£o spam)
- **Regress√£o**: prever valores cont√≠nuos (ex: pre√ßo de casas)

### Tarefas n√£o supervisionadas:
- **Clusteriza√ß√£o (agrupamento)**: agrupar dados semelhantes (ex: segmentos de clientes)
- **Extra√ß√£o de regras de associa√ß√£o**: descobrir rela√ß√µes (ex: clientes que compram X tendem a comprar Y)
- **Detec√ß√£o de outliers**: identificar anomalias


<img src="https://idapgroup.com/blog/blog/wp-content/uploads/2019/11/34534-1024x427.png">

### Exemplo: Clusteriza√ß√£o com K-Means

In [None]:
from sklearn.cluster import KMeans
import matplotlib.pyplot as plt

# Aplicar KMeans
kmeans = KMeans(n_clusters=3, random_state=0)
clusters = kmeans.fit_predict(X)

# Visualizar
plt.scatter(X[:, 0], X[:, 1], c=clusters, cmap="viridis")
plt.title("Clusteriza√ß√£o K-Means (Iris Dataset)")
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")
plt.show()

## 5. Aplica√ß√µes Reais de Machine Learning

- **Detec√ß√£o de fraude**: transa√ß√µes banc√°rias e cart√µes de cr√©dito
- **Sistemas de recomenda√ß√£o**: filmes, m√∫sicas, produtos
- **Tradu√ß√£o autom√°tica**: PLN, redes neurais seq2seq
- **Cr√©dito e score**: an√°lise de risco com regress√£o e √°rvores

---
## üìå Conclus√£o

- Machine Learning √© uma ferramenta poderosa para extrair valor de dados.
- Compreender os paradigmas e tarefas √© fundamental para aplicar ML corretamente.
- Aplica√ß√µes pr√°ticas est√£o em constante crescimento com o avan√ßo de dados e hardware.

## üß† Exerc√≠cios Pr√°ticos

### 1. Classifica√ß√£o com KNN
Utilize o `KNeighborsClassifier` da scikit-learn para classificar o dataset Iris. Me√ßa a acur√°cia do modelo.

### 2. Regress√£o Linear
Use o `LinearRegression` para prever valores de um dataset de regress√£o (ex: `sklearn.datasets.load_diabetes`).

### 3. Clusteriza√ß√£o com DBSCAN
Experimente o algoritmo `DBSCAN` da scikit-learn para realizar agrupamento no dataset Iris. Visualize os resultados com `matplotlib`.

In [None]:
from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)
acc_knn = accuracy_score(y_test, knn.predict(X_test))
print(f"Acur√°cia - KNN: {acc_knn:.2f}")

In [None]:
from sklearn.datasets import load_diabetes
from sklearn.linear_model import LinearRegression

X, y = load_diabetes(return_X_y=True)
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3)

model = LinearRegression()
model.fit(X_train, y_train)
print("R¬≤ score (regress√£o):", model.score(X_test, y_test))

In [None]:
from sklearn.cluster import DBSCAN

dbscan = DBSCAN(eps=0.5, min_samples=5)
clusters = dbscan.fit_predict(X)

plt.scatter(X[:, 0], X[:, 1], c=clusters, cmap="plasma")
plt.title("DBSCAN Clustering (Iris Dataset)")
plt.xlabel("Feature 1")
plt.ylabel("Feature 2")
plt.show()