# 🧪 Atividade Prática - KNN com Wine Dataset

Bem-vindo à sua atividade prática! Hoje, vamos aplicar o algoritmo **KNN (K-Nearest Neighbors)** no famoso dataset **Wine**, que contém características químicas de diferentes vinhos cultivados na Itália. Você irá realizar experimentos e refletir sobre como o KNN se comporta em diferentes cenários.

## 📚 Estudo de Caso
O Instituto de Vinhos da Toscana deseja criar um sistema que classifique automaticamente os vinhos com base em suas propriedades químicas. Para isso, você foi contratado como cientista de dados responsável por aplicar e avaliar o algoritmo KNN.

Seu objetivo é treinar o modelo com um conjunto de amostras de vinho e prever a classe dos vinhos desconhecidos. Você também deverá analisar o impacto da normalização dos dados e da variação do parâmetro `K`.

Vamos começar? 🍷

In [None]:
from sklearn.datasets import load_wine
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier
from sklearn.metrics import accuracy_score, confusion_matrix
import matplotlib.pyplot as plt
import seaborn as sns
import pandas as pd

In [None]:
# Carregando o dataset Wine
wine = load_wine()
X = wine.data
y = wine.target

# Visualizando as primeiras amostras
df_wine = pd.DataFrame(X, columns=wine.feature_names)
df_wine['target'] = y
df_wine.head()

In [None]:
# Normalizando os dados
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

# Dividindo entre treino e teste
X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.3, random_state=42)

In [None]:
# Treinando o modelo KNN
knn = KNeighborsClassifier(n_neighbors=5)
knn.fit(X_train, y_train)

# Previsões
y_pred = knn.predict(X_test)

# Acurácia
acc = accuracy_score(y_test, y_pred)
print('Acurácia do KNN com Wine Dataset:', acc)

In [None]:
# Matriz de confusão
cm = confusion_matrix(y_test, y_pred)
sns.heatmap(cm, annot=True, cmap='Purples', fmt='d',
            xticklabels=wine.target_names,
            yticklabels=wine.target_names)
plt.title('Matriz de Confusão - KNN (Wine Dataset)')
plt.xlabel('Previsto')
plt.ylabel('Real')
plt.show()

## 🧪 Experimentos Propostos
Agora é com você! Realize os seguintes testes:

1. **Variação do número de vizinhos**:
   - Altere o parâmetro `n_neighbors` para 1, 3, 7, 11 e observe o impacto na acurácia e matriz de confusão.

2. **Remoção da normalização**:
   - Execute o mesmo processo **sem usar o `StandardScaler`** e compare os resultados.

3. **Reflexão**:
   - Qual configuração teve melhor desempenho?
   - A ausência de normalização impactou o resultado?
   - Qual valor de `k` apresentou melhor equilíbrio entre acurácia e simplicidade?

💡 Anote suas observações abaixo.

### 📝 Suas Observações:
- Resultado com K=1: 
- Resultado com K=3: 
- Resultado com K=7: 
- Resultado com K=11: 
- Resultado sem normalização: 
- Conclusão: 
