# Classificação com k-NN
Este notebook demonstra a tarefa de **classificação** usando o algoritmo k-NN (k-Vizinhos Mais Próximos) em um dataset fictício de frutas.

## 1. Criar Dataset
Geramos um dataset fictício com 50 amostras, contendo as colunas:
- Peso (g)
- Tamanho (cm)
- Doçura (1-10)

Classes: Maçã, Banana, Laranja

In [None]:
import pandas as pd
import numpy as np

np.random.seed(42)
n = 50

frutas = {
    "Maçã": {
        "peso": np.random.normal(150, 10, n),      # em gramas
        "tamanho": np.random.normal(7, 0.5, n),    # em cm
        "doçura": np.random.normal(6, 1, n)        # em escala de 1-10
    },
    "Banana": {
        "peso": np.random.normal(120, 15, n),
        "tamanho": np.random.normal(15, 1, n),
        "doçura": np.random.normal(8, 0.7, n)
    },
    "Laranja": {
        "peso": np.random.normal(180, 20, n),
        "tamanho": np.random.normal(8, 0.6, n),
        "doçura": np.random.normal(5, 1, n)
    }
}

# Construindo o DataFrame
dados = []
for fruta, valores in frutas.items():
    for p, t, d in zip(valores["peso"], valores["tamanho"], valores["doçura"]):
        dados.append([p, t, d, fruta])

df = pd.DataFrame(dados, columns=["peso", "tamanho", "doçura", "classe"])

print(df.head())

## 2. Dividir em treino e teste

In [None]:
from sklearn.model_selection import train_test_split

X = df[['peso', 'tamanho', 'doçura']].values
y = df['classe'].map({'Maçã':0,'Banana':1,'Laranja':2}).values

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3,
                                                    random_state=42)
print('Tamanho treino:', len(X_train), 'Tamanho teste:', len(X_test))

## 3. Normalização e Treinamento do Modelo

In [None]:
from sklearn.preprocessing import StandardScaler
from sklearn.neighbors import KNeighborsClassifier

scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train_scaled, y_train)

## 4. Avaliação do Modelo

In [None]:
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix

y_pred = knn.predict(X_test_scaled)
acc = accuracy_score(y_test, y_pred)
cm = confusion_matrix(y_test, y_pred)
print('Acurácia:', acc)
print('\nMatriz de Confusão:\n', cm)
print('\nRelatório de Classificação:\n', classification_report(y_test, y_pred,
                                                               target_names=['Maçã','Banana','Laranja']))

## 5. Predizer uma nova fruta

In [None]:
# Exemplo: fruta com peso=160g, tamanho=8cm, doçura=6
nova_fruta = np.array([[160, 8, 6]])
nova_fruta_scaled = scaler.transform(nova_fruta)
classe_pred = knn.predict(nova_fruta_scaled)[0]
print('Classe prevista:', ['Maçã','Banana','Laranja'][classe_pred])