### Preparando os Dados

Neste exercício, carregamos a base de dados dos pinguins e preparamos os dados para um classificador binário: identificar pinguins da espécie *Adelie*.


In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split

# Carregar os dados
url = 'https://raw.githubusercontent.com/mcnakhaee/palmerpenguins/master/penguins.csv'
df = pd.read_csv(url)

# Remover valores ausentes
df = df.dropna()

# Criar variável binária: Adelie vs Outras
df['label'] = df['species'].apply(lambda x: 1 if x == 'Adelie' else 0)

# Seleção de features
X = df[['bill_length_mm', 'bill_depth_mm', 'flipper_length_mm', 'body_mass_g']]
y = df['label']

# Separação treino/validação
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=42)

### Construção do Modelo com KNN

Utilizamos o algoritmo K-Nearest Neighbors (KNN) com 3 vizinhos para treinar um modelo que reconhece pinguins da espécie Adelie.


In [None]:
from sklearn.neighbors import KNeighborsClassifier

knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

### Avaliação do Modelo

Avaliação da acurácia do modelo treinado usando os dados de validação.


In [None]:
from sklearn.metrics import accuracy_score

y_pred = knn.predict(X_val)
accuracy = accuracy_score(y_val, y_pred)
print(f"Acurácia Adelie vs outras: {accuracy:.2f}")

### Novo Modelo - Gentoo vs Outras

Criamos agora um modelo para identificar se o pinguim pertence à espécie Gentoo, repetindo os mesmos passos.

In [None]:
# Recriar rótulo para Gentoo vs outras
df['label'] = df['species'].apply(lambda x: 1 if x == 'Gentoo' else 0)

# Atualizar X e y
X = df[['bill_length_mm', 'bill_depth_mm', 'flipper_length_mm', 'body_mass_g']]
y = df['label']

# Divisão dos dados
X_train, X_val, y_train, y_val = train_test_split(X, y, test_size=0.2, random_state=42)

# Novo modelo KNN
knn = KNeighborsClassifier(n_neighbors=3)
knn.fit(X_train, y_train)

# Avaliação
y_pred = knn.predict(X_val)
accuracy = accuracy_score(y_val, y_pred)
print(f"Acurácia Gentoo vs outras: {accuracy:.2f}")