In [2]:
import numpy as np
from sklearn.datasets import load_iris
from sklearn.model_selection import cross_val_score
from sklearn.neighbors import KNeighborsClassifier


In [3]:
iris = load_iris()
X = iris.data
y = iris.target

In [4]:
knn = KNeighborsClassifier(n_neighbors=3)
scores = cross_val_score(knn, X, y, cv=10)
print(f"Pontuações de Acurácia por Fold: {scores}")
print(f"Acurácia média: {scores.mean():.4f}")
print(f"Desvio padrão da Acurácia: {scores.std():.4f}")

Pontuações de Acurácia por Fold: [1.         0.93333333 1.         0.93333333 0.86666667 1.
 0.93333333 1.         1.         1.        ]
Acurácia média: 0.9667
Desvio padrão da Acurácia: 0.0447


In [5]:
knn = KNeighborsClassifier(n_neighbors=20)
scores = cross_val_score(knn, X, y, cv=10)
print(f"Pontuações de Acurácia por Fold: {scores}")
print(f"Acurácia média: {scores.mean():.4f}")
print(f"Desvio padrão da Acurácia: {scores.std():.4f}")

Pontuações de Acurácia por Fold: [1.         0.93333333 1.         1.         1.         0.93333333
 0.93333333 1.         1.         1.        ]
Acurácia média: 0.9800
Desvio padrão da Acurácia: 0.0306


In [6]:
from sklearn.neighbors import KNeighborsClassifier
from sklearn.model_selection import cross_val_score

best_n_neighbors = 1
best_score_mean = 0
best_score_std = float('inf')

for n in range(1, 51):
    knn = KNeighborsClassifier(n_neighbors=n)
    scores = cross_val_score(knn, X, y, cv=10)
    score_mean = scores.mean()
    score_std = scores.std()
    
    if score_mean > best_score_mean or (score_mean == best_score_mean and score_std < best_score_std):
        best_n_neighbors = n
        best_score_mean = score_mean
        best_score_std = score_std

print(f"Melhor quantidade de n_neighbors: {best_n_neighbors}")
print(f"Melhor acurácia média: {best_score_mean:.4f}")
print(f"Melhor desvio padrão da acurácia: {best_score_std:.4f}")


Melhor quantidade de n_neighbors: 13
Melhor acurácia média: 0.9800
Melhor desvio padrão da acurácia: 0.0306


In [7]:
knn_best = KNeighborsClassifier(n_neighbors=best_n_neighbors)
knn_best.fit(X, y)

In [8]:
novo_dado = np.array([[5.9, 2.8, 4.3, 1.3]])  # Exemplo de uma Iris setosa
previsao = knn_best.predict(novo_dado)
nome_especie = iris.target_names[previsao][0]

In [None]:
print(f"A previsão para o novo dado é: {nome_especie}")

A previsão para o novo dado é: versicolor


In [12]:
import numpy as np
np.random.seed(42)

setosa_samples = np.random.normal(loc=[5.0, 3.4, 1.5, 0.2], scale=[0.5, 0.5, 0.3, 0.1], size=(10, 4))
versicolor_samples = np.random.normal(loc=[5.9, 2.8, 4.3, 1.3], scale=[0.5, 0.5, 0.3, 0.1], size=(10, 4))
virginica_samples = np.random.normal(loc=[6.6, 3.0, 5.2, 2.0], scale=[0.5, 0.5, 0.3, 0.2], size=(10, 4))

all_samples = np.vstack([setosa_samples, versicolor_samples, virginica_samples])

real_labels = np.array([0]*10 + [1]*10 + [2]*10)

predictions = knn_best.predict(all_samples)

species_names = iris.target_names[predictions]

for i, (real, pred, name) in enumerate(zip(real_labels, predictions, species_names)):
    real_name = iris.target_names[real]
    if real != pred:
        print(f"Amostra {i+1}: Real = {real_name}, Previsto = {name}")

Amostra 28: Real = virginica, Previsto = versicolor
