In [10]:
from sklearn.datasets import load_iris
from sklearn.neighbors import KDTree
from collections import Counter
import numpy as np
import random

In [11]:
def partition(T, p):
    random.shuffle(T)
    return [T[i::p] for i in range(p)]

In [None]:
def knn_predict(data, x, k):
    
    # Convertir l'ensemble d'apprentissage en un tableau numpy pour les caractéristiques et les étiquettes
    X_train = np.array([x for x, _ in data])
    y_train = np.array([y for _, y in data])
    
    # Créer un KDTree à partir de l'ensemble d'apprentissage
    tree = KDTree(X_train)
    
    # Trouver les indices des k voisins les plus proches
    dists, indices = tree.query([x], k=k)
    
    # Obtenir les étiquettes des k voisins les plus proches
    k_nearest_labels = y_train[indices[0]]
    
    # Retourner l'étiquette la plus commune parmi les k voisins
    return Counter(k_nearest_labels).most_common(1)[0][0]

In [None]:
def KNNLearnInit(T, p):
    # Partitionner l'ensemble d'apprentissage T en p groupes (G1, G2, ..., Gp)
    groups = partition(T, p)
    
    candidate_values = [1, 2, 4, 6]
    
    errors = {Ki: [0 for _ in range(p)] for Ki in candidate_values}
    
    errSet = [[[] for _ in range(p)] for _ in candidate_values]
    
    for Ki in candidate_values:
        # Calculer i la position de Ki dans candidate_values
        i = candidate_values.index(Ki)
        
        for j, Gj in enumerate(groups):
            for x, y in Gj:
                data = [x for x in T if not any(np.array_equal(x[0], element[0]) and x[1] == element[1] for element in Gj)]
                if knn_predict(data, x, Ki) != y:
                    errSet[i][j].append((x,y))
            errors[Ki][j] = len(errSet[i][j]) / len(Gj)
            
        
        errors[Ki] = sum([errors[Ki][j] for j in range(p)]) / p
    
    # Obtenir Ki avec l'erreur minimale
    K_star = min(errors, key=errors.get)
    
    Error_star = [(groups[j], errSet[candidate_values.index(K_star)][j]) for j in range(p)]
    
    return K_star, Error_star



X, y = load_iris(return_X_y=True)

# # Créer une liste de paires (x, y) à partir de X et y
xy = list(zip(X, y))

print(KNNLearnInit(xy, 10))