In [5]:
from sklearn.datasets import make_regression
import pandas as pd
import numpy as np 

In [10]:
class MyKNNReg: 
    def __init__(self, k=3, metric='euclidean'): 
        self.k = k
        self.train_size = None
        self.metric = metric

        self.__valid()

    def __repr__(self): 
        return f'MyKNNReg class: k={self.k}'
   
    def __valid(self): 
        if self.metric not in ['euclidean', 'chebyshev', 'manhattan', 'cosine']:
            raise ValueError(f"Invalid metric '{self.metric}'. Choose from: 'euclidean', 'chebyshev', 'manhattan', 'cosine'.")
                               

    def fit(self, X: pd.DataFrame, y: pd.Series):
        self.__X_train, self.__y_train = X.values, y.values 
        self.train_size = X.shape
        
    def __metric(self, X_train :pd.DataFrame, X_test: pd.DataFrame):
        '''Этот метод принимает тренеровачные и тестовые данные и на них считает метрики'''
        if self.metric == 'euclidean':
            dist = np.sqrt(np.sum((X_train-X_test)**2, axis=1))
            return dist 
        if self.metric == 'chebyshev': 
            dist = np.max(np.abs(X_train - X_test), axis=1)
            return dist 
        if self.metric == 'manhattan':
            dist = np.sum(np.abs(X_train - X_test), axis=1)
            return dist 
        if self.metric == 'cosine': 
            dist = 1 - (np.dot(X_train, X_test) /
            (np.linalg.norm(X_train, axis=1) * np.linalg.norm(X_test)))
            return dist

    def predict(self, X: pd.DataFrame): 
        X_test = X.values
        preds = []
        for x in X_test:                                               ## проходимся по каждому объекту из тестовой выборки  
            ## расстояние для всех объектов  train
            dist = self.__metric(self__X_train, x) 
            k_idx = np.argsort(dist)[:self.k]                          ## сортируем расстояние по возрасстанию (сортируются поиндексно) возращаем k элементов
            k_val = self.__y_train[k_idx]                              ## находим значения самый ближайших точек
            preds.append(np.mean(k_val))                               ## усредняем и длавляем в список preds
        return np.array(preds)