In [6]:
import numpy as np
import pandas as pd


class MyPCA:
    def __init__(self, n_components=3):
        self.n_components = n_components

    def __repr__(self):
        #Возвращает строковое представление объекта класса
        return f"MyPCA class: n_components={self.n_components}"
    
    def fit_transform(self, X):
    #Применяет метод PCA к входным данным и уменьшает их размерность
        
        # Преобразуем DataFrame в numpy массив
        X = X.values if isinstance(X, pd.DataFrame) else X

        # Центрируем данные (вычитаем среднее значение из каждого столбца)
        X_mean = np.mean(X, axis=0)
        X_centered = X - X_mean

        # Вычисляем ковариационную матрицу
        covariance_matrix = np.cov(X_centered, rowvar=False)

        # Собственные значения и собственные векторы
        eigenvalues, eigenvectors = np.linalg.eigh(covariance_matrix)

        # Сортируем собственные значения и векторы в порядке убывания
        sorted_indices = np.argsort(eigenvalues)[::-1]
        eigenvalues = eigenvalues[sorted_indices]
        eigenvectors = eigenvectors[:, sorted_indices]

        # Выбираем первые n_components собственных векторов
        principal_components = eigenvectors[:, :self.n_components]

        # Проецируем данные на главные компоненты
        X_reduced = np.dot(X_centered, principal_components)

        # Возвращаем результат в виде DataFrame
        return pd.DataFrame(X_reduced, columns=[f"PC{i+1}" for i in range(self.n_components)])



In [None]:
# Пример использования
if __name__ == "__main__":
    # Создаем тесты
    test_data_1 = pd.DataFrame({
        'A': [1, 2, 3, 4, 5],
        'B': [5, 4, 3, 2, 1],
        'C': [2, 3, 4, 5, 6]
    })

    test_data_2 = pd.DataFrame({
        'X': [10, 20, 30, 40, 50],
        'Y': [50, 40, 30, 20, 10],
        'Z': [5, 15, 25, 35, 45]
    })

    test_data_3 = pd.DataFrame({
        'P': [3, 6, 9, 12, 15],
        'Q': [8, 16, 24, 32, 40],
        'R': [1, 2, 3, 4, 5]
    })

    # Тестируем наш MyPCA
    my_pca = MyPCA(n_components=2)
    print("MyPCA Test 1:")
    print(my_pca.fit_transform(test_data_1))
    print("\nMyPCA Test 2:")
    print(my_pca.fit_transform(test_data_2))
    print("\nMyPCA Test 3:")
    print(my_pca.fit_transform(test_data_3))

In [4]:
# Пример класса
if __name__ == "__main__":
    # Создаем экземпляр класса с параметром n_components=3
    pca = MyPCA(n_components=3)
    print(pca)
    
    pca2 = MyPCA(n_components=5)
    print(pca2)
    
    pca3 = MyPCA(n_components=7)
    print(pca3)

MyPCA class: n_components=3
MyPCA class: n_components=5
MyPCA class: n_components=7
