# Module ACP

In [1]:
import numpy as np
import pandas as pd
import matplotlib
import matplotlib.pyplot as plt

from utilities import *

In [2]:
def observation():
    #mise en place des donnes
    X, y, Xtest, yt = load_data()
    Xr=X.reshape(X.shape[0],X.shape[1]*X.shape[2])
    
    # etape 1 : avoir la matrice de correlation
    Cor=np.corrcoef(Xr.T)
    
    # etape 2 : déterminer ses valeurs propres
    vals_propres,P = np.linalg.eig(Cor)
    
    # etape 3 : diagonaliser la matrice de corrélation. Soit P sa matrice de passage
    D = np.diag(vals_propres)
    
    # etape 4 : construire les deux composantes principales
    C = np.dot(Xr,P)
    Ct = np.transpose(C)
    
    #on isole nos 2 composantes principales
    C1 = Ct[0]
    C2 = Ct[1]
    
    #distinguer les elements, pour ensuite les visuliser
    def liste_chien_chat(y,composante):
        chien = []
        chat = []

        for k in range(len(y)):
            if y[k] == [0.]:
                chat.append(composante[k])
            else:
                chien.append(composante[k])
        return (chien,chat)
    
    (chien1,chat1) = liste_chien_chat(y,C1)
    (chien2,chat2) = liste_chien_chat(y,C2)
    
    plt.scatter(chien1,chien2,marker='o',color='gold',alpha = 0.7)
    plt.scatter(chat1,chat2,marker='.',color='steelblue', alpha = 0.7)
    plt.xlabel('CP 1')
    plt.ylabel('CP 2')
    plt.title("Tracé suivant les composantes principales")
    plt.show()


In [6]:
def acp_premier (nb_variable):
    
    #chargement des données
    X, y, Xtest, yt = load_data()
    Xr=X.reshape(X.shape[0],X.shape[1]*X.shape[2])
    maximum = Xr.shape[1]
    
    if nb_variable> maximum:
        print("Trop de variable prise en compte. Choisir un nombre entre 1 et",maximum)
        raise
    
    # etape 1 : avoir la matrice de correlation
    Cor=np.corrcoef(Xr.T)
    # etape 2 : déterminer ses valeurs propres
    vals_propres,P = np.linalg.eig(Cor)


    # Calculer l'inertie de la composante principale et du plan principal
    inertie_total = sum(vals_propres) 
    vals_propre_reduites = vals_propres[:nb_variable]
    inertie_pp = (vals_propres[0]+vals_propres[1])/inertie_total * 100
    
    inertie = sum(vals_propres[:nb_variable])/inertie_total * 100
    
    print('Inertie du plan principal = ', inertie_pp,'%')
    print('Inertie avec',nb_variable,'=', inertie,'%' )
    
    #dessin 
    liste = [i for i in range(nb_variable)]
    evol = []
    x = 0
    for k in vals_propre_reduites:
        x += k
        evol.append(x/inertie_total * 100)
        

    plt.plot(liste,evol)
    plt.title("Evolution de l'inertie en fonction du nombre de composant")
    plt.show()
    plt.scatter(liste,vals_propre_reduites)
    plt.title("Ebouli des valeurs propres")
    plt.show()
    

In [9]:
def acp_second(X, k):
    pca = PCA()
    ipca = IncrementalPCA(n_components=k)
    image_convertit = []
    for new_image in X:
        image_convertit.append(ipca.inverse_transform(ipca.fit_transform(new_image)))
    return np.array(image_convertit)