In [1]:
import pandas as pd
import numpy as np
from sklearn.decomposition import PCA
from sklearn.datasets import load_iris

# Carregando o conjunto de dados Iris como exemplo
iris = load_iris()
X = iris.data
columns = iris.feature_names

# Criando um DataFrame do Pandas
df = pd.DataFrame(X, columns=columns)

# Inicializando e ajustando o PCA com 2 componentes principais
pca = PCA(n_components=2)
pca.fit(df)

# Transformando os dados originais no novo espaço de características
df_pca = pca.transform(df)

# Criando um novo DataFrame para os dados transformados
df_pca = pd.DataFrame(data=df_pca, columns=['PC1', 'PC2'])

# Concatenando os PCs com o DataFrame original para visualização
df_final = pd.concat([df, df_pca], axis=1)

# Visualizando os resultados
print("Dados originais com PCs:")
print(df_final.head())


Dados originais com PCs:
   sepal length (cm)  sepal width (cm)  petal length (cm)  petal width (cm)  \
0                5.1               3.5                1.4               0.2   
1                4.9               3.0                1.4               0.2   
2                4.7               3.2                1.3               0.2   
3                4.6               3.1                1.5               0.2   
4                5.0               3.6                1.4               0.2   

        PC1       PC2  
0 -2.684126  0.319397  
1 -2.714142 -0.177001  
2 -2.888991 -0.144949  
3 -2.745343 -0.318299  
4 -2.728717  0.326755  


In [2]:
teste = df.iloc[2:4]
teste

Unnamed: 0,sepal length (cm),sepal width (cm),petal length (cm),petal width (cm)
2,4.7,3.2,1.3,0.2
3,4.6,3.1,1.5,0.2


In [3]:
pca.transform(teste)

array([[-2.88899057, -0.14494943],
       [-2.74534286, -0.31829898]])

In [4]:
import bentoml 
import pandas as pd 
from bentoml.io import NumpyNdarray, PandasDataFrame, JSON 
import numpy as np 
from pydantic import BaseModel
import pickle

In [5]:
def load_scaler():
    try:
        with open("processors/scaler.pkl", "rb") as s:
            scaler = pickle.load(s)
        print("Scaler carregado com sucesso.")
        return scaler  # Retorna o scaler carregado
    except FileNotFoundError:
        print("Arquivo não encontrado. Verifique o caminho do arquivo.")
        return None
    except Exception as e:
        print(f"Erro ao carregar scaler: {e}")
        return None

def load_pca():
    try:
        with open("processors/PCA.pkl", "rb") as p:
            pca = pickle.load(p)
        print("PCA carregado com sucesso.")
        print(type(pca))
        return pca  # Retorna o PCA carregado
    except FileNotFoundError:
        print("Arquivo não encontrado. Verifique o caminho do arquivo.")
        return None
    except Exception as e:
        print(f"Erro ao carregar PCA: {e}")
        return None
    
class Customer(BaseModel):
    Income: float = 53138
    Recency: int = 58
    NumWebVisitsMonth: int = 7
    Complain: int = 0
    age: int = 64
    total_purchases: int = 25
    enrollment_years: int = 10
    family_size: int = 1

In [6]:
df_teste = pd.DataFrame([Customer().dict()])
df_teste

Unnamed: 0,Income,Recency,NumWebVisitsMonth,Complain,age,total_purchases,enrollment_years,family_size
0,53138,58,7,0,64,25,10,1


In [7]:
scaler = load_scaler()
scaled_df = pd.DataFrame(scaler.transform(df_teste), columns=df_teste.columns)
scaled_df

Scaler carregado com sucesso.


Unnamed: 0,Income,Recency,NumWebVisitsMonth,Complain,age,total_purchases,enrollment_years,family_size
0,0.054789,0.310353,0.692181,-0.09552,1.018352,1.317945,1.499086,-1.758359


In [8]:
pca_teste = load_pca()
pd.DataFrame(pca_teste.transform(scaled_df))

PCA carregado com sucesso.
<class 'sklearn.decomposition._pca.PCA'>


Unnamed: 0,0,1,2
0,1.028136,1.982411,-0.570848
