In [None]:
from sklearn.decomposition import PCA
import numpy as np

def analisis_pca_drift(datos_originales, datos_nuevos):
    """
    Detecta cambios en estructura de datos mediante PCA
    """
    # Combinar datos
    datos_combinados = np.vstack([
        datos_originales, 
        datos_nuevos
    ])
    
    # Aplicar PCA
    pca = PCA()
    pca.fit(datos_combinados)
    
    # Varianza explicada
    varianza_acumulada = np.cumsum(pca.explained_variance_ratio_)
    
    # Componentes principales
    componentes = pca.components_
    
    # Transformar datos
    datos_orig_pca = pca.transform(datos_originales)
    datos_nuevos_pca = pca.transform(datos_nuevos)
    
    # Comparar distribuciones de componentes principales
    diferencias = np.abs(
        np.mean(datos_orig_pca, axis=0) - 
        np.mean(datos_nuevos_pca, axis=0)
    )
    
    return {
        'varianza_explicada': varianza_acumulada,
        'diferencias_componentes': diferencias,
        'hay_drift': np.any(diferencias > 0.1)  # Umbral configurable
    }