<div align="center">

<a id="inicio"></a>
 
# üìä Aplicaciones de PCA en Ingenier√≠a Electr√≥nica

## üî¨ An√°lisis de Componentes Principales para Problemas Electr√≥nicos

**Casos pr√°cticos de Machine Learning aplicado a Electr√≥nica**

</div>

---

## üìã Contenido del Notebook

Este notebook presenta **un ejemplo introductorio con el dataset Iris** seguido de **tres aplicaciones pr√°cticas** del An√°lisis de Componentes Principales (PCA) en el dominio de la ingenier√≠a electr√≥nica:

[[ libs ]](#libs)

### üéØ Aplicaciones

- **[üîç PCA en el Dataset Iris](#iris)**
   - Visualizar las muestras antes y despu√©s de la transformaci√≥n PCA
   - An√°lisis de varianza explicada
   - Gr√°fico de codo para selecci√≥n de componentes

1. **[üîä Limpieza de Ruido en Se√±ales](#limpieza)**
   - Filtrado de se√±ales electr√≥nicas contaminadas
   - Mejora de SNR (Signal-to-Noise Ratio)
   - An√°lisis espectral comparativo

2. **[‚ö° Detecci√≥n de Fallas en Circuitos](#fallas)**
   - Identificaci√≥n de componentes defectuosos
   - An√°lisis de anomal√≠as en caracter√≠sticas el√©ctricas
   - Clasificaci√≥n con Machine Learning

3. **[üì∏ Compresi√≥n de Im√°genes de Componentes](#compresion)**
   - Reducci√≥n dimensional de im√°genes
   - Optimizaci√≥n de almacenamiento
   - Reconstrucci√≥n con p√©rdida controlada

- **[üìå Buenas Pr√°cticas al Usar PCA en Electr√≥nica](#recomendaciones)**

- **[üìö Recursos Adicionales](#referencias)**

---

### üõ†Ô∏è Herramientas Utilizadas

- **NumPy**: C√°lculo num√©rico y procesamiento de se√±ales
- **Pandas**: Manipulaci√≥n de datos
- **Matplotlib**: Visualizaci√≥n de resultados
- **Scikit-learn**: Implementaci√≥n de PCA y algoritmos ML
  - `PCA`: An√°lisis de Componentes Principales
  - `StandardScaler`: Normalizaci√≥n de datos
  - `IsolationForest`: Detecci√≥n de anomal√≠as

---

### üìö Conceptos Clave

- Descomposici√≥n en valores singulares (SVD)
- Reducci√≥n de dimensionalidad
- Varianza explicada
- Transformaci√≥n lineal
- Detecci√≥n de anomal√≠as
- Procesamiento de se√±ales digitales


---

<a id="libs"></a>
## üì¶ Importaci√≥n de Librer√≠as y Configuraci√≥n [‚Üë](#inicio)

---

Configuramos el entorno de trabajo importando las librer√≠as necesarias y suprimiendo warnings para mejor legibilidad.


In [None]:
# Cargar las librer√≠as necesarias
import warnings
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.datasets import load_iris
from sklearn.decomposition import PCA
from sklearn.preprocessing import StandardScaler
from sklearn.ensemble import IsolationForest

# ============================================================================
# SUPRIMIR WARNINGS
# ============================================================================
# Suprimir advertencias para visualizaci√≥n limpia
warnings.filterwarnings('ignore')

# Configuraci√≥n de NumPy para errores num√©ricos
np.seterr(divide='ignore', invalid='ignore', over='ignore')

# ============================================================================
# CONFIGURACI√ìN DE MATPLOTLIB
# ============================================================================
plt.rcParams['figure.figsize'] = (12, 8)
plt.rcParams['font.size'] = 12
plt.style.use('seaborn-v0_8')

print("‚úÖ Librer√≠as importadas correctamente")
print("‚úÖ Warnings suprimidos")

---

<a id="iris"></a>
# üîç Ejemplo Introductorio: PCA en el Dataset Iris [‚Üë](#inicio)

---

## üéØ Introducci√≥n

Antes de aplicar PCA a problemas de ingenier√≠a electr√≥nica, comenzamos con un ejemplo cl√°sico: el **dataset Iris**. Este conjunto de datos contiene mediciones de 150 flores de iris de tres especies diferentes.

## üìä Objetivos

- Visualizar los datos originales en 4 dimensiones
- Aplicar PCA para reducir a 2 componentes principales
- Analizar la varianza explicada
- Comparar visualizaciones antes y despu√©s de PCA


In [None]:
# Cargar el dataset Iris
iris = load_iris()
X = iris.data
y = iris.target
feature_names = iris.feature_names
target_names = iris.target_names

# Crear un DataFrame
df = pd.DataFrame(X, columns=feature_names)
df['target'] = y

# Seleccionar 10 muestras por clase (solo para mejor visualizacion de las muestras)
df_parcial = df.groupby('target').apply(lambda x: x.sample(n=10, random_state=42)).reset_index(drop=True)
df_parcial['class_name'] = df_parcial['target'].map(dict(enumerate(target_names)))

# Obtener la paleta de colores usada por Seaborn
palette = sns.color_palette("Set1", n_colors=3)

# Graficar dispersi√≥n de los dos primeros atributos originales
plt.figure(figsize=(8, 6))
for i, label in enumerate(target_names):
    plt.scatter(df_parcial.loc[df_parcial['target'] == i, feature_names[0]],
                df_parcial.loc[df_parcial['target'] == i, feature_names[1]],
                label=label,
                color=palette[i])  # usar el mismo color que sns
plt.xlabel(feature_names[0])
plt.ylabel(feature_names[1])
plt.title("Diagrama de dispersi√≥n de los dos primeros atributos (originales)")
plt.legend(loc='center left', bbox_to_anchor=(1, 0.5), title="class_name")
plt.grid(True)
plt.tight_layout()
plt.savefig("nuevo_iris_antes_del_PCA.png", format="png", dpi=100)
plt.show()

# Graficar todos los 6 diagramas de dispersi√≥n 2 a 2
sns.set(style="ticks")
sns.pairplot(df_parcial, hue="class_name", vars=feature_names, plot_kws={'alpha': 0.8, 's': 60}, palette='Set1')
plt.suptitle("Todos los diagramas de dispersi√≥n (atributos originales)", y=1.02)
plt.savefig("nuevo_iris_todos_antes_del_PCA.png", format="png", dpi=100)
plt.show()

# Crear el modelo PCA para poder obtener todos los componentes posibles (que este exemplo es 4)
pca = PCA()
# fit realiza la descomposici√≥n SVD de la matriz centrada
# transform proyecta los datos sobre los componentes principales (producto matricial XV)
X_pca = pca.fit_transform(df_parcial[feature_names])
print('Componentes principales. sklearn entrega la tranpuesta de V:\n', pca.components_)


# Crear DataFrame con solo los 2 primeros componentes, para graficar las muestras en el nuevo 2D
df_pca = pd.DataFrame(X_pca[:, :2], columns=['PCA1', 'PCA2'])
df_pca['target'] = df_parcial['target']

plt.figure(figsize=(8,6))
for i, label in enumerate(target_names):
    plt.scatter(df_pca.loc[df_pca['target'] == i, 'PCA1'],
                df_pca.loc[df_pca['target'] == i, 'PCA2'],
                label=label,
                color=palette[i])
plt.xlabel("Componente Principal 1")
plt.ylabel("Componente Principal 2")
plt.title("Diagrama de dispersi√≥n usando PCA (2 componentes principales)")
plt.legend(loc='center left', bbox_to_anchor=(1, 0.5), title="class_name")
plt.grid(True)
plt.tight_layout()
plt.savefig("nuevo_iris_despues_del_PCA.png", format="png", dpi=100)
plt.show()

#Proporci√≥n de la varianza explicada por cada componente
explained_var = pca.explained_variance_ratio_

print("Varianza explicada por cada componente:                       ", np.round(pca.explained_variance_ratio_, 4))
print("Varianza acumulada con los 2 primeros componentes principales:", round(np.sum(pca.explained_variance_ratio_[:2]), 4))
print("Varianza total acumulada:                                     ", round(np.sum(pca.explained_variance_ratio_), 4))

# √çndices de los componentes (1, 2, 3, ...)
components = np.arange(1, len(explained_var) + 1)
plt.figure(figsize=(8, 5))
# Barras: varianza explicada por componente
plt.bar(components, explained_var, alpha=0.5, align='center', label='Varianza por componente')
# Linea: varianza acumulada
plt.plot(components, np.cumsum(explained_var), marker='o', linestyle='--', color='b', label='Varianza acumulada')
plt.xlabel('N√∫mero de Componentes Principais')
plt.ylabel('Proporci√≥n de la Varianza Explicada')
plt.title('Gr√°fico de codo - PCA')
plt.xticks(components)
plt.legend(loc='center left', bbox_to_anchor=(1, 0.5), title='Con todos los componentes principales')
plt.grid(True)
plt.tight_layout()
plt.savefig("nuevo_iris_grafico_codo_PCA.png", format="png", dpi=100)
plt.show()


---

<a id="limpieza"></a>
# üîä Aplicaci√≥n 1: Limpieza de Ruido en Se√±ales Electr√≥nicas [‚Üë](#inicio)

---

## üéØ Problema

Las se√±ales electr√≥nicas est√°n frecuentemente contaminadas con ruido que degrada la calidad de la informaci√≥n transmitida. El ruido puede provenir de:
- üå°Ô∏è Ruido t√©rmico (Johnson-Nyquist)
- ‚ö° Interferencia electromagn√©tica (EMI)
- üîå Ruido de cuantizaci√≥n en ADC/DAC
- üì° Crosstalk entre se√±ales

## üí° Soluci√≥n con PCA

Utilizamos PCA para separar las componentes principales de la se√±al (informaci√≥n √∫til) del ruido (componentes de baja varianza), aplicando:
1. Segmentaci√≥n de la se√±al en ventanas temporales
2. Extracci√≥n de componentes principales
3. Reconstrucci√≥n usando solo componentes significativos


In [None]:
# ============================================================================
# FUNCI√ìN: Generar se√±al sint√©tica con ruido
# ============================================================================
def generar_se√±al_electr√≥nica(t, frecuencia=50, amplitud=1, ruido=0.3):
    """
    Genera una se√±al electr√≥nica sint√©tica con componentes arm√≥nicos y ruido.

    Par√°metros:
        t: Array de tiempo (segundos)
        frecuencia: Frecuencia fundamental de la se√±al (Hz)
        amplitud: Amplitud m√°xima de la se√±al (V)
        ruido: Factor de ruido a agregar (valor entre 0 y 1)

    Retorna:
        se√±al_limpia: Se√±al sin ruido (solo frecuencia fundamental + arm√≥nicos)
        se√±al_ruidosa: Se√±al con ruido gaussiano y de alta frecuencia a√±adido
    """

    # Componente principal: se√±al senoidal a la frecuencia fundamental
    se√±al_limpia = amplitud * np.sin(2 * np.pi * frecuencia * t)

    # Arm√≥nicos: componentes a frecuencias m√∫ltiplos de la fundamental
    # Tercer arm√≥nico (3x frecuencia fundamental, 30% de amplitud)
    arm√≥nico_1 = 0.3 * amplitud * np.sin(2 * np.pi * frecuencia * t * 3)
    # Quinto arm√≥nico (5x frecuencia fundamental, 10% de amplitud)
    arm√≥nico_2 = 0.1 * amplitud * np.sin(2 * np.pi * frecuencia * t * 5)

    # Ruido gaussiano: distribuci√≥n normal con media 0 y desviaci√≥n est√°ndar 1
    # Simula ruido t√©rmico y de cuantizaci√≥n
    ruido_gaussiano = ruido * np.random.normal(0, 1, len(t))

    # Ruido de alta frecuencia: simula interferencia electromagn√©tica
    # Frecuencia 50 veces mayor que la fundamental (2.5 kHz si f=50Hz)
    ruido_af = 0.2 * ruido * amplitud * np.sin(2 * np.pi * frecuencia * t * 50)

    # Se√±al final: combinaci√≥n de componentes limpias + ruido
    se√±al_ruidosa = se√±al_limpia + arm√≥nico_1 + arm√≥nico_2 + ruido_gaussiano + ruido_af

    return se√±al_limpia, se√±al_ruidosa

# ============================================================================
# GENERACI√ìN DE SE√ëALES PARA AN√ÅLISIS
# ============================================================================

# Crear vector de tiempo: 1000 muestras distribuidas uniformemente en 1 segundo
# Esto da una tasa de muestreo de 1000 Hz
tiempo = np.linspace(0, 1, 1000)

# Generar las se√±ales limpia y ruidosa
se√±al_limpia, se√±al_ruidosa = generar_se√±al_electr√≥nica(tiempo)

# ============================================================================
# AN√ÅLISIS ESPECTRAL MEDIANTE TRANSFORMADA DE FOURIER
# ============================================================================

# Transformada de Fourier: convierte se√±al del dominio temporal al frecuencial
fft_limpia = np.fft.fft(se√±al_limpia)      # FFT de la se√±al limpia
fft_ruidosa = np.fft.fft(se√±al_ruidosa)    # FFT de la se√±al con ruido

# Calcular las frecuencias correspondientes a cada componente de la FFT
# El segundo argumento es el per√≠odo de muestreo (diferencia entre muestras consecutivas)
frecuencias = np.fft.fftfreq(len(tiempo), tiempo[1] - tiempo[0])

In [None]:
# Tama√±o de las se√±ales
print(f"    Se√±al limpia: {se√±al_limpia.shape}, Se√±al ruidosa: {se√±al_ruidosa.shape}")

In [None]:
# ============================================================================
# VISUALIZACI√ìN: Se√±ales originales y an√°lisis espectral
# ============================================================================
def gr√°ficos():
    """Visualiza las se√±ales en dominio temporal y frecuencial."""

    plt.figure(figsize=(15, 10))

    # ========================================================================
    # GR√ÅFICO 1: Se√±ales en dominio temporal
    # ========================================================================
    plt.subplot(2, 2, 1)
    plt.plot(tiempo, se√±al_limpia, 'b-', linewidth=2, label='Se√±al limpia')
    plt.plot(tiempo, se√±al_ruidosa, 'r-', alpha=0.7, label='Se√±al ruidosa')
    plt.title('Se√±al Electr√≥nica: Original vs Con Ruido')
    plt.xlabel('Tiempo (s)')
    plt.ylabel('Amplitud (V)')
    plt.legend()
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 2: An√°lisis espectral (dominio frecuencial)
    # ========================================================================
    plt.subplot(2, 2, 2)
    # Mostrar solo frecuencias positivas (la mitad del espectro)
    plt.plot(frecuencias[:len(frecuencias)//2],
             np.abs(fft_limpia[:len(frecuencias)//2]),
             'b-', label='Espectro Original')
    plt.plot(frecuencias[:len(frecuencias)//2],
             np.abs(fft_ruidosa[:len(frecuencias)//2]),
             'r-', alpha=0.7, label='Espectro con Ruido')
    plt.title('An√°lisis Espectral')
    plt.xlabel('Frecuencia (Hz)')
    plt.ylabel('Magnitud')
    plt.legend()
    plt.grid(True, alpha=0.3)

    plt.tight_layout()
    plt.show()

    # ========================================================================
    # C√ÅLCULO DE SNR (Relaci√≥n Se√±al/Ruido)
    # ========================================================================
    # SNR en dB: 20*log10(potencia_se√±al / potencia_ruido)
    snr_db = 20*np.log10(np.std(se√±al_limpia)/np.std(se√±al_ruidosa - se√±al_limpia))

    print(f"SNR (Signal-to-Noise Ratio) estimado: {snr_db:.2f} dB")
    print(f"Relaci√≥n entre la potencia de la se√±al y la potencia del ruido")

gr√°ficos()

In [None]:
# ============================================================================
# FUNCI√ìN: Reducci√≥n de ruido mediante PCA
# ============================================================================
def reducir_ruido_con_pca(se√±al, n_ventanas=50, n_componentes=5):
    """
    Reduce el ruido de una se√±al mediante PCA aplicado a ventanas deslizantes.

    El m√©todo divide la se√±al en ventanas y aplica PCA para identificar y conservar
    solo los componentes principales (que contienen la se√±al √∫til), eliminando
    componentes de menor varianza (que t√≠picamente corresponden al ruido).

    Par√°metros:
        se√±al: Array con los valores de la se√±al ruidosa
        n_ventanas: N√∫mero de ventanas en que se divide la se√±al (default: 50)
        n_componentes: N√∫mero de componentes principales a conservar (default: 5)

    Retorna:
        se√±al_filtrada: Se√±al reconstruida con ruido reducido
        varianza_explicada: Array con la varianza explicada por cada componente
    """

    # ========================================================================
    # PASO 1: Dividir la se√±al en ventanas
    # ========================================================================
    # Calcular el tama√±o de cada ventana (ej: 1000 muestras / 50 ventanas = 20 muestras/ventana)
    tama√±o_ventana = len(se√±al) // n_ventanas

    # Lista para almacenar cada segmento de la se√±al
    ventanas = []

    # Dividir la se√±al en segmentos (ventanas) no solapados
    for i in range(n_ventanas):
        √≠ndice_inicio = i * tama√±o_ventana
        √≠ndice_fin = √≠ndice_inicio + tama√±o_ventana

        # Verificar que no excedamos el tama√±o de la se√±al
        if √≠ndice_fin <= len(se√±al):
            ventanas.append(se√±al[√≠ndice_inicio:√≠ndice_fin])

    # ========================================================================
    # PASO 2: Convertir a matriz para aplicar PCA
    # ========================================================================
    # Cada fila representa una ventana, cada columna una muestra temporal
    # Matriz resultante: (n_ventanas x tama√±o_ventana)
    matriz_ventanas = np.array(ventanas)

    # Normalizar cada ventana (restar media de cada ventana)
    # Esto evita problemas num√©ricos en el PCA
    matriz_ventanas = matriz_ventanas - np.mean(matriz_ventanas, axis=1, keepdims=True)

    # ========================================================================
    # PASO 3: Aplicar PCA para extraer componentes principales
    # ========================================================================
    # Crear modelo PCA que conservar√° solo los n componentes m√°s importantes
    modelo_pca = PCA(n_components=n_componentes)

    # Ajustar el modelo: calcular componentes principales a partir de las ventanas
    modelo_pca.fit(matriz_ventanas)

    # ========================================================================
    # PASO 4: Transformar se√±al al espacio de componentes principales
    # ========================================================================
    # Proyectar las ventanas al nuevo espacio de menor dimensi√≥n
    # Matriz resultante: (n_ventanas x n_componentes)
    se√±al_transformada = modelo_pca.transform(matriz_ventanas)

    # ========================================================================
    # PASO 5: Reconstruir se√±al desde componentes principales
    # ========================================================================
    # Transformaci√≥n inversa: de espacio PCA de vuelta al espacio original
    # Solo usa los n_componentes principales, eliminando componentes de ruido
    se√±al_reconstruida = modelo_pca.inverse_transform(se√±al_transformada)

    # ========================================================================
    # PASO 6: Ensamblar la se√±al completa desde las ventanas reconstruidas
    # ========================================================================
    # Crear array vac√≠o del mismo tama√±o que la se√±al original
    se√±al_filtrada = np.zeros_like(se√±al)

    # Colocar cada ventana reconstruida en su posici√≥n original
    for i, ventana in enumerate(se√±al_reconstruida):
        √≠ndice_inicio = i * tama√±o_ventana
        √≠ndice_fin = √≠ndice_inicio + tama√±o_ventana

        if √≠ndice_fin <= len(se√±al):
            se√±al_filtrada[√≠ndice_inicio:√≠ndice_fin] = ventana

    # Mostrar dimensiones en cada paso del procesamiento
    print(f"Se√±al: {se√±al.shape} -> {matriz_ventanas.shape} -> {se√±al_transformada.shape} ->"
          f"{se√±al_reconstruida.shape} -> {se√±al_filtrada.shape}")

    return se√±al_filtrada, modelo_pca.explained_variance_ratio_

# ============================================================================
# APLICAR FILTRADO PCA A LA SE√ëAL RUIDOSA
# ============================================================================
se√±al_filtrada, varianza_explicada = reducir_ruido_con_pca(se√±al_ruidosa)

In [None]:
# Para hacer pruebas


In [None]:
# ============================================================================
# VISUALIZACI√ìN: Resultados del filtrado PCA
# ============================================================================
def gr√°ficos():
    """Visualiza el efecto del filtrado PCA en la reducci√≥n de ruido."""

    plt.figure(figsize=(15, 12))

    # ========================================================================
    # GR√ÅFICO 1: Comparaci√≥n se√±al original vs se√±al ruidosa
    # ========================================================================
    plt.subplot(3, 2, 1)
    plt.plot(tiempo, se√±al_limpia,  'b-', linewidth=2, label='Se√±al Original')
    plt.plot(tiempo, se√±al_ruidosa, 'r:', alpha=0.5,   label='Se√±al con Ruido')
    plt.title('Comparaci√≥n de Se√±ales')
    plt.xlabel('Tiempo (s)')
    plt.ylabel('Amplitud (V)')
    plt.legend()
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 2: Se√±al original vs se√±al filtrada con PCA
    # ========================================================================
    plt.subplot(3, 2, 2)
    plt.plot(tiempo, se√±al_limpia,   'b-', linewidth=2, label='Se√±al Original')
    plt.plot(tiempo, se√±al_filtrada, 'g:', linewidth=2, label='Se√±al Filtrada con PCA')
    plt.title('Resultado del Filtrado PCA')
    plt.xlabel('Tiempo (s)')
    plt.ylabel('Amplitud (V)')
    plt.legend()
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 3: An√°lisis del ruido removido
    # ========================================================================
    plt.subplot(3, 2, 3)
    ruido_original = se√±al_ruidosa - se√±al_limpia
    ruido_residual = se√±al_filtrada - se√±al_limpia

    plt.plot(tiempo, ruido_original,  'r-', alpha=0.7, label='Ruido Original')
    plt.plot(tiempo, ruido_residual, 'g:', alpha=0.7, label='Ruido Residual')
    plt.title('An√°lisis del Ruido')
    plt.xlabel('Tiempo (s)')
    plt.ylabel('Amplitud del Ruido (V)')
    plt.legend()
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 4: Varianza explicada por cada componente principal
    # ========================================================================
    plt.subplot(3, 2, 4)
    plt.bar(range(1, len(varianza_explicada)+1), varianza_explicada, color='blue')
    plt.title('Varianza Explicada por Componentes')
    plt.xlabel('Componente Principal')
    plt.ylabel('Varianza Explicada')
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 5: An√°lisis espectral comparativo
    # ========================================================================
    # Calcular FFT de la se√±al filtrada
    fft_filtrada = np.fft.fft(se√±al_filtrada)

    plt.subplot(3, 2, 5)
    plt.plot(frecuencias[:len(frecuencias)//2],
             np.abs(fft_limpia[:len(frecuencias)//2]),
             'b-', label='Original')
    plt.plot(frecuencias[:len(frecuencias)//2],
             np.abs(fft_ruidosa[:len(frecuencias)//2]),
             'r-', alpha=0.5, label='Con Ruido')
    plt.plot(frecuencias[:len(frecuencias)//2],
             np.abs(fft_filtrada[:len(frecuencias)//2]),
             'g:', label='Filtrada')
    plt.title('Espectros Comparativos')
    plt.xlabel('Frecuencia (Hz)')
    plt.ylabel('Magnitud')
    plt.legend()
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 6: M√©tricas de calidad (SNR)
    # ========================================================================
    # Calcular SNR para se√±al ruidosa y filtrada
    snr_original = 20*np.log10(np.std(se√±al_limpia)/np.std(ruido_original))
    snr_filtrada = 20*np.log10(np.std(se√±al_limpia)/np.std(ruido_residual))
    mejora_snr = snr_filtrada - snr_original

    plt.subplot(3, 2, 6)
    metricas = ['SNR Original', 'SNR Filtrada', 'Mejora SNR']
    valores = [snr_original, snr_filtrada, mejora_snr]
    colores = ['blue', 'green', 'purple']
    plt.bar(metricas, valores, color=colores, alpha=0.7)
    plt.title('M√©tricas de Calidad')
    plt.ylabel('SNR (dB)')
    plt.grid(True, alpha=0.3)

    plt.tight_layout()
    plt.show()

    # ========================================================================
    # RESUMEN NUM√âRICO
    # ========================================================================
    print(f"M√©tricas de Calidad del Filtrado:")
    print(f"=" * 50)
    print(f"SNR Original: {snr_original:.2f} dB")           # Se√±al ruidosa
    print(f"SNR Filtrada: {snr_filtrada:.2f} dB")           # Despu√©s de PCA
    print(f"Mejora en SNR: {mejora_snr:.2f} dB")            # Ganancia obtenida
    print(f"Varianza total explicada: {np.sum(varianza_explicada):.3f} ({np.sum(varianza_explicada)*100:.1f}%)")

gr√°ficos()

---

<a id="fallas"></a>
# ‚ö° Aplicaci√≥n 2: Detecci√≥n de Fallas en Circuitos Electr√≥nicos [‚Üë](#inicio)

---

## üéØ Problema

Identificar componentes defectuosos en circuitos electr√≥nicos mediante el an√°lisis de sus caracter√≠sticas el√©ctricas medidas:
- üîå Resistencia, capacitancia, inductancia
- üìà Impedancia y factor de calidad
- üå°Ô∏è Temperatura y corriente de fuga
- üìä Par√°metros de operaci√≥n fuera de especificaci√≥n

## üí° Soluci√≥n con PCA

Combinamos PCA con algoritmos de detecci√≥n de anomal√≠as:
1. Reducci√≥n dimensional de caracter√≠sticas el√©ctricas
2. Identificaci√≥n de patrones an√≥malos
3. Clasificaci√≥n con Isolation Forest


In [None]:
# ============================================================================
# FUNCI√ìN: Generaci√≥n de datos sint√©ticos de circuitos electr√≥nicos
# ============================================================================
def generar_datos_circuito(n_muestras=200, probabilidad_falla=0.1):
    """
    Simula mediciones de caracter√≠sticas el√©ctricas de circuitos, incluyendo
    componentes normales y defectuosos.

    Genera datos sint√©ticos de 10 caracter√≠sticas el√©ctricas medidas en circuitos.
    Algunos circuitos tienen fallas introducidas aleatoriamente.

    Par√°metros:
        n_muestras: N√∫mero total de circuitos a simular (default: 200)
        probabilidad_falla: Probabilidad de que un circuito tenga falla (default: 0.1 = 10%)

    Retorna:
        datos_normales: Array (n x 11) con circuitos normales + etiqueta [0]
        datos_fallas: Array (m x 11) con circuitos defectuosos + etiqueta [1]
    """

    # Listas para almacenar circuitos normales y defectuosos
    datos_normales = []
    datos_fallas = []

    # Generar n_muestras de circuitos
    for _ in range(n_muestras):
        # ====================================================================
        # CARACTER√çSTICAS EL√âCTRICAS T√çPICAS DE UN CIRCUITO
        # ====================================================================
        # Cada caracter√≠stica sigue una distribuci√≥n normal con media y desviaci√≥n

        resistencia = np.random.normal(100, 10)                 # 100Œ© ¬± 10Œ© (tolerancia 10%)
        capacitancia = np.random.normal(1e-6, 1e-7)             # 1¬µF ¬± 0.1¬µF
        inductancia = np.random.normal(1e-3, 1e-4)              # 1mH ¬± 0.1mH
        frecuencia_resonancia = np.random.normal(1000, 100)     # 1kHz ¬± 100Hz
        impedancia = np.random.normal(50, 5)                    # 50Œ© ¬± 5Œ©
        factor_calidad = np.random.normal(100, 10)              # Factor Q ¬± 10%
        temperatura = np.random.normal(25, 5)                   # 25¬∞C ¬± 5¬∞C
        humedad = np.random.normal(50, 10)                      # 50% ¬± 10%
        voltaje_ruido = np.random.normal(0, 0.1)                # 0V ¬± 0.1V (ruido)
        corriente_fuga = np.random.normal(1e-9, 1e-10)          # 1nA ¬± 0.1nA

        # Vector con todas las caracter√≠sticas del circuito
        caracteristicas = [
            resistencia, capacitancia, inductancia, frecuencia_resonancia,
            impedancia, factor_calidad, temperatura, humedad,
            voltaje_ruido, corriente_fuga
        ]

        # ====================================================================
        # INTRODUCIR FALLAS ALEATORIAS EN ALGUNOS CIRCUITOS
        # ====================================================================
        if np.random.random() < probabilidad_falla:
            # Seleccionar tipo de falla aleatoriamente
            tipo_falla = np.random.choice(['resistencia_alta', 'capacitancia_baja', 'ruido_excesivo'])

            # Modificar la caracter√≠stica correspondiente seg√∫n el tipo de falla
            if tipo_falla == 'resistencia_alta':
                # Resistencia 2-5 veces mayor (componente quemado o degradado)
                caracteristicas[0] *= np.random.uniform(2, 5)

            elif tipo_falla == 'capacitancia_baja':
                # Capacitancia reducida al 10-50% (capacitor degradado o seco)
                caracteristicas[1] *= np.random.uniform(0.1, 0.5)

            elif tipo_falla == 'ruido_excesivo':
                # Ruido 5-20 veces mayor (mal filtrado o conexiones defectuosas)
                caracteristicas[8] *= np.random.uniform(5, 20)

            # Agregar etiqueta de falla [1] al final del vector
            datos_fallas.append(caracteristicas + [1])
        else:
            # Agregar etiqueta normal [0] al final del vector
            datos_normales.append(caracteristicas + [0])

    return np.array(datos_normales), np.array(datos_fallas)

# ============================================================================
# GENERAR DATASET DE CIRCUITOS ELECTR√ìNICOS
# ============================================================================

# Generar datos sint√©ticos de circuitos normales y con fallas
datos_normales, datos_fallas = generar_datos_circuito()
# Resultado: dos matrices (n x 11) y (m x 11) donde n + m = 200

# ============================================================================
# PREPARAR DATOS PARA AN√ÅLISIS
# ============================================================================

# Combinar circuitos normales y defectuosos en un √∫nico dataset
todos_datos = np.vstack([datos_normales, datos_fallas])

# Separar caracter√≠sticas (X) y etiquetas (y)
X = todos_datos[:, :-1]  # Primeras 10 columnas: caracter√≠sticas el√©ctricas
y = todos_datos[:, -1]   # √öltima columna: etiqueta (0=normal, 1=falla)

# Definir nombres descriptivos para cada caracter√≠stica
nombres_caracteristicas = [
    'Resistencia (Œ©)', 'Capacitancia (F)', 'Inductancia (H)', 'F Resonancia (Hz)',
    'Impedancia (Œ©)', 'Factor Calidad', 'Temperatura (¬∞C)', 'Humedad (%)',
    'Voltaje Ruido (V)', 'Corriente Fuga (A)'
]

# ============================================================================
# RESUMEN DEL DATASET GENERADO
# ============================================================================
print(f"Datos generados: {len(datos_normales)} normales, {len(datos_fallas)} con fallas")
print(f"Total de caracter√≠sticas: {X.shape[1]}")
print(f"Tasa de fallas: {len(datos_fallas)/len(todos_datos)*100:.1f}%")

In [None]:
# Pruebas: m√°s info de los datos
datos_normales.shape, datos_fallas.shape, todos_datos.shape, X.shape, y.shape

In [None]:
# ============================================================================
# VISUALIZACI√ìN: An√°lisis exploratorio de datos de circuitos
# ============================================================================
def gr√°ficos():
    """Visualiza distribuciones y estad√≠sticas de caracter√≠sticas de circuitos."""
    plt.figure(figsize=(15, 10))

    # Matriz de correlaci√≥n
    plt.subplot(2, 3, 1)
    correlacion = np.corrcoef(X.T)
    im = plt.imshow(correlacion, cmap='coolwarm', aspect='auto')
    plt.colorbar(im)
    plt.title('Matriz de Correlaci√≥n')
    plt.xlabel('Caracter√≠sticas')
    plt.ylabel('Caracter√≠sticas')

    # Distribuci√≥n de caracter√≠sticas principales
    plt.subplot(2, 3, 2)
    plt.hist(X[y==0, 0], bins=20, alpha=0.7, label='Normal', color='blue')
    plt.hist(X[y==1, 0], bins=20, alpha=0.7, label='Falla', color='red')
    plt.xlabel('Resistencia (Œ©)')
    plt.ylabel('Frecuencia')
    plt.title('Distribuci√≥n de Resistencia')
    plt.legend()

    plt.subplot(2, 3, 3)
    plt.hist(X[y==0, 1], bins=20, alpha=0.7, label='Normal', color='blue')
    plt.hist(X[y==1, 1], bins=20, alpha=0.7, label='Falla', color='red')
    plt.xlabel('Capacitancia (F)')
    plt.ylabel('Frecuencia')
    plt.title('Distribuci√≥n de Capacitancia')
    plt.legend()

    # Boxplot de caracter√≠sticas
    plt.subplot(2, 3, 4)
    datos_plot = [X[y==0, 8], X[y==1, 8]]  # Voltaje de ruido
    plt.boxplot(datos_plot, tick_labels=['Normal', 'Falla'])
    plt.ylabel('Voltaje Ruido (V)')
    plt.title('Distribuci√≥n del Ruido')

    # Scatter plot de dos caracter√≠sticas
    plt.subplot(2, 3, 5)
    plt.scatter(X[y==0, 0], X[y==0, 1], alpha=0.6, label='Normal', color='blue')
    plt.scatter(X[y==1, 0], X[y==1, 1], alpha=0.6, label='Falla', color='red')
    plt.xlabel('Resistencia (Œ©)')
    plt.ylabel('Capacitancia (F)')
    plt.title('Resistencia vs Capacitancia')
    plt.legend()

    # Estad√≠sticas por tipo
    plt.subplot(2, 3, 6)
    estadisticas = ['Media', 'Desv. Est.', 'Min', 'Max']
    valores_normales = [np.mean(X[y==0, 0]), np.std(X[y==0, 0]), np.min(X[y==0, 0]), np.max(X[y==0, 0])]
    valores_fallas = [np.mean(X[y==1, 0]), np.std(X[y==1, 0]), np.min(X[y==1, 0]), np.max(X[y==1, 0])]

    x = np.arange(len(estadisticas))
    width = 0.35

    plt.bar(x - width/2, valores_normales, width, label='Normal', alpha=0.7, color='blue')
    plt.bar(x + width/2, valores_fallas, width, label='Falla', alpha=0.7, color='red')
    plt.xlabel('Estad√≠sticas')
    plt.ylabel('Resistencia (Œ©)')
    plt.title('Estad√≠sticas de Resistencia')
    plt.xticks(x, estadisticas)
    plt.legend()

    plt.tight_layout()
    plt.show()

    # Estad√≠sticas descriptivas
    print("Estad√≠sticas Descriptivas:")
    print("="*50)
    df_stats = pd.DataFrame(X, columns=nombres_caracteristicas)
    df_stats['Estado'] = ['Normal' if label == 0 else 'Falla' for label in y]
    print(df_stats.groupby('Estado').describe().round(3))
gr√°ficos()

In [None]:
# ============================================================================
# FUNCI√ìN: Aplicar PCA para detecci√≥n de fallas en circuitos
# ============================================================================
def aplicar_pca_detecci√≥n_fallas(caracter√≠sticas, etiquetas, n_componentes):
    """
    Aplica PCA a datos de circuitos para reducir dimensionalidad y facilitar
    la detecci√≥n de fallas mediante visualizaci√≥n y an√°lisis de anomal√≠as.

    Par√°metros:
        caracter√≠sticas: Array (n x m) con m caracter√≠sticas de n circuitos
        etiquetas: Array (n) con etiquetas 0=normal, 1=falla
        n_componentes: N√∫mero de componentes principales a extraer

    Retorna:
        datos_pca: Array transformado en espacio PCA reducido
        modelo_pca: Modelo PCA ajustado (para transformaciones futuras)
        normalizador: Escalador ajustado (para normalizar nuevos datos)
        df_pca: DataFrame con componentes principales y etiquetas
    """

    # ========================================================================
    # PASO 1: Normalizaci√≥n de datos
    # ========================================================================
    # Estandarizar cada caracter√≠stica: media = 0, desviaci√≥n est√°ndar = 1
    # Esto es crucial porque las caracter√≠sticas tienen diferentes escalas
    # (ej: resistencia ~100Œ© vs corriente de fuga ~1e-9A)
    normalizador = StandardScaler()
    caracter√≠sticas_normalizadas = normalizador.fit_transform(caracter√≠sticas)

    # Reemplazar cualquier NaN o Inf que pueda haber surgido
    caracter√≠sticas_normalizadas = np.nan_to_num(caracter√≠sticas_normalizadas, nan=0.0, posinf=0.0, neginf=0.0)

    # ========================================================================
    # PASO 2: Aplicar PCA
    # ========================================================================
    # Crear y ajustar modelo PCA con SVD para mayor estabilidad num√©rica
    modelo_pca = PCA(n_components=n_componentes, svd_solver='full')

    # Transformar datos al espacio de componentes principales
    # Cada componente es una combinaci√≥n lineal de las caracter√≠sticas originales
    datos_pca = modelo_pca.fit_transform(caracter√≠sticas_normalizadas)

    # ========================================================================
    # PASO 3: Organizar resultados en DataFrame para an√°lisis
    # ========================================================================
    # Crear DataFrame con componentes principales
    df_pca = pd.DataFrame(datos_pca, columns=[f'PC{i+1}' for i in range(n_componentes)])

    # Agregar columna con estado del circuito (Normal/Falla)
    df_pca['Estado'] = ['Normal' if etiq == 0 else 'Falla' for etiq in etiquetas]

    # Mostrar transformaci√≥n de dimensiones
    print(f"Transformaci√≥n: {caracter√≠sticas.shape} --> {caracter√≠sticas_normalizadas.shape} --> {datos_pca.shape}")
    print(f"Reducci√≥n: {caracter√≠sticas.shape[1]} caracter√≠sticas --> {datos_pca.shape[1]} componentes principales")

    return datos_pca, modelo_pca, normalizador, df_pca

# ============================================================================
# APLICAR PCA AL DATASET DE CIRCUITOS
# ============================================================================
# Reducir de 10 caracter√≠sticas a 3 componentes principales
X_pca, modelo_pca, normalizador, df_pca = aplicar_pca_detecci√≥n_fallas(X, y, n_componentes=3)

In [None]:
# para hacer pruebas
df_pca


In [None]:
# ============================================================================
# VISUALIZACI√ìN: Resultados del PCA en detecci√≥n de fallas
# ============================================================================
def gr√°ficos():
    """Visualiza los resultados del an√°lisis PCA aplicado a datos de circuitos."""

    plt.figure(figsize=(15, 12))

    # ========================================================================
    # GR√ÅFICO 1: Varianza explicada por cada componente principal
    # ========================================================================
    plt.subplot(2, 3, 1)
    plt.bar(range(1, len(modelo_pca.explained_variance_ratio_)+1),
            modelo_pca.explained_variance_ratio_,
            color=['blue', 'green','brown'])
    plt.xlabel('Componente Principal')
    plt.ylabel('Varianza Explicada')
    plt.title('Varianza Explicada por Componentes')
    plt.xticks(range(1, len(modelo_pca.explained_variance_ratio_)+1),
               [f'PC{i+1}' for i in range(len(modelo_pca.explained_variance_ratio_))],
               rotation=45)
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 2: Varianza acumulada
    # ========================================================================
    plt.subplot(2, 3, 2)
    varianza_acumulada = np.cumsum(modelo_pca.explained_variance_ratio_)
    plt.plot(range(1, len(varianza_acumulada)+1), varianza_acumulada, 'bo-')
    plt.xticks(range(1, len(varianza_acumulada)+1),
               [f'PC{i+1}' for i in range(len(varianza_acumulada))],
               rotation=45)
    plt.xlabel('N√∫mero de Componentes')
    plt.ylabel('Varianza Acumulada')
    plt.title('Varianza Acumulada')
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 3: Scatter plot PC1 vs PC2
    # ========================================================================
    plt.subplot(2, 3, 3)
    # Crear m√°scaras para separar circuitos normales y defectuosos
    mascara_normal = df_pca['Estado'] == 'Normal'
    mascara_falla = df_pca['Estado'] == 'Falla'

    plt.scatter(df_pca[mascara_normal]['PC1'], df_pca[mascara_normal]['PC2'],
               alpha=0.6, label='Normal', color='blue')
    plt.scatter(df_pca[mascara_falla]['PC1'], df_pca[mascara_falla]['PC2'],
               alpha=0.6, label='Falla', color='red')
    plt.xlabel('Primera Componente Principal')
    plt.ylabel('Segunda Componente Principal')
    plt.title('PCA: PC1 vs PC2')
    plt.legend()
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 4: Scatter plot PC1 vs PC3
    # ========================================================================
    plt.subplot(2, 3, 4)
    plt.scatter(df_pca[mascara_normal]['PC1'], df_pca[mascara_normal]['PC3'],
               alpha=0.6, label='Normal', color='blue')
    plt.scatter(df_pca[mascara_falla]['PC1'], df_pca[mascara_falla]['PC3'],
               alpha=0.6, label='Falla', color='red')
    plt.xlabel('Primera Componente Principal')
    plt.ylabel('Tercera Componente Principal')
    plt.title('PCA: PC1 vs PC3')
    plt.legend()
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 5: Scatter plot PC2 vs PC3
    # ========================================================================
    plt.subplot(2, 3, 5)
    plt.scatter(df_pca[mascara_normal]['PC2'], df_pca[mascara_normal]['PC3'],
               alpha=0.6, label='Normal', color='blue')
    plt.scatter(df_pca[mascara_falla]['PC2'], df_pca[mascara_falla]['PC3'],
               alpha=0.6, label='Falla', color='red')
    plt.xlabel('Segunda Componente Principal')
    plt.ylabel('Tercera Componente Principal')
    plt.title('PCA: PC2 vs PC3')
    plt.legend()
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 6: Contribuci√≥n de caracter√≠sticas originales a cada PC
    # ========================================================================
    plt.subplot(2, 3, 6)
    # Matriz de componentes: muestra c√≥mo cada caracter√≠stica original
    # contribuye a cada componente principal
    componentes = modelo_pca.components_
    plt.imshow(componentes, cmap='coolwarm', aspect='auto')
    plt.colorbar()
    plt.xlabel('Caracter√≠sticas Originales')
    plt.ylabel('Componentes Principales')
    plt.title('Contribuci√≥n de Caracter√≠sticas')
    plt.xticks(range(len(nombres_caracteristicas)), nombres_caracteristicas, rotation=90)

    plt.tight_layout()
    plt.show()

    # ========================================================================
    # RESUMEN NUM√âRICO
    # ========================================================================
    print(f"Varianza explicada por los primeros {len(modelo_pca.explained_variance_ratio_)} componentes:")
    for i, varianza in enumerate(modelo_pca.explained_variance_ratio_):
        print(f"  PC{i+1}: {varianza:.3f} ({varianza*100:.1f}%)")

    print(f"\nVarianza total explicada: {np.sum(modelo_pca.explained_variance_ratio_):.3f} ({np.sum(modelo_pca.explained_variance_ratio_)*100:.1f}%)")

gr√°ficos()

In [None]:
# ============================================================================
# FUNCI√ìN: Detecci√≥n de anomal√≠as usando Isolation Forest
# ============================================================================
def detectar_anomal√≠as_pca(datos_pca, etiquetas_reales, contaminaci√≥n=0.1):
    """
    Detecta anomal√≠as (circuitos defectuosos) usando el algoritmo Isolation Forest
    aplicado sobre los datos en el espacio PCA reducido.

    Isolation Forest es un algoritmo de detecci√≥n de anomal√≠as que identifica
    puntos de datos aislados (outliers) que se separan f√°cilmente del resto.

    Par√°metros:
        datos_pca: Array con datos en espacio PCA reducido
        etiquetas_reales: Array con etiquetas verdaderas (0=normal, 1=falla)
        contaminaci√≥n: Proporci√≥n esperada de anomal√≠as en los datos (default: 0.1)

    Retorna:
        predicciones: Array con predicciones (0=normal, 1=anomal√≠a)
        precisi√≥n: Precisi√≥n del modelo (fracci√≥n de predicciones correctas)
        modelo_bosque: Modelo Isolation Forest entrenado
    """

    # ========================================================================
    # ENTRENAR MODELO ISOLATION FOREST
    # ========================================================================
    # Crear modelo con semilla aleatoria fija para reproducibilidad
    modelo_bosque = IsolationForest(contamination=contaminaci√≥n, random_state=42)

    # Entrenar y predecir en un solo paso
    # Retorna: -1 para anomal√≠as, +1 para datos normales
    anomalias = modelo_bosque.fit_predict(datos_pca)

    # ========================================================================
    # CONVERTIR PREDICCIONES AL FORMATO ESPERADO
    # ========================================================================
    # Convertir de formato Isolation Forest (-1/+1) a formato binario (1/0)
    # -1 (anomal√≠a) --> 1
    # +1 (normal)   --> 0
    predicciones = (anomalias == -1).astype(int)

        # ========================================================================
    # CALCULAR M√âTRICAS DE DESEMPE√ëO
    # ========================================================================
    from sklearn.metrics import accuracy_score

    # Precisi√≥n: porcentaje de predicciones correctas
    precisi√≥n = accuracy_score(etiquetas_reales, predicciones)

    return predicciones, precisi√≥n, modelo_bosque

# ============================================================================
# APLICAR DETECCI√ìN DE ANOMAL√çAS
# ============================================================================
predicciones, precisi√≥n, modelo_bosque = detectar_anomal√≠as_pca(X_pca, y, contaminaci√≥n=0.1)

print(f"Precisi√≥n del modelo: {precisi√≥n:.3f} ({precisi√≥n*100:.1f}%)")
print(f"El modelo detect√≥ correctamente {precisi√≥n*100:.1f}% de los circuitos")

---

<a id="compresion"></a>
# üì∏ Aplicaci√≥n 3: Compresi√≥n de Im√°genes de Componentes Electr√≥nicos [‚Üë](#inicio)

---

## üéØ Problema

En sistemas de inspecci√≥n autom√°tica de componentes electr√≥nicos, las im√°genes de alta resoluci√≥n ocupan mucho espacio de almacenamiento:
- üíæ Grandes vol√∫menes de datos
- ‚ö° Procesamiento lento
- üì° Transmisi√≥n costosa
- üîç Necesidad de mantener calidad para an√°lisis

## üí° Soluci√≥n con PCA

Aplicamos PCA para compresi√≥n de im√°genes manteniendo las caracter√≠sticas m√°s importantes:
1. Vectorizaci√≥n de im√°genes (p√≠xeles ‚Üí features)
2. Reducci√≥n dimensional controlada
3. Reconstrucci√≥n con p√©rdida m√≠nima


In [None]:
# ============================================================================
# FUNCIONES: Generaci√≥n de im√°genes sint√©ticas de componentes electr√≥nicos
# ============================================================================

def resistencia(tama√±o=(64, 64)):
    """
    Genera una imagen sint√©tica de una resistencia electr√≥nica.

    Dibuja un rect√°ngulo horizontal (cuerpo de la resistencia) con cables
    en ambos extremos. Con 20% de probabilidad, a√±ade defectos visuales.

    Par√°metros:
        tama√±o: Tupla (alto, ancho) con dimensiones de la imagen en p√≠xeles

    Retorna:
        imagen: Array 2D (matriz) con valores 0-1 representando la imagen
        es_defectuoso: Booleano indicando si tiene defectos
    """
    # Crear imagen negra (todos los p√≠xeles en 0)
    imagen = np.zeros(tama√±o)

    # ========================================================================
    # DIBUJAR CUERPO DE LA RESISTENCIA
    # ========================================================================
    centro_x, centro_y = tama√±o[0]//2, tama√±o[1]//2
    longitud = 40  # Longitud del cuerpo en p√≠xeles
    ancho = 8      # Ancho del cuerpo en p√≠xeles

    # Calcular coordenadas del rect√°ngulo del cuerpo
    y_inicio = centro_y - ancho//2
    y_fin = centro_y + ancho//2
    x_inicio = centro_x - longitud//2
    x_fin = centro_x + longitud//2

    # Dibujar cuerpo: p√≠xeles blancos (valor 1)
    imagen[y_inicio:y_fin, x_inicio:x_fin] = 1

    # ========================================================================
    # DIBUJAR CABLES TERMINALES
    # ========================================================================
    # Cable izquierdo: desde el borde hasta el inicio del cuerpo
    imagen[centro_y-2:centro_y+2, :x_inicio] = 1
    # Cable derecho: desde el final del cuerpo hasta el borde
    imagen[centro_y-2:centro_y+2, x_fin:] = 1

    # ========================================================================
    # A√ëADIR DEFECTOS VISUALES ALEATORIOS (20% de probabilidad)
    # ========================================================================
    es_defectuoso = np.random.random() < 0.2

    if es_defectuoso:
        if np.random.random() < 0.5:
            # DEFECTO TIPO 1: Grieta o raya en el cuerpo
            # Crear l√≠nea oscura (valor 0) simulando da√±o
            imagen[centro_y-1:centro_y+1, x_inicio+10:x_inicio+15] = 0
        else:
            # DEFECTO TIPO 2: Mancha o quemadura
            # Posici√≥n aleatoria cerca del centro
            mancha_x = centro_x + np.random.randint(-10, 10)
            mancha_y = centro_y + np.random.randint(-5, 5)

            # Verificar que la mancha est√© dentro de los l√≠mites de la imagen
            if 0 <= mancha_x < tama√±o[0] and 0 <= mancha_y < tama√±o[1]:
                # Dibujar mancha gris (valor 0.5)
                imagen[mancha_y-2:mancha_y+2, mancha_x-2:mancha_x+2] = 0.5

    return imagen, es_defectuoso
def capacitor(tama√±o=(64, 64)):
    """
    Genera una imagen sint√©tica de un capacitor electrol√≠tico.

    Dibuja un rect√°ngulo vertical (cuerpo cil√≠ndrico del capacitor) con cables
    en ambos lados. Con 20% de probabilidad, a√±ade defectos visuales.

    Par√°metros:
        tama√±o: Tupla (alto, ancho) con dimensiones de la imagen en p√≠xeles

    Retorna:
        imagen: Array 2D con valores 0-1 representando la imagen
        es_defectuoso: Booleano indicando si tiene defectos
    """
    # Crear imagen negra (fondo)
    imagen = np.zeros(tama√±o)

    # ========================================================================
    # DIBUJAR CUERPO DEL CAPACITOR
    # ========================================================================
    centro_x, centro_y = tama√±o[0]//2, tama√±o[1]//2
    ancho = 20  # Ancho del cuerpo (m√°s ancho que la resistencia)
    alto = 30   # Alto del cuerpo (vertical)

    # Calcular coordenadas del rect√°ngulo del cuerpo
    y_inicio = centro_y - alto//2
    y_fin = centro_y + alto//2
    x_inicio = centro_x - ancho//2
    x_fin = centro_x + ancho//2

    # Dibujar cuerpo cil√≠ndrico: p√≠xeles blancos
    imagen[y_inicio:y_fin, x_inicio:x_fin] = 1

    # ========================================================================
    # DIBUJAR CABLES TERMINALES
    # ========================================================================
    # Cable izquierdo (terminal negativo)
    imagen[centro_y-2:centro_y+2, :x_inicio] = 1
    # Cable derecho (terminal positivo)
    imagen[centro_y-2:centro_y+2, x_fin:] = 1

    # ========================================================================
    # A√ëADIR DEFECTOS VISUALES ALEATORIOS (20% de probabilidad)
    # ========================================================================
    es_defectuoso = np.random.random() < 0.2

    if es_defectuoso:
        if np.random.random() < 0.5:
            # DEFECTO TIPO 1: Deformaci√≥n o abultamiento del cuerpo
            # T√≠pico en capacitores a punto de explotar
            # Cambiar tono del interior (valor 0.8 = gris claro)
            imagen[y_inicio+5:y_fin-5, x_inicio+2:x_fin-2] = 0.8
        else:
            # DEFECTO TIPO 2: Grieta horizontal
            # Simulando da√±o f√≠sico o sobrecalentamiento
            imagen[y_inicio+10:y_inicio+12, x_inicio:x_fin] = 0

    return imagen, es_defectuoso
def inductor(tama√±o=(64, 64)):
    """
    Genera una imagen sint√©tica de un inductor (bobina).

    Dibuja un anillo circular que representa la bobina del inductor, con cables
    conectados a ambos lados. Con 20% de probabilidad, a√±ade defectos visuales.

    Par√°metros:
        tama√±o: Tupla (alto, ancho) con dimensiones de la imagen en p√≠xeles

    Retorna:
        imagen: Array 2D con valores 0-1 representando la imagen
        es_defectuoso: Booleano indicando si tiene defectos
    """
    # Crear imagen negra (fondo)
    imagen = np.zeros(tama√±o)

    # ========================================================================
    # DIBUJAR BOBINA CIRCULAR
    # ========================================================================
    centro_x, centro_y = tama√±o[0]//2, tama√±o[1]//2
    radio = 15  # Radio de la bobina en p√≠xeles

    # Crear m√°scara circular usando coordenadas cartesianas
    y, x = np.ogrid[:tama√±o[0], :tama√±o[1]]
    # Calcular distancia de cada p√≠xel al centro
    distancia = np.sqrt((x - centro_x)**2 + (y - centro_y)**2)

    # Crear anillo: p√≠xeles entre radio-3 y radio
    # Esto crea un c√≠rculo hueco que representa el alambre enrollado
    mascara = (distancia <= radio) & (distancia >= radio-3)
    imagen[mascara] = 1

    # ========================================================================
    # DIBUJAR CABLES TERMINALES
    # ========================================================================
    # Cable izquierdo: desde el borde hasta el lado izquierdo de la bobina
    imagen[centro_y-2:centro_y+2, :centro_x-radio+1] = 1
    # Cable derecho: desde el lado derecho de la bobina hasta el borde
    imagen[centro_y-2:centro_y+2, centro_x+radio:] = 1

    # ========================================================================
    # A√ëADIR DEFECTOS VISUALES ALEATORIOS (20% de probabilidad)
    # ========================================================================
    es_defectuoso = np.random.random() < 0.2

    if es_defectuoso:
        # DEFECTO: Interrupci√≥n en la bobina
        # Simula un corte en el alambre del inductor

        # Seleccionar posici√≥n angular aleatoria para el defecto
        angulo = np.random.uniform(0, 2*np.pi)

        # Convertir coordenadas polares a cartesianas
        x_defecto = int(centro_x + (radio-1.5) * np.cos(angulo))
        y_defecto = int(centro_y + (radio-1.5) * np.sin(angulo))

        # Verificar que el defecto est√© dentro de los l√≠mites
        if 0 <= x_defecto < tama√±o[0] and 0 <= y_defecto < tama√±o[1]:
            # Crear peque√±o hueco (p√≠xeles negros) en la bobina
            imagen[y_defecto-1:y_defecto+1, x_defecto-1:x_defecto+1] = 0

    return imagen, es_defectuoso
def chip(tama√±o=(64, 64)):
    """
    Genera una imagen sint√©tica de un chip de circuito integrado (IC).

    Dibuja un rect√°ngulo horizontal (cuerpo del chip) con 8 pines (terminales)
    en la parte superior e inferior. Con 20% de probabilidad, a√±ade defectos.

    Par√°metros:
        tama√±o: Tupla (alto, ancho) con dimensiones de la imagen en p√≠xeles

    Retorna:
        imagen: Array 2D con valores 0-1 representando la imagen
        es_defectuoso: Booleano indicando si tiene defectos
    """
    # Crear imagen negra (fondo)
    imagen = np.zeros(tama√±o)

    # ========================================================================
    # DIBUJAR CUERPO DEL CHIP
    # ========================================================================
    centro_x, centro_y = tama√±o[0]//2, tama√±o[1]//2
    ancho = 34  # Ancho del cuerpo del chip
    alto = 20   # Alto del cuerpo del chip

    # Calcular coordenadas del rect√°ngulo del cuerpo
    y_inicio = centro_y - alto//2
    y_fin = centro_y + alto//2
    x_inicio = centro_x - ancho//2 + 1
    x_fin = centro_x + ancho//2

    # Dibujar cuerpo del chip: p√≠xeles blancos
    imagen[y_inicio:y_fin, x_inicio:x_fin] = 1

    # ========================================================================
    # DIBUJAR PINES (TERMINALES)
    # ========================================================================
    # Dibujar 8 pines: 4 arriba y 4 abajo
    # Estilo DIP (Dual In-line Package)
    for indice_pin in range(8):
        # Calcular posici√≥n X de cada pin (distribuidos uniformemente)
        pin_x = x_inicio + 2 + (indice_pin * ancho) // 8

        # Pin superior (hacia arriba desde el cuerpo)
        imagen[y_inicio-3:y_inicio, pin_x-1:pin_x+1] = 1
        # Pin inferior (hacia abajo desde el cuerpo)
        imagen[y_fin:y_fin+3, pin_x-1:pin_x+1] = 1

    # ========================================================================
    # A√ëADIR DEFECTOS VISUALES ALEATORIOS (20% de probabilidad)
    # ========================================================================
    es_defectuoso = np.random.random() < 0.2

    if es_defectuoso:
        # DEFECTO: Pin faltante o roto
        # Simula soldadura deficiente o da√±o mec√°nico

        # Seleccionar aleatoriamente cu√°l pin est√° da√±ado (0-7)
        pin_faltante = np.random.randint(0, 8)
        pin_x = x_inicio + 2 + (pin_faltante * ancho // 8)

        # Verificar l√≠mites de la imagen
        if pin_x < tama√±o[0]:
            # Borrar el pin superior e inferior (ponerlos en negro)
            imagen[y_inicio-3:y_inicio, pin_x-1:pin_x+1] = 0
            imagen[y_fin:y_fin+3, pin_x-1:pin_x+1] = 0

    return imagen, es_defectuoso

In [None]:
# ============================================================================
# VISUALIZACI√ìN DE PRUEBA: Ejemplos de cada tipo de componente
# ============================================================================
def mostrar_im√°genes_de_componentes():
    """Muestra un ejemplo de cada tipo de componente electr√≥nico."""

    plt.figure(figsize=(15, 10))

    # Definir tipos de componentes
    tipos_componentes = ["Resistencia", "Capacitor", "Inductor", "Chip"]

    # Generar un ejemplo de cada tipo
    imagenes_componentes = [resistencia(), capacitor(), inductor(), chip()]

    # Mostrar cada componente
    for i in range(4):
        imagen, es_defectuoso = imagenes_componentes[i]
        plt.subplot(2, 4, i+1)
        plt.imshow(imagen, cmap='gray')
        plt.title(f'{tipos_componentes[i]}')
        estado = "defectuoso" if es_defectuoso else "bueno"
        plt.xlabel(f'{estado}')
        plt.xticks([]), plt.yticks([])

    plt.tight_layout()
    plt.show()

mostrar_im√°genes_de_componentes()

In [None]:
# ============================================================================
# FUNCI√ìN: Generaci√≥n de dataset de im√°genes de componentes
# ============================================================================
def generar_im√°genes_componentes_electr√≥nicos(n_im√°genes=100, tama√±o=(64, 64)):
    """
    Genera un dataset de im√°genes sint√©ticas de componentes electr√≥nicos.

    Crea aleatoriamente im√°genes de 4 tipos de componentes (resistencia,
    capacitor, inductor, chip), a√±ade ruido realista, y las convierte
    a formato vectorial para an√°lisis con PCA.

    Par√°metros:
        n_im√°genes: Cantidad de im√°genes a generar (default: 100)
        tama√±o: Tupla (alto, ancho) de cada imagen en p√≠xeles (default: 64x64)

    Retorna:
        im√°genes: Array (n x p√≠xeles) donde cada fila es una imagen aplanada
        etiquetas: Array (n) con etiquetas 1=defectuoso, 0=bueno
    """
        # Fijar semilla para reproducibilidad
    np.random.seed(42)

    # Listas para almacenar im√°genes y etiquetas
    im√°genes = []       # Lista de vectores (im√°genes aplanadas)
    etiquetas = []      # Lista de etiquetas binarias

    # ========================================================================
    # GENERAR CADA IMAGEN
    # ========================================================================
    for i in range(n_im√°genes):
        # Seleccionar aleatoriamente tipo de componente
        tipo_componente = np.random.choice(['resistencia', 'capacitor', 'inductor', 'chip'])

        # Generar imagen del componente correspondiente
        if tipo_componente == 'resistencia':
            imagen, es_defectuoso = resistencia()
        elif tipo_componente == 'capacitor':
            imagen, es_defectuoso = capacitor()
        elif tipo_componente == 'inductor':
            imagen, es_defectuoso = inductor()
        elif tipo_componente == 'chip':
            imagen, es_defectuoso = chip()

        # ====================================================================
        # A√ëADIR RUIDO GAUSSIANO REALISTA
        # ====================================================================
        # Simula imperfecciones del sensor de la c√°mara y condiciones de iluminaci√≥n
        ruido = np.random.normal(0, 0.1, tama√±o)

        # Sumar ruido y recortar valores para mantenerlos en rango [0, 1]
        imagen = np.clip(imagen + ruido, 0, 1)

                # ====================================================================
        # APLANAR IMAGEN Y GUARDAR
        # ====================================================================
        # Convertir matriz 2D (64x64) a vector 1D (4096 elementos)
        # Esto es necesario para procesamiento con PCA
        im√°genes.append(imagen.flatten())

        # Guardar etiqueta: 1=defectuoso, 0=bueno
        etiquetas.append(1 if es_defectuoso else 0)

    # ========================================================================
    # RESUMEN DEL DATASET GENERADO
    # ========================================================================
    print(f"Im√°genes generadas: {len(im√°genes)}")
    print(f"Dimensiones de cada imagen: {tama√±o[0]}x{tama√±o[1]}")
    print(f"Formato: {len(im√°genes)} x {tama√±o} --> {len(im√°genes)} x {tama√±o[0]*tama√±o[1]}")
    print(f"Componentes defectuosos: {np.sum(etiquetas)} ({np.sum(etiquetas)/len(etiquetas)*100:.1f}%)")
    print(f"Componentes buenos: {len(etiquetas) - np.sum(etiquetas)} ({(len(etiquetas) - np.sum(etiquetas))/len(etiquetas)*100:.1f}%)")

    # Convertir listas a arrays de NumPy
    return np.array(im√°genes), np.array(etiquetas)

# ============================================================================
# GENERAR DATASET DE 100 IM√ÅGENES
# ============================================================================
im√°genes_componentes, etiquetas_componentes = generar_im√°genes_componentes_electr√≥nicos()

In [None]:
# Para hacer pruebas


In [None]:
# ============================================================================
# VISUALIZACI√ìN: Muestra de im√°genes generadas
# ============================================================================
def gr√°ficos():
    """Visualiza una muestra aleatoria de im√°genes de componentes."""

    plt.figure(figsize=(15, 10))

        # ========================================================================
    # MOSTRAR 12 IM√ÅGENES ALEATORIAS DEL DATASET
    # ========================================================================
    # Seleccionar 12 √≠ndices aleatorios sin reemplazo
    √≠ndices_aleatorios = np.random.choice(range(len(im√°genes_componentes)), 12, replace=False)

    # Mostrar cada imagen en un subplot
    for i, √≠ndice in enumerate(√≠ndices_aleatorios):
        plt.subplot(3, 4, i+1)

        # Convertir vector 1D (4096) de vuelta a matriz 2D (64x64)
        imagen_ejemplo = im√°genes_componentes[√≠ndice].reshape(64, 64)

        # Mostrar imagen en escala de grises
        plt.imshow(imagen_ejemplo, cmap='gray')

        # T√≠tulo con n√∫mero de imagen y estado
        estado = "Defectuoso" if etiquetas_componentes[√≠ndice] else "Bueno"
        plt.title(f'Imagen {√≠ndice+1} - {estado}')
        plt.axis('off')  # Ocultar ejes

    plt.tight_layout()
    plt.show()

gr√°ficos()

In [None]:
# ============================================================================
# FUNCI√ìN: Aplicar PCA a im√°genes para compresi√≥n y extracci√≥n de caracter√≠sticas
# ============================================================================
def aplicar_pca_im√°genes(im√°genes, n_componentes=50):
    """
    Aplica PCA a un conjunto de im√°genes para reducir dimensionalidad.

    Transforma im√°genes de alta dimensi√≥n (ej: 4096 p√≠xeles) a un espacio
    de caracter√≠sticas reducido conservando la mayor varianza posible.
    √ötil para compresi√≥n, visualizaci√≥n y clasificaci√≥n.

    Par√°metros:
        im√°genes: Array (n x p√≠xeles) con n im√°genes aplanadas
        n_componentes: N√∫mero de componentes principales a conservar (default: 50)

    Retorna:
        im√°genes_pca: Array (n x n_componentes) en espacio reducido
        modelo_pca: Modelo PCA ajustado (para reconstrucci√≥n)
        normalizador: Escalador ajustado (para normalizar nuevas im√°genes)
    """

    # ========================================================================
    # PASO 1: Normalizaci√≥n de p√≠xeles
    # ========================================================================
    # Estandarizar cada p√≠xel (columna): media = 0, desviaci√≥n est√°ndar = 1
    # Esto asegura que todos los p√≠xeles contribuyan equitativamente al PCA
    normalizador = StandardScaler()
    im√°genes_normalizadas = normalizador.fit_transform(im√°genes)

    # Reemplazar cualquier NaN o Inf que pueda haber surgido
    im√°genes_normalizadas = np.nan_to_num(im√°genes_normalizadas, nan=0.0, posinf=0.0, neginf=0.0)

    # ========================================================================
    # PASO 2: Aplicar PCA para reducir dimensionalidad
    # ========================================================================
    # Crear modelo PCA que conservar√° n_componentes principales
    # Usar SVD completo para mayor estabilidad num√©rica
    modelo_pca = PCA(n_components=n_componentes, svd_solver='full')

    # Ajustar modelo y transformar im√°genes al espacio reducido
    # Esto encuentra las direcciones de m√°xima varianza en el dataset
    im√°genes_pca = modelo_pca.fit_transform(im√°genes_normalizadas)

    # ========================================================================
    # RESUMEN DE LA TRANSFORMACI√ìN
    # ========================================================================
    print(f"Transformaci√≥n: {len(im√°genes)} x {im√°genes_componentes.shape[1]} ‚Üí {len(im√°genes)} x {im√°genes_pca.shape[1]}")
    print(f"Reducci√≥n de dimensionalidad: {im√°genes_componentes.shape[1]} ‚Üí {im√°genes_pca.shape[1]}")
    print(f"Varianza explicada total: {np.sum(modelo_pca.explained_variance_ratio_):.3f} ({np.sum(modelo_pca.explained_variance_ratio_)*100:.1f}%)")
    print(f"Factor de compresi√≥n: {im√°genes_componentes.shape[1]/im√°genes_pca.shape[1]:.1f}x")
    print(f"Ahorro de espacio: {(1 - im√°genes_pca.shape[1]/im√°genes_componentes.shape[1])*100:.1f}%")

    return im√°genes_pca, modelo_pca, normalizador

# ============================================================================
# APLICAR PCA AL DATASET DE IM√ÅGENES
# ============================================================================
# Reducir de 4096 p√≠xeles a 50 componentes principales (compresi√≥n ~82x)
im√°genes_pca, modelo_pca_im√°genes, normalizador_im√°genes = aplicar_pca_im√°genes(im√°genes_componentes, n_componentes=50)

In [None]:
# ============================================================================
# VISUALIZACI√ìN: Resultados del PCA en im√°genes
# ============================================================================
def gr√°ficos():
    """Visualiza resultados de compresi√≥n PCA aplicado a im√°genes."""

    plt.figure(figsize=(15, 12))

    # ========================================================================
    # GR√ÅFICO 1: Varianza explicada por cada componente principal
    # ========================================================================
    plt.subplot(2, 3, 1)
    plt.bar(range(1, len(modelo_pca_im√°genes.explained_variance_ratio_)+1),
            modelo_pca_im√°genes.explained_variance_ratio_)
    plt.xlabel('Componente Principal')
    plt.ylabel('Varianza Explicada')
    plt.title('Varianza Explicada por Componentes')
    plt.grid(True, alpha=0.3)

    # ========================================================================
    # GR√ÅFICO 2: Imagen original (primera del dataset)
    # ========================================================================
    plt.subplot(2, 3, 2)
    imagen_original = im√°genes_componentes[0].reshape(64, 64)
    plt.imshow(imagen_original, cmap='gray')
    plt.title('Imagen Original')
    plt.axis('off')

    # ========================================================================
    # GR√ÅFICO 3: Imagen reconstruida desde PCA
    # ========================================================================
    # Reconstruir imagen desde componentes principales
    # Proceso: PCA inverso -> desnormalizar -> reshape
    imagen_reconstruida = modelo_pca_im√°genes.inverse_transform(im√°genes_pca[0:1])
    imagen_reconstruida = normalizador_im√°genes.inverse_transform(imagen_reconstruida)
    imagen_reconstruida = imagen_reconstruida.reshape(64, 64)

    plt.subplot(2, 3, 3)
    plt.imshow(imagen_reconstruida, cmap='gray')
    plt.title('Imagen Reconstruida (PCA)')
    plt.axis('off')

    plt.tight_layout()
    plt.show()

    # ========================================================================
    # M√âTRICAS DE CALIDAD DE RECONSTRUCCI√ìN
    # ========================================================================
    # Calcular error cuadr√°tico medio (MSE) entre originales y reconstruidas
    im√°genes_reconstruidas_completas = normalizador_im√°genes.inverse_transform(
        modelo_pca_im√°genes.inverse_transform(im√°genes_pca)
    )
    error_reconstrucci√≥n = np.mean((im√°genes_componentes - im√°genes_reconstruidas_completas)**2)

    print(f"M√©tricas de PCA en im√°genes:")
    print(f"=" * 50)
    print(f"Error de reconstrucci√≥n (MSE): {error_reconstrucci√≥n:.6f}")
    print(f"Varianza total explicada: {np.sum(modelo_pca_im√°genes.explained_variance_ratio_):.3f} ({np.sum(modelo_pca_im√°genes.explained_variance_ratio_)*100:.1f}%)")
    print(f"Factor de compresi√≥n: {im√°genes_componentes.shape[1]/im√°genes_pca.shape[1]:.1f}x")
    print(f"Reducci√≥n de dimensionalidad: {im√°genes_componentes.shape[1]} ‚Üí {im√°genes_pca.shape[1]}")
    print(f"Ahorro de memoria: {(1 - im√°genes_pca.shape[1]/im√°genes_componentes.shape[1])*100:.1f}%")

gr√°ficos()

In [None]:
# Para hacer pruebas


---

<a id="recomendaciones"></a>
## üìå Buenas Pr√°cticas al Usar PCA en Electr√≥nica  [‚Üë](#inicio)

---

### Ventajas del PCA en Electr√≥nica

- **Eficiencia computacional**: Reduce la complejidad de los algoritmos
- **Robustez**: Mejora la tolerancia al ruido
- **Interpretabilidad**: Facilita la comprensi√≥n de los datos
- **Escalabilidad**: Funciona con grandes vol√∫menes de datos
- **Versatilidad**: Se aplica a diferentes tipos de datos electr√≥nicos

### Limitaciones y Consideraciones

- **P√©rdida de informaci√≥n**: Al reducir dimensiones se puede perder informaci√≥n
- **Linealidad**: PCA asume relaciones lineales entre variables
- **Sensibilidad a outliers**: Los valores extremos pueden afectar los resultados
- **Interpretaci√≥n**: Los componentes principales pueden ser dif√≠ciles de interpretar

### Recomendaciones Pr√°cticas

- **Preprocesamiento**: Normalizar siempre los datos antes de aplicar PCA
- **Selecci√≥n de componentes**: Usar el criterio de varianza explicada (el 95% es com√∫n)
- **Validaci√≥n**: Verificar que la reducci√≥n de dimensionalidad no afecte la calidad de los resultados
- **Visualizaci√≥n**: Usar las primeras componentes para visualizaci√≥n 2D/3D
- **Combinaci√≥n**: El PCA funciona bien combinado con otros algoritmos de aprendizaje autom√°tico

### Casos de Uso Reales

- **Sistemas de Monitoreo Industrial**
  - Monitoreo de vibraciones en motores el√©ctricos
  - An√°lisis de temperatura en transformadores
  - Detecci√≥n de fallas en sistemas de potencia
  
- **Dispositivos IoT y Sensores**
  - Compresi√≥n de datos en sensores remotos
  - An√°lisis de patrones en redes de sensores
  - Optimizaci√≥n de transmisi√≥n de datos
  
- **Control de Calidad en Manufactura**
  - Inspecci√≥n autom√°tica de componentes
  - Detecci√≥n de defectos en PCB
  - An√°lisis de calidad en l√≠neas de producci√≥n
  
- **Sistemas de Diagn√≥stico**
  - Diagn√≥stico de fallas en equipos m√©dicos
  - An√°lisis de se√±ales biom√©dicas
  - Monitoreo de sistemas cr√≠ticos

### M√©tricas de Evaluaci√≥n

- **Varianza explicada**: Porcentaje de informaci√≥n conservada
- **Error de reconstrucci√≥n**: Diferencia entre los datos originales y los reconstruidos
- **Ratio de compresi√≥n**: Reducci√≥n en el n√∫mero de dimensiones
- **Tiempo de procesamiento**: Eficiencia computacional

### Extensiones y Variantes

- **Kernel PCA**: Para datos no lineales
- **Incremental PCA**: Para datos en streaming
- **Sparse PCA**: Para datos con muchas caracter√≠sticas irrelevantes
- **Robust PCA**: Para datos con outliers

---

<a id="referencias"></a>
# üìö Recursos Adicionales [‚Üë](#inicio)

---

- Scikit-learn Documentation \
  https://scikit-learn.org/stable/modules/decomposition.html#pca
- Pattern Recognition and Machine Learning - Christopher Bishop
- The Elements of Statistical Learning - Hastie, Tibshirani, Friedman
- Papers sobre PCA en aplicaciones electr√≥nicas y de ingenier√≠

