# UTILIDADES Y PLANTILLAS - LABORATORIO INTEGRADOR

## Contenido
Este cuaderno contiene **funciones de utilidad** y **plantillas de c√≥digo** para usar en los laboratorios integradores.

### Prop√≥sito:
- **Acelerar el desarrollo** en los laboratorios
- **Evitar repetir c√≥digo** com√∫n
- **Proporcionar ejemplos** de buenas pr√°cticas
- **Facilitar la experimentaci√≥n** r√°pida

---

## IMPORTACIONES EST√ÅNDAR

In [None]:
# ============================================
# IMPORTACIONES EST√ÅNDAR - COPIAR Y PEGAR
# ============================================
# Copiar y pegar este bloque en cualquier laboratorio

# Procesamiento num√©rico y manipulaci√≥n de datos
import numpy as np          # Operaciones num√©ricas y arrays multidimensionales
import pandas as pd         # An√°lisis y manipulaci√≥n de datos estructurados

# Bibliotecas de visualizaci√≥n
import matplotlib.pyplot as plt    # Gr√°ficos y visualizaciones b√°sicas
import seaborn as sns             # Visualizaciones estad√≠sticas avanzadas

# Procesamiento de im√°genes - Bibliotecas principales
from PIL import Image, ImageEnhance           # Python Imaging Library - carga y manipulaci√≥n b√°sica
import cv2                                    # OpenCV - procesamiento avanzado (nota: usa BGR)
from skimage import color, feature, measure, filters, morphology, segmentation  # Scikit-image - algoritmos especializados

# Machine Learning y an√°lisis predictivo
from sklearn.preprocessing import StandardScaler, LabelEncoder    # Preprocesamiento de datos
from sklearn.model_selection import train_test_split             # Divisi√≥n de datasets
from sklearn.ensemble import RandomForestClassifier              # Algoritmo de clasificaci√≥n
from sklearn.metrics import accuracy_score, classification_report, confusion_matrix  # M√©tricas de evaluaci√≥n

# Utilidades del sistema operativo
import os        # Navegaci√≥n de archivos y carpetas
import glob      # B√∫squeda de archivos con patrones
import warnings  # Control de mensajes de advertencia
warnings.filterwarnings('ignore')  # Suprimir advertencias para salida m√°s limpia

# Espec√≠fico para Google Colab
from google.colab import files    # Subida y descarga de archivos en Colab

# Configuraci√≥n global de matplotlib para gr√°ficos m√°s grandes y legibles
plt.rcParams['figure.figsize'] = (12, 8)    # Tama√±o por defecto de las figuras
plt.rcParams['font.size'] = 10              # Tama√±o de fuente por defecto

# Semilla para reproducibilidad de resultados aleatorios
np.random.seed(42)  # Garantiza que los resultados aleatorios sean consistentes

print("‚úì Importaciones cargadas correctamente")
print("‚úì Configuraci√≥n aplicada")
print("‚úì Listo para comenzar el an√°lisis")

## UTILIDADES DE IM√ÅGENES

In [None]:
# =============================================
# UTILIDADES PARA MANEJO SEGURO DE IM√ÅGENES
# =============================================

def cargar_imagen_segura(path, target_size=None):
    """
    Carga una imagen de forma segura con manejo completo de errores.
    Convierte autom√°ticamente a RGB y normaliza valores entre 0-1.

    Args:
        path (str): Ruta completa al archivo de imagen
        target_size (tuple): Tupla (ancho, alto) para redimensionar la imagen

    Returns:
        numpy.ndarray: Array normalizado (0-1) o None si hay error

    Ejemplo:
        img = cargar_imagen_segura('foto.jpg', target_size=(256, 256))
    """
    try:
        # Abrir imagen usando PIL (soporta m√∫ltiples formatos)
        img = Image.open(path)

        # Convertir a RGB si est√° en otro modo (RGBA, L, etc.)
        # Esto garantiza consistencia en el n√∫mero de canales
        if img.mode != 'RGB':
            img = img.convert('RGB')

        # Redimensionar si se especifica un tama√±o objetivo
        # LANCZOS ofrece mejor calidad para redimensionamiento
        if target_size:
            img = img.resize(target_size, Image.Resampling.LANCZOS)

        # Convertir a numpy array y normalizar a rango [0,1]
        # Divisi√≥n por 255 convierte de uint8 [0,255] a float [0,1]
        return np.array(img) / 255.0

    except Exception as e:
        # Capturar cualquier error (archivo no encontrado, formato no v√°lido, etc.)
        print(f"Error cargando {path}: {e}")
        return None

def mostrar_imagen_info(imagen, titulo="Imagen"):
    """
    Muestra informaci√≥n estad√≠stica completa de una imagen.
    √ötil para debugging y an√°lisis exploratorio.

    Args:
        imagen (numpy.ndarray): Array de la imagen
        titulo (str): T√≠tulo descriptivo para la salida

    Ejemplo:
        mostrar_imagen_info(mi_imagen, "Imagen Original")
    """
    print(f"{titulo.upper()}:")
    print(f"   Shape: {imagen.shape}")                    # Dimensiones (altura, ancho, canales)
    print(f"   Tipo de datos: {imagen.dtype}")           # Tipo de datos (float64, uint8, etc.)
    print(f"   Rango de valores: [{imagen.min():.3f}, {imagen.max():.3f}]")  # Min y max
    print(f"   Valor promedio: {imagen.mean():.3f}")     # Media de todos los p√≠xeles
    print(f"   Desviaci√≥n est√°ndar: {imagen.std():.3f}") # Variabilidad de los valores

def visualizar_canales_rgb(imagen, titulo="An√°lisis de Canales RGB"):
    """
    Visualiza los canales RGB de una imagen por separado.
    √ötil para entender la contribuci√≥n de cada color primario.

    Args:
        imagen (numpy.ndarray): Imagen RGB a analizar
        titulo (str): T√≠tulo para la visualizaci√≥n

    Nota:
        Cada canal se muestra con su colormap correspondiente para mejor interpretaci√≥n.
    """
    # Crear subplot con 4 columnas: original + 3 canales
    fig, axes = plt.subplots(1, 4, figsize=(16, 4))

    # Mostrar imagen original en color completo
    axes[0].imshow(imagen)
    axes[0].set_title('Imagen Completa (RGB)')
    axes[0].axis('off')  # Ocultar ejes para mejor visualizaci√≥n

    # Definir nombres y mapas de color para cada canal
    canales = ['Rojo (R)', 'Verde (G)', 'Azul (B)']
    colormaps = ['Reds', 'Greens', 'Blues']  # Mapas de color tem√°ticos

    # Mostrar cada canal individual
    for i in range(3):
        # Extraer canal espec√≠fico ([:,:,i] selecciona el canal i)
        axes[i+1].imshow(imagen[:,:,i], cmap=colormaps[i])
        axes[i+1].set_title(f'Canal {canales[i]}')
        axes[i+1].axis('off')

    # Configurar layout y mostrar
    plt.suptitle(titulo)
    plt.tight_layout()
    plt.show()

def convertir_espacios_color(imagen):
    """
    Convierte una imagen RGB a m√∫ltiples espacios de color.
    √ötil para an√°lisis comparativo y selecci√≥n del espacio √≥ptimo.

    Args:
        imagen (numpy.ndarray): Imagen RGB normalizada [0,1]

    Returns:
        dict: Diccionario con diferentes representaciones de la imagen

    Espacios incluidos:
        - RGB: Red, Green, Blue (original)
        - HSV: Hue (tono), Saturation (saturaci√≥n), Value (valor)
        - Grayscale: Escala de grises (luminancia)
        - LAB: L*a*b* (perceptualmente uniforme)
    """
    espacios = {
        'rgb': imagen,                      # Espacio original
        'hsv': color.rgb2hsv(imagen),       # Separaci√≥n tono/saturaci√≥n/brillo
        'gray': color.rgb2gray(imagen),     # Informaci√≥n de luminancia √∫nicamente
        'lab': color.rgb2lab(imagen)        # Espacio perceptualmente uniforme
    }

    return espacios

# Mensaje de confirmaci√≥n para el usuario
print("‚úì Utilidades de im√°genes definidas y documentadas")
print("  ‚Üí cargar_imagen_segura(): Carga robusta con manejo de errores")
print("  ‚Üí mostrar_imagen_info(): Estad√≠sticas detalladas de la imagen")
print("  ‚Üí visualizar_canales_rgb(): Separaci√≥n visual de canales")
print("  ‚Üí convertir_espacios_color(): M√∫ltiples representaciones")

## UTILIDADES DE SEGMENTACI√ìN

In [None]:
# =========================================================
# UTILIDADES AVANZADAS DE SEGMENTACI√ìN DE IM√ÅGENES
# =========================================================

def segmentar_por_color_hsv_auto(imagen, num_colores=5):
    """
    Segmentaci√≥n autom√°tica usando clustering K-means en espacio HSV.
    Agrupa p√≠xeles similares por sus caracter√≠sticas de tono y saturaci√≥n.

    Args:
        imagen (numpy.ndarray): Imagen RGB normalizada [0,1]
        num_colores (int): N√∫mero de clusters (regiones) deseadas

    Returns:
        tuple: (m√°scara_segmentada, modelo_kmeans)
        - m√°scara_segmentada: Array 2D con etiquetas de cluster por p√≠xel
        - modelo_kmeans: Objeto KMeans entrenado para reutilizaci√≥n

    Ventaja del HSV: Separaci√≥n natural entre tono (color) y brillo
    """
    from sklearn.cluster import KMeans

    # Convertir RGB a HSV para mejor separaci√≥n de colores
    # HSV separa informaci√≥n crom√°tica (H,S) de luminancia (V)
    imagen_hsv = color.rgb2hsv(imagen)

    # Obtener dimensiones para reshape posterior
    altura, ancho, _ = imagen_hsv.shape

    # Usar solo canales H (tono) y S (saturaci√≥n) para clustering
    # El canal V (valor/brillo) puede variar por iluminaci√≥n
    pixeles_hs = imagen_hsv[:,:,:2].reshape(-1, 2)  # Reshape a (n_pixeles, 2)

    # Aplicar K-means clustering
    # random_state=42 garantiza resultados reproducibles
    kmeans = KMeans(n_clusters=num_colores, random_state=42)
    etiquetas = kmeans.fit_predict(pixeles_hs)

    # Reformar etiquetas de vuelta a forma de imagen
    segmentacion = etiquetas.reshape(altura, ancho)

    return segmentacion, kmeans

def crear_mascara_color_rango(imagen_hsv, h_min, h_max, s_min=0.2, v_min=0.2):
    """
    Crea m√°scara binaria para segmentar un rango espec√≠fico de colores.
    √ötil para detectar objetos de colores conocidos (ej: frutas, se√±ales).

    Args:
        imagen_hsv (numpy.ndarray): Imagen en espacio HSV [0,1]
        h_min, h_max (float): Rango de tono (Hue) [0,1]
        s_min (float): Saturaci√≥n m√≠nima (evita colores desaturados)
        v_min (float): Valor m√≠nimo (evita p√≠xeles muy oscuros)

    Returns:
        numpy.ndarray: M√°scara binaria (1 donde cumple condiciones, 0 donde no)

    Ejemplo rangos de tono:
        - Rojo: 0.0-0.1 y 0.9-1.0 (el rojo est√° en los extremos)
        - Verde: 0.2-0.4
        - Azul: 0.5-0.7
    """
    # Crear m√°scaras individuales para cada condici√≥n
    mask_h = (imagen_hsv[:,:,0] >= h_min) & (imagen_hsv[:,:,0] <= h_max)  # Rango de tono
    mask_s = imagen_hsv[:,:,1] >= s_min  # Saturaci√≥n m√≠nima (evita grises)
    mask_v = imagen_hsv[:,:,2] >= v_min  # Valor m√≠nimo (evita negro/sombras)

    # Combinar todas las condiciones con operador AND l√≥gico
    # Un p√≠xel debe cumplir TODAS las condiciones para ser incluido
    mask_final = mask_h & mask_s & mask_v

    # Convertir boolean a uint8 para compatibilidad con OpenCV
    return mask_final.astype(np.uint8)

def limpiar_mascara_morfologia(mascara, tam_kernel=3, operaciones=['close', 'open']):
    """
    Limpia m√°scaras binarias usando operaciones morfol√≥gicas.
    Elimina ruido y conecta regiones fragmentadas.

    Args:
        mascara (numpy.ndarray): M√°scara binaria a limpiar
        tam_kernel (int): Tama√±o del elemento estructurante (kernel)
        operaciones (list): Lista de operaciones a aplicar en orden

    Returns:
        numpy.ndarray: M√°scara limpiada

    Operaciones disponibles:
        - 'close': Cierra huecos peque√±os (dilataci√≥n + erosi√≥n)
        - 'open': Elimina ruido peque√±o (erosi√≥n + dilataci√≥n)
        - 'erode': Reduce el tama√±o de las regiones
        - 'dilate': Expande las regiones
    """
    from skimage.morphology import disk, closing, opening, erosion, dilation

    # Crear elemento estructurante circular
    # disk() crea un c√≠rculo que preserva mejor las formas naturales
    kernel = disk(tam_kernel)
    resultado = mascara.copy()

    # Aplicar operaciones en el orden especificado
    for op in operaciones:
        if op == 'close':
            # Closing: Conecta regiones cercanas y cierra huecos
            resultado = closing(resultado, kernel)
        elif op == 'open':
            # Opening: Elimina regiones peque√±as (ruido)
            resultado = opening(resultado, kernel)
        elif op == 'erode':
            # Erosi√≥n: Reduce tama√±o de regiones (adelgaza bordes)
            resultado = erosion(resultado, kernel)
        elif op == 'dilate':
            # Dilataci√≥n: Expande regiones (engrosa bordes)
            resultado = dilation(resultado, kernel)

    return resultado

def analizar_regiones_conectadas(mascara_binaria, min_area=50):
    """
    Identifica y analiza objetos individuales en una m√°scara binaria.
    Extrae propiedades geom√©tricas de cada regi√≥n conectada.

    Args:
        mascara_binaria (numpy.ndarray): M√°scara binaria con objetos
        min_area (int): √Årea m√≠nima en p√≠xeles para considerar un objeto

    Returns:
        list: Lista de objetos regionprops con propiedades geom√©tricas

    Propiedades √∫tiles de cada regi√≥n:
        - .area: √Årea en p√≠xeles
        - .bbox: Bounding box (min_row, min_col, max_row, max_col)
        - .centroid: Centro de masa
        - .eccentricity: Excentricidad (0=c√≠rculo, 1=l√≠nea)
        - .perimeter: Per√≠metro
    """
    # Etiquetar regiones conectadas (componentes conectados)
    # Cada objeto recibe una etiqueta num√©rica √∫nica
    etiquetas = measure.label(mascara_binaria)

    # Extraer propiedades geom√©tricas de cada regi√≥n
    # regionprops calcula m√∫ltiples caracter√≠sticas autom√°ticamente
    regiones = measure.regionprops(etiquetas)

    # Filtrar regiones muy peque√±as (probablemente ruido)
    regiones_filtradas = [r for r in regiones if r.area >= min_area]

    return regiones_filtradas

def dibujar_bounding_boxes(ax, regiones, color='red', alpha=0.8):
    """
    Dibuja rect√°ngulos delimitadores (bounding boxes) alrededor de objetos detectados.
    √ötil para visualizar resultados de detecci√≥n de objetos.

    Args:
        ax (matplotlib.axes): Eje donde dibujar los rect√°ngulos
        regiones (list): Lista de objetos regionprops
        color (str): Color de los rect√°ngulos
        alpha (float): Transparencia (0=transparente, 1=opaco)

    Nota: Debe llamarse despu√©s de ax.imshow() y antes de plt.show()
    """
    import matplotlib.patches as patches

    # Iterar sobre cada regi√≥n detectada
    for region in regiones:
        # Obtener bounding box: (min_row, min_col, max_row, max_col)
        bbox = region.bbox

        # Crear rect√°ngulo para matplotlib
        # Nota: matplotlib usa (x,y) = (col,row), por eso se invierten las coordenadas
        rect = patches.Rectangle(
            (bbox[1], bbox[0]),           # Esquina inferior izquierda (x,y)
            bbox[3] - bbox[1],            # Ancho (max_col - min_col)
            bbox[2] - bbox[0],            # Alto (max_row - min_row)
            linewidth=2,                  # Grosor del borde
            edgecolor=color,              # Color del borde
            facecolor='none',             # Sin relleno (solo borde)
            alpha=alpha                   # Transparencia
        )

        # Agregar rect√°ngulo al eje
        ax.add_patch(rect)

# Mensajes informativos para el usuario
print("‚úì Utilidades de segmentaci√≥n definidas y documentadas")
print("  ‚Üí segmentar_por_color_hsv_auto(): Clustering autom√°tico en HSV")
print("  ‚Üí crear_mascara_color_rango(): Segmentaci√≥n por rango de color")
print("  ‚Üí limpiar_mascara_morfologia(): Limpieza morfol√≥gica de m√°scaras")
print("  ‚Üí analizar_regiones_conectadas(): Detecci√≥n de objetos individuales")
print("  ‚Üí dibujar_bounding_boxes(): Visualizaci√≥n de detecciones")

## UTILIDADES DE EXTRACCI√ìN DE CARACTER√çSTICAS

In [None]:
# ==============================================================
# EXTRACCI√ìN AVANZADA DE CARACTER√çSTICAS PARA MACHINE LEARNING
# ==============================================================

def extraer_estadisticas_basicas(imagen_canal):
    """
    Extrae estad√≠sticas descriptivas fundamentales de un canal de imagen.
    Estas m√©tricas capturan la distribuci√≥n de intensidades en la imagen.

    Args:
        imagen_canal (numpy.ndarray): Canal individual de imagen (2D array)

    Returns:
        dict: Diccionario con estad√≠sticas b√°sicas

    Estad√≠sticas calculadas:
        - Media: Intensidad promedio (indica brillo general)
        - Desviaci√≥n est√°ndar: Variabilidad de intensidades (indica contraste)
        - Mediana: Valor central (robusto a valores at√≠picos)
        - Cuartiles: Q25 y Q75 (rango intercuart√≠lico)
        - M√≠nimo/M√°ximo: Rango completo de valores
    """
    # Aplanar imagen a vector 1D para c√°lculos estad√≠sticos
    datos = imagen_canal.flatten()

    # Calcular estad√≠sticas descriptivas
    estadisticas = {
        'media': np.mean(datos),              # Promedio aritm√©tico
        'std': np.std(datos),                 # Desviaci√≥n est√°ndar (medida de dispersi√≥n)
        'mediana': np.median(datos),          # Valor del percentil 50
        'q25': np.percentile(datos, 25),      # Primer cuartil
        'q75': np.percentile(datos, 75),      # Tercer cuartil
        'min': np.min(datos),                 # Valor m√≠nimo
        'max': np.max(datos)                  # Valor m√°ximo
    }

    return estadisticas

def extraer_features_color_completas(imagen):
    """
    Extrae caracter√≠sticas completas de color en espacios RGB y HSV.
    Combina informaci√≥n crom√°tica de ambos espacios para mayor robustez.

    Args:
        imagen (numpy.ndarray): Imagen RGB normalizada [0,1]

    Returns:
        numpy.ndarray: Vector de caracter√≠sticas de color (15 elementos)

    Caracter√≠sticas extra√≠das:
        RGB: 9 features (media, std, mediana por canal R, G, B)
        HSV: 6 features (media, std por canal H, S, V)
        Total: 15 caracter√≠sticas de color
    """
    features = []

    # CARACTER√çSTICAS RGB (3 canales √ó 3 estad√≠sticas = 9 features)
    for canal in range(3):
        stats = extraer_estadisticas_basicas(imagen[:,:,canal])
        # Seleccionar las 3 estad√≠sticas m√°s informativas por canal
        features.extend([stats['media'], stats['std'], stats['mediana']])

    # CARACTER√çSTICAS HSV (separaci√≥n crom√°tica/luminancia)
    imagen_hsv = color.rgb2hsv(imagen)
    for canal in range(3):
        stats = extraer_estadisticas_basicas(imagen_hsv[:,:,canal])
        # HSV: solo media y std son m√°s relevantes (mediana menos informativa)
        features.extend([stats['media'], stats['std']])

    return np.array(features)

def extraer_features_textura_avanzadas(imagen):
    """
    Extrae caracter√≠sticas avanzadas de textura usando filtros de gradiente.
    Captura informaci√≥n sobre patrones, bordes y rugosidad de la superficie.

    Args:
        imagen (numpy.ndarray): Imagen RGB o escala de grises

    Returns:
        numpy.ndarray: Vector de caracter√≠sticas de textura (7 elementos)

    T√©cnicas utilizadas:
        - Filtros de Sobel: Detectan gradientes horizontales y verticales
        - Detector de Canny: Identifica bordes bien definidos
        - Estad√≠sticas de intensidad: Propiedades b√°sicas de luminancia
    """
    # Convertir a escala de grises si es necesario (textura no necesita color)
    if len(imagen.shape) == 3:
        imagen_gray = color.rgb2gray(imagen)
    else:
        imagen_gray = imagen

    features = []

    # FILTROS DE SOBEL para detecci√≥n de gradientes
    # Sobel horizontal: detecta cambios verticales (l√≠neas horizontales)
    sobel_h = filters.sobel_h(imagen_gray)
    # Sobel vertical: detecta cambios horizontales (l√≠neas verticales)
    sobel_v = filters.sobel_v(imagen_gray)

    # Estad√≠sticas de gradientes (intensidad y variabilidad de bordes)
    features.extend([
        np.mean(np.abs(sobel_h)),    # Intensidad promedio de gradiente horizontal
        np.mean(np.abs(sobel_v)),    # Intensidad promedio de gradiente vertical
        np.std(sobel_h),             # Variabilidad de gradiente horizontal
        np.std(sobel_v)              # Variabilidad de gradiente vertical
    ])

    # DETECTOR DE CANNY para bordes bien definidos
    # Canny es m√°s selectivo que Sobel (menos ruido, bordes m√°s limpios)
    bordes = feature.canny(imagen_gray)
    # Densidad de bordes: proporci√≥n de p√≠xeles que son borde
    features.append(np.sum(bordes) / bordes.size)

    # CARACTER√çSTICAS DE INTENSIDAD b√°sicas
    features.extend([
        np.mean(imagen_gray),        # Brillo promedio
        np.std(imagen_gray)          # Contraste general
    ])

    return np.array(features)

def calcular_histograma_color(imagen, bins=32):
    """
    Calcula histograma concatenado de los 3 canales RGB.
    Los histogramas capturan la distribuci√≥n de colores en la imagen.

    Args:
        imagen (numpy.ndarray): Imagen RGB [0,1]
        bins (int): N√∫mero de bins por canal (resoluci√≥n del histograma)

    Returns:
        numpy.ndarray: Histograma concatenado normalizado (bins√ó3 elementos)

    Normalizaci√≥n: Cada histograma suma 1.0 (distribuci√≥n de probabilidad)
    Ventaja: Invariante al tama√±o de la imagen
    """
    histograma = []

    # Procesar cada canal RGB por separado
    for canal in range(3):
        # Calcular histograma en el rango [0,1] (im√°genes normalizadas)
        hist, _ = np.histogram(imagen[:,:,canal], bins=bins, range=(0, 1))

        # Normalizar para que sume 1 (convertir a probabilidades)
        hist = hist / np.sum(hist)
        histograma.extend(hist)

    return np.array(histograma)

def extraer_features_completas(imagen):
    """
    Combina TODAS las caracter√≠sticas disponibles en un vector √∫nico.
    Esta funci√≥n integra color, textura e histograma para m√°xima informaci√≥n.

    Args:
        imagen (numpy.ndarray): Imagen RGB normalizada [0,1]

    Returns:
        numpy.ndarray: Vector completo de caracter√≠sticas

    Composici√≥n del vector:
        - Caracter√≠sticas de color: 15 elementos (RGB + HSV)
        - Caracter√≠sticas de textura: 7 elementos (gradientes + bordes)
        - Histograma reducido: 24 elementos (8 bins √ó 3 canales)
        Total: 46 caracter√≠sticas por imagen
    """
    features = []

    # BLOQUE 1: Caracter√≠sticas de color (RGB + HSV)
    features_color = extraer_features_color_completas(imagen)
    features.extend(features_color)

    # BLOQUE 2: Caracter√≠sticas de textura (gradientes y bordes)
    features_textura = extraer_features_textura_avanzadas(imagen)
    features.extend(features_textura)

    # BLOQUE 3: Histograma compacto (reducido para evitar sobreajuste)
    # 8 bins por canal = 24 features totales (balance informaci√≥n/dimensionalidad)
    histograma = calcular_histograma_color(imagen, bins=8)
    features.extend(histograma)

    return np.array(features)

# Mensajes informativos para el usuario
print("‚úì Utilidades de extracci√≥n de caracter√≠sticas definidas y documentadas")
print("  ‚Üí extraer_estadisticas_basicas(): Estad√≠sticas descriptivas por canal")
print("  ‚Üí extraer_features_color_completas(): Caracter√≠sticas RGB + HSV")
print("  ‚Üí extraer_features_textura_avanzadas(): Gradientes y detecci√≥n de bordes")
print("  ‚Üí calcular_histograma_color(): Histogramas normalizados por canal")
print("  ‚Üí extraer_features_completas(): Vector integrado de 46 caracter√≠sticas")

## UTILIDADES DE MACHINE LEARNING

In [None]:
# ===========================================================
# UTILIDADES COMPLETAS PARA MACHINE LEARNING EN IM√ÅGENES
# ===========================================================

def preparar_datos_ml(X, y, test_size=0.2, val_size=0.2):
    """
    Prepara datos para entrenamiento de ML con divisi√≥n estratificada en train/val/test.
    Incluye codificaci√≥n de etiquetas y normalizaci√≥n de caracter√≠sticas.

    Args:
        X (array-like): Matriz de caracter√≠sticas (n_muestras, n_features)
        y (array-like): Vector de etiquetas (puede ser string o num√©rico)
        test_size (float): Proporci√≥n para conjunto de prueba (0.2 = 20%)
        val_size (float): Proporci√≥n de train para validaci√≥n (0.2 = 20% del 80% restante)

    Returns:
        dict: Diccionario con conjuntos preparados y objetos de preprocesamiento

    Conjuntos generados:
        - Train: 60% de datos (para entrenar modelo)
        - Validation: 20% de datos (para ajuste de hiperpar√°metros)
        - Test: 20% de datos (para evaluaci√≥n final)
    """
    # CODIFICACI√ìN DE ETIQUETAS (si son texto)
    # Convertir categor√≠as string a n√∫meros enteros
    if isinstance(y[0], str):
        label_encoder = LabelEncoder()
        y_encoded = label_encoder.fit_transform(y)
        print(f"‚úì Etiquetas codificadas: {list(label_encoder.classes_)}")
    else:
        y_encoded = y
        label_encoder = None
        print("‚úì Etiquetas num√©ricas detectadas (sin codificaci√≥n)")

    # PRIMERA DIVISI√ìN: Train (80%) + Test (20%)
    # stratify=y_encoded mantiene proporci√≥n de clases en ambos conjuntos
    X_train, X_test, y_train, y_test = train_test_split(
        X, y_encoded,
        test_size=test_size,        # 20% para test
        random_state=42,           # Reproducibilidad
        stratify=y_encoded         # Mantener distribuci√≥n de clases
    )

    # SEGUNDA DIVISI√ìN: Train (60%) + Validation (20%)
    # val_size se aplica sobre el conjunto de entrenamiento temporal
    X_train_final, X_val, y_train_final, y_val = train_test_split(
        X_train, y_train,
        test_size=val_size,        # 20% del 80% restante = 16% total ‚Üí ajustado a 25% para obtener 20% final
        random_state=42,
        stratify=y_train
    )

    # NORMALIZACI√ìN DE CARACTER√çSTICAS
    # StandardScaler: media=0, desviaci√≥n=1 para cada caracter√≠stica
    # Importante: fit solo en train, transform en todos los conjuntos
    scaler = StandardScaler()
    X_train_scaled = scaler.fit_transform(X_train_final)  # Fit + transform en train
    X_val_scaled = scaler.transform(X_val)                # Solo transform en val
    X_test_scaled = scaler.transform(X_test)              # Solo transform en test

    # PREPARAR RESULTADO
    resultado = {
        # Conjuntos de datos normalizados
        'X_train': X_train_scaled,
        'X_val': X_val_scaled,
        'X_test': X_test_scaled,
        # Etiquetas correspondientes
        'y_train': y_train_final,
        'y_val': y_val,
        'y_test': y_test,
        # Objetos de preprocesamiento (para nuevas predicciones)
        'scaler': scaler,
        'label_encoder': label_encoder
    }

    # REPORTE DE DIMENSIONES
    print(f"\n‚úì Conjuntos de datos preparados:")
    print(f"   ‚Ä¢ Train: {X_train_scaled.shape[0]} muestras ({X_train_scaled.shape[0]/len(X)*100:.1f}%)")
    print(f"   ‚Ä¢ Validation: {X_val_scaled.shape[0]} muestras ({X_val_scaled.shape[0]/len(X)*100:.1f}%)")
    print(f"   ‚Ä¢ Test: {X_test_scaled.shape[0]} muestras ({X_test_scaled.shape[0]/len(X)*100:.1f}%)")
    print(f"   ‚Ä¢ Caracter√≠sticas: {X_train_scaled.shape[1]} features por muestra")

    return resultado

def entrenar_modelo_rapido(datos, modelo=None):
    """
    Entrena un modelo de clasificaci√≥n con evaluaci√≥n autom√°tica.
    √ötil para prototipos r√°pidos y validaci√≥n de caracter√≠sticas.

    Args:
        datos (dict): Diccionario retornado por preparar_datos_ml()
        modelo (sklearn.base.BaseEstimator): Modelo a entrenar (opcional)

    Returns:
        tuple: (modelo_entrenado, predicciones_val, predicciones_test)

    Modelo por defecto: RandomForest (robusto, interpretable, buen rendimiento)
    """
    # Usar RandomForest si no se especifica modelo
    # RF es robusto a overfitting y funciona bien sin mucho tuning
    if modelo is None:
        modelo = RandomForestClassifier(
            n_estimators=100,      # 100 √°rboles (balance velocidad/rendimiento)
            random_state=42,       # Reproducibilidad
            max_depth=10,          # Limitar profundidad (evitar overfitting)
            min_samples_split=5    # M√≠nimo de muestras para dividir nodo
        )
        print("‚úì Usando RandomForest por defecto")
    else:
        print(f"‚úì Usando modelo personalizado: {type(modelo).__name__}")

    # ENTRENAMIENTO
    print("‚è≥ Entrenando modelo...")
    modelo.fit(datos['X_train'], datos['y_train'])

    # PREDICCIONES
    # Validaci√≥n: para ajuste de hiperpar√°metros
    y_pred_val = modelo.predict(datos['X_val'])
    # Test: para evaluaci√≥n final (solo se usa una vez)
    y_pred_test = modelo.predict(datos['X_test'])

    # M√âTRICAS DE RENDIMIENTO
    acc_val = accuracy_score(datos['y_val'], y_pred_val)
    acc_test = accuracy_score(datos['y_test'], y_pred_test)

    print(f"\n‚úì Entrenamiento completado:")
    print(f"   ‚Ä¢ Accuracy en Validaci√≥n: {acc_val:.3f} ({acc_val*100:.1f}%)")
    print(f"   ‚Ä¢ Accuracy en Test: {acc_test:.3f} ({acc_test*100:.1f}%)")

    # Interpretaci√≥n autom√°tica de resultados
    if acc_val > 0.9:
        print("   ‚Üí Excelente rendimiento")
    elif acc_val > 0.8:
        print("   ‚Üí Buen rendimiento")
    elif acc_val > 0.7:
        print("   ‚Üí Rendimiento aceptable")
    else:
        print("   ‚Üí Rendimiento bajo - revisar caracter√≠sticas o modelo")

    # Warning sobre overfitting
    if (acc_val - acc_test) > 0.1:
        print("   ‚ö†Ô∏è  Posible overfitting (gran diferencia val-test)")

    return modelo, y_pred_val, y_pred_test

def mostrar_matriz_confusion(y_true, y_pred, labels=None, title="Matriz de Confusi√≥n"):
    """
    Visualiza matriz de confusi√≥n con formato profesional.
    Permite identificar errores de clasificaci√≥n por clase.

    Args:
        y_true (array-like): Etiquetas reales
        y_pred (array-like): Etiquetas predichas
        labels (list): Nombres de clases para ejes (opcional)
        title (str): T√≠tulo del gr√°fico

    La matriz muestra:
        - Diagonal: Clasificaciones correctas
        - Fuera de diagonal: Errores de clasificaci√≥n
    """
    # Calcular matriz de confusi√≥n
    cm = confusion_matrix(y_true, y_pred)

    # Crear visualizaci√≥n con seaborn (m√°s elegante que matplotlib b√°sico)
    plt.figure(figsize=(8, 6))

    # Heatmap con anotaciones num√©ricas
    sns.heatmap(cm,
                annot=True,           # Mostrar n√∫meros en celdas
                fmt='d',              # Formato entero
                cmap='Blues',         # Escala de colores azul
                xticklabels=labels,   # Etiquetas eje X
                yticklabels=labels,   # Etiquetas eje Y
                cbar_kws={'label': 'N√∫mero de muestras'})

    # Configuraci√≥n de ejes y t√≠tulo
    plt.title(title, fontsize=14, fontweight='bold')
    plt.xlabel('Predicci√≥n del Modelo', fontsize=12)
    plt.ylabel('Valor Real', fontsize=12)
    plt.tight_layout()
    plt.show()

    # Calcular m√©tricas adicionales de la matriz
    total_muestras = np.sum(cm)
    aciertos = np.trace(cm)  # Suma de la diagonal
    print(f"\nüìä An√°lisis de la matriz:")
    print(f"   ‚Ä¢ Total de muestras: {total_muestras}")
    print(f"   ‚Ä¢ Aciertos totales: {aciertos}")
    print(f"   ‚Ä¢ Errores totales: {total_muestras - aciertos}")

def mostrar_importancia_features(modelo, feature_names=None, top_n=10):
    """
    Visualiza importancia de caracter√≠sticas para modelos basados en √°rboles.
    Ayuda a entender qu√© caracter√≠sticas son m√°s relevantes para la clasificaci√≥n.

    Args:
        modelo: Modelo entrenado con atributo feature_importances_
        feature_names (list): Nombres de caracter√≠sticas (opcional)
        top_n (int): N√∫mero de caracter√≠sticas m√°s importantes a mostrar

    Solo funciona con: RandomForest, ExtraTrees, GradientBoosting, etc.
    """
    # Verificar si el modelo soporta importancia de caracter√≠sticas
    if hasattr(modelo, 'feature_importances_'):
        importancias = modelo.feature_importances_

        # Obtener √≠ndices de las caracter√≠sticas m√°s importantes
        indices = np.argsort(importancias)[-top_n:]  # Top N (orden ascendente)

        # Crear nombres por defecto si no se proporcionan
        if feature_names is None:
            feature_names = [f'Feature_{i}' for i in range(len(importancias))]

        # Crear gr√°fico horizontal (mejor para nombres largos)
        plt.figure(figsize=(10, 6))
        plt.barh(range(len(indices)), importancias[indices], color='skyblue', alpha=0.8)

        # Configurar ejes
        plt.yticks(range(len(indices)), [feature_names[i] for i in indices])
        plt.xlabel('Importancia Relativa', fontsize=12)
        plt.title(f'Top {top_n} Caracter√≠sticas M√°s Importantes', fontsize=14, fontweight='bold')

        # Agregar valores en las barras
        for i, v in enumerate(importancias[indices]):
            plt.text(v + 0.001, i, f'{v:.3f}', va='center', fontsize=10)

        plt.grid(axis='x', alpha=0.3)
        plt.tight_layout()
        plt.show()

        # Mostrar valores num√©ricos tambi√©n
        print(f"\nüîç Top {top_n} caracter√≠sticas m√°s importantes:")
        for i, idx in enumerate(reversed(indices)):  # Orden descendente
            print(f"   {i+1:2d}. {feature_names[idx]:<30} {importancias[idx]:.4f}")

    else:
        print(f"‚ùå El modelo {type(modelo).__name__} no soporta importancia de caracter√≠sticas")
        print("   Modelos compatibles: RandomForest, ExtraTrees, GradientBoosting")

# Mensajes informativos para el usuario
print("‚úì Utilidades de Machine Learning definidas y documentadas")
print("  ‚Üí preparar_datos_ml(): Divisi√≥n estratificada train/val/test + normalizaci√≥n")
print("  ‚Üí entrenar_modelo_rapido(): Entrenamiento con evaluaci√≥n autom√°tica")
print("  ‚Üí mostrar_matriz_confusion(): Visualizaci√≥n profesional de errores")
print("  ‚Üí mostrar_importancia_features(): An√°lisis de relevancia de caracter√≠sticas")

## UTILIDADES DE VISUALIZACI√ìN

In [None]:
# ====================================================
# UTILIDADES AVANZADAS DE VISUALIZACI√ìN
# ====================================================

def crear_grid_imagenes(imagenes, titulos=None, filas=2, figsize=(15, 8)):
    """
    Crea un grid organizado de im√°genes para comparaci√≥n visual.
    √ötil para mostrar m√∫ltiples im√°genes en una sola figura.

    Args:
        imagenes (list): Lista de arrays de im√°genes
        titulos (list): Lista de t√≠tulos para cada imagen (opcional)
        filas (int): N√∫mero de filas en el grid
        figsize (tuple): Tama√±o de la figura (ancho, alto)

    Maneja autom√°ticamente:
        - Im√°genes en escala de grises (2D arrays)
        - Im√°genes en color (3D arrays)
        - Grids irregulares (espacios vac√≠os)
    """
    n_imagenes = len(imagenes)
    # Calcular columnas necesarias basado en n√∫mero de im√°genes y filas
    columnas = int(np.ceil(n_imagenes / filas))

    # Crear subplot grid
    fig, axes = plt.subplots(filas, columnas, figsize=figsize)

    # Manejar caso especial de una sola imagen
    if n_imagenes == 1:
        axes = [axes]
    elif filas == 1:
        axes = axes.reshape(1, -1)
    elif columnas == 1:
        axes = axes.reshape(-1, 1)

    # Aplanar array de axes para f√°cil iteraci√≥n
    axes = axes.flatten()

    # Mostrar cada imagen
    for i, img in enumerate(imagenes):
        # Detectar si es escala de grises o color
        if len(img.shape) == 2:  # Escala de grises
            axes[i].imshow(img, cmap='gray')
        else:  # Color (RGB)
            axes[i].imshow(img)

        # Agregar t√≠tulo si se proporciona
        if titulos and i < len(titulos):
            axes[i].set_title(titulos[i], fontsize=12)

        # Ocultar ejes para mejor visualizaci√≥n
        axes[i].axis('off')

    # Ocultar axes sobrantes en caso de grid irregular
    for i in range(n_imagenes, len(axes)):
        axes[i].axis('off')

    plt.tight_layout()
    plt.show()

def mostrar_antes_despues(img_original, img_procesada, titulo_original="Original", titulo_procesada="Procesada"):
    """
    Muestra comparaci√≥n lado a lado de imagen original vs procesada.
    Perfecto para visualizar el efecto de operaciones de procesamiento.

    Args:
        img_original (numpy.ndarray): Imagen antes del procesamiento
        img_procesada (numpy.ndarray): Imagen despu√©s del procesamiento
        titulo_original (str): T√≠tulo para imagen original
        titulo_procesada (str): T√≠tulo para imagen procesada
    """
    # Crear subplot con 2 columnas
    fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(12, 5))

    # Mostrar imagen original
    ax1.imshow(img_original)
    ax1.set_title(titulo_original, fontsize=14, fontweight='bold')
    ax1.axis('off')

    # Mostrar imagen procesada (detectar si es escala de grises)
    if len(img_procesada.shape) == 2:
        ax2.imshow(img_procesada, cmap='gray')
    else:
        ax2.imshow(img_procesada)
    ax2.set_title(titulo_procesada, fontsize=14, fontweight='bold')
    ax2.axis('off')

    plt.tight_layout()
    plt.show()

def crear_dashboard_imagen(imagen, mostrar_canales=True, mostrar_histograma=True, mostrar_estadisticas=True):
    """
    Crea un dashboard completo de an√°lisis visual de imagen.
    Combina m√∫ltiples visualizaciones en una sola figura integral.

    Args:
        imagen (numpy.ndarray): Imagen RGB a analizar
        mostrar_canales (bool): Mostrar separaci√≥n de canales RGB
        mostrar_histograma (bool): Mostrar histograma de intensidades
        mostrar_estadisticas (bool): Mostrar panel de estad√≠sticas

    Genera:
        - Imagen original
        - Canales RGB separados
        - Histograma de distribuci√≥n de colores
        - Panel de estad√≠sticas descriptivas
    """
    # Crear figura grande con subplot grid
    fig = plt.figure(figsize=(16, 12))

    # Imagen original (posici√≥n principal)
    ax1 = plt.subplot(3, 3, 1)
    plt.imshow(imagen)
    plt.title('Imagen Original', fontsize=14, fontweight='bold')
    plt.axis('off')

    if mostrar_canales and len(imagen.shape) == 3:
        # Canales RGB individuales
        canales = ['Rojo', 'Verde', 'Azul']
        cmaps = ['Reds', 'Greens', 'Blues']

        for i in range(3):
            ax = plt.subplot(3, 3, i + 2)
            plt.imshow(imagen[:,:,i], cmap=cmaps[i])
            plt.title(f'Canal {canales[i]}', fontsize=12)
            plt.axis('off')

    if mostrar_histograma:
        # Histograma de distribuci√≥n de colores
        ax5 = plt.subplot(3, 3, 5)
        if len(imagen.shape) == 3:
            colors = ['red', 'green', 'blue']
            # Histograma superpuesto para cada canal
            for i in range(3):
                plt.hist(imagen[:,:,i].flatten(), bins=50, alpha=0.6,
                        color=colors[i], label=canales[i])
            plt.legend()
        else:
            plt.hist(imagen.flatten(), bins=50, alpha=0.7, color='gray')

        plt.title('Histograma de Intensidades', fontsize=12)
        plt.xlabel('Intensidad')
        plt.ylabel('Frecuencia')
        plt.grid(True, alpha=0.3)

    if mostrar_estadisticas:
        # Panel de estad√≠sticas descriptivas
        ax6 = plt.subplot(3, 3, 6)
        ax6.axis('off')  # Sin ejes para texto puro

        # Compilar texto estad√≠stico
        stats_text = "üìä ESTAD√çSTICAS:\n\n"
        stats_text += f"üìê Dimensiones: {imagen.shape}\n"
        stats_text += f"üî¢ Tipo de datos: {imagen.dtype}\n"
        stats_text += f"üìâ Rango: [{imagen.min():.3f}, {imagen.max():.3f}]\n"
        stats_text += f"üìä Media global: {imagen.mean():.3f}\n"
        stats_text += f"üìà Desv. est√°ndar: {imagen.std():.3f}\n\n"

        # Estad√≠sticas por canal si es color
        if len(imagen.shape) == 3:
            stats_text += "üé® POR CANAL:\n"
            canales_nombres = ['üî¥ Rojo', 'üü¢ Verde', 'üîµ Azul']
            for i in range(3):
                canal_mean = imagen[:,:,i].mean()
                canal_std = imagen[:,:,i].std()
                stats_text += f"{canales_nombres[i]}: Œº={canal_mean:.3f}, œÉ={canal_std:.3f}\n"

        # Mostrar texto con formato monoespaciado
        plt.text(0.05, 0.95, stats_text, fontsize=10,
                verticalalignment='top', fontfamily='monospace',
                bbox=dict(boxstyle="round,pad=0.3", facecolor="lightgray", alpha=0.8))

    plt.suptitle('Dashboard de An√°lisis de Imagen', fontsize=16, fontweight='bold')
    plt.tight_layout()
    plt.show()

# Mensajes informativos para el usuario
print("‚úì Utilidades de visualizaci√≥n definidas y documentadas")
print("  ‚Üí crear_grid_imagenes(): Grid organizado para m√∫ltiples im√°genes")
print("  ‚Üí mostrar_antes_despues(): Comparaci√≥n lado a lado")
print("  ‚Üí crear_dashboard_imagen(): Dashboard integral de an√°lisis")

## PLANTILLAS R√ÅPIDAS

In [None]:
# =============================================
# PLANTILLAS R√ÅPIDAS PARA TAREAS COMUNES
# =============================================

def analisis_rapido_imagen(path_imagen):
    """
    PLANTILLA 1: An√°lisis completo y r√°pido de una imagen individual.
    Combina carga, an√°lisis estad√≠stico, visualizaci√≥n y conversi√≥n de espacios.

    Args:
        path_imagen (str): Ruta al archivo de imagen

    Returns:
        tuple: (imagen_cargada, dict_espacios_color) o None si hay error

    Procesos incluidos:
        - Carga segura con redimensionamiento est√°ndar
        - An√°lisis estad√≠stico completo
        - Dashboard visual integrado
        - Conversi√≥n a m√∫ltiples espacios de color
        - Visualizaci√≥n comparativa de espacios
    """
    print("üöÄ Iniciando an√°lisis r√°pido de imagen...")

    # PASO 1: Cargar imagen con tama√±o est√°ndar para an√°lisis
    imagen = cargar_imagen_segura(path_imagen, target_size=(256, 256))
    if imagen is None:
        print("‚ùå Error: No se pudo cargar la imagen")
        return None

    print("‚úì Imagen cargada correctamente")

    # PASO 2: An√°lisis estad√≠stico b√°sico
    print("\nüìä Informaci√≥n estad√≠stica:")
    mostrar_imagen_info(imagen, "An√°lisis R√°pido")

    # PASO 3: Dashboard visual completo
    print("\nüìà Generando dashboard visual...")
    crear_dashboard_imagen(imagen)

    # PASO 4: Conversi√≥n a m√∫ltiples espacios de color
    print("\nüé® Convirtiendo espacios de color...")
    espacios = convertir_espacios_color(imagen)

    # PASO 5: Visualizaci√≥n comparativa de espacios
    imagenes_espacios = [espacios['rgb'], espacios['hsv'], espacios['gray']]
    titulos_espacios = ['RGB (Original)', 'HSV (Tono-Saturaci√≥n)', 'Escala de Grises']
    crear_grid_imagenes(imagenes_espacios, titulos_espacios, filas=1)

    print("‚úÖ An√°lisis completado exitosamente")
    return imagen, espacios

def pipeline_dataset_completo(carpeta_imagenes, target_size=(128, 128)):
    """
    PLANTILLA 2: Pipeline completo para procesamiento de dataset de im√°genes.
    Desde carga masiva hasta modelo entrenado y evaluado.

    Args:
        carpeta_imagenes (str): Ruta a carpeta con subcarpetas por categor√≠a
        target_size (tuple): Tama√±o objetivo para todas las im√°genes

    Returns:
        dict: Diccionario completo con im√°genes, caracter√≠sticas, datos ML y modelo

    Estructura esperada de carpetas:
        carpeta_imagenes/
        ‚îú‚îÄ‚îÄ categoria1/
        ‚îÇ   ‚îú‚îÄ‚îÄ imagen1.jpg
        ‚îÇ   ‚îî‚îÄ‚îÄ imagen2.jpg
        ‚îî‚îÄ‚îÄ categoria2/
            ‚îú‚îÄ‚îÄ imagen3.jpg
            ‚îî‚îÄ‚îÄ imagen4.jpg
    """
    print("üîÑ Iniciando pipeline completo de dataset...")

    imagenes = []
    etiquetas = []

    # PASO 1: Carga masiva por categor√≠as
    print("üìÅ Cargando im√°genes por categor√≠a:")
    for categoria in os.listdir(carpeta_imagenes):
        categoria_path = os.path.join(carpeta_imagenes, categoria)

        # Verificar que sea directorio
        if os.path.isdir(categoria_path):
            print(f"   üîç Procesando categor√≠a '{categoria}'...")
            contador_categoria = 0

            # Procesar cada imagen en la categor√≠a
            for archivo in os.listdir(categoria_path):
                # Verificar extensiones de imagen v√°lidas
                if archivo.lower().endswith(('.png', '.jpg', '.jpeg', '.bmp', '.tiff')):
                    path_completo = os.path.join(categoria_path, archivo)
                    img = cargar_imagen_segura(path_completo, target_size)

                    if img is not None:
                        imagenes.append(img)
                        etiquetas.append(categoria)
                        contador_categoria += 1

            print(f"      ‚úì {contador_categoria} im√°genes cargadas")

    total_imagenes = len(imagenes)
    print(f"\nüìä Total: {total_imagenes} im√°genes cargadas desde {len(set(etiquetas))} categor√≠as")

    if total_imagenes == 0:
        print("‚ùå Error: No se encontraron im√°genes v√°lidas")
        return None

    # PASO 2: Conversi√≥n a arrays NumPy
    X = np.array(imagenes)
    y = np.array(etiquetas)

    # PASO 3: Extracci√≥n masiva de caracter√≠sticas
    print(f"\nüéØ Extrayendo caracter√≠sticas de {total_imagenes} im√°genes...")
    features = []

    # Barra de progreso simulada
    for i, img in enumerate(imagenes):
        feat = extraer_features_completas(img)
        features.append(feat)

        # Mostrar progreso cada 10%
        if (i + 1) % max(1, total_imagenes // 10) == 0:
            progreso = (i + 1) / total_imagenes * 100
            print(f"      üìà Progreso: {progreso:.0f}% ({i + 1}/{total_imagenes})")

    X_features = np.array(features)
    print(f"‚úì Caracter√≠sticas extra√≠das: {X_features.shape[1]} features por imagen")

    # PASO 4: Preparaci√≥n para ML
    print(f"\nü§ñ Preparando datos para Machine Learning...")
    datos_ml = preparar_datos_ml(X_features, y)

    # PASO 5: Entrenamiento y evaluaci√≥n r√°pida
    print(f"\nüé≤ Entrenamiento de modelo de validaci√≥n...")
    modelo, pred_val, pred_test = entrenar_modelo_rapido(datos_ml)

    # PASO 6: Compilar resultados
    resultado = {
        'imagenes_originales': X,           # Arrays de im√°genes
        'etiquetas': y,                     # Etiquetas de categor√≠as
        'caracteristicas': X_features,      # Features extra√≠dos
        'datos_ml': datos_ml,              # Conjuntos train/val/test preparados
        'modelo': modelo,                   # Modelo entrenado
        'predicciones_val': pred_val,      # Predicciones en validaci√≥n
        'predicciones_test': pred_test     # Predicciones en test
    }

    print(f"\nüéâ Pipeline completado exitosamente!")
    print(f"   üìù Datos listos para an√°lisis avanzado")

    return resultado

def segmentacion_rapida(imagen, metodo='kmeans', **kwargs):
    """
    PLANTILLA 3: Segmentaci√≥n r√°pida con m√∫ltiples algoritmos disponibles.
    Permite experimentar f√°cilmente con diferentes t√©cnicas de segmentaci√≥n.

    Args:
        imagen (numpy.ndarray): Imagen a segmentar
        metodo (str): M√©todo de segmentaci√≥n ('kmeans' o 'color_range')
        **kwargs: Par√°metros espec√≠ficos del m√©todo

    Returns:
        tuple: (resultado_segmentacion, modelo_o_parametros)

    M√©todos disponibles:
        - 'kmeans': Clustering autom√°tico en espacio HSV
          Par√°metros: n_clusters=5
        - 'color_range': Segmentaci√≥n por rango de color HSV
          Par√°metros: h_min=0.0, h_max=0.1, s_min=0.2, v_min=0.2
    """
    print(f"üéØ Iniciando segmentaci√≥n usando m√©todo '{metodo}'...")

    if metodo == 'kmeans':
        # SEGMENTACI√ìN POR CLUSTERING
        n_clusters = kwargs.get('n_clusters', 5)
        print(f"   üî¨ Aplicando K-means con {n_clusters} clusters...")

        segmentacion, modelo = segmentar_por_color_hsv_auto(imagen, n_clusters)
        parametros = {'metodo': 'kmeans', 'n_clusters': n_clusters}

    elif metodo == 'color_range':
        # SEGMENTACI√ìN POR RANGO DE COLOR
        h_min = kwargs.get('h_min', 0.0)
        h_max = kwargs.get('h_max', 0.1)
        s_min = kwargs.get('s_min', 0.2)
        v_min = kwargs.get('v_min', 0.2)

        print(f"   üåà Segmentando rango HSV: H[{h_min:.2f}-{h_max:.2f}], S‚â•{s_min:.2f}, V‚â•{v_min:.2f}")

        imagen_hsv = color.rgb2hsv(imagen)
        segmentacion = crear_mascara_color_rango(imagen_hsv, h_min, h_max, s_min, v_min)

        modelo = None
        parametros = {
            'metodo': 'color_range',
            'h_min': h_min, 'h_max': h_max,
            's_min': s_min, 'v_min': v_min
        }

    else:
        print(f"‚ùå Error: M√©todo '{metodo}' no reconocido")
        print("   üí° M√©todos disponibles: 'kmeans', 'color_range'")
        return None, None

    # Mostrar resultados comparativos
    print("   üìä Generando visualizaci√≥n comparativa...")
    titulo_resultado = f"Segmentaci√≥n ({metodo.upper()})"
    mostrar_antes_despues(imagen, segmentacion, "Original", titulo_resultado)

    # Estad√≠sticas de la segmentaci√≥n
    if metodo == 'kmeans':
        regiones_unicas = len(np.unique(segmentacion))
        print(f"   ‚úì {regiones_unicas} regiones identificadas")
    else:
        pixeles_segmentados = np.sum(segmentacion)
        total_pixeles = segmentacion.size
        porcentaje = (pixeles_segmentados / total_pixeles) * 100
        print(f"   ‚úì {pixeles_segmentados} p√≠xeles segmentados ({porcentaje:.1f}% del total)")

    print("üéØ Segmentaci√≥n completada")
    return segmentacion, {'modelo': modelo, 'parametros': parametros}

# Mensajes informativos para el usuario
print("‚úì Plantillas r√°pidas definidas y documentadas")
print("\nüöÄ Plantillas disponibles:")
print("   1Ô∏è‚É£  analisis_rapido_imagen(path) - An√°lisis integral de imagen individual")
print("   2Ô∏è‚É£  pipeline_dataset_completo(carpeta) - Procesamiento completo de dataset")
print("   3Ô∏è‚É£  segmentacion_rapida(imagen, metodo, **params) - Segmentaci√≥n experimental")
print("\nüí° Cada plantilla incluye mensajes de progreso y manejo de errores")

## EJEMPLOS DE USO

### Ejemplo 1: An√°lisis r√°pido de imagen
```python
# An√°lisis completo con una sola funci√≥n
imagen, espacios = analisis_rapido_imagen('mi_imagen.jpg')

# Acceder a diferentes espacios de color
img_hsv = espacios['hsv']
img_gray = espacios['gray']
```

### Ejemplo 2: Segmentaci√≥n por color
```python
# Segmentaci√≥n autom√°tica con K-means
seg, info = segmentacion_rapida(imagen, 'kmeans', n_clusters=4)

# Segmentaci√≥n por rango de color espec√≠fico (rojos)
seg, info = segmentacion_rapida(imagen, 'color_range',
                               h_min=0.9, h_max=1.0,
                               s_min=0.5, v_min=0.3)
```

### Ejemplo 3: Pipeline completo de dataset
```python
# Procesamiento autom√°tico de dataset completo
resultado = pipeline_dataset_completo('mi_dataset/')

# Acceder a componentes individuales
modelo = resultado['modelo']
datos_ml = resultado['datos_ml']
caracteristicas = resultado['caracteristicas']

# An√°lisis avanzado
mostrar_matriz_confusion(datos_ml['y_test'],
                        resultado['predicciones_test'])
```

### Ejemplo 4: Extracci√≥n manual de caracter√≠sticas
```python
# Cargar y preparar imagen
img = cargar_imagen_segura('imagen.jpg', target_size=(128, 128))

# Extraer diferentes tipos de caracter√≠sticas
features_completas = extraer_features_completas(img)  # 46 caracter√≠sticas
features_color = extraer_features_color_completas(img)  # 15 caracter√≠sticas
features_textura = extraer_features_textura_avanzadas(img)  # 7 caracter√≠sticas

print(f"Caracter√≠sticas extra√≠das: {len(features_completas)} total")
```

### Ejemplo 5: Visualizaci√≥n avanzada
```python
# Grid de m√∫ltiples im√°genes
imagenes = [img1, img2, img3, img4]
titulos = ['Original', 'Filtrada', 'Segmentada', 'Resultado']
crear_grid_imagenes(imagenes, titulos, filas=2)

# Dashboard completo
crear_dashboard_imagen(imagen,
                      mostrar_canales=True,
                      mostrar_histograma=True,
                      mostrar_estadisticas=True)
```

---

## ¬°Utilidades listas para usar!

**üéØ Para usar en laboratorios:**
1. Ejecuta la celda de **importaciones** al inicio
2. Ejecuta las celdas de **utilidades** que necesites
3. Usa las **plantillas r√°pidas** para tareas comunes
4. Consulta el **glosario** para t√©rminos t√©cnicos

**üí° Consejos:**
- Todas las funciones incluyen documentaci√≥n detallada
- Los mensajes de progreso te mantienen informado
- Manejo robusto de errores en todas las operaciones
- Par√°metros por defecto optimizados para la mayor√≠a de casos

---

# GLOSARIO T√âCNICO

## T√©rminos de Procesamiento de Im√°genes

**Array/Arreglo**: Estructura de datos multidimensional de NumPy. Para im√°genes RGB: shape (altura, ancho, 3)

**BGR vs RGB**: Orden de canales de color. OpenCV usa BGR (Azul-Verde-Rojo), PIL/matplotlib usan RGB (Rojo-Verde-Azul)

**Bounding Box**: Rect√°ngulo m√≠nimo que contiene completamente un objeto detectado

**Canal**: Una de las componentes de color en una imagen (ej: R, G, B en RGB o H, S, V en HSV)

**Clustering**: T√©cnica de agrupamiento que divide datos en grupos similares sin supervisi√≥n

**Componentes Conectados**: Regiones de p√≠xeles conectados que comparten caracter√≠sticas similares

**Elemento Estructurante/Kernel**: Matriz peque√±a usada en operaciones morfol√≥gicas (ej: c√≠rculo, cuadrado)

**Escala de Grises**: Imagen con un solo canal representando intensidad de luminancia (0=negro, 1=blanco)

**Espacio de Color**: Sistema de coordenadas para representar colores (RGB, HSV, LAB, etc.)

**M√°scara Binaria**: Imagen de 2 valores (0 y 1) que indica qu√© p√≠xeles pertenecen a una regi√≥n de inter√©s

**Normalizaci√≥n**: Proceso de escalar valores a un rango est√°ndar (ej: [0,255] ‚Üí [0,1])

**P√≠xel**: Unidad m√≠nima de una imagen digital. Contiene valores de intensidad para cada canal de color

**Segmentaci√≥n**: Proceso de dividir una imagen en regiones homog√©neas o objetos de inter√©s

**Umbralizaci√≥n/Thresholding**: T√©cnica que convierte imagen en escala de grises a binaria usando un valor umbral

## Espacios de Color

**RGB (Red-Green-Blue)**:
- R: Intensidad de rojo [0,1]
- G: Intensidad de verde [0,1]  
- B: Intensidad de azul [0,1]
- Aditivo (suma colores para crear blanco)

**HSV (Hue-Saturation-Value)**:
- H: Tono/Matiz [0,1] (tipo de color: rojo‚âà0, verde‚âà0.33, azul‚âà0.67)
- S: Saturaci√≥n [0,1] (pureza del color: 0=gris, 1=color puro)
- V: Valor/Brillo [0,1] (intensidad luminosa: 0=negro, 1=brillante)

**LAB (L*a*b*)**:
- L: Luminancia [0,100] (brillo perceptual)
- a: Verde (-) a Magenta (+)
- b: Azul (-) a Amarillo (+)
- Perceptualmente uniforme (diferencias num√©ricas = diferencias visuales)

## Operaciones Morfol√≥gicas

**Erosi√≥n**: Reduce el tama√±o de regiones blancas (adelgaza objetos)

**Dilataci√≥n**: Expande el tama√±o de regiones blancas (engrosa objetos)

**Apertura (Opening)**: Erosi√≥n seguida de dilataci√≥n (elimina ruido peque√±o)

**Cierre (Closing)**: Dilataci√≥n seguida de erosi√≥n (cierra huecos peque√±os)

## Filtros y Detecci√≥n de Bordes

**Filtro Sobel**: Detecta gradientes (cambios de intensidad) en direcciones horizontal y vertical

**Detector Canny**: Algoritmo avanzado de detecci√≥n de bordes con supresi√≥n de no-m√°ximos

**Gradiente**: Medida del cambio de intensidad entre p√≠xeles vecinos

## Caracter√≠sticas (Features) para ML

**Estad√≠sticas de Primer Orden**: Media, desviaci√≥n est√°ndar, mediana (distribuci√≥n de intensidades)

**Estad√≠sticas de Segundo Orden**: Correlaci√≥n, contraste, homogeneidad (relaciones espaciales)

**Histograma**: Distribuci√≥n de frecuencias de intensidades de p√≠xeles

**Textura**: Patrones espaciales de variaci√≥n de intensidad (rugosidad, suavidad, regularidad)

## Machine Learning

**Conjunto de Entrenamiento (Train)**: Datos usados para ense√±ar al modelo (‚âà60%)

**Conjunto de Validaci√≥n (Val)**: Datos para ajustar hiperpar√°metros y evitar overfitting (‚âà20%)

**Conjunto de Prueba (Test)**: Datos para evaluaci√≥n final del modelo (‚âà20%)

**Caracter√≠sticas/Features**: Variables num√©ricas que describen cada muestra (ej: color promedio, textura)

**Etiquetas/Labels**: Categor√≠as o valores objetivo que el modelo debe predecir

**Matriz de Confusi√≥n**: Tabla que muestra aciertos y errores de clasificaci√≥n por cada clase

**Overfitting**: Modelo que memoriza datos de entrenamiento pero no generaliza a datos nuevos

**RandomForest**: Algoritmo que combina m√∫ltiples √°rboles de decisi√≥n para mayor robustez

**Validaci√≥n Estratificada**: Divisi√≥n que mantiene la proporci√≥n de cada clase en todos los conjuntos

## M√©tricas de Evaluaci√≥n

**Accuracy (Exactitud)**: Proporci√≥n de predicciones correctas sobre el total

**Precisi√≥n**: De las predicciones positivas, cu√°ntas fueron correctas

**Recall (Sensibilidad)**: De los casos positivos reales, cu√°ntos fueron detectados

**F1-Score**: Media arm√≥nica entre precisi√≥n y recall

## Bibliotecas Python

**NumPy**: Operaciones num√©ricas y arrays multidimensionales eficientes

**PIL (Pillow)**: Carga, manipulaci√≥n y guardado de im√°genes en m√∫ltiples formatos

**OpenCV (cv2)**: Biblioteca completa de computer vision (¬°usa formato BGR!)

**scikit-image**: Algoritmos especializados de procesamiento de im√°genes

**scikit-learn**: Herramientas de machine learning y an√°lisis de datos

**matplotlib**: Creaci√≥n de gr√°ficos y visualizaci√≥n de im√°genes

**seaborn**: Visualizaciones estad√≠sticas avanzadas basadas en matplotlib

---

## Referencias R√°pidas de Rangos

### Rangos de Tono (H) en HSV para Colores Comunes:
- **Rojo**: 0.0-0.1 y 0.9-1.0 (est√° en ambos extremos)
- **Naranja**: 0.05-0.15
- **Amarillo**: 0.15-0.25  
- **Verde**: 0.25-0.45
- **Cian**: 0.45-0.55
- **Azul**: 0.55-0.75
- **Magenta**: 0.75-0.9

### Valores T√≠picos de Saturaci√≥n (S) y Valor (V):
- **Colores vivos**: S > 0.5, V > 0.5
- **Colores pasteles**: S < 0.5, V > 0.7
- **Colores oscuros**: V < 0.3 (independiente de S)
- **Grises**: S < 0.2 (independiente de V)

### Tama√±os de Kernel Recomendados:
- **Ruido peque√±o**: kernel = 2-3 p√≠xeles
- **Detalles medianos**: kernel = 5-7 p√≠xeles  
- **Objetos grandes**: kernel = 10+ p√≠xeles

---

## ¬°Todo listo para el laboratorio integrador!

Este cuaderno te proporciona todas las herramientas necesarias para trabajar eficientemente en el procesamiento de im√°genes y machine learning.