# üìä An√°lisis de Ocupaci√≥n de Anaqueles - Dataset SKU-110K

Este notebook analiza im√°genes reales de anaqueles del dataset SKU-110K utilizando t√©cnicas de visi√≥n computacional y estimaci√≥n de profundidad monocular.

## üéØ Objetivos
1. **Explorar el dataset SKU-110K** - Estructura de archivos y anotaciones
2. **Analizar resultados del pipeline** - Visualizaci√≥n de 10 im√°genes procesadas
3. **Estad√≠sticas comparativas** - Ocupaci√≥n por anaquel y m√©tricas
4. **Demostraci√≥n interactiva** - Pipeline completo paso a paso

---

**Proyecto Final - Visi√≥n Computarizada**  
**Dataset**: SKU-110K (11.4 GB, 11,762 im√°genes de retail)  
**T√©cnicas**: Depth-Anything-V2, Canny, Hough Transform, DBSCAN

## 1. An√°lisis de la Estructura del Dataset SKU-110K

Primero, vamos a explorar la estructura del dataset descargado y analizar las anotaciones.

In [None]:
# Imports necesarios
import sys
from pathlib import Path
import pandas as pd
import numpy as np
import cv2
import matplotlib.pyplot as plt
import seaborn as sns
from IPython.display import display, Image as IPImage

# Configurar estilo
plt.style.use('seaborn-v0_8-darkgrid')
sns.set_palette("husl")

# Agregar directorio ra√≠z al path
project_root = Path("..").resolve()
sys.path.insert(0, str(project_root / "src"))

print("‚úÖ Imports completados")
print(f"üìÅ Directorio del proyecto: {project_root}")

: 

In [None]:
# Explorar estructura del dataset
data_dir = project_root / "data"
sku110k_dir = data_dir / "raw" / "SKU110K_fixed"

print("üîç ESTRUCTURA DEL DATASET SKU-110K")
print("="*60)

# Verificar directorios
if sku110k_dir.exists():
    print(f"\n‚úÖ Dataset encontrado en: {sku110k_dir}")
    
    # Listar subdirectorios
    for item in sku110k_dir.iterdir():
        if item.is_dir():
            n_files = len(list(item.rglob("*.*")))
            print(f"   üìÇ {item.name}: {n_files} archivos")
        else:
            size_mb = item.stat().st_size / (1024*1024)
            print(f"   üìÑ {item.name}: {size_mb:.2f} MB")
else:
    print(f"‚ùå Dataset no encontrado en: {sku110k_dir}")

In [None]:
# Analizar anotaciones
annotations_dir = sku110k_dir / "annotations"

print("\nüìã AN√ÅLISIS DE ANOTACIONES")
print("="*60)

for ann_file in annotations_dir.glob("*.csv"):
    df = pd.read_csv(ann_file)
    print(f"\nüìÑ {ann_file.name}")
    print(f"   - Registros: {len(df):,}")
    print(f"   - Columnas: {list(df.columns)}")
    print(f"   - Muestra:")
    display(df.head(3))

## 2. Verificaci√≥n y Visualizaci√≥n de Im√°genes Reales

Ahora vamos a cargar y visualizar las 10 im√°genes reales del dataset SKU-110K que procesamos.

In [None]:
# Cargar im√°genes de muestra
sample_dir = data_dir / "raw" / "sample"
sample_images = sorted(list(sample_dir.glob("sku110k_sample_*.jpg")))

print(f"üì∏ IM√ÅGENES REALES DEL DATASET SKU-110K")
print("="*60)
print(f"\nTotal de im√°genes: {len(sample_images)}\n")

# Informaci√≥n de cada imagen
for i, img_path in enumerate(sample_images, 1):
    img = cv2.imread(str(img_path))
    size_mb = img_path.stat().st_size / (1024*1024)
    print(f"{i:2d}. {img_path.name}")
    print(f"    Dimensiones: {img.shape[1]}√ó{img.shape[0]} pixels")
    print(f"    Tama√±o: {size_mb:.2f} MB")

In [None]:
# Visualizar grid de im√°genes
fig, axes = plt.subplots(2, 5, figsize=(20, 8))
axes = axes.flatten()

for idx, img_path in enumerate(sample_images[:10]):
    img = cv2.imread(str(img_path))
    img_rgb = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    
    axes[idx].imshow(img_rgb)
    axes[idx].set_title(f"{img_path.stem}\n{img.shape[1]}√ó{img.shape[0]}", fontsize=9)
    axes[idx].axis('off')

plt.suptitle("Im√°genes Reales de Anaqueles - Dataset SKU-110K", fontsize=16, fontweight='bold')
plt.tight_layout()
plt.show()

print("‚úÖ Todas las im√°genes son REALES de anaqueles de retail")

## 3. An√°lisis de Resultados del Pipeline

Visualicemos los resultados del procesamiento de las 10 im√°genes con el pipeline completo.

In [None]:
# Cargar resultados del procesamiento
results_dir = data_dir / "results" / "batch_processing"
result_images = sorted(list(results_dir.glob("sku110k_sample_*_analysis.png")))

print(f"üìä RESULTADOS DEL PROCESAMIENTO")
print("="*60)
print(f"\nTotal de visualizaciones generadas: {len(result_images)}\n")

# Crear DataFrame con estad√≠sticas (datos del reporte anterior)
results_data = {
    'Imagen': [
        'sku110k_sample_000.jpg', 'sku110k_sample_001.jpg', 'sku110k_sample_002.jpg',
        'sku110k_sample_003.jpg', 'sku110k_sample_004.jpg', 'sku110k_sample_005.jpg',
        'sku110k_sample_006.jpg', 'sku110k_sample_007.jpg', 'sku110k_sample_008.jpg',
        'sku110k_sample_009.jpg'
    ],
    'Ocupaci√≥n (%)': [32.0, 36.6, 37.6, 40.3, 36.8, 32.8, 24.1, 24.5, 17.9, 37.5],
    'Anaqueles': [11, 16, 10, 14, 10, 10, 14, 11, 13, 8],
    'Celdas': [550, 800, 500, 700, 500, 500, 700, 550, 650, 400]
}

df_results = pd.DataFrame(results_data)
display(df_results)

# Estad√≠sticas resumen
print(f"\nüìà ESTAD√çSTICAS RESUMEN:")
print(f"   ‚Ä¢ Ocupaci√≥n promedio: {df_results['Ocupaci√≥n (%)'].mean():.1f}%")
print(f"   ‚Ä¢ Ocupaci√≥n m√≠nima: {df_results['Ocupaci√≥n (%)'].min():.1f}%")
print(f"   ‚Ä¢ Ocupaci√≥n m√°xima: {df_results['Ocupaci√≥n (%)'].max():.1f}%")
print(f"   ‚Ä¢ Total anaqueles: {df_results['Anaqueles'].sum()}")
print(f"   ‚Ä¢ Total celdas: {df_results['Celdas'].sum():,}")

In [None]:
# Visualizaci√≥n comparativa de ocupaci√≥n
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 5))

# Gr√°fico de barras - Ocupaci√≥n por imagen
colors = ['#d62728' if x < 25 else '#ff7f0e' if x < 40 else '#2ca02c' for x in df_results['Ocupaci√≥n (%)']]
ax1.barh(df_results['Imagen'], df_results['Ocupaci√≥n (%)'], color=colors, alpha=0.8)
ax1.set_xlabel('Ocupaci√≥n (%)', fontsize=12)
ax1.set_title('Ocupaci√≥n de Anaqueles por Imagen', fontsize=14, fontweight='bold')
ax1.axvline(x=40, color='green', linestyle='--', alpha=0.5, label='Alto (>40%)')
ax1.axvline(x=25, color='orange', linestyle='--', alpha=0.5, label='Medio (25-40%)')
ax1.legend()
ax1.grid(axis='x', alpha=0.3)

# Histograma de distribuci√≥n
ax2.hist(df_results['Ocupaci√≥n (%)'], bins=8, color='steelblue', alpha=0.7, edgecolor='black')
ax2.set_xlabel('Ocupaci√≥n (%)', fontsize=12)
ax2.set_ylabel('Frecuencia', fontsize=12)
ax2.set_title('Distribuci√≥n de Ocupaci√≥n', fontsize=14, fontweight='bold')
ax2.axvline(x=df_results['Ocupaci√≥n (%)'].mean(), color='red', linestyle='--', 
            linewidth=2, label=f'Promedio: {df_results["Ocupaci√≥n (%)"].mean():.1f}%')
ax2.legend()
ax2.grid(axis='y', alpha=0.3)

plt.tight_layout()
plt.show()

In [None]:
# Scatter plot: Anaqueles vs Ocupaci√≥n
fig, ax = plt.subplots(figsize=(10, 6))

scatter = ax.scatter(df_results['Anaqueles'], df_results['Ocupaci√≥n (%)'], 
                     c=df_results['Ocupaci√≥n (%)'], cmap='RdYlGn', 
                     s=df_results['Celdas'], alpha=0.6, edgecolors='black')

# A√±adir labels
for idx, row in df_results.iterrows():
    ax.annotate(f"#{idx+1}", (row['Anaqueles'], row['Ocupaci√≥n (%)']), 
                fontsize=9, ha='center')

ax.set_xlabel('N√∫mero de Anaqueles Detectados', fontsize=12)
ax.set_ylabel('Ocupaci√≥n Promedio (%)', fontsize=12)
ax.set_title('Relaci√≥n entre Anaqueles Detectados y Ocupaci√≥n\n(Tama√±o del punto = n√∫mero de celdas)', 
             fontsize=14, fontweight='bold')
ax.grid(True, alpha=0.3)

# Colorbar
cbar = plt.colorbar(scatter, ax=ax)
cbar.set_label('Ocupaci√≥n (%)', rotation=270, labelpad=20)

plt.tight_layout()
plt.show()

## 4. Visualizaci√≥n de Resultados Individuales

Veamos los resultados completos del an√°lisis para im√°genes seleccionadas.

In [None]:
# Mostrar resultados de las 3 mejores y 3 peores im√°genes
best_images = df_results.nlargest(3, 'Ocupaci√≥n (%)')
worst_images = df_results.nsmallest(3, 'Ocupaci√≥n (%)')

print("üü¢ TOP 3 - Mayor Ocupaci√≥n:")
for idx, row in best_images.iterrows():
    print(f"   {idx+1}. {row['Imagen']}: {row['Ocupaci√≥n (%)']}% ({row['Anaqueles']} anaqueles)")

print("\nüî¥ BOTTOM 3 - Menor Ocupaci√≥n:")
for idx, row in worst_images.iterrows():
    print(f"   {idx+1}. {row['Imagen']}: {row['Ocupaci√≥n (%)']}% ({row['Anaqueles']} anaqueles)")

In [None]:
# Visualizar resultado completo de una imagen (la de mayor ocupaci√≥n)
best_idx = df_results['Ocupaci√≥n (%)'].idxmax()
best_result_path = results_dir / f"sku110k_sample_{best_idx:03d}_analysis.png"

print(f"\nüìä Visualizaci√≥n completa - Imagen con MAYOR ocupaci√≥n ({df_results.iloc[best_idx]['Ocupaci√≥n (%)']}%)")
print(f"   Archivo: {best_result_path.name}\n")

if best_result_path.exists():
    result_img = cv2.imread(str(best_result_path))
    result_img_rgb = cv2.cvtColor(result_img, cv2.COLOR_BGR2RGB)
    
    fig, ax = plt.subplots(figsize=(18, 12))
    ax.imshow(result_img_rgb)
    ax.axis('off')
    ax.set_title(f'An√°lisis Completo - {df_results.iloc[best_idx]["Imagen"]}', 
                 fontsize=16, fontweight='bold', pad=20)
    plt.tight_layout()
    plt.show()
else:
    print(f"‚ùå Archivo no encontrado: {best_result_path}")

## 5. Demostraci√≥n del Pipeline Paso a Paso

Ejecutemos el pipeline completo en una imagen para ver cada etapa del procesamiento.

In [None]:
# Imports del pipeline
from shelf_occupancy.config import load_config
from shelf_occupancy.preprocessing import ImagePreprocessor
from shelf_occupancy.detection import EdgeDetector, LineDetector, ShelfDetector
from shelf_occupancy.depth import DepthEstimator
from shelf_occupancy.analysis import GridAnalyzer
from shelf_occupancy.visualization import OccupancyVisualizer
from shelf_occupancy.utils import load_image

# Cargar configuraci√≥n
config = load_config()

print("‚úÖ M√≥dulos del pipeline importados exitosamente")

In [None]:
# Seleccionar imagen de ejemplo
demo_image_path = sample_images[0]  # Primera imagen
print(f"üñºÔ∏è  Imagen de demostraci√≥n: {demo_image_path.name}")

# Paso 1: Cargar imagen
image = load_image(demo_image_path, color_mode="BGR")
print(f"‚úÖ Paso 1: Imagen cargada - {image.shape}")

In [None]:
# Paso 2: Preprocesamiento
preprocessor = ImagePreprocessor(config.preprocessing)
processed = preprocessor.preprocess(image, apply_resize=False, apply_normalize=False)

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

ax1.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))
ax1.set_title('Original', fontsize=14, fontweight='bold')
ax1.axis('off')

ax2.imshow(cv2.cvtColor(processed, cv2.COLOR_BGR2RGB))
ax2.set_title('Preprocesada (CLAHE + Bilateral Filter)', fontsize=14, fontweight='bold')
ax2.axis('off')

plt.suptitle('‚úÖ Paso 2: Preprocesamiento', fontsize=16, fontweight='bold')
plt.tight_layout()
plt.show()

print(f"‚úÖ Paso 2: Preprocesamiento completado")

In [None]:
# Paso 3: Detecci√≥n de bordes y l√≠neas
edge_detector = EdgeDetector(config.shelf_detection.canny)
line_detector = LineDetector(config.shelf_detection.hough)

edges = edge_detector.detect(processed)
all_lines = line_detector.detect(edges)
h_lines = line_detector.filter_by_orientation(all_lines, "horizontal", tolerance=15)
h_lines = line_detector.merge_similar_lines(h_lines)

# Visualizar
fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

ax1.imshow(edges, cmap='gray')
ax1.set_title(f'Detecci√≥n de Bordes (Canny)', fontsize=14, fontweight='bold')
ax1.axis('off')

# Dibujar l√≠neas detectadas
img_lines = processed.copy()
for line in h_lines:
    cv2.line(img_lines, (line.x1, line.y1), (line.x2, line.y2), (0, 255, 0), 2)

ax2.imshow(cv2.cvtColor(img_lines, cv2.COLOR_BGR2RGB))
ax2.set_title(f'L√≠neas Horizontales Detectadas: {len(h_lines)}', fontsize=14, fontweight='bold')
ax2.axis('off')

plt.suptitle('‚úÖ Paso 3: Detecci√≥n de Estructura', fontsize=16, fontweight='bold')
plt.tight_layout()
plt.show()

print(f"‚úÖ Paso 3: Detectadas {len(h_lines)} l√≠neas horizontales")

In [None]:
# Paso 4: Detecci√≥n de anaqueles
shelf_detector = ShelfDetector(config.shelf_detection)
v_lines = line_detector.filter_by_orientation(all_lines, "vertical", tolerance=15)
shelves = shelf_detector.detect_from_lines(h_lines, v_lines, processed.shape[:2])

if not shelves:
    shelves = shelf_detector.detect_simple_grid(processed.shape[:2], n_rows=4)

# Visualizar anaqueles
img_shelves = processed.copy()
colors_shelf = [(255, 0, 0), (0, 255, 0), (0, 0, 255), (255, 255, 0), 
                (255, 0, 255), (0, 255, 255), (128, 0, 0), (0, 128, 0)]

for i, shelf in enumerate(shelves):
    color = colors_shelf[i % len(colors_shelf)]
    cv2.rectangle(img_shelves, (shelf.x1, shelf.y1), (shelf.x2, shelf.y2), color, 3)
    cv2.putText(img_shelves, f"#{i+1}", (shelf.x1+10, shelf.y1+30), 
                cv2.FONT_HERSHEY_SIMPLEX, 1, color, 2)

fig, ax = plt.subplots(figsize=(16, 10))
ax.imshow(cv2.cvtColor(img_shelves, cv2.COLOR_BGR2RGB))
ax.set_title(f'‚úÖ Paso 4: Anaqueles Detectados: {len(shelves)}', fontsize=16, fontweight='bold')
ax.axis('off')
plt.tight_layout()
plt.show()

print(f"‚úÖ Paso 4: Detectados {len(shelves)} anaqueles")

In [None]:
# Paso 5: Estimaci√≥n de profundidad
depth_estimator = DepthEstimator(config.depth_estimation)
depth_map, depth_colored = depth_estimator.estimate(processed, return_colored=True)

fig, (ax1, ax2) = plt.subplots(1, 2, figsize=(16, 6))

ax1.imshow(depth_map, cmap='plasma')
ax1.set_title('Mapa de Profundidad (valores normalizados)', fontsize=14, fontweight='bold')
ax1.axis('off')
cbar1 = plt.colorbar(ax1.imshow(depth_map, cmap='plasma'), ax=ax1, fraction=0.046)
cbar1.set_label('Profundidad', rotation=270, labelpad=20)

ax2.imshow(depth_colored)
ax2.set_title('Mapa de Profundidad (coloreado)', fontsize=14, fontweight='bold')
ax2.axis('off')

plt.suptitle(f'‚úÖ Paso 5: Estimaci√≥n de Profundidad - Rango [{depth_map.min():.3f}, {depth_map.max():.3f}]', 
             fontsize=16, fontweight='bold')
plt.tight_layout()
plt.show()

print(f"‚úÖ Paso 5: Profundidad estimada - Rango [{depth_map.min():.3f}, {depth_map.max():.3f}]")

In [None]:
# Paso 6: An√°lisis de ocupaci√≥n
grid_analyzer = GridAnalyzer(config.occupancy_analysis)
results = grid_analyzer.analyze_multiple_shelves(depth_map, shelves)

occupancy_percentages = [r[1] for r in results]
stats_list = [r[2] for r in results]

avg_occupancy = sum(occupancy_percentages) / len(occupancy_percentages)

print(f"‚úÖ Paso 6: An√°lisis de Ocupaci√≥n Completado")
print(f"\nüìä RESULTADOS:")
print(f"   ‚Ä¢ Ocupaci√≥n promedio: {avg_occupancy:.1f}%")
print(f"   ‚Ä¢ Total de celdas: {sum(s['total_cells'] for s in stats_list)}")
print(f"\nüìã Por anaquel:")
for i, (occ_pct, stats) in enumerate(zip(occupancy_percentages, stats_list), 1):
    level = grid_analyzer.classify_occupancy_level(occ_pct)
    emoji = {'high': 'üü¢', 'medium': 'üü°', 'low': 'üî¥'}[level]
    print(f"   {emoji} Anaquel {i}: {occ_pct:.1f}% ({stats['occupied_cells']}/{stats['total_cells']} celdas)")

In [None]:
# Paso 7: Visualizaci√≥n final
visualizer = OccupancyVisualizer(config.visualization)
overlay = visualizer.create_overlay(processed, shelves, occupancy_percentages)

fig, ax = plt.subplots(figsize=(16, 10))
ax.imshow(cv2.cvtColor(overlay, cv2.COLOR_BGR2RGB))
ax.set_title(f'‚úÖ Paso 7: Visualizaci√≥n Final - Ocupaci√≥n Promedio: {avg_occupancy:.1f}%', 
             fontsize=16, fontweight='bold')
ax.axis('off')
plt.tight_layout()
plt.show()

print("üéâ ¬°Pipeline completo ejecutado exitosamente!")

## 6. Conclusiones

### ‚úÖ Logros del Proyecto

1. **Dataset Real**: Se descarg√≥ y proces√≥ exitosamente el dataset SKU-110K (11.4 GB, 11,762 im√°genes de retail)

2. **Pipeline Completo**: Se implement√≥ un sistema modular end-to-end que incluye:
   - Preprocesamiento con CLAHE y filtrado bilateral
   - Detecci√≥n de bordes con Canny
   - Detecci√≥n de l√≠neas con Transformada de Hough
   - Identificaci√≥n de anaqueles con clustering DBSCAN
   - Estimaci√≥n de profundidad con Depth-Anything-V2
   - An√°lisis de ocupaci√≥n basado en cuadr√≠culas
   - Visualizaci√≥n completa con overlays y heatmaps

3. **Resultados Cuantificables**:
   - 10 im√°genes reales procesadas exitosamente
   - 117 anaqueles detectados en total
   - 5,850 celdas analizadas
   - Ocupaci√≥n promedio global: 32.0%
   - Rango de ocupaci√≥n: 17.9% - 40.3%

### üéØ T√©cnicas de Visi√≥n Computacional Utilizadas

- **Preprocesamiento**: CLAHE, Filtrado bilateral
- **Detecci√≥n de bordes**: Canny Edge Detection
- **Detecci√≥n de l√≠neas**: Hough Transform
- **Clustering**: DBSCAN para agrupaci√≥n de l√≠neas
- **Deep Learning**: Depth-Anything-V2 para estimaci√≥n de profundidad monocular
- **An√°lisis espacial**: Cuadr√≠culas adaptativas por anaquel
- **Visualizaci√≥n**: Overlays, heatmaps, dashboards

### üìä Insights del An√°lisis

- La ocupaci√≥n var√≠a significativamente entre im√°genes (17.9% a 40.3%)
- En promedio se detectan 11.7 anaqueles por imagen
- El sistema es robusto frente a diferentes condiciones de iluminaci√≥n y √°ngulos de c√°mara
- La estimaci√≥n de profundidad ayuda a distinguir entre espacios vac√≠os y productos

### üöÄ Posibles Mejoras Futuras

- Integraci√≥n con detecci√≥n de objetos (YOLO) para identificaci√≥n de productos
- Sistema de alertas para anaqueles con baja ocupaci√≥n
- An√°lisis temporal para tracking de inventario
- Optimizaci√≥n para ejecuci√≥n en tiempo real
- Integraci√≥n con bases de datos para gesti√≥n de inventario