# **Notebook 5: Sistema Completo de Inventario con IA**

**Proyecto:**  Agente de Gesti√≥n de Inventario con IA

**Autor::** Andres Morocho, Robinson Redrovan

**Carrera::** Computacion

**Instituci√≥n::** Universidad Politecnica Salesiana

**Fecha::** 09 de Febrero 2026.

---

## Objetivo Final

Integrar todos los componentes en un pipeline completo:
```
üì∑ Imagen ‚Üí üîç OCR ‚Üí ü§ñ IA ‚Üí üîé Dedup ‚Üí üíæ Base de Datos
```

---

In [1]:
%pip install easyocr opencv-python google-generativeai fuzzywuzzy pandas matplotlib -q

import cv2
import numpy as np
import easyocr
import google.generativeai as genai
from fuzzywuzzy import fuzz
import time
import json
from datetime import datetime
import matplotlib.pyplot as plt
import pandas as pd

print("‚úÖ M√≥dulos importados")

Note: you may need to restart the kernel to use updated packages.


  from .autonotebook import tqdm as notebook_tqdm

All support for the `google.generativeai` package has ended. It will no longer be receiving 
updates or bug fixes. Please switch to the `google.genai` package as soon as possible.
See README for more details:

https://github.com/google-gemini/deprecated-generative-ai-python/blob/main/README.md

  import google.generativeai as genai


‚úÖ M√≥dulos importados


---

## üîß Pipeline Integrado

Clase que une todos los servicios.

In [2]:
class AgentInventario:
    """Sistema completo de registro de productos"""
    
    def __init__(self, gemini_api_key: str):
        # Inicializar servicios
        print("üîß Inicializando servicios...")
        
        # OCR
        self.reader = easyocr.Reader(['en', 'es'], gpu=False, verbose=False)
        print("  ‚úì EasyOCR listo")
        
        # IA
        genai.configure(api_key=gemini_api_key)
        self.model = genai.GenerativeModel('gemini-1.5-flash')
        print("  ‚úì Gemini listo")
        
        # Base de datos (simulada)
        self.productos = []
        print("  ‚úì Base de datos lista")
        
        print("‚úÖ Sistema inicializado")
    
    def preprocesar_imagen(self, img_path: str, tipo: str) -> np.ndarray:
        """Preprocesamiento seg√∫n tipo de imagen"""
        img = cv2.imread(img_path)
        gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
        
        if tipo == 'front':
            clahe = cv2.createCLAHE(clipLimit=2.5, tileGridSize=(8,8))
            enhanced = clahe.apply(gray)
            denoised = cv2.fastNlMeansDenoising(enhanced, h=10)
            return denoised
        else:
            kernel = np.array([[0,-1,0],[-1,5,-1],[0,-1,0]])
            sharpened = cv2.filter2D(gray, -1, kernel)
            clahe = cv2.createCLAHE(clipLimit=3.0, tileGridSize=(8,8))
            enhanced = clahe.apply(sharpened)
            _, binary = cv2.threshold(enhanced, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
            return binary
    
    def ocr_imagen(self, img_procesada: np.ndarray) -> dict:
        """OCR con EasyOCR"""
        results = self.reader.readtext(img_procesada, detail=1, paragraph=False)
        
        texts = [text for (_, text, _) in results]
        confidences = [conf for (_, _, conf) in results]
        
        return {
            'text': ' '.join(texts),
            'confidence': np.mean(confidences) if confidences else 0
        }
    
    def extraer_con_ia(self, texto_ocr: str) -> dict:
        """Extraer informaci√≥n estructurada con Gemini"""
        prompt = f"""Extrae informaci√≥n de este texto OCR de un producto:

{texto_ocr}

Responde SOLO con JSON:
{{
  "nombre": "...",
  "marca": "...",
  "tamano": "...",
  "precio": null,
  "codigo_barras": "...",
  "lote": "...",
  "fecha_vencimiento": "YYYY-MM-DD"
}}"""
        
        response = self.model.generate_content(prompt)
        text = response.text.strip()
        
        if text.startswith("```"):
            text = text.split("```")[1]
            if text.startswith("json"):
                text = text[4:]
        
        return json.loads(text.strip())
    
    def buscar_duplicados(self, producto: dict) -> list:
        """Buscar productos similares"""
        if not self.productos:
            return []
        
        duplicados = []
        
        for prod_bd in self.productos:
            # Match por barcode
            if producto.get('codigo_barras') and prod_bd.get('codigo_barras'):
                if producto['codigo_barras'] == prod_bd['codigo_barras']:
                    return [{'producto': prod_bd, 'similitud': 1.0}]
            
            # Fuzzy matching
            nombre_sim = fuzz.ratio(
                producto['nombre'].lower(), 
                prod_bd['nombre'].lower()
            ) / 100
            marca_sim = fuzz.ratio(
                producto['marca'].lower(), 
                prod_bd['marca'].lower()
            ) / 100
            
            similitud = nombre_sim * 0.6 + marca_sim * 0.4
            
            if similitud >= 0.85:
                duplicados.append({
                    'producto': prod_bd,
                    'similitud': similitud
                })
        
        duplicados.sort(key=lambda x: x['similitud'], reverse=True)
        return duplicados
    
    def procesar_producto(self, imagenes: dict) -> dict:
        """
        Pipeline completo
        
        Args:
            imagenes: {'front': 'path/to/front.jpg', 'left': '...', 'right': '...'}
        """
        resultados = {
            'timestamp': datetime.now().isoformat(),
            'etapas': {}
        }
        
        # 1Ô∏è‚É£ Preprocesamiento + OCR
        print("\n1Ô∏è‚É£ Preprocesamiento y OCR...")
        textos_ocr = []
        
        for tipo, path in imagenes.items():
            img_prep = self.preprocesar_imagen(path, tipo)
            ocr_result = self.ocr_imagen(img_prep)
            textos_ocr.append(ocr_result['text'])
            print(f"  ‚úì {tipo}: {ocr_result['confidence']:.2%} confianza")
        
        texto_combinado = ' '.join(textos_ocr)
        resultados['etapas']['ocr'] = texto_combinado[:200]
        
        # 2Ô∏è‚É£ Extracci√≥n con IA
        print("\n2Ô∏è‚É£ Extracci√≥n con Gemini...")
        producto = self.extraer_con_ia(texto_combinado)
        print(f"  ‚úì Producto: {producto.get('nombre', 'N/A')}")
        resultados['etapas']['extraccion'] = producto
        
        # 3Ô∏è‚É£ B√∫squeda de duplicados
        print("\n3Ô∏è‚É£ Buscando duplicados...")
        duplicados = self.buscar_duplicados(producto)
        
        if duplicados and duplicados[0]['similitud'] >= 0.95:
            print(f"  ‚ö†Ô∏è Duplicado detectado: {duplicados[0]['similitud']:.0%} similitud")
            resultados['duplicado'] = True
            resultados['producto_existente'] = duplicados[0]['producto']
        else:
            print(f"  ‚úì Producto nuevo (sin duplicados)")
            # Guardar en BD
            producto['id'] = len(self.productos) + 1
            self.productos.append(producto)
            resultados['duplicado'] = False
            resultados['producto_guardado'] = producto
        
        resultados['duplicados_encontrados'] = len(duplicados)
        
        return resultados


# Inicializar sistema
GEMINI_API_KEY = "AIzaSyDt7Eiw7ThHGeNU6VcsuTWptcDikcihVdo"
agente = AgentInventario(GEMINI_API_KEY)

üîß Inicializando servicios...
  ‚úì EasyOCR listo
  ‚úì Gemini listo
  ‚úì Base de datos lista
‚úÖ Sistema inicializado


---

## üß™ Prueba End-to-End

Procesamos un producto completo con im√°genes reales.

In [3]:
# Rutas de im√°genes de ejemplo
imagenes_test = {
    'front': '../datasets/avena/front.jpeg',
    'left': '../datasets/avena/side_left.jpeg',
    'right': '../datasets/avena/side_right.jpeg'
}

print("="*70)
print("üöÄ PROCESANDO PRODUCTO COMPLETO")
print("="*70)

start_time = time.time()

resultado = agente.procesar_producto(imagenes_test)

elapsed = time.time() - start_time

print("\n" + "="*70)
print(f"‚úÖ PROCESAMIENTO COMPLETADO EN {elapsed:.2f}s")
print("="*70)

# Mostrar resultado
if resultado['duplicado']:
    print("\n‚ö†Ô∏è PRODUCTO DUPLICADO:")
    prod = resultado['producto_existente']
    print(f"  ID: {prod['id']}")
    print(f"  Nombre: {prod['nombre']}")
    print(f"  Marca: {prod['marca']}")
else:
    print("\n‚úÖ PRODUCTO NUEVO GUARDADO:")
    prod = resultado['producto_guardado']
    print(f"  ID: {prod['id']}")
    print(f"  Nombre: {prod['nombre']}")
    print(f"  Marca: {prod['marca']}")
    print(f"  Tama√±o: {prod['tamano']}")
    print(f"  Precio: {prod.get('precio', 'N/A')}")

print(f"\nüìä Duplicados encontrados: {resultado['duplicados_encontrados']}")

üöÄ PROCESANDO PRODUCTO COMPLETO

1Ô∏è‚É£ Preprocesamiento y OCR...


  super().__init__(loader)


  ‚úì front: 74.69% confianza
  ‚úì left: 47.94% confianza
  ‚úì right: 37.15% confianza

2Ô∏è‚É£ Extracci√≥n con Gemini...


NotFound: 404 models/gemini-1.5-flash is not found for API version v1beta, or is not supported for generateContent. Call ListModels to see the list of available models and their supported methods.

---

## M√©tricas del Sistema

Evaluamos el rendimiento global.

In [None]:
# Procesar varios productos
test_productos = [
    {
        'nombre': 'Producto 1',
        'imagenes': {
            'front': 'datasets/producto_1/front.jpg',
            'left': 'datasets/producto_1/left.jpg',
            'right': 'datasets/producto_1/right.jpg'
        }
    },
    {
        'nombre': 'Producto 2',
        'imagenes': {
            'front': 'datasets/producto_2/front.jpg',
            'left': 'datasets/producto_2/left.jpg',
            'right': 'datasets/producto_2/right.jpg'
        }
    },
    # Agregar m√°s productos...
]

metricas = {
    'tiempos': [],
    'exitos': 0,
    'duplicados_detectados': 0,
    'errores': 0
}

print("üìä Evaluando sistema con m√∫ltiples productos...\n")

for test in test_productos:
    print(f"Procesando: {test['nombre']}")
    
    try:
        start = time.time()
        resultado = agente.procesar_producto(test['imagenes'])
        elapsed = time.time() - start
        
        metricas['tiempos'].append(elapsed)
        metricas['exitos'] += 1
        
        if resultado['duplicado']:
            metricas['duplicados_detectados'] += 1
        
        print(f"  ‚úì Completado en {elapsed:.2f}s\n")
        
    except Exception as e:
        metricas['errores'] += 1
        print(f"  ‚úó Error: {e}\n")

# Resumen
print("="*70)
print("RESUMEN DE EVALUACI√ìN")
print("="*70)
print(f"Productos procesados: {metricas['exitos']}")
print(f"Tiempo promedio: {np.mean(metricas['tiempos']):.2f}s")
print(f"Tiempo total: {sum(metricas['tiempos']):.2f}s")
print(f"Duplicados detectados: {metricas['duplicados_detectados']}")
print(f"Errores: {metricas['errores']}")
print(f"Tasa de √©xito: {metricas['exitos']/(metricas['exitos']+metricas['errores'])*100:.1f}%")

# Gr√°fico de tiempos
plt.figure(figsize=(10, 4))
plt.bar(range(len(metricas['tiempos'])), metricas['tiempos'], color='steelblue')
plt.axhline(np.mean(metricas['tiempos']), color='red', linestyle='--', label='Promedio')
plt.xlabel('Producto')
plt.ylabel('Tiempo (segundos)')
plt.title('Tiempo de Procesamiento por Producto')
plt.legend()
plt.grid(axis='y', alpha=0.3)
plt.tight_layout()
plt.show()

---

## Conclusiones Finales del Proyecto

### Sistema Completo Implementado:

**Pipeline End-to-End:**
```
1. Captura de im√°genes (3 √°ngulos)
2. Preprocesamiento adaptativo
3. OCR con EasyOCR
4. Extracci√≥n IA con Gemini
5. Detecci√≥n de duplicados
6. Almacenamiento en BD
```

### M√©tricas Finales:

- **Precisi√≥n OCR:** ~{precision_ocr}%
- **Precisi√≥n extracci√≥n IA:** ~{precision_ia}%
- **Detecci√≥n duplicados:** ~{precision_dedup}%
- **Tiempo promedio:** ~{tiempo_promedio}s por producto
- **Tasa de √©xito:** {tasa_exito}%

### Logros Clave:

1. OCR robusto con preprocesamiento adaptativo
2. Extracci√≥n inteligente corrige errores autom√°ticamente
3. Deduplicaci√≥n eficiente (fuzzy + barcode)
4. Sistema integrado funcional

### Recomendaciones de Producci√≥n:

1. Implementar cach√© de resultados
2. Agregar validaci√≥n manual para confianza <70%
3. Monitorear costos de API Gemini
4. Escalar BD con √≠ndices en marca/barcode
5. Agregar sistema de feedback para mejorar precisi√≥n


In [None]:
reporte_final = {
    'proyecto': 'Agente de Gesti√≥n de Inventario con IA',
    'fecha_evaluacion': datetime.now().isoformat(),
    'metricas': {
        'productos_procesados': metricas['exitos'],
        'tiempo_promedio_s': float(np.mean(metricas['tiempos'])),
        'tasa_exito': metricas['exitos']/(metricas['exitos']+metricas['errores']),
        'duplicados_detectados': metricas['duplicados_detectados']
    },
    'componentes': {
        'ocr': 'EasyOCR',
        'ia': 'Google Gemini 1.5 Flash',
        'deduplicacion': 'FuzzyWuzzy + Levenshtein'
    },
    'productos_registrados': len(agente.productos)
}

with open('reporte_final_sistema.json', 'w', encoding='utf-8') as f:
    json.dump(reporte_final, f, indent=2, ensure_ascii=False)

print("üíæ Reporte final guardado: reporte_final_sistema.json")
print("\n‚úÖ TODOS LOS NOTEBOOKS COMPLETADOS")
print("="*70)
print("üìö Documentaci√≥n generada:")
print("  - Notebook 1: Exploraci√≥n OCR")
print("  - Notebook 2: Preprocesamiento")
print("  - Notebook 3: Extracci√≥n con IA (Gemini)")
print("  - Notebook 4: Deduplicaci√≥n")
print("  - Notebook 5: Sistema Integrado")
print("="*70)