# Sistema de visión artificial 

````{admonition} Resumen 
:class: tip

El presente documento recoge los trabajos relativos al módulo de visión artificial de **FLATCLASS**. Este módulo es el responsable de la adquisición, normalizado, segmentación y extracción de las características mormométricas de los alevines de lenguado. 

**Entregable**: E1.2  
**Versión**: 1.0  
**Autor**: Javier Álvarez Osuna  
**Email**: javier.osuna@fishfarmfeeder.com  
**ORCID**: [0000-0001-7063-1279](https://orcid.org/0000-0001-7063-1279)  
**Licencia**: CC-BY-4.0  
**Código proyecto**: IG408M.2025.000.000072

```{figure} .././assets/FLATCLASS_logo_publicidad.png
:width: 100%
:align: center
```

````

## Introducción

Uno de los objetivos técnicos plantedos en **FLATCLASS* se centra en el Desarrollo e integración de un sistema de visión artificial de alta resolución que permita la captura precisa de imágenes de los alevines en tiempo real, asegurando una segmentación eficaz y el cálculo automático del área de superficie, longitud y anchura de cada individuo. El sistema automático desarrollado permite la medición sin contacto de las características morfométricas de lenguados (*Solea solea*) tales como la longitud total (L), la anchura corporal (A) y la superficie real (S) a partir de las imágenes fotográficas, obtenidas con una cámara Datalogic P22C 600-000 ML, mediante un algoritmo de procesado. Este algoritmo permite realizar la medición incluso cuando la cola del pez plano está deformada o cuando el pez se encuentra orientado de manera aleatoria, informando del nivel de fiabilidad de las mediciones cuando los resultados puedan persentar dudas. Este último aspecto es especialmente importante si tenemos en cuenta que el proceso de clasificación de juveniles se suele producir en ambientes de baja luminosidad y alta concentración de humedad que introduce importantes restricciones en la calidad de las imágenes obtenidas.

El núcleo del sistema se sustenta en **GrabCut**, un método de segmentación de imágenes interactivo basado en teoría de grafos y optimización de cortes mínimos en campos aleatorios de Markov (MRF) definido por primera vez por [Rother et al.,](https://doi.org/10.1145/1015706.1015720) en 2004. El usuario define inicialmente un recuadro aproximado que contiene el pez, permitiendo al algoritmo estimar la distribución de color del primer plano y el fondo mediante modelos de mezcla gaussiana (Gaussian Mixture Models, GMM). Posteriormente, se plantea una función de energía que combina un término regional (basado en las probabilidades del GMM) y un término de continuidad espacial (prefiriendo regiones conectadas con etiquetas uniformes), la cual se minimiza mediante un corte en el grafo (graph cut). Este proceso se itera hasta converger en una segmentación refinada del pez frente al fondo [[Alsmadi et al., 2022](https://doi.org/10.1016/j.jksuci.2020.07.005].

GrabCut ha sido objeto de mejoras continuas en los últimos años, incluyendo variantes que integran mapas de saliencia, superpíxeles o funciones de energía modificadas que permiten segmentaciones más precisas y automáticas [[Wang et al., 2023](https://doi.org/10.3390/math11081965)]. En el contexto acuícola, diferentes trabajos han aplicado algoritmos derivados de GrabCut (como versiones adaptadas o iterativas) para refinar la segmentación en imágenes de peces. Por ejemplo, [Huang et al., 2023](https://doi.org/10.11975/j.issn.1002-6819.2020.21.026) han desarrollado un sistema de visión binocular en acuicultura utilizó GrabCut adaptativo por contraste para segmentar peces bajo el agua, logrando un error porcentual medio en la medida de longitud de solo 0,9%. Asimismo, en el ámbito de la fenotipificación de peces de tilapia, GrabCut se ha empleado para afinar muestras en los bordes de segmentación, mejorando el IoU hasta un 81 % cuando se combina con redes profundas [[Feng et al., 2023](https://doi.org/10.3390/app13179635)].

Para la extracción de morfometría de alevines de lenguado en fotografías tomadas desde arriba sobre una cinta transportadora, GrabCut es especialmente adecuado por varias razones clave. Primero, requiere mínima interacción (únicamente un recuadro inicial), lo cual es práctico en entornos productivos con alto flujo de muestras. Segundo, al basarse en modelos estadísticos de color y continuidad espacial, puede separar con precisión el pez del fondo uniforme de la cinta, incluso con variaciones de iluminación. Esto resulta esencial para cálculos fiables de longitud, anchura y superficie del pez. Finalmente, es computacionalmente eficiente y ya está implementado en bibliotecas comunes como OpenCV, lo que facilita su integración en un sistema automatizado de procesamiento de imágenes en planta.

## Algoritmo extracción características morfométricas

El flujograma del algortimo se recoge en la siguiente figura:

```{figure} .././assets/Process_Img_Master.png
:name: Figura_WP1_imagen.1
:alt: Pipeline del sistema de extracción de características
:width: 25%
:align: center

Pipeline del sistema de extracción de características
```

Como se puede apreciar el sistema está formado por siete módulos funcionales cada uno de ellos responsable de una función específica. En las siguientes secciones se estudia con mayor detalle cada uno de ellos y las tecnologías hardware-software usadas.

### M1 - Captura

Este módulo es el responsable de la adquisición de las imágenes. Funcionalmente este módulo se sustenta sobre una barrera láser - a modo de trigger - a la entrada del canal (cinta transportadora) que cuando es interrumpida por el paso de un alevín activa la captura de la fotografía. La cámara envía la foto capturada a través del protocolo TCP al sistema de visión en dónde se lleva a cabo el flujo de acciones recogido en el siguiente diagrama.

```{figure} .././assets/Modulo-1.png
:name: Figura_WP1_imagen.2
:alt: Flujograma del módulo de captura
:width: 50%
:align: center

Flujograma del módulo de captura
```

El motor que controla el flujo de acciones se ha desarrollado sobre la base de Node-RED. Node-RED es una herramienta de programación visual basada en flujos desarrollada inicialmente por IBM, que permite integrar dispositivos, APIs y servicios mediante nodos configurables. Su arquitectura está construida sobre Node.js, lo que le proporciona un alto rendimiento y la capacidad de ejecutar procesos en tiempo real sobre hardware ligero (desde servidores industriales hasta dispositivos embebidos como Raspberry Pi). Los flujos en Node-RED se representan gráficamente, facilitando la implementación de sistemas complejos en entornos de IoT e Industria 4.0. Además, su ecosistema de nodos permite la integración directa con protocolos industriales (p. ej., MQTT, OPC-UA, Modbus, TCP-UDP), bases de datos, sistemas de control (PLC) y librerías externas en Python o C++, lo que lo convierte en una plataforma idónea para la adquisición y procesamiento de datos heterogéneos.

En el contexto del módulo de captura de imágenes descrito, Node-RED ofrece ventajas críticas: permite orquestar la señal de disparo proveniente de una barrera, gestiona la adquisición de la imagen junto con sus metadatos (timestamp, ID, parámetros de cámara...) y aplicar rutinas de validación para garantizar la integridad del frame capturado. El hecho adicional de poder programar funciones personalizadas en JavaScript o integrar scripts externos en Python, permite ejecutar código necesario para validar si la imagen es utilizable (`¿Frame válido?`) antes de enviarla a etapas posteriores de procesado, minimizando errores y pérdidas de información. El flujo responsable de la adquisición y los nodos implicados se refleja en la siguiente figura.

```{figure} .././assets/Modulo-1_nodered.png
:name: Figura_WP1_imagen.3
:alt: Flujo de acciones Node-RED
:width: 75%
:align: center

Flujo de acciones responsable de la funcionalidad del módulo de captura de imagen
```

### M2 - Calibración

Para poder extraer las dimensiones reales (mm) de la longitud, anchura y altura es necesario que el sistema disponga de algún tipo de calibración. Para ello la forma más rápida es disponer de un damero (Checkerboard) de dimensiones exactas y conocidas como el de la figura, en el que cada una de las inserciones internas mide exactamente 10 mm de lado.

```{figure} .././assets/checkerboard_10x10.png
:name: Figura_WP1_imagen.4
:alt: Checkerboard
:width: 75%
:align: center

Checkerdoard (damero) para calibración
```
Si $𝐿_{px}$ es la longitud medida en píxeles de un objeto cuya longitud real $L_{mm}$ es conocida (10 mm en nuestro damero), la escala se define como:

$$
𝑠[mm/px]=\dfrac{L_{mm}}{𝐿_{px}}
$$
  
Para robustez, se usa la mediana de múltiples aristas horizontales y verticales [[Zang, Z., 2020](https://doi.org/10.1109/34.888718)]. La incertidumbre relativa de primer orden es:
$$
\left(\frac{\sigma_s}{s}\right)^2 \;\approx\; 
\left(\frac{\sigma_{L_{\text{mm}}}}{L_{\text{mm}}}\right)^2 \;+\; 
\left(\frac{\sigma_{L_{\text{px}}}}{L_{\text{px}}}\right)^2
$$

El flujo UML que resuelve la calibración es el siguiente:

```{figure} .././assets/calibracion.png
:name: Figura_WP1_imagen.5
:alt: UML Calibracion
:width: 75%
:align: center

UML proceso de calibración
```

In [1]:
## INSTALACION DE LIBRERIAS

!pip install opencv-python

Collecting opencv-python
  Downloading opencv_python-4.12.0.88-cp37-abi3-win_amd64.whl.metadata (19 kB)
Downloading opencv_python-4.12.0.88-cp37-abi3-win_amd64.whl (39.0 MB)
   ---------------------------------------- 0.0/39.0 MB ? eta -:--:--
   ------ --------------------------------- 6.8/39.0 MB 38.3 MB/s eta 0:00:01
   ---------------- ----------------------- 16.3/39.0 MB 41.0 MB/s eta 0:00:01
   ------------------------ --------------- 24.1/39.0 MB 40.2 MB/s eta 0:00:01
   -------------------------- ------------- 26.0/39.0 MB 32.3 MB/s eta 0:00:01
   -------------------------------- ------- 32.0/39.0 MB 31.7 MB/s eta 0:00:01
   ---------------------------------------  38.8/39.0 MB 32.9 MB/s eta 0:00:01
   ---------------------------------------- 39.0/39.0 MB 31.8 MB/s  0:00:01
Installing collected packages: opencv-python
Successfully installed opencv-python-4.12.0.88


In [3]:
## IMPORT Y UTILIDAES DE E/S

# Importa librerías y define utilidades para leer/escribir JSON con seguridad.

import json
from dataclasses import dataclass, asdict
from pathlib import Path
from typing import Optional, Dict, Any, Tuple

import numpy as np
import cv2

def load_json(path: Path) -> Optional[dict]:
    """Carga un JSON si existe; devuelve None si no existe."""
    if not path.exists():
        return None
    with path.open("r", encoding="utf-8") as f:
        return json.load(f)

def save_json(path: Path, data: dict) -> None:
    """Guarda un dict como JSON (UTF-8, con indentado) y crea carpetas si no existen."""
    path.parent.mkdir(parents=True, exist_ok=True)
    with path.open("w", encoding="utf-8") as f:
        json.dump(data, f, indent=2, ensure_ascii=False)

In [12]:
## CONFIG

# fija rutas y parámetros del patrón para el damero

# === CONFIG (ajustada a tu damero generado) ===================================
CALIB_FILE = Path("./calibracion_px_mm.json")

# Patrón de referencia: DAMERO 10x10 cuadrados => 9x9 intersecciones internas
CHECKERBOARD_SQUARE_MM = 10.0
CHECKERBOARD_SQUARES_COLS = 10   # número de cuadrados horizontales
CHECKERBOARD_SQUARES_ROWS = 10   # número de cuadrados verticales
CHECKERBOARD_INTERNAL_COLS = CHECKERBOARD_SQUARES_COLS - 1  # 9 intersecciones internas
CHECKERBOARD_INTERNAL_ROWS = CHECKERBOARD_SQUARES_ROWS - 1  # 9 intersecciones internas

# Agregación robusta de distancias entre esquinas: "median" o "mean"
AGGREGATION = "median"

# Usa el damero de referencia.
IMG_PATH = Path(".././assets/checkerboard_10x10.png")


In [13]:
## ESTRUCTURA DE CALIBRACION Y PERSISTENCIA

# Define la estructura (dataclass) que se guardará en JSON y las funciones de lectura/escritura

@dataclass
class Calibration:
    """
    Estructura persistente de calibración.
    - mm_per_px: escala (milímetros por píxel).
    - method: método usado ("checkerboard").
    - meta: metadatos/diagnósticos (estadísticos de distancias en píxeles, etc.).
    """
    mm_per_px: float
    method: str
    meta: Dict[str, Any]

def load_calibration(path: Path) -> Optional[Calibration]:
    """Lee la calibración desde JSON; devuelve None si no existe o si hay formato inválido."""
    data = load_json(path)
    if data is None:
        return None
    try:
        return Calibration(
            mm_per_px=float(data["mm_per_px"]),
            method=str(data["method"]),
            meta=dict(data["meta"]),
        )
    except Exception:
        return None

def save_calibration(path: Path, cal: Calibration) -> None:
    """Persistencia de calibración a JSON."""
    save_json(path, asdict(cal))

In [14]:
## DETECCIÓN DEL DAMERO Y CÁLCULO mm/px

def detect_checkerboard_scale(
    img_bgr: np.ndarray,
    cols_internal: int,
    rows_internal: int,
    square_mm: float,
    aggregation: str = "median"
) -> Optional[Tuple[float, Dict[str, Any]]]:
    """
    Detecta un damero de (cols_internal x rows_internal) intersecciones internas.
    Calcula mm/px usando la mediana (por defecto) de distancias entre esquinas adyacentes.

    Devuelve: (mm_per_px, diagnostics) si detecta; None si no detecta.
    """
    gray = cv2.cvtColor(img_bgr, cv2.COLOR_BGR2GRAY)

    flags = cv2.CALIB_CB_ADAPTIVE_THRESH | cv2.CALIB_CB_NORMALIZE_IMAGE
    found, corners = cv2.findChessboardCorners(gray, (cols_internal, rows_internal), flags)

    if not found or corners is None:
        return None

    # Refinamiento subpíxel
    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 50, 1e-4)
    corners = cv2.cornerSubPix(gray, corners, (11, 11), (-1, -1), criteria)
    corners = corners.reshape(-1, 2)  # N x 2

    # Distancias horizontales
    horiz = []
    for r in range(rows_internal):
        for c in range(cols_internal - 1):
            i = r * cols_internal + c
            j = r * cols_internal + (c + 1)
            d = np.linalg.norm(corners[i] - corners[j])
            if d > 0:
                horiz.append(d)

    # Distancias verticales
    vert = []
    for r in range(rows_internal - 1):
        for c in range(cols_internal):
            i = r * cols_internal + c
            j = (r + 1) * cols_internal + c
            d = np.linalg.norm(corners[i] - corners[j])
            if d > 0:
                vert.append(d)

    dists = np.array(horiz + vert, dtype=float)
    if dists.size == 0:
        return None

    # px por cuadrado (mediana por robustez ante outliers)
    px_per_square = np.median(dists) if aggregation == "median" else np.mean(dists)
    mm_per_px     = square_mm / px_per_square

    diagnostics = {
        "pattern": "checkerboard",
        "internal_cols": int(cols_internal),
        "internal_rows": int(rows_internal),
        "square_mm": float(square_mm),
        "edges_count": int(dists.size),
        "px_per_square_summary": {
            "mean": float(np.mean(dists)),
            "median": float(np.median(dists)),
            "std": float(np.std(dists, ddof=1)) if dists.size > 1 else 0.0
        },
        "aggregation": aggregation
    }
    return mm_per_px, diagnostics


In [15]:
## OVERLAY DE CONTROL VISUAL Y .png DIAGNÓSTICO

# Su función es verificar y documentar que la detección ha sido correcta.

from datetime import datetime

def overlay_checkerboard_and_save(
    img_path: Path,
    out_path: Path,
    cols_internal: int,
    rows_internal: int,
    mm_per_px: float = None,
    draw_rect: bool = True
) -> dict:
    """
    Dibuja esquinas del damero y anota mm/px (si disponible). Guarda PNG.
    Devuelve dict con 'ok' y detalles/motivo de fallo.
    """
    if not img_path.exists():
        return {"ok": False, "motivo": f"Imagen no encontrada: {str(img_path)}"}

    img = cv2.imread(str(img_path))
    if img is None:
        return {"ok": False, "motivo": f"No se pudo abrir la imagen: {str(img_path)}"}

    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    flags = cv2.CALIB_CB_ADAPTIVE_THRESH | cv2.CALIB_CB_NORMALIZE_IMAGE
    found, corners = cv2.findChessboardCorners(gray, (cols_internal, rows_internal), flags)

    vis = img.copy()
    if not found or corners is None:
        cv2.putText(vis, "Checkerboard NO detectado", (20, 40),
                    cv2.FONT_HERSHEY_SIMPLEX, 1.0, (0, 0, 255), 2, cv2.LINE_AA)
        out_path.parent.mkdir(parents=True, exist_ok=True)
        ok = cv2.imwrite(str(out_path), vis)
        return {"ok": bool(ok), "motivo": "No se detecto el damero; PNG guardado con aviso.", "out": str(out_path)}

    criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 50, 1e-4)
    corners = cv2.cornerSubPix(gray, corners, (11, 11), (-1, -1), criteria)

    cv2.drawChessboardCorners(vis, (cols_internal, rows_internal), corners, found)

    if draw_rect:
        pts = corners.reshape(-1, 2)
        x_min, y_min = np.floor(pts.min(axis=0)).astype(int)
        x_max, y_max = np.ceil(pts.max(axis=0)).astype(int)
        cv2.rectangle(vis, (x_min, y_min), (x_max, y_max), (255, 0, 0), 2)

    y0 = 30
    cv2.putText(vis, f"Damero {cols_internal}x{rows_internal} (intersecciones)", (20, y0),
                cv2.FONT_HERSHEY_SIMPLEX, 0.8, (50, 220, 50), 2, cv2.LINE_AA)
    y0 += 30
    if mm_per_px is not None:
        cv2.putText(vis, f"Escala: {mm_per_px:.6f} mm/px", (20, y0),
                    cv2.FONT_HERSHEY_SIMPLEX, 0.8, (50, 220, 50), 2, cv2.LINE_AA)
        y0 += 30
    cv2.putText(vis, f"Timestamp: {datetime.now().isoformat(timespec='seconds')}", (20, y0),
                cv2.FONT_HERSHEY_SIMPLEX, 0.7, (200, 200, 200), 2, cv2.LINE_AA)

    out_path.parent.mkdir(parents=True, exist_ok=True)
    ok = cv2.imwrite(str(out_path), vis)
    return {"ok": bool(ok), "motivo": "" if ok else "cv2.imwrite fallo", "out": str(out_path)}


In [16]:
## EJECUTOR

# implementa literalmente el diagrama de decisiones: 
# - usar calibración vigente (permanente) salvo que el usuario fuerce recalibración;
# - si no hay calibración o se fuerza, intenta detectar y calcular; 
# - si falla, `sin_escala`

def run_calibration_pipeline_checkerboard(
    calib_file: Path,
    img_path: Path,
    cols_internal: int,
    rows_internal: int,
    square_mm: float,
    aggregation: str = "median",
    force_recalibrate: bool = False
) -> Dict[str, Any]:
    """
    UML “M2 - Calibración de escala”:

    if (¿Calibración vigente?) then (Sí)
        :Usar escala px→mm guardada;
    else (No)
        :Detectar patrón referencia;
        if (¿Detectado?) then (Sí)
            :Calcular escala px→mm; (y guardar)
        else (No)
            :Marcar sin_escala;

    'Vigente' = existe calibración en disco y NO se fuerza recalibración.
    """
    # 1) ¿Calibración 'vigente'?
    if not force_recalibrate:
        cal = load_calibration(calib_file)
        if cal is not None and cal.method == "checkerboard":
            return {
                "estado": "vigente",
                "mm_per_px": cal.mm_per_px,
                "method": cal.method,
                "meta": cal.meta
            }

    # 2) No vigente (o se fuerza) -> Detectar patrón referencia
    if not img_path.exists():
        return {"estado": "sin_escala", "motivo": f"Imagen no encontrada: {str(img_path)}"}

    img = cv2.imread(str(img_path))
    if img is None:
        return {"estado": "sin_escala", "motivo": f"No se pudo abrir la imagen: {str(img_path)}"}

    res = detect_checkerboard_scale(
        img_bgr=img,
        cols_internal=cols_internal,
        rows_internal=rows_internal,
        square_mm=square_mm,
        aggregation=aggregation
    )

    # 3) ¿Detectado?
    if res is None:
        return {"estado": "sin_escala", "motivo": "No se detectó el damero en la imagen"}

    # 4) Calcular escala y guardar
    mm_per_px, diag = res
    cal = Calibration(
        mm_per_px=float(mm_per_px),
        method="checkerboard",
        meta={"diagnostics": diag}
    )
    save_calibration(calib_file, cal)

    return {
        "estado": "recalibrado",
        "mm_per_px": cal.mm_per_px,
        "method": cal.method,
        "meta": cal.meta
    }


In [18]:
## EJECUCION NORMAL

result = run_calibration_pipeline_checkerboard(
    calib_file=CALIB_FILE,
    img_path=IMG_PATH,
    cols_internal=CHECKERBOARD_INTERNAL_COLS,
    rows_internal=CHECKERBOARD_INTERNAL_ROWS,
    square_mm=CHECKERBOARD_SQUARE_MM,          
    aggregation=AGGREGATION,                   
    force_recalibrate=False
)
result


{'estado': 'vigente',
 'mm_per_px': 0.125,
 'method': 'checkerboard',
 'meta': {'diagnostics': {'pattern': 'checkerboard',
   'internal_cols': 9,
   'internal_rows': 9,
   'square_mm': 10.0,
   'edges_count': 144,
   'px_per_square_summary': {'mean': 80.0, 'median': 80.0, 'std': 0.0},
   'aggregation': 'median'}}}

In [21]:
## VALIDACIÓN NUMÉRICA

# Lee la calibración y reporta mm/px y px/mm estimado la incertidumbre

def load_calibration_dict(path: Path) -> dict:
    if not path.exists():
        raise FileNotFoundError(f"No existe el archivo de calibración: {path}")
    with path.open("r", encoding="utf-8") as f:
        return json.load(f)

def validation_report(calib_json: dict, assume_square_exact_mm=True, square_sigma_mm=0.0):
    """
    Reporta mm/px, px/mm e incertidumbre estimada.
    - Si conoces la tolerancia del patrón (p.ej. ±0.02 mm), usa assume_square_exact_mm=False y square_sigma_mm=0.02.
    """
    mm_per_px = float(calib_json["mm_per_px"])
    px_per_mm = 1.0 / mm_per_px if mm_per_px > 0 else np.nan

    diag = calib_json.get("meta", {}).get("diagnostics", {})
    pattern = diag.get("pattern", "checkerboard")
    px_sum = diag.get("px_per_square_summary", {})
    aggregation = diag.get("aggregation", "median")
    square_mm = float(diag.get("square_mm", np.nan))

    center_px = px_sum.get("median" if aggregation == "median" else "mean", None)
    std_px = px_sum.get("std", None)
    n_edges = diag.get("edges_count", None)

    sigma_s = None
    ci95 = (None, None)
    details = {}

    if center_px and std_px is not None and center_px > 0:
        sigma_square = 0.0 if assume_square_exact_mm else float(square_sigma_mm)

        # Error estándar del estimador: media vs mediana
        if n_edges and n_edges > 1:
            if aggregation == "mean":
                se_px = std_px / np.sqrt(n_edges)
            else:
                se_px = 1.253 * std_px / np.sqrt(n_edges)  # aprox. SE de la mediana
        else:
            se_px = std_px

        # Propagación de errores (1er orden)
        rel_sq = (sigma_square / square_mm)**2 if (square_mm and square_mm > 0) else 0.0
        rel_px = (se_px / center_px)**2
        rel_s  = np.sqrt(rel_sq + rel_px)

        sigma_s = rel_s * mm_per_px
        ci95 = (mm_per_px - 1.96 * sigma_s, mm_per_px + 1.96 * sigma_s)

        details = {
            "center_px": center_px,
            "std_px_edges": std_px,
            "se_px_used": se_px,
            "n_edges": n_edges,
            "aggregation": aggregation,
            "square_mm": square_mm,
            "sigma_square_mm": sigma_square,
            "rel_uncertainty_s": rel_s
        }

    return {
        "mm_per_px": mm_per_px,
        "px_per_mm": px_per_mm,
        "method": calib_json.get("method", ""),
        "pattern": pattern,
        "uncertainty_sigma_mm_per_px": sigma_s,
        "ci95_mm_per_px": ci95,
        "diagnostics_available": (std_px is not None),
        "details": details
    }

# === Ejecutar validación ===
cal_data = load_calibration_dict(CALIB_FILE)
report = validation_report(cal_data, assume_square_exact_mm=True, square_sigma_mm=0.0)
report


{'mm_per_px': 0.125,
 'px_per_mm': 8.0,
 'method': 'checkerboard',
 'pattern': 'checkerboard',
 'uncertainty_sigma_mm_per_px': np.float64(0.0),
 'ci95_mm_per_px': (np.float64(0.125), np.float64(0.125)),
 'diagnostics_available': True,
 'details': {'center_px': 80.0,
  'std_px_edges': 0.0,
  'se_px_used': np.float64(0.0),
  'n_edges': 144,
  'aggregation': 'median',
  'square_mm': 10.0,
  'sigma_square_mm': 0.0,
  'rel_uncertainty_s': np.float64(0.0)}}

In [27]:
## UTILIDADES DE CONVERSION

# Funciones auxiliares para convertir medidas en el pipeline de visión.

def get_mm_per_px(calib_file: Path = CALIB_FILE) -> float:
    """Devuelve la escala mm/px leída del archivo de calibración."""
    cal = load_calibration(calib_file)
    if cal is None:
        raise RuntimeError(f"No hay calibración guardada en {calib_file}. Ejecuta el pipeline primero.")
    return float(cal.mm_per_px)

def px_to_mm(value_px: float, mm_per_px: float) -> float:
    """Convierte longitudes en píxeles a milímetros."""
    return float(value_px) * float(mm_per_px)

def mm_to_px(value_mm: float, mm_per_px: float) -> float:
    """Convierte longitudes en milímetros a píxeles."""
    if mm_per_px <= 0:
        raise ValueError("mm_per_px debe ser positivo.")
    return float(value_mm) / float(mm_per_px)

# Ejemplos:
# mmpp = get_mm_per_px()
# L_mm = px_to_mm(123.4, mmpp)
# print("Longitud en mm:", L_mm)


Un ejemplo de uso de estas funciones sería:

In [34]:
print(f"Escala actual mm/px: {get_mm_per_px()}\n")
print(f"Longitud en milímetros de 125 px: {px_to_mm(125, get_mm_per_px())}")

Escala actual mm/px: 0.125

Longitud en milímetros de 125 px: 15.625


In [22]:
## UTILIDAD DE RECALIBRACION FORZADA CON .png DE DIAGNOSTICO

# fuerza recálculo con el damero sintético y genera un PNG de control visual.

def recalibrar_y_generar_png(
    calib_file: Path,
    img_path: Path,
    cols_internal: int,
    rows_internal: int,
    square_mm: float,
    aggregation: str = "median",
    out_png: Path = Path("./diagnosticos/diagnostico_calibracion.png"),
    timestamp_bgr: tuple = (0, 0, 255),   # ROJO en BGR (por defecto)
    box_bgr: tuple = (255, 0, 0),         # Azul para rectángulo envolvente
    text_bgr: tuple = (50, 220, 50)       # Verde para textos informativos
) -> dict:
    """
    Fuerza la recalibración usando el damero de 'img_path' y genera un PNG de diagnóstico.
    - Dibuja esquinas detectadas, rectángulo envolvente y anota mm/px.
    - Pinta el timestamp en ROJO (BGR=(0,0,255) por defecto).
    
    Parámetros
    ----------
    calib_file : Path
        Ruta del JSON donde se guardará la calibración (mm/px, meta).
    img_path : Path
        Ruta de la imagen del damero (10x10 → 9x9 intersecciones internas).
    cols_internal, rows_internal : int
        Intersecciones internas del damero (p.ej., 9x9 para 10x10 cuadrados).
    square_mm : float
        Tamaño físico del lado de cada cuadrado (mm), p.ej. 10.0.
    aggregation : {"median","mean"}
        Agregación para estimar px por cuadrado (robusta por defecto: "median").
    out_png : Path
        Ruta de salida del PNG de diagnóstico.
    timestamp_bgr : tuple
        Color BGR para el timestamp (rojo por defecto).
    box_bgr : tuple
        Color BGR del rectángulo envolvente (azul por defecto).
    text_bgr : tuple
        Color BGR para textos informativos (verde por defecto).
    
    Returns
    -------
    dict con claves:
      - "recal": dict con el resultado de la recalibración (estado, mm_per_px, meta)
      - "overlay": dict con {"ok": bool, "out": str(ruta_png)} (o motivo de fallo)
      - "mm_per_px": float o None (si no disponible)
      - "estado": str (e.g., "recalibrado", "vigente", "sin_escala")
    """
    from datetime import datetime

    # 1) Forzar recalibración (usa la función del pipeline del notebook)
    recal = run_calibration_pipeline_checkerboard(
        calib_file=calib_file,
        img_path=img_path,
        cols_internal=cols_internal,
        rows_internal=rows_internal,
        square_mm=square_mm,
        aggregation=aggregation,
        force_recalibrate=True
    )

    # 2) Preparar overlay (detectar de nuevo para dibujar) con TIMESTAMP ROJO
    if not img_path.exists():
        return {
            "recal": recal,
            "overlay": {"ok": False, "motivo": f"Imagen no encontrada: {str(img_path)}"},
            "mm_per_px": float(recal["mm_per_px"]) if isinstance(recal, dict) and "mm_per_px" in recal else None,
            "estado": recal.get("estado") if isinstance(recal, dict) else None
        }

    img = cv2.imread(str(img_path))
    if img is None:
        return {
            "recal": recal,
            "overlay": {"ok": False, "motivo": f"No se pudo abrir la imagen: {str(img_path)}"},
            "mm_per_px": float(recal["mm_per_px"]) if isinstance(recal, dict) and "mm_per_px" in recal else None,
            "estado": recal.get("estado") if isinstance(recal, dict) else None
        }

    gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
    flags = cv2.CALIB_CB_ADAPTIVE_THRESH | cv2.CALIB_CB_NORMALIZE_IMAGE
    found, corners = cv2.findChessboardCorners(gray, (cols_internal, rows_internal), flags)

    vis = img.copy()
    if not found or corners is None:
        cv2.putText(
            vis, "Checkerboard NO detectado", (20, 40),
            cv2.FONT_HERSHEY_SIMPLEX, 1.0, (0, 0, 255), 2, cv2.LINE_AA
        )
        # timestamp en rojo aunque no haya detección
        cv2.putText(
            vis, f"Timestamp: {datetime.now().isoformat(timespec='seconds')}", (20, 80),
            cv2.FONT_HERSHEY_SIMPLEX, 0.7, timestamp_bgr, 2, cv2.LINE_AA
        )
    else:
        # Refinar esquinas y dibujarlas
        criteria = (cv2.TERM_CRITERIA_EPS + cv2.TERM_CRITERIA_MAX_ITER, 50, 1e-4)
        corners = cv2.cornerSubPix(gray, corners, (11, 11), (-1, -1), criteria)
        cv2.drawChessboardCorners(vis, (cols_internal, rows_internal), corners, found)

        # Rectángulo envolvente
        pts = corners.reshape(-1, 2)
        x_min, y_min = np.floor(pts.min(axis=0)).astype(int)
        x_max, y_max = np.ceil(pts.max(axis=0)).astype(int)
        cv2.rectangle(vis, (x_min, y_min), (x_max, y_max), box_bgr, 2)

        # Textos informativos (verde por defecto)
        y0 = 30
        cv2.putText(
            vis, f"Damero {cols_internal}x{rows_internal} (intersecciones)", (20, y0),
            cv2.FONT_HERSHEY_SIMPLEX, 0.8, text_bgr, 2, cv2.LINE_AA
        )
        y0 += 30
        mmpp = float(recal["mm_per_px"]) if isinstance(recal, dict) and "mm_per_px" in recal else None
        if mmpp is not None:
            cv2.putText(
                vis, f"Escala: {mmpp:.6f} mm/px", (20, y0),
                cv2.FONT_HERSHEY_SIMPLEX, 0.8, text_bgr, 2, cv2.LINE_AA
            )
            y0 += 30

        # TIMESTAMP en ROJO
        cv2.putText(
            vis, f"Timestamp: {datetime.now().isoformat(timespec='seconds')}", (20, y0),
            cv2.FONT_HERSHEY_SIMPLEX, 0.7, timestamp_bgr, 2, cv2.LINE_AA
        )

    # 3) Guardar PNG
    out_png.parent.mkdir(parents=True, exist_ok=True)
    ok = cv2.imwrite(str(out_png), vis)

    return {
        "recal": recal,
        "overlay": {"ok": bool(ok), "out": str(out_png) if ok else None},
        "mm_per_px": float(recal["mm_per_px"]) if isinstance(recal, dict) and "mm_per_px" in recal else None,
        "estado": recal.get("estado") if isinstance(recal, dict) else None
    }


Un ejemplo de uso de esta función de recalibrado forzado sería:

In [23]:
res = recalibrar_y_generar_png(
    calib_file=CALIB_FILE,
    img_path=IMG_PATH,
    cols_internal=CHECKERBOARD_INTERNAL_COLS,  # 9
    rows_internal=CHECKERBOARD_INTERNAL_ROWS,  # 9
    square_mm=CHECKERBOARD_SQUARE_MM,          # 10.0
    aggregation=AGGREGATION,                   # "median"
    out_png=Path("./diagnosticos/diagnostico_calibracion.png")
)

res

{'recal': {'estado': 'recalibrado',
  'mm_per_px': 0.125,
  'method': 'checkerboard',
  'meta': {'diagnostics': {'pattern': 'checkerboard',
    'internal_cols': 9,
    'internal_rows': 9,
    'square_mm': 10.0,
    'edges_count': 144,
    'px_per_square_summary': {'mean': 80.0, 'median': 80.0, 'std': 0.0},
    'aggregation': 'median'}}},
 'overlay': {'ok': True, 'out': 'diagnosticos\\diagnostico_calibracion.png'},
 'mm_per_px': 0.125,
 'estado': 'recalibrado'}