# üéØ GeoProj - Correcci√≥n de Distorsi√≥n Geom√©trica con Deep Learning

<div align="center">

![Python](https://img.shields.io/badge/Python-3.7+-blue.svg)
![PyTorch](https://img.shields.io/badge/PyTorch-1.9+-orange.svg)
![License](https://img.shields.io/badge/License-MIT-green.svg)

</div>

Este notebook implementa el m√©todo de **Blind Geometric Distortion Correction** usando Deep Learning para detectar y corregir autom√°ticamente distorsiones geom√©tricas en im√°genes.

---

## üìñ Descripci√≥n

El modelo utiliza una arquitectura encoder-decoder con clasificaci√≥n para:
1. **Detectar** el tipo de distorsi√≥n presente en la imagen
2. **Calcular** un campo de flujo √≥ptico para la correcci√≥n
3. **Aplicar** la rectificaci√≥n para obtener la imagen corregida

**Paper:** Li, X., Zhang, B., Sander, P. V., & Liao, J. (2019)  
*Blind Geometric Distortion Correction on Images Through Deep Learning*  
IEEE/CVF CVPR 2019

**Repositorio (Versi√≥n Mejorada):** https://github.com/gallobruno81/GeoProj  
**Repositorio Original:** https://github.com/xiaoyu258/GeoProj

---

## üéØ Tipos de Distorsi√≥n Soportados

| Tipo | Descripci√≥n | Ejemplo Com√∫n |
|------|-------------|---------------|
| üî¥ **Barrel** | Distorsi√≥n de barril | Lentes gran angular, c√°maras de acci√≥n |
| üîµ **Pincushion** | Distorsi√≥n de coj√≠n | Lentes telefoto, zoom |
| üîÑ **Rotation** | Rotaci√≥n de imagen | Inclinaci√≥n de c√°mara |
| ‚úÇÔ∏è **Shear** | Cizallamiento | Escaneo angular |
| üìê **Projective** | Distorsi√≥n proyectiva | Perspectiva incorrecta |
| üåä **Wave** | Ondulaci√≥n | Distorsiones complejas |

---

## üöÄ Inicio R√°pido

1. **Configura GPU** ‚Üí `Runtime` > `Change runtime type` > `GPU`
2. **Ejecuta Celdas 2-5** ‚Üí Instala dependencias y clona repositorio
3. **Sube Modelos** ‚Üí Celda 7 (descarga primero desde Google Drive)
4. **Sube Imagen** ‚Üí Celda 9
5. **Procesa** ‚Üí Ejecuta Celdas 11-18

**‚è±Ô∏è Tiempo estimado:** 2-5 minutos por imagen

**üí° Consejo:** Despu√©s de la primera imagen, solo repite las Celdas 9-18

---

## üìã Requisitos

- Google Colab (con GPU recomendado)
- Modelos pre-entrenados ([descargar aqu√≠](https://drive.google.com/open?id=1Tdi92IMA-rrX2ozdUMvfiN0jCZY7wIp_))
- Imagen con distorsi√≥n geom√©trica

---

¬°Comencemos! üëá


## 1Ô∏è‚É£ Configuraci√≥n Inicial

### Verificar y Configurar GPU


In [None]:
import torch
import subprocess

# Verificar GPU
print("="*60)
print("INFORMACI√ìN DEL SISTEMA")
print("="*60)

try:
    subprocess.run(['nvidia-smi'], check=True)
    print("\n‚úì GPU NVIDIA detectada")
except:
    print("\n‚ö†Ô∏è No se detect√≥ GPU NVIDIA")

print("\n" + "="*60)
print(f"PyTorch versi√≥n: {torch.__version__ if 'torch' in dir() else 'No instalado'}")
print(f"CUDA disponible: {torch.cuda.is_available() if 'torch' in dir() else 'N/A'}")
if torch.cuda.is_available():
    print(f"CUDA versi√≥n: {torch.version.cuda}")
    print(f"GPU: {torch.cuda.get_device_name(0)}")
print("="*60)


In [None]:
# Instalar dependencias
print("Instalando dependencias necesarias...")
print("Esto puede tomar 1-2 minutos...\n")

!pip install torch>=1.9.0 torchvision>=0.10.0 --quiet
!pip install numpy>=1.19.0 --quiet
!pip install scikit-image>=0.18.0 scipy>=1.7.0 --quiet
!pip install numba>=0.54.0 --quiet
!pip install matplotlib>=3.3.0 Pillow>=8.3.0 --quiet

print("\n" + "="*60)
print("‚úì Todas las dependencias instaladas correctamente")
print("="*60)

# Verificar instalaci√≥n
import torch
import torchvision
import numpy
import skimage
import scipy
import numba
import matplotlib
from PIL import Image

print("\nVersiones instaladas:")
print(f"  - torch: {torch.__version__}")
print(f"  - torchvision: {torchvision.__version__}")
print(f"  - numpy: {numpy.__version__}")
print(f"  - scikit-image: {skimage.__version__}")
print(f"  - scipy: {scipy.__version__}")
print(f"  - numba: {numba.__version__}")
print(f"  - matplotlib: {matplotlib.__version__}")
print(f"  - Pillow: {Image.__version__}")


## 2Ô∏è‚É£ Clonar Repositorio


In [None]:
import os
import shutil

# Repositorio mejorado con inference.py y rectify.py
REPO_URL = "https://github.com/gallobruno81/GeoProj.git"

print("="*60)
print("CLONANDO REPOSITORIO")
print("="*60)
print("\nüì¶ Repositorio mejorado con scripts de inferencia y rectificaci√≥n")

# Asegurarse de estar en /content
%cd /content

# Si existe un GeoProj viejo, eliminarlo
if os.path.exists('GeoProj'):
    print("\nüóëÔ∏è Eliminando repositorio anterior...")
    shutil.rmtree('GeoProj')

# Clonar repositorio
print(f"\nüîÑ Clonando desde: {REPO_URL}")
!git clone {REPO_URL}

# Cambiar al directorio del proyecto
%cd GeoProj

print(f"\nüìÅ Directorio actual: {os.getcwd()}")

# Verificar archivos clave
print("\n‚úÖ Verificando archivos del proyecto:")
files_to_check = ['inference.py', 'rectify.py', 'modelNetM.py', 'eval.py']
for f in files_to_check:
    status = "‚úì" if os.path.exists(f) else "‚úó"
    print(f"  {status} {f}")

if not os.path.exists('inference.py'):
    print("\n‚ùå ERROR: inference.py no encontrado!")
    print("Puede que se haya clonado el repositorio incorrecto.")
else:
    print("\n‚úÖ Repositorio clonado correctamente!")
    print("="*60)


## 3Ô∏è‚É£ Descargar Modelos Pre-entrenados

**IMPORTANTE:** Descarga los modelos manualmente desde:  
https://drive.google.com/open?id=1Tdi92IMA-rrX2ozdUMvfiN0jCZY7wIp_

Luego s√∫belos usando la celda siguiente.


In [None]:
import os
import shutil

os.makedirs('models', exist_ok=True)

print("="*60)
print("CONFIGURANDO MODELOS")
print("="*60)

# Buscar modelos en /kaggle/input/ (datasets de Kaggle)
input_dir = '/kaggle/input'
model_files = ['model_en.pkl', 'model_de.pkl', 'model_class.pkl']
found_models = []

print("\nüîç Buscando modelos en datasets de Kaggle...")

if os.path.exists(input_dir):
    for root, dirs, files in os.walk(input_dir):
        for model_file in model_files:
            if model_file in files:
                source = os.path.join(root, model_file)
                dest = os.path.join('models', model_file)
                shutil.copy2(source, dest)
                found_models.append(model_file)
                print(f"  ‚úì {model_file} copiado desde dataset")

# Verificar
print("\n" + "="*60)
print("VERIFICANDO MODELOS")
print("="*60)
!ls -lh models/

missing = [f for f in model_files if f not in found_models]

if not missing:
    print("\n‚úÖ Todos los modelos disponibles!")
else:
    print(f"\n‚ö†Ô∏è FALTAN: {', '.join(missing)}")
    print("\nüí° Agrega el dataset con los modelos:")
    print("  1. Click '+ Add Data' (panel derecho)")
    print("  2. Busca tu dataset con los .pkl")
    print("  3. Click 'Add'")
    print("  4. Vuelve a ejecutar esta celda")

print("="*60)


## 4Ô∏è‚É£ Subir Imagen para Procesar


In [None]:
from IPython.display import Image as IPImage, display
from PIL import Image
import os
import shutil

print("="*60)
print("CONFIGURANDO IMAGEN")
print("="*60)

# Buscar imagen en /kaggle/input/ (dataset de Kaggle)
input_image = None
print("\nüîç Buscando imagen en datasets de Kaggle...")

for root, dirs, files in os.walk('/kaggle/input'):
    for file in files:
        if file.lower().endswith(('.jpg', '.jpeg', '.png', '.bmp')):
            source = os.path.join(root, file)
            # Copiar a directorio de trabajo
            shutil.copy2(source, file)
            input_image = file
            print(f"  ‚úì {file} encontrada y copiada")
            break
    if input_image:
        break

if input_image:
    img = Image.open(input_image)
    width, height = img.size
    mode = img.mode
    
    print("\n" + "="*60)
    print("INFORMACI√ìN DE LA IMAGEN")
    print("="*60)
    print(f"‚úì Archivo: {input_image}")
    print(f"  - Dimensiones: {width}x{height} px")
    print(f"  - Modo de color: {mode}")
    print(f"  - Tama√±o: {os.path.getsize(input_image)/1024:.1f} KB")
    print("="*60)
    
    print("\nüì∑ Vista previa:")
    display(IPImage(filename=input_image, width=500))
else:
    print("\n‚ö†Ô∏è No se encontr√≥ ninguna imagen")
    print("\nüí° Agrega una imagen al dataset:")
    print("  1. Click '+ Add Data'")
    print("  2. Sube tu imagen o usa el dataset existente")
    print("  3. Vuelve a ejecutar esta celda")


## 5Ô∏è‚É£ Procesar Imagen (Detecci√≥n + Flow)


In [None]:
import time
import os

# Verificar que inference.py existe
if not os.path.exists('inference.py'):
    print("‚ùå ERROR: inference.py no encontrado!")
    print("Por favor, ejecuta la Celda 4 (Clonar Repositorio).")
    raise FileNotFoundError("inference.py no encontrado")

print(f"üìÅ Directorio de trabajo: {os.getcwd()}\n")

print("="*60)
print("INICIANDO PROCESAMIENTO")
print("="*60)
print("\n‚è≥ Detectando tipo de distorsi√≥n y calculando flujo √≥ptico...")
print("   (esto puede tomar 10-30 segundos)\n")

start_time = time.time()

# Ejecutar inferencia (escapar nombre de archivo con espacios/caracteres especiales)
!python inference.py --input_image "{input_image}" --output_dir results --model_dir models

elapsed_time = time.time() - start_time

print("\n" + "="*60)
print("‚úÖ PROCESAMIENTO COMPLETADO")
print("="*60)
print(f"‚è±Ô∏è Tiempo transcurrido: {elapsed_time:.1f} segundos")
print("="*60)


In [None]:
from IPython.display import Image as IPImage, display
import os

base_name = os.path.splitext(input_image)[0]
flow_viz_path = f'results/{base_name}_flow_viz.png'

print("="*60)
print("VISUALIZACI√ìN DEL FLUJO √ìPTICO")
print("="*60)
print("\nüìä El flujo √≥ptico representa la correcci√≥n que se aplicar√°:")
print("   - Rojo/Azul: direcci√≥n del desplazamiento")
print("   - Intensidad: magnitud de la correcci√≥n\n")

if os.path.exists(flow_viz_path):
    display(IPImage(filename=flow_viz_path, width=900))
    print("\n‚úì Visualizaci√≥n generada correctamente")
else:
    print("‚ö†Ô∏è No se encontr√≥ la visualizaci√≥n del flujo")
    print("   Verifica que el procesamiento anterior se complet√≥ exitosamente.")


## 6Ô∏è‚É£ Aplicar Correcci√≥n (Rectificaci√≥n)

**Nota:** Esto requiere GPU con CUDA. Si no funciona en Colab, el flujo ya est√° calculado.


In [None]:
import os
import time

base_name = os.path.splitext(input_image)[0]
resized_path = f'results/{base_name}_resized.jpg'
flow_path = f'results/{base_name}_flow.npy'

print(f"üìÅ Directorio de trabajo: {os.getcwd()}\n")

print("="*60)
print("APLICANDO RECTIFICACI√ìN")
print("="*60)
print("\n‚öôÔ∏è Aplicando la correcci√≥n de distorsi√≥n...")
print("   (esto requiere GPU con CUDA)\n")

start_time = time.time()
rectification_success = False

try:
    # Intentar rectificaci√≥n (escapar nombres con espacios)
    # Nota: output_dir por defecto es 'results'
    !python rectify.py --img_path "{resized_path}" --flow_path "{flow_path}"
    rectification_success = True
    elapsed_time = time.time() - start_time
    
    print("\n" + "="*60)
    print("‚úÖ RECTIFICACI√ìN COMPLETADA")
    print("="*60)
    print(f"‚è±Ô∏è Tiempo: {elapsed_time:.1f} segundos")
    print("="*60)
    
except Exception as e:
    print("\n" + "="*60)
    print("‚ö†Ô∏è ERROR EN RECTIFICACI√ìN")
    print("="*60)
    print(f"Error: {e}")
    print("\nüí° SOLUCI√ìN:")
    print("   1. El flujo √≥ptico ya fue calculado y guardado")
    print("   2. Descarga el archivo 'results.zip' al final")
    print("   3. Usa rectify.py localmente con una GPU CUDA")
    print("="*60)
    rectification_success = False


## 7Ô∏è‚É£ Ver Resultados


In [None]:
from IPython.display import Image as IPImage, display
import os

base_name = os.path.splitext(input_image)[0]

print("="*60)
print("RESULTADOS FINALES")
print("="*60)

# Mostrar comparaci√≥n si existe
comparison_path = f'results/{base_name}_comparison.png'
corrected_path = f'results/{base_name}_corrected.png'

if os.path.exists(comparison_path):
    print("\nüé® Comparaci√≥n Antes/Despu√©s:\n")
    display(IPImage(filename=comparison_path, width=1000))
    print("\n‚úÖ Correcci√≥n aplicada exitosamente!")
elif os.path.exists(corrected_path):
    print("\nüé® Imagen Corregida:\n")
    display(IPImage(filename=corrected_path, width=500))
    print("\n‚úÖ Imagen corregida generada!")
else:
    print("\n‚ö†Ô∏è No se encontraron im√°genes corregidas")
    print("\nArchivos disponibles en results/:")
    !ls -lh results/
    
print("\n" + "="*60)
print("Archivos generados:")
!ls -lh results/ 2>/dev/null | grep "{base_name}"
print("="*60)


## 8Ô∏è‚É£ Descargar Resultados


In [None]:
import os

print("="*60)
print("DESCARGAR RESULTADOS")
print("="*60)
print("\nüì¶ Comprimiendo resultados...")

# Comprimir resultados
!zip -r -q results.zip results/

# Obtener tama√±o del zip
zip_size = os.path.getsize('results.zip') / 1024 / 1024  # MB

print(f"\n‚úì Archivo comprimido: results.zip ({zip_size:.2f} MB)")
print("\nContenido del archivo:")
!zipinfo results.zip | head -20

print("\n" + "="*60)
print("‚¨áÔ∏è Iniciando descarga...")
print("="*60)

print("\n" + "="*60)
print("üì• DESCARGAR RESULTADOS EN KAGGLE")
print("="*60)
print("\nPara descargar los resultados:")
print("  1. Click 'Save Version' (arriba derecha)")
print("  2. Espera a que termine la ejecuci√≥n")
print("  3. Ve a la tab 'Output'")
print("  4. Descarga 'results.zip'")
print("\nO descarga archivos individuales desde:")
print(f"  {os.getcwd()}/results/")
print("="*60)

print("\nüìÇ Archivos generados:")
print("   - *_flow.npy: flujo √≥ptico calculado")
print("   - *_flow_viz.png: visualizaci√≥n del flujo")
print("   - *_resized.jpg: imagen redimensionada")
print("   - *_corrected.png: imagen corregida")
print("   - *_comparison.png: comparaci√≥n antes/despu√©s")
print("   - *_mask.png: m√°scara de validez")


---

## üöÄ ¬øQuieres Procesar Otra Imagen?

Para procesar otra imagen, simplemente:
1. Vuelve a ejecutar la **Celda 9** (Subir Imagen)
2. Luego ejecuta las **Celdas 11-18** en orden

No necesitas volver a:
- Instalar dependencias (Celda 3)
- Clonar el repositorio (Celda 5) 
- Subir los modelos (Celda 7)

---

## üìù Notas Importantes

### Requisitos del Sistema

1. **GPU:** Se recomienda usar GPU para mejor rendimiento
   - En Colab: `Runtime` ‚Üí `Change runtime type` ‚Üí `GPU` (T4, V100, etc.)
   - La inferencia funciona en CPU, pero es ~10x m√°s lenta

2. **CUDA para rectificaci√≥n:** La etapa de rectificaci√≥n requiere:
   - GPU con CUDA habilitada
   - numba con soporte CUDA
   - Si falla, descarga el flujo y procesa localmente

### Tama√±os de Imagen

- **Entrada:** Cualquier resoluci√≥n (se redimensiona autom√°ticamente)
- **Procesamiento:** 256x256 (requisito del modelo)
- **Salida:** 256x256 (puedes escalar despu√©s si necesitas)

### Archivos Generados

| Archivo | Descripci√≥n |
|---------|-------------|
| `*_flow.npy` | Flujo √≥ptico calculado (array NumPy) |
| `*_flow_viz.png` | Visualizaci√≥n del flujo (3 vistas) |
| `*_resized.jpg` | Imagen redimensionada a 256x256 |
| `*_corrected.png` | Imagen corregida final |
| `*_comparison.png` | Comparaci√≥n antes/despu√©s |
| `*_mask.png` | M√°scara de validez de p√≠xeles |

### Tipos de Distorsi√≥n Soportados

‚úÖ **Barrel** (Barril) - Lentes gran angular  
‚úÖ **Pincushion** (Coj√≠n) - Lentes telefoto  
‚úÖ **Rotation** (Rotaci√≥n) - Rotaci√≥n de c√°mara  
‚úÖ **Shear** (Cizallamiento) - Distorsi√≥n de corte  
‚úÖ **Projective** (Proyectiva) - Perspectiva incorrecta  
‚úÖ **Wave** (Onda) - Distorsiones complejas  

---

## üîß Troubleshooting

### Error: "Model files not found"
- Aseg√∫rate de descargar los 3 archivos .pkl del Google Drive
- Verifica que los subiste correctamente en la Celda 7

### Error: "CUDA not available"
- Cambia el runtime: `Runtime` ‚Üí `Change runtime type` ‚Üí `GPU`
- Reinicia el runtime despu√©s de cambiar

### Error: "inference.py not found"
- Verifica que se clon√≥ el repositorio correcto (gallobruno81/GeoProj)
- Vuelve a ejecutar la Celda 5 (eliminar√° el repo anterior y clonar√° el correcto)
- El repositorio original (xiaoyu258) NO tiene inference.py

### Error en rectificaci√≥n (numba-cuda)
- Es normal en algunos entornos de Colab
- El flujo ya est√° calculado, desc√°rgalo y procesa localmente
- Alternativamente, usa una instancia Colab Pro con mejor GPU

### Imagen muy grande o muy peque√±a
- El modelo funciona mejor con im√°genes de tama√±o razonable (>256px)
- Las im√°genes muy grandes se redimensionan autom√°ticamente

### Resultados no satisfactorios
- Verifica que la imagen tenga distorsi√≥n geom√©trica real
- El modelo est√° entrenado para tipos espec√≠ficos de distorsi√≥n
- Distorsiones muy extremas pueden no corregirse completamente

---

## üí° Tips para Mejores Resultados

1. **Calidad de entrada:** Usa im√°genes con buena iluminaci√≥n y contraste
2. **Formato:** JPG o PNG funcionan bien
3. **Contenido:** Im√°genes con l√≠neas rectas (edificios, documentos) muestran mejor la correcci√≥n
4. **Procesamiento local:** Para producci√≥n, descarga el c√≥digo y ejecuta localmente con GPU

---

## üìö Referencias

**Paper:** Li, X., Zhang, B., Sander, P. V., & Liao, J. (2019).  
*Blind Geometric Distortion Correction on Images Through Deep Learning.*  
IEEE/CVF Conference on Computer Vision and Pattern Recognition (CVPR) 2019.

**Enlaces:**
- üìÑ ArXiv: https://arxiv.org/abs/1909.03459  
- üíª GitHub: https://github.com/gallobruno81/GeoProj (Versi√≥n mejorada)
- üíª GitHub: https://github.com/xiaoyu258/GeoProj (Original)
- üîó Paper: http://openaccess.thecvf.com/content_CVPR_2019/html/Li_Blind_Geometric_Distortion_Correction_on_Images_Through_Deep_Learning_CVPR_2019_paper.html

---

## üéì Citaci√≥n

Si usas este c√≥digo en tu investigaci√≥n, por favor cita:

```bibtex
@inproceedings{li2019blind,
  title={Blind Geometric Distortion Correction on Images Through Deep Learning},
  author={Li, Xiaoyu and Zhang, Bo and Sander, Pedro V and Liao, Jing},
  booktitle={Proceedings of the IEEE/CVF Conference on Computer Vision and Pattern Recognition},
  pages={4855--4864},
  year={2019}
}
```

---

## ‚≠ê ¬øTe fue √∫til?

Si este notebook te ayud√≥, considera:
- ‚≠ê Dar una estrella al repositorio en GitHub
- üêõ Reportar bugs o problemas
- üí¨ Compartir tus resultados
- ü§ù Contribuir con mejoras

---

**Desarrollado con ‚ù§Ô∏è para la comunidad de Computer Vision**

*√öltima actualizaci√≥n: Octubre 2025*
