# Introducción a la Visión Computacional

Bienvenido al curso de **Visión Computacional con OpenCV**, un espacio diseñado para introducirte al fascinante mundo donde las computadoras “ven” e interpretan imágenes y videos. A lo largo de este curso, aprenderás los fundamentos de la visión computacional a través de ejercicios prácticos de programación, que te permitirán comprender cómo las máquinas pueden reconocer objetos, detectar rostros, seguir movimientos y mucho más.

### ¿Qué es OpenCV?

OpenCV (Open Source Computer Vision Library) es una biblioteca de código abierto ampliamente utilizada para aplicaciones de visión por computadora y aprendizaje automático. Desarrollada inicialmente por Intel en el año 2000, y ahora mantenida por una comunidad activa de desarrolladores, OpenCV ha sido una piedra angular en el crecimiento de esta área, al proporcionar herramientas potentes, eficientes y gratuitas para procesar imágenes y videos.

Gracias a su flexibilidad, velocidad y soporte para múltiples plataformas (Windows, Linux, macOS, Android, iOS), OpenCV se ha convertido en una herramienta estándar en el desarrollo de aplicaciones como reconocimiento facial, conducción autónoma, realidad aumentada, robótica, entre muchas otras.

### ¿Qué aprenderás?

Este curso se basa en el aprendizaje **haciendo**. A través de ejercicios prácticos en Python, explorarás conceptos clave como:

- Carga y manipulación de imágenes
- Transformaciones geométricas y filtrado
- Detección de bordes y contornos
- Detección de objetos
- Seguimiento de movimiento en video
- Aplicaciones de visión con inteligencia artificial

No necesitas conocimientos previos avanzados en visión computacional, pero sí es recomendable tener experiencia básica en programación con Python.

Al finalizar este curso, tendrás las herramientas necesarias para comenzar tus propios proyectos en visión computacional y comprenderás cómo esta tecnología está cambiando industrias enteras.


## Leer imagenes en OpenCV

En OpenCV, las imágenes no son objetos especiales ni estructuras complicadas: **son simplemente arreglos de números**, es decir, **matrices**. Estos arreglos representan los valores de intensidad de los píxeles que componen una imagen.

OpenCV utiliza principalmente **arrays de NumPy** para representar las imágenes, lo que permite manipularlas fácilmente con operaciones matemáticas y lógicas.

### Imágenes en escala de grises

Una imagen en escala de grises se representa como una matriz 2D (dos dimensiones), donde cada elemento es un número entre 0 y 255:

- `0` representa el negro absoluto.
- `255` representa el blanco absoluto.
- Los valores intermedios representan tonos de gris.

Ejemplo:
```python
import cv2

img = cv2.imread('imagen.jpg', cv2.IMREAD_GRAYSCALE)
print(img.shape)  # Salida: (alto, ancho)
```

### Imágenes a color (RGB en OpenCV: BGR)

Las imágenes a color se representan como matrices 3D (tres dimensiones). Cada píxel tiene tres valores que indican la intensidad de los colores **Azul (Blue), Verde (Green) y Rojo (Red)**. **¡Importante!**: OpenCV usa el orden **BGR**, no RGB.

La estructura sería:
```
img[y, x] = [B, G, R]
```
Donde:
- `y` es la fila (alto),
- `x` es la columna (ancho),
- y `[B, G, R]` son los valores del color para ese píxel.

Ejemplo:
```python
img = cv2.imread('imagen.jpg')
print(img.shape)  # Salida: (alto, ancho, 3)
print(img[100, 200])  # Muestra los valores BGR del píxel en (100, 200)
```

En este primer ejemplo de programación leeremos un archivo de imagen y observaremos sus características.

In [None]:
# El primer paso es decirle al intérprete que paquetes necesitamos
import matplotlib.pyplot as plt
import cv2
%matplotlib inline

A continuación usaremos la función de *opencv* "imread" para leer la imagen de Lenna y convertirla a una matriz.

In [None]:
# Ejercicio: Leer la imagen 'Lenna.png' con opencv y la función imread
image = None

# imprimir los valores de los pixeles en la imagen
print(image)

In [None]:
# Para obtener información de la imagen podemos utilizar dtype y shape
print(image.shape)
print(image.dtype)

In [None]:
# Graficar la imagen. 
# Nota: OpenCV lee los canales de la imagen como BGR, 
# asi que para graficarla es necesario antes convertirla a RGB y que la entienda matplotlib
plt.imshow(cv2.cvtColor(image, cv2.COLOR_BGR2RGB))  

In [None]:
# Si deseas desplegar la imagen en escala de grises puedes convertirla a un solo canal y después mostrarla.  
gray_image = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)

# Ejercicio: Obtener información de la imagen de gris usando funciones de numpy dtype y shape
im_type = None
shape = None

print('Esta imagen es de tipo:', gray_image.dtype, 'con dimensiones:', gray_image.shape)
plt.imshow(gray_image, cmap='gray')


Cuando trabajamos con imágenes digitales en OpenCV (o en general), estamos lidiando con una representación **discreta** de una realidad continua. Para convertir una imagen del mundo real (continua) en una digital (discreta), se utilizan dos procesos fundamentales:


### 1. **Muestreo (Sampling)**

El **muestreo** consiste en dividir una imagen continua en una **rejilla de píxeles**. Cada píxel representa una pequeña porción de la imagen original. Es decir, estamos escogiendo **qué puntos del espacio vamos a guardar**.

- Cuanto mayor es la resolución (más píxeles), más fiel es la imagen digital al original.
- En OpenCV, al cargar una imagen, el número de filas y columnas de la matriz (`img.shape`) corresponde al resultado del muestreo: el **alto** y **ancho** de la imagen en píxeles.

Ejemplo de muestreo:
```python
import cv2
img = cv2.imread('imagen.jpg')
print(img.shape)  # (alto, ancho, canales)
```

### 2. **Cuantización (Quantization)**

La **cuantización** se refiere a cómo se asignan **valores numéricos** a la información capturada en cada píxel, es decir, cómo representamos la intensidad de luz o color con números finitos.

- En imágenes en escala de grises, cada píxel toma un valor entre 0 y 255 (8 bits).
- En imágenes a color, cada canal (B, G, R) tiene su propio valor entre 0 y 255, lo que permite hasta **256 × 256 × 256 ≈ 16.7 millones de colores**.

Este proceso implica una **pérdida de precisión**, porque se redondean los valores reales a los niveles disponibles.

Ejemplo: si un sensor capta un valor de intensidad real de 132.7, al cuantizarlo con 8 bits, se redondea a 133.

## Ejercicio:

Dada la imagen 'Monkey.png'. Determina: i) El muestreo. ii) La cuantización.

In [None]:
#TODO (2 puntos): Completa el código faltante

# Escribe el muestreo como una tupla
sampling = None

# Escribe la cuantización como un tipo de dato
quantization = None