# 2. Fundamentos de imágenes digitales

## 2.1. Elementos de la percepción visual

Aunque el campo de procesamiento de imágenes está construido en fundamentos matemáticos, el análisis y la intuición humana muchas veces juegan un papel en la selección de una técnica contra otra.

Por ello, entender las características básicas de la percepción humana es un primer paso en nuestra jornada hacia el procesamiento de imágenes.


### Estructura del ojo humano

La retina cuenta con dos tipos de receptores: conos y bastones

Hay entre 6 y 7 millones de conos en cada ojo. Se encuentran localizados principalmente en la porción central de la retina, llamada fovea, y que es altamente sensible al color

Los humanos podemos resolver detalles finos debido a que cada cono está conectado a su propia terminal nerviosa

La visión proporcionada por los conos es llamada fotópica o visión de luz brillante

Contamos con un número mucho más grande de bastones, entre 75 y 150 millones se encuentran distribuidos en la retina


![Estructura del ojo humano](figs/ojo.png)

![Conos y bastones](figs/conos_bastones.png)

### Formación de la imagen en el ojo humano

![Visión humana](figs/formacion.png)

## 2.2. La luz y el espectro electromagnético

En 1666, Sir Isaac Newton descubrió que cuando un rayo de luz solar pasa a través de un prisma de vidrio, el rayo de luz que emerge no es blanco sino que consiste en un espectro continuo de colores que van desde el violeta en un extremo hasta el rojo en el otro.

La gama de colores que percibimos en la luz visible es una pequeña porción del espectro electromagnético. 

En un extremo del espectro están las ondas de radio con longitudes de onda miles de millones de veces más largas que las de la luz visible. En el otro extremo del espectro se encuentran los rayos gamma con longitudes de onda millones de veces más pequeñas que las de la luz visible.

![Expectro](figs/espectro.png)

$$ \lambda = \frac{c}{f}$$

- $\lambda$ es la longitud de onda (m)
- $c$ es la velocidad de la luz ($2.998×10^8$ m/s)
- $f$ es la frecuencia (Hz)


$$ E = hf $$

- $E$ es la energía (eV)
- $h$ es la constante de Planck ($6.626174×10^{−27}$)


## 2.3. Adquisición y sensado de imagen

### Sensores

Sensor simple y sensor lineal

![Sensores 1](figs/sensores_1.png)



Matriz de sensores

![Sensores 2](figs/sensores_2.png)

Sensor rotativo

![Sensores 3](figs/sensores_3.png)

### Arreglos de sensores

![Arreglos de sensores](figs/arreglos.png)

### Modelo simple para la formación de imágenes

$$ f(x,y) = i(x,y) r(x,y)$$

- $ 0 \leq f(x,y) < \infty$
- $ x,y $ son coordenadas en el espacio de la imagen
- $ 0 \leq i(x,y) < \infty$ es la función de iluminación, determinada por la fuente de iluminación
- $ 0 \leq r(x,y) \leq 1 $ es la función de reflectancia, determinada por las características del objeto

$$ \ell = f(x,y) $$

- $ L_{min} \leq \ell \leq L_{max} $
    * $ L_{min} = i_{min} r_{min} $ es NO negativa
    * $ L_{max} = i_{max} r_{max} $ es finita

## 2.4. Cuantización y muestreo de imágenes

* La salida de la mayoría de los sensores es un voltaje contino cuya amplitud y comportamiento espacial están relacionados con el fenómeno físico que está sensando.

* Para crear una imagen digital, necesitamos convertir los datos continuos en un formato digital. 

* Esto requiere dos procesos: muestreo y cuantización.


![Aspectos básicos](figs/aspectos_basicos.png)

### Resolución espacial

* Depende de la frecuencia de muestreo. 

* Es el número de elementos por unidad de longitud.


### Resolución espectral

* Depende de la cantidad de niveles de cuantización. 

* Es el número máximo de niveles posible que puede tener cada elemento en una imagen una vez digitalizada.


Resolución espacial y espectral

![Resolución espacial y espectral](figs/resoluciones.png)

### Representación de imágenes digitales

* El resultado del muestreo y la cuantización es una matriz de números reales. 

* Los valores de las coordenadas de origen son (𝑥,𝑦)=(0,0). 

* Los siguientes valores a lo largo de la primera fila son: (𝑥,𝑦)=(0,1);(0,2);(0,3);…

* Éstos no son valores reales de las coordenadas físicas cuando la imagen fue muestreada, sino los de la segunda (tercera, cuarta) muestra a lo largo de la primera fila. 


* De acuerdo a esta mutación, en el caso de una imagen de M filas y columnas, la imagen digital se puede representar como sigue:

\begin{equation}
f(x,y) = 
\begin{bmatrix}
f(0,0) & f(0,1) & \cdots & f(0,N-1)\\
f(1,0) & f(1,1) & \cdots & f(1,N-1)\\
\vdots & \vdots &        & \vdots \\
f(M-1,0) & f(M-1,1) & \cdots & f(M,N-1)
\end{bmatrix}
\end{equation}

* Otra forma de representar el modelo es a través de una matriz

\begin{equation}
A = 
\begin{bmatrix}
a_{0,0} & a_{0,1} & \cdots & a_{0,N-1}\\
a_{1,0} & a_{1,1} & \cdots & a_{1,N-1}\\
\vdots & \vdots &        & \vdots \\
a_{M-1,0} & a_{M-1,1} & \cdots & a_{M,N-1}
\end{bmatrix}
\end{equation}

![Representación de imágenes digitales](figs/representacion.png)

![Elementos de representación](figs/representaciones_2.png)

* Los niveles de quantización permitidos para cada pixel se representan por el número entero 𝐿. 

* Normalmente, con fines de facilitar el procesamiento, el almacenamiento y el muestreo, este número es, típicamente, una potencia de 2, es decir: 
    * $𝐿=2^k$


* 𝑘 es el número de bits que se emplearán en la representación de los niveles
* que representa valores igualmente espaciados y enteros en el intervalo $[0,𝐿−1]$


* Sea $I_(M \times N)$ una imagen de $M$ filas y $N$ columnas
* Entonces, el número de bits necesarios para almacenar dicha imagen es

    * $ b = MNk $
    * $ b = kN^2 $ si $ M=N$



![Bytes necesarios para una imagen de NxN](figs/grafica_bytes.png)





## 2.5. Relaciones básicas entre pixeles
## 2.6. Introducción a las herramientas matemáticas básicas utilizadas en el procesamiento de imágenes
