# COMPUTER VISION 1 - TRABAJO PRACTICO nº1

**Autor: Julio Agustín Donadello**

**Fecha de entrega: 18-07-2024**

In [1]:
%matplotlib qt

import numpy as np
import cv2 as cv
import matplotlib.pyplot as plt

# Parte 1

## 1.1 Coordenadas cromáticas

In [2]:
img1 = cv.imread('data/coord_cromaticas/CoordCrom_1.png')
img2 = cv.imread('data/coord_cromaticas/CoordCrom_2.png')
img3 = cv.imread('data/coord_cromaticas/CoordCrom_3.png')

In [3]:
fig, (ax1, ax2, ax3) = plt.subplots(1, 3, figsize=(15, 5))  # 1 fila, 3 columnas
ax1.imshow(img1)
ax1.set_title('Imagen 1')
ax2.imshow(img2)
ax2.set_title('Imagen 2')
ax3.imshow(img3)
ax3.set_title('Imagen 3')
plt.show()

In [4]:
img1.shape

(996, 908, 3)

In [5]:
def convert_to_cromatic_coords(img: np.ndarray) -> np.ndarray:
    '''
    Parameters
    ----------
    img : np.ndarray
        Input image in BGR format.

    Returns
    -------
    np.ndarray
        Image converted to chromatic coordinates.
    '''
    img_float = img.astype(np.float32)  # Convertir a float32 para precisión en la división
    img_cromatic = np.zeros_like(img_float)

    for row in range(img.shape[0]):
        for col in range(img.shape[1]):
            b, g, r = img_float[row, col]
            sum_channels = b + g + r
            if sum_channels > 0:
                img_cromatic[row, col] = [b / sum_channels, g / sum_channels, r / sum_channels]

    # Convertir de nuevo a 0-255 y uint8 para visualización
    img_cromatic = (img_cromatic * 255).astype(np.uint8)

    return img_cromatic

### Resultados

In [6]:
img1_cromatic = convert_to_cromatic_coords(img1)
img2_cromatic = convert_to_cromatic_coords(img2)
img3_cromatic = convert_to_cromatic_coords(img3)


fig, ((ax1, ax2, ax3), (ax4, ax5, ax6)) = plt.subplots(2, 3, figsize=(15, 10))

ax1.imshow(cv.cvtColor(img1, cv.COLOR_BGR2RGB))
ax1.set_title('Imagen 1 - Original')

ax2.imshow(cv.cvtColor(img2, cv.COLOR_BGR2RGB))
ax2.set_title('Imagen 2 - Original')

ax3.imshow(cv.cvtColor(img3, cv.COLOR_BGR2RGB))
ax3.set_title('Imagen 3 - Original')

ax4.imshow(cv.cvtColor(img1_cromatic, cv.COLOR_BGR2RGB))
ax4.set_title('Imagen 1 - Coordenadas Cromáticas')

ax5.imshow(cv.cvtColor(img2_cromatic, cv.COLOR_BGR2RGB))
ax5.set_title('Imagen 2 - Coordenadas Cromáticas')

ax6.imshow(cv.cvtColor(img3_cromatic, cv.COLOR_BGR2RGB))
ax6.set_title('Imagen 3 - Coordenadas Cromáticas')

plt.tight_layout()
plt.show()

## 1.2 White patch

In [7]:
test_blue = cv.imread('data/white_patch/test_blue.png')
test_green = cv.imread('data/white_patch/test_green.png')
test_red = cv.imread('data/white_patch/test_red.png')

In [8]:
wp_blue = cv.imread('data/white_patch/wp_blue.jpg')
wp_green = cv.imread('data/white_patch/wp_green.png')
wp_green2 = cv.imread('data/white_patch/wp_green2.jpg')
wp_red = cv.imread('data/white_patch/wp_red.png')
wp_red2 = cv.imread('data/white_patch/wp_red2.jpg')

In [9]:
def white_patch(img: np.ndarray) -> np.ndarray:
    '''
    Parameters
    ----------
    img : np.ndarray
        Input image in BGR format.

    Returns
    -------
    np.ndarray
        Image patched in BGR format.
    '''
    img_float = img.astype(np.float32)  # Convertir a float32 para precisión en la división
    adjust_max = lambda channel: np.percentile(channel, 95) if channel.max() == 255 else channel.max()
    #adjust_max = lambda channel: np.percentile(channel, 95) if channel.max() == 255 else channel.max()-50 # testing

    # máximo ajustado de cada canal
    b_max = adjust_max(img_float[:,:,0])
    g_max = adjust_max(img_float[:,:,1])
    r_max = adjust_max(img_float[:,:,2])
    
    # Verificar si alguno de los canales tiene un valor máximo de 0
    if b_max == 0 or g_max == 0 or r_max == 0:
        raise ValueError("Problemas con la cámara: uno de los canales tiene un valor máximo de 0.")

    # Normalizar cada canal por su valor máximo
    img_patched = img_float / [b_max, g_max, r_max] * 255.0

    # Convertir de nuevo a uint8 para visualización
    img_patched = img_patched.astype(np.uint8)

    return img_patched

### Resultados

In [10]:
# Crear figura y subplots
fig, axs = plt.subplots(2, 3, figsize=(15, 8))

# Mostrar imágenes originales en la primera fila
axs[0, 0].imshow(cv.cvtColor(test_blue, cv.COLOR_BGR2RGB))
axs[0, 0].set_title('Original Test Blue')
axs[0, 1].imshow(cv.cvtColor(test_green, cv.COLOR_BGR2RGB))
axs[0, 1].set_title('Original Test Green')
axs[0, 2].imshow(cv.cvtColor(test_red, cv.COLOR_BGR2RGB))
axs[0, 2].set_title('Original Test Red')

# Mostrar imágenes parcheadas en la segunda fila
axs[1, 0].imshow(cv.cvtColor(white_patch(test_blue), cv.COLOR_BGR2RGB))
axs[1, 0].set_title('Patched Test Blue')
axs[1, 1].imshow(cv.cvtColor(white_patch(test_green), cv.COLOR_BGR2RGB))
axs[1, 1].set_title('Patched Test Green')
axs[1, 2].imshow(cv.cvtColor(white_patch(test_red), cv.COLOR_BGR2RGB))
axs[1, 2].set_title('Patched Test Red')

# Ajustar espacios y mostrar la figura
plt.tight_layout()
plt.show()

In [11]:
# Crear figura y subplots
fig, axs = plt.subplots(2, 5, figsize=(15, 8))
# Mostrar imágenes originales en la primera fila
axs[0, 0].imshow(cv.cvtColor(wp_blue, cv.COLOR_BGR2RGB))
axs[0, 0].set_title('Original WP Blue')
axs[0, 1].imshow(cv.cvtColor(wp_green, cv.COLOR_BGR2RGB))
axs[0, 1].set_title('Original WP Green')
axs[0, 2].imshow(cv.cvtColor(wp_green2, cv.COLOR_BGR2RGB))
axs[0, 2].set_title('Original WP Green 2')
axs[0, 3].imshow(cv.cvtColor(wp_red, cv.COLOR_BGR2RGB))
axs[0, 3].set_title('Original WP Red')
axs[0, 4].imshow(cv.cvtColor(wp_red2, cv.COLOR_BGR2RGB))
axs[0, 4].set_title('Original WP Red 2')
# Mostrar imágenes parcheadas en la segunda fila
axs[1, 0].imshow(cv.cvtColor(white_patch(wp_blue), cv.COLOR_BGR2RGB))
axs[1, 0].set_title('Patched WP Blue')
axs[1, 1].imshow(cv.cvtColor(white_patch(wp_green), cv.COLOR_BGR2RGB))
axs[1, 1].set_title('Patched WP Green')
axs[1, 2].imshow(cv.cvtColor(white_patch(wp_green2), cv.COLOR_BGR2RGB))
axs[1, 2].set_title('Patched WP Green 2')
axs[1, 3].imshow(cv.cvtColor(white_patch(wp_red), cv.COLOR_BGR2RGB))
axs[1, 3].set_title('Patched WP Red')
axs[1, 4].imshow(cv.cvtColor(white_patch(wp_red2), cv.COLOR_BGR2RGB))
axs[1, 4].set_title('Patched WP Red 2')
# Ajustar espacios y mostrar la figura
plt.tight_layout()
plt.show()

# 1.3 Falla Whitepatch

Se observa una "falla" cuando se trabaja con la imagen wp_blue. Esto tiene una explicación y una posible mitigación.

- Explicación: Viendo la distribución de intensidades en los canales de la imagen wp_blue, vemos en la imagen que genera la celda posterior que el percentil seleccionado para los canales R y G responden a valores muy bajos. Por ende el escalamiento afecta en gran medida a los valores "bajos" que poseían de antemano estos canales.

- Mitigación: Tomar un percentil superior para evitar una disminución de escala abrupta por la baja densidad de intensidades altas que presentan las distribuciones de algunos canales. Por ejemplo: Usar el percentil 99.
Esto mitiga el problema en la imagen wp_blue pero baja el rendimiento general del algoritmo, que se puede observar en la modificación de rendimiento que recibe el resto de las imágenes. 

In [12]:
# Leer la imagen
wp_blue = cv.imread('data/white_patch/wp_blue.jpg')

# Convertir de BGR a RGB para mostrar con Matplotlib
wp_blue_rgb = cv.cvtColor(wp_blue, cv.COLOR_BGR2RGB)

# Calcular histogramas para cada canal de color
hist_b = cv.calcHist([wp_blue], [0], None, [256], [0, 256])
hist_g = cv.calcHist([wp_blue], [1], None, [256], [0, 256])
hist_r = cv.calcHist([wp_blue], [2], None, [256], [0, 256])

# Calcular percentil 95 para cada canal
percentile_b = np.percentile(wp_blue[:,:,0], 95)
percentile_g = np.percentile(wp_blue[:,:,1], 95)
percentile_r = np.percentile(wp_blue[:,:,2], 95)

# Crear la figura y los subplots
fig, axs = plt.subplots(1, 4, figsize=(15, 4))

# Mostrar la imagen
axs[0].imshow(wp_blue_rgb)
axs[0].set_title('Imagen')

# Mostrar histograma para el canal Azul (B)
axs[1].plot(hist_b, color='b')
axs[1].axvline(x=percentile_b, color='r', linestyle='--', label=f'Percentil 95 ({int(percentile_b)})')
axs[1].set_title('Histograma Azul')
axs[1].set_xlim([0, 256])
axs[1].legend()

# Mostrar histograma para el canal Verde (G)
axs[2].plot(hist_g, color='g')
axs[2].axvline(x=percentile_g, color='r', linestyle='--', label=f'Percentil 95 ({int(percentile_g)})')
axs[2].set_title('Histograma Verde')
axs[2].set_xlim([0, 256])
axs[2].legend()

# Mostrar histograma para el canal Rojo (R)
axs[3].plot(hist_r, color='r')
axs[3].axvline(x=percentile_r, color='r', linestyle='--', label=f'Percentil 95 ({int(percentile_r)})')
axs[3].set_title('Histograma Rojo')
axs[3].set_xlim([0, 256])
axs[3].legend()

# Ajustar espacios y mostrar la figura
plt.tight_layout()
plt.show()


- Corrección para imagen wp_blue con los g_max y r_max hardcodeados a 240.

In [13]:
def white_patch_wp_blue(img: np.ndarray) -> np.ndarray:
    '''
    Parameters
    ----------
    img : np.ndarray
        Input image in BGR format.

    Returns
    -------
    np.ndarray
        Image patched in BGR format.
    '''
    img_float = img.astype(np.float32)  # Convertir a float32 para precisión en la división
    adjust_max = lambda channel: np.percentile(channel, 95) if channel.max() == 255 else channel.max()
    #adjust_max = lambda channel: np.percentile(channel, 95) if channel.max() == 255 else channel.max()-50 # testing

    # máximo ajustado de cada canal
    b_max = adjust_max(img_float[:,:,0])
    g_max = 240
    r_max = 240
    
    # Verificar si alguno de los canales tiene un valor máximo de 0
    if b_max == 0 or g_max == 0 or r_max == 0:
        raise ValueError("Problemas con la cámara: uno de los canales tiene un valor máximo de 0.")

    # Normalizar cada canal por su valor máximo
    img_patched = img_float / [b_max, g_max, r_max] * 255.0

    # Convertir de nuevo a uint8 para visualización
    img_patched = img_patched.astype(np.uint8)

    return img_patched

- Resultados

In [14]:
# Crear figura y subplots
fig, axs = plt.subplots(1,2, figsize=(10, 5))
# Mostrar imágenes originales en la primera fila
axs[0].imshow(cv.cvtColor(wp_blue, cv.COLOR_BGR2RGB))
axs[0].set_title('Original WP Blue')
# Mostrar imágenes parcheadas en la segunda fila
axs[1].imshow(cv.cvtColor(white_patch_wp_blue(wp_blue), cv.COLOR_BGR2RGB))
axs[1].set_title('Patched WP Blue')
# Ajustar espacios y mostrar la figura
plt.tight_layout()
plt.show()

No se termina de corregir el comportamiento sobre la imagen wp_blue pero se ve una mejoría.

---

# Parte 2

## 2.1 Escala de grises

In [15]:
img1_tp = cv.imread('data/img1_tp.png', cv.IMREAD_GRAYSCALE)
img2_tp = cv.imread('data/img2_tp.png', cv.IMREAD_GRAYSCALE)

In [16]:
# Crear figura y subplots
fig, axs = plt.subplots(2, 2, figsize=(10, 5))
# Mostrar imágenes originales en la primera fila
axs[0,0].imshow(cv.cvtColor(img1_tp, cv.COLOR_BGR2RGB))
axs[0,0].set_title('Original img1_tp')
axs[0,1].imshow(cv.cvtColor(img2_tp, cv.COLOR_BGR2RGB))
axs[0,1].set_title('Original img2_tp')
# Mostrar imágenes parcheadas en la segunda fila
axs[1,0].imshow(cv.cvtColor(img1_tp, cv.COLOR_BGR2RGB), cmap='gray')
axs[1,0].set_title('Grey cmap img1_tp')
axs[1,1].imshow(cv.cvtColor(img2_tp, cv.COLOR_BGR2RGB), cmap='gray')
axs[1,1].set_title('Grey cmap img2_tp')
# Ajustar espacios y mostrar la figura
plt.tight_layout()
plt.show()

## 2.2 Histogramas

In [17]:
# Elegir el número de bins (por ejemplo, 256 para cada nivel de gris)
num_bins = 25

# Calcular el histograma
hist_img1, bins_img1 = np.histogram(img1_tp, bins=num_bins, range=(0, 256))
hist_img2, bins_img2 = np.histogram(img2_tp, bins=num_bins, range=(0, 256))

# Graficar el histograma
plt.figure(figsize=(10, 5))

plt.subplot(1, 2, 1)
plt.bar(bins_img1[:-1], hist_img1, width=1, color='black')
plt.title('Histograma de img1_tp')
plt.xlabel('Intensidad de píxel')
plt.ylabel('Frecuencia')

plt.subplot(1, 2, 2)
plt.bar(bins_img2[:-1], hist_img2, width=1, color='black')
plt.title('Histograma de img2_tp')
plt.xlabel('Intensidad de píxel')
plt.ylabel('Frecuencia')

plt.tight_layout()
plt.show()


- Se observa un histograma idéntico por más que las imágenes son claramente distintas.
- Para un problema de clasificación no veo útil usar los histogramas como features por los casos como el que estamos evaluando. Estaría alimentando al modelo con información errónea ya que se interpretaría una similaridad donde no la hay.

## 2.3 Segmentación

In [18]:
segmentacion = cv.cvtColor(cv.imread('data/segmentacion.png'), cv.COLOR_BGR2RGB)

In [19]:
plt.imshow(segmentacion)
plt.show()

In [20]:
num_bins = 30
# Calcular el histograma
hist_segmentacion, bins_segmentacion = np.histogram(segmentacion[:,:,2], bins=num_bins, range=(0, 256))
plt.bar(bins_segmentacion[:-1], hist_segmentacion, width=1, color='blue')
plt.title('Histograma de img1_tp')
plt.xlabel('Intensidad de píxel')
plt.ylabel('Frecuencia')
plt.show()

- Histograma de cada Canal

In [21]:
# Elegir el número de bins
num_bins = 55

# Calcular el histograma para cada canal
hist_r, bins_r = np.histogram(segmentacion[:,:,2], bins=num_bins, range=(0, 256))
hist_g, bins_g = np.histogram(segmentacion[:,:,1], bins=num_bins, range=(0, 256))
hist_b, bins_b = np.histogram(segmentacion[:,:,0], bins=num_bins, range=(0, 256))

# Calcular el ancho de los bins
bin_width = bins_r[1] - bins_r[0]

# Graficar los histogramas en subplots
plt.figure(figsize=(15, 5))

plt.subplot(1, 3, 1)
plt.bar(bins_r[:-1], hist_r, width=bin_width, color='red')
plt.title('Histograma del canal R')
plt.xlabel('Intensidad de píxel')
plt.ylabel('Frecuencia')

plt.subplot(1, 3, 2)
plt.bar(bins_g[:-1], hist_g, width=bin_width, color='green')
plt.title('Histograma del canal G')
plt.xlabel('Intensidad de píxel')
plt.ylabel('Frecuencia')

plt.subplot(1, 3, 3)
plt.bar(bins_b[:-1], hist_b, width=bin_width, color='blue')
plt.title('Histograma del canal B')
plt.xlabel('Intensidad de píxel')
plt.ylabel('Frecuencia')

plt.tight_layout()
plt.show()

- Superposicion de histogramas por par de canales

In [37]:
# Elegir el número de bins
num_bins = 55
# Calcular el ancho de los bins
bin_width = bins_r[1] - bins_r[0]
# Crear el subplot de 2x2
fig, axes = plt.subplots(2, 2, figsize=(12, 12))

# Histograma de los tres canales superpuestos
axes[0, 0].bar(bins_r[:-1], hist_r, width=bin_width, color='red', alpha=0.5, label='Red')
axes[0, 0].bar(bins_g[:-1], hist_g, width=bin_width, color='green', alpha=0.5, label='Green')
axes[0, 0].bar(bins_b[:-1], hist_b, width=bin_width, color='blue', alpha=0.5, label='Blue')
axes[0, 0].set_title('Histogramas de los canales R, G, B superpuestos')
axes[0, 0].set_xlabel('Intensidad de píxel')
axes[0, 0].set_ylabel('Frecuencia')
axes[0, 0].legend()

# Histograma de los canales R y G superpuestos
axes[0, 1].bar(bins_r[:-1], hist_r, width=bin_width, color='red', alpha=0.5, label='Red')
axes[0, 1].bar(bins_g[:-1], hist_g, width=bin_width, color='green', alpha=0.5, label='Green')
axes[0, 1].set_title('Histogramas de los canales R y G superpuestos')
axes[0, 1].set_xlabel('Intensidad de píxel')
axes[0, 1].set_ylabel('Frecuencia')
axes[0, 1].legend()

# Histograma de los canales R y B superpuestos
axes[1, 0].bar(bins_r[:-1], hist_r, width=bin_width, color='red', alpha=0.5, label='Red')
axes[1, 0].bar(bins_b[:-1], hist_b, width=bin_width, color='blue', alpha=0.5, label='Blue')
axes[1, 0].set_title('Histogramas de los canales R y B superpuestos')
axes[1, 0].set_xlabel('Intensidad de píxel')
axes[1, 0].set_ylabel('Frecuencia')
axes[1, 0].legend()

# Histograma de los canales G y B superpuestos
axes[1, 1].bar(bins_g[:-1], hist_g, width=bin_width, color='green', alpha=0.5, label='Green')
axes[1, 1].bar(bins_b[:-1], hist_b, width=bin_width, color='blue', alpha=0.5, label='Blue')
axes[1, 1].set_title('Histogramas de los canales G y B superpuestos')
axes[1, 1].set_xlabel('Intensidad de píxel')
axes[1, 1].set_ylabel('Frecuencia')
axes[1, 1].legend()

plt.tight_layout()
plt.show()

- Segmentacion del cielo: Usando el horizonte.

In [23]:
segmentacion.shape

(628, 953, 3)

In [29]:
mask = np.zeros(segmentacion.shape, dtype=np.uint8)
mask[0:288, 0:953] = 255  # y = 288 --> horizonte

# Aplicar operaciones lógicas
img_and = cv.bitwise_and(segmentacion, mask)
img_or = cv.bitwise_or(segmentacion, mask)

# Mostrar resultados en un subplot de 2x2
fig, axes = plt.subplots(2, 2, figsize=(12, 12))

# Imagen original
axes[0, 0].imshow(segmentacion, cmap='gray')
axes[0, 0].set_title('Imagen Original')
axes[0, 0].axis('off')

# Máscara
axes[0, 1].imshow(mask, cmap='gray')
axes[0, 1].set_title('Máscara')
axes[0, 1].axis('off')

# Resultado de bitwise_and
axes[1, 0].imshow(img_and, cmap='gray')
axes[1, 0].set_title('Resultado de bitwise_and')
axes[1, 0].axis('off')

# Resultado de bitwise_or
axes[1, 1].imshow(img_or, cmap='gray')
axes[1, 1].set_title('Resultado de bitwise_or')
axes[1, 1].axis('off')

plt.tight_layout()
plt.show()

Se observa un pequeño pico de montaña usando el horizonte.

- Segmentacion del cielo: Usando el horizonte y la intensidad del canal azul.

In [39]:
segmentacion = cv.cvtColor(cv.imread('data/segmentacion.png'), cv.COLOR_BGR2RGB)

# Mask of blue
mask_blue = cv.inRange(segmentacion, (0, 0, 170), (255, 255, 255)) #Umbral de intensidad azul: 170

# Mask of horizon line
mask_horizon = np.zeros(segmentacion.shape[:2], dtype=np.uint8)
mask_horizon[0:288, 0:953] = 255  # y = 288 --> horizonte

# Combine masks 
mask = cv.bitwise_and(mask_blue, mask_horizon) # deberia usar OR pero funciona con AND.

# Apply bitwise_and operation with combined mask
target = cv.bitwise_and(segmentacion, segmentacion, mask=mask)

fig, axes = plt.subplots(1, 3, figsize=(15, 5))
# Original image
axes[0].imshow(segmentacion)
axes[0].set_title('Imagen Original')
axes[0].axis('off')
# Mask
axes[1].imshow(mask, cmap='gray')
axes[1].set_title('Máscara combinada')
axes[1].axis('off')
# Image with mask applied
axes[2].imshow(target)
axes[2].set_title('Imagen con Máscara')
axes[2].axis('off')

plt.tight_layout()
plt.show()


Queda eliminado el pico de la montaña al combinar una mascara para el horizonte con una mascara en funcion de tipo treshold para la intensidad del canal azul.