# Transformaciones<a class="tocSkip">
## TRATAMIENTO DE SEÑALES <a class="tocSkip">
### Ingenieria Electrónica <a class="tocSkip">
### Universidad Popular del Cesar <a class="tocSkip">
### Prof.: Jose Ramón Iglesias Gamarra - [https://github.com/joseramoniglesias/](https://github.com/joseramoniglesias/) <a class="tocSkip">
  **joseiglesias@unicesar.edu.co**

# Transformaciones de Imagen - DIP


## Configuración del ambiente

In [None]:
# Importamos las librerías necesarias
import cv2
import numpy as np
from numpy import r_
from scipy import signal
import scipy.fftpack as fp
from skimage.draw import disk
import matplotlib.pyplot as plt

%matplotlib inline

def signaltonoise(a, axis=0, ddof=0):
    a = np.asanyarray(a)
    m = a.mean(axis)
    sd = a.std(axis = axis, ddof = ddof)
    return np.where(sd == 0, 0, m / sd)

def plot_images(img, title=None, font_size=None, axis="off", color=cv2.COLOR_BGR2RGB):
    n_imgs = len(img)
    if  n_imgs > 1:
        _, axs = plt.subplots(1, n_imgs, **{'figsize':(3*n_imgs, 3)})
        axs = axs.ravel()
        for i in range(n_imgs):
            if title and (len(title) == n_imgs):
                axs[i].set_title(title[i], fontsize=font_size)
            axs[i].axis(axis)
            if len(img[i].shape) == 2:
              axs[i].imshow(img[i], cmap="gray")
            else:
              axs[i].imshow(cv2.cvtColor(img[i], color))
        plt.tight_layout()    
    else:
        plt.title(title, fontsize=font_size)
        plt.axis(axis)
        if len(img[0].shape) == 2:
          plt.imshow(img[0], cmap="gray")
        else:
          plt.imshow(cv2.cvtColor(img[0], color))

In [None]:
# Leemos las imágenes y nos aseguramos de que sean binarias
lenna = cv2.resize(cv2.imread("lenna.jpg", cv2.IMREAD_GRAYSCALE), (512, 512))
astronauta = cv2.resize(cv2.imread("astronauta.png", cv2.IMREAD_GRAYSCALE), (512, 512))
pcb = cv2.resize(cv2.imread("pcb.png", cv2.IMREAD_GRAYSCALE), (512, 512))
moire = cv2.imread("moire.png", cv2.IMREAD_GRAYSCALE)
_, vertical_stripes = cv2.threshold(cv2.imread("black-white-vertical-stripes.jpg", cv2.IMREAD_GRAYSCALE), 127, 255, cv2.THRESH_BINARY)
_, diagonal_stripes = cv2.threshold(cv2.imread("black-white-diagonal-stripes.jpg", cv2.IMREAD_GRAYSCALE), 127, 255, cv2.THRESH_BINARY)
_, circles = cv2.threshold(cv2.imread("expanding-circles-from-center.jpg", cv2.IMREAD_GRAYSCALE), 127, 255, cv2.THRESH_BINARY)
plot_images([lenna, astronauta, pcb, moire, vertical_stripes, diagonal_stripes, circles])

## Otros ejemplos FFT

In [None]:
freq = fp.fft2(lenna) # Para el cálculo de la FFT usamos la librería SciPy
freq = np.vectorize(complex)(freq.real, (-1)*freq.imag)
freq2 = fp.fftshift(freq) # Centramos el espectro para una mejor visualización
freq_dB = 20*np.log10(0.01+np.abs(freq2)) # Paso de escala lineal a escala logarítmica
imageOut = fp.ifft2(np.vectorize(complex)(freq.real, freq.imag)).real
plot_images([lenna, freq_dB.real.astype(int), imageOut], ["Original", "Espectro FFT [Fase * (-1)]", "Reconstruida [Fase * (-1)]"])

In [None]:
freq = fp.fft2(vertical_stripes) # Para el cálculo de la FFT usamos la librería SciPy
freq2 = fp.fftshift(freq) # Centramos el espectro para una mejor visualización
freq_dB = 20*np.log10(0.01+np.abs(freq2)) # Paso de escala lineal a escala logarítmica
plot_images([vertical_stripes, freq_dB.real.astype(int)], ["Original", "Espectro FFT"])

In [None]:
filt_vertical_stripes = cv2.GaussianBlur(vertical_stripes, (25,25), 20.0)
freq = fp.fft2(filt_vertical_stripes) # Para el cálculo de la FFT usamos la librería SciPy
freq2 = fp.fftshift(freq) # Centramos el espectro para una mejor visualización
freq_dB = 20*np.log10(0.01+np.abs(freq2)) # Paso de escala lineal a escala logarítmica
plot_images([filt_vertical_stripes, freq_dB.real.astype(int)], ["Original", "Espectro FFT"])

In [None]:
rot_vertical_stripes = cv2.rotate(filt_vertical_stripes, 2)
freq = fp.fft2(rot_vertical_stripes) # Para el cálculo de la FFT usamos la librería SciPy
freq2 = fp.fftshift(freq) # Centramos el espectro para una mejor visualización
freq_dB = 20*np.log10(0.01+np.abs(freq2)) # Paso de escala lineal a escala logarítmica
plot_images([rot_vertical_stripes, freq_dB.real.astype(int)], ["Original", "Espectro FFT"])

In [None]:
freq = fp.fft2(diagonal_stripes) # Para el cálculo de la FFT usamos la librería SciPy
freq2 = fp.fftshift(freq) # Centramos el espectro para una mejor visualización
freq_dB = 20*np.log10(0.01+np.abs(freq2)) # Paso de escala lineal a escala logarítmica
plot_images([diagonal_stripes, freq_dB.real.astype(int)], ["Original", "Espectro FFT"])

In [None]:
filt_diagonal_stripes = cv2.GaussianBlur(diagonal_stripes, (15,15), 10.0)
freq = fp.fft2(filt_diagonal_stripes) # Para el cálculo de la FFT usamos la librería SciPy
freq2 = fp.fftshift(freq) # Centramos el espectro para una mejor visualización
freq_dB = 20*np.log10(0.01+np.abs(freq2)) # Paso de escala lineal a escala logarítmica
plot_images([filt_diagonal_stripes, freq_dB.real.astype(int)], ["Original", "Espectro FFT"])

In [None]:
freq = fp.fft2(circles) # Para el cálculo de la FFT usamos la librería SciPy
freq2 = fp.fftshift(freq) # Centramos el espectro para una mejor visualización
freq_dB = 20*np.log10(0.01+np.abs(freq2)) # Paso de escala lineal a escala logarítmica
plot_images([circles, freq_dB.real.astype(int)], ["Original", "Espectro FFT"])

In [None]:
filt_circles = cv2.GaussianBlur(circles, (25,25), 20.0)
freq = fp.fft2(filt_circles) # Para el cálculo de la FFT usamos la librería SciPy
freq2 = fp.fftshift(freq) # Centramos el espectro para una mejor visualización
freq_dB = 20*np.log10(0.01+np.abs(freq2)) # Paso de escala lineal a escala logarítmica
plot_images([filt_circles, freq_dB.real.astype(int)], ["Original", "Espectro FFT"])

In [None]:
rectangle = np.zeros((512, 521), dtype=np.uint8)
rectangle[210:282, 230:272] = 255
freq = fp.fft2(rectangle) # Para el cálculo de la FFT usamos la librería ScipPy
imageOut = fp.ifft2(freq).real # Cálculo de la FFT inversa
spectrum = 20*np.log10(0.01+np.abs(fp.fftshift(freq)))
phase = np.angle(fp.fftshift(freq))
plot_images([rectangle, spectrum.real.astype(int), phase.real.astype(int)], 
            ["Original", "Espectro FFT", "Fase FFT"])

In [None]:
filt_rectangle = cv2.GaussianBlur(rectangle, (15,15), 20.0)
freq = fp.fft2(filt_rectangle) # Para el cálculo de la FFT usamos la librería ScipPy
spectrum = 20*np.log10(0.01+np.abs(fp.fftshift(freq)))
phase = np.angle(fp.fftshift(freq))
plot_images([filt_rectangle, spectrum.real.astype(int), phase.real.astype(int)], 
            ["Original", "Espectro FFT", "Fase FFT"])

In [None]:
rectangle = np.zeros((512, 521), dtype=np.uint8)
rectangle[100:172, 260:302] = 255
freq = fp.fft2(rectangle) # Para el cálculo de la FFT usamos la librería ScipPy
spectrum = 20*np.log10(0.01+np.abs(fp.fftshift(freq)))
phase = np.angle(fp.fftshift(freq))
plot_images([rectangle, spectrum.real.astype(int), phase.real.astype(int)], 
            ["Original", "Espectro FFT", "Fase FFT"])

In [None]:
shape = rectangle.shape[1::-1]
rot_rectangle = cv2.warpAffine(rectangle, cv2.getRotationMatrix2D(tuple(np.array(shape) / 2), 30, 1.0), shape)
freq = fp.fft2(rot_rectangle) # Para el cálculo de la FFT usamos la librería ScipPy
spectrum = 20*np.log10(0.01+np.abs(fp.fftshift(freq)))
phase = np.angle(fp.fftshift(freq))
plot_images([rot_rectangle, spectrum.real.astype(int), phase.real.astype(int)], 
            ["Original", "Espectro FFT", "Fase FFT"])

## Casos de uso filtrado en frecuencia

### Interferencia sinusoidal
#### Filtros pasabanda

In [None]:
shape = astronauta.shape
center_X, center_Y = shape[0]//2, shape[1]//2

rr, cc = disk((center_X, center_Y), 50)
kernel = np.zeros(shape, dtype=np.uint8)
kernel[rr, cc] = 1

rr, cc = disk((center_X, center_Y), 30)
kernel2 = np.zeros(shape, dtype=np.uint8)
kernel2[rr, cc] = 1

kernel3 = kernel-kernel2

freq = fp.fftshift(fp.fft2(astronauta))

freq_kernel = fp.fft2(fp.ifftshift(kernel3))
convolved = freq*kernel3
imageOut = np.clip(fp.ifft2(fp.ifftshift(convolved)).real,0,255)

astronauta_spectrum = (20*np.log10(0.1+freq)).real.astype(int)
result_spectrum = (20*np.log10(0.1+convolved)).real.astype(int)

plot_images([astronauta, 255*kernel3, imageOut], ["Original", "Filtro pasabanda", "Resultado"])
plot_images([astronauta_spectrum, result_spectrum], ["Espectro FFT Original", "Espectro FFT Resultado"])

In [None]:
std = 25 # Dispersión de la distribución gaussiana
gauss_kernel_1 = np.outer(signal.gaussian(astronauta.shape[0], std), signal.gaussian(astronauta.shape[1], std))

std = 20 # Dispersión de la distribución gaussiana
gauss_kernel_2 = np.outer(signal.gaussian(astronauta.shape[0], std), signal.gaussian(astronauta.shape[1], std))

kernel3 = gauss_kernel_1-gauss_kernel_2

freq = fp.fftshift(fp.fft2(astronauta))

freq_kernel = fp.fft2(fp.ifftshift(kernel3))
convolved = freq*kernel3
imageOut = np.clip(fp.ifft2(fp.ifftshift(convolved)).real,0,255)

astronauta_spectrum = (20*np.log10(0.1+freq)).real.astype(int)
result_spectrum = (20*np.log10(0.1+convolved)).real.astype(int)

plot_images([astronauta, 255*kernel3, imageOut], ["Original", "Filtro pasabanda Gaussiano", "Resultado"])
plot_images([astronauta_spectrum, result_spectrum], ["Espectro FFT Original", "Espectro FFT Resultado"])

#### Filtro rechaza bandas

In [None]:
shape = astronauta.shape
center_X, center_Y = shape[0]//2, shape[1]//2

rr, cc = disk((center_X, center_Y), 60)
kernel = np.zeros(shape, dtype=np.uint8)
kernel[rr, cc] = 1

rr, cc = disk((center_X, center_Y), 30)
kernel2 = np.zeros(shape, dtype=np.uint8)
kernel2[rr, cc] = 1

kernel3 = 1-(kernel-kernel2)

freq = fp.fftshift(fp.fft2(astronauta))

freq_kernel = fp.fft2(fp.ifftshift(kernel3))
convolved = freq*kernel3
imageOut = np.clip(fp.ifft2(fp.ifftshift(convolved)).real,0,255)

astronauta_spectrum = (20*np.log10(0.1+freq)).real.astype(int)
result_spectrum = (20*np.log10(0.1+convolved)).real.astype(int)

plot_images([astronauta, 255*kernel3, imageOut], ["Original", "Filtro rechazabanda", "Resultado"])
plot_images([astronauta_spectrum, result_spectrum], ["Espectro FFT Original", "Espectro FFT Resultado"])

In [None]:
std = 70 # Dispersión de la distribución gaussiana
gauss_kernel_1 = np.outer(signal.gaussian(astronauta.shape[0], std), signal.gaussian(astronauta.shape[1], std))

std = 15 # Dispersión de la distribución gaussiana
gauss_kernel_2 = np.outer(signal.gaussian(astronauta.shape[0], std), signal.gaussian(astronauta.shape[1], std))

kernel3 = 1-(gauss_kernel_1-gauss_kernel_2)
min, max = kernel3.min(), kernel3.max()
kernel3 = (kernel3-min)/(max-min)

freq = fp.fftshift(fp.fft2(astronauta))

freq_kernel = fp.fft2(fp.ifftshift(kernel3))
convolved = freq*kernel3
imageOut = np.clip(fp.ifft2(fp.ifftshift(convolved)).real,0,255)

astronauta_spectrum = (20*np.log10(0.1+freq)).real.astype(int)
result_spectrum = (20*np.log10(0.1+convolved)).real.astype(int)

plot_images([astronauta, 255*kernel3, imageOut], ["Original", "Filtro pasabanda Gaussiano", "Resultado"])
plot_images([astronauta_spectrum, result_spectrum], ["Espectro FFT Original", "Espectro FFT Resultado"])

#### Creando una máscara específica para eliminar la interferencia

In [None]:
rr, cc = disk((center_X, center_Y), 30)
kernel = np.ones(shape, dtype=np.uint8)
kernel[rr, cc] = 0

freq = fp.fftshift(fp.fft2(astronauta))
astronauta_spectrum = (20*np.log10(0.1+freq)).real.astype(int)
mask = 1-(astronauta_spectrum>100)*kernel # Sin tener en cuenta el centro de la imagen, buscar los picos del espectro mayores a 100 que corresponden al ruido

freq_kernel = fp.fft2(fp.ifftshift(kernel))
convolved = freq*mask
imageOut = np.clip(fp.ifft2(fp.ifftshift(convolved)).real,0,255)

result_spectrum = (20*np.log10(0.1+convolved)).real.astype(int)

plot_images([astronauta, 255*mask, imageOut], ["Original", "Máscara", "Resultado"])
plot_images([astronauta_spectrum, result_spectrum], ["Espectro FFT Original", "Espectro FFT Resultado"])

In [None]:
freq = fp.fftshift(fp.fft2(astronauta))
astronauta_spectrum = (20*np.log10(0.1+freq)).real.astype(int)
mask = (astronauta_spectrum>100)*kernel # Sin tener en cuenta el centro de la imagen, buscar los picos del espectro mayores a 100 que corresponden al ruido

freq_kernel = fp.fft2(fp.ifftshift(kernel))
convolved = freq*mask
imageOut = np.clip(fp.ifft2(fp.ifftshift(convolved)).real,0,255)

result_spectrum = (20*np.log10(0.1+convolved)).real.astype(int)

plot_images([astronauta, 255*mask, imageOut], ["Original", "Máscara", "Resultado"])
plot_images([astronauta_spectrum, result_spectrum], ["Espectro FFT Original", "Espectro FFT Resultado"])

### Patrón de moiré o muaré

In [None]:
freq = fp.fftshift(fp.fft2(moire))
moire_spectrum = (20*np.log10(0.1+freq)).real.astype(int)
plot_images([moire, moire_spectrum], ["Original", "Espectro FFT"])

In [None]:
std = 70 # Dispersión de la distribución gaussiana
gauss_kernel_1 = np.outer(signal.gaussian(moire.shape[0], std), signal.gaussian(moire.shape[1], std))

std = 15 # Dispersión de la distribución gaussiana
gauss_kernel_2 = np.outer(signal.gaussian(moire.shape[0], std), signal.gaussian(moire.shape[1], std))

kernel3 = 1-(gauss_kernel_1-gauss_kernel_2)
min, max = kernel3.min(), kernel3.max()
kernel3 = (kernel3-min)/(max-min)

freq = fp.fftshift(fp.fft2(moire))

freq_kernel = fp.fft2(fp.ifftshift(kernel3))
convolved = freq*kernel3
imageOut = np.clip(fp.ifft2(fp.ifftshift(convolved)).real,0,255)

astronauta_spectrum = (20*np.log10(0.1+freq)).real.astype(int)
result_spectrum = (20*np.log10(0.1+convolved)).real.astype(int)

plot_images([moire, 255*kernel3, imageOut], ["Original", "Filtro pasabanda Gaussiano", "Resultado"])
plot_images([astronauta_spectrum, result_spectrum], ["Espectro FFT Original", "Espectro FFT Resultado"])

## Transformada discreta del coseno y compresión JPEG

De manera similar a la transformada de Fourier, la transformada discreta del coseno o DCT (*Discrete Cosine Transform*), representa una imagen como la suma de funciones senoidales de diferentes magnitudes y frecuencias. Una de las diferencias prácticas importantes es que la DCT tiene una resolución en frecuencia más alta.

Para el caso 2D, las funciones base usadas para calcular DCT en regiones de 8x8 se muestran en la siguiente figura.

<img src="https://www.mathworks.com/help/images/basis8.gif" width="500"/>

Las frecuencias horizontales aumentan de izquierda a derecha y las verticales de arriba hacia abajo. La primera función base de valor constante se conoce como la componente DC.

In [None]:
def dct2(a):
    return fp.dct(fp.dct(a, axis=0, norm='ortho'), axis=1, norm='ortho')

def idct2(a):
    return fp.idct(fp.idct(a, axis=0, norm='ortho'), axis=1 , norm='ortho')

In [None]:
dct = dct2(lenna[:8,:8])
plt.imshow(lenna[:8,:8], cmap='gray')
plt.show()
plt.imshow(dct, cmap='gray', vmax = np.max(dct)*0.01, vmin = 0)
plt.show()

In [None]:
dct = dct2(lenna[128:136,128:136])
plt.imshow(lenna[128:136,128:136], cmap='gray')
plt.show()
plt.imshow(dct, cmap='gray', vmax = np.max(dct)*0.01, vmin = 0)
plt.show()

In [None]:
imsize = lenna.shape
dct = np.zeros(imsize)

# Aplicar la DCT a cada región de 8x8
for i in r_[:imsize[0]:8]:
    for j in r_[:imsize[1]:8]:
        dct[i:(i+8),j:(j+8)] = dct2(lenna[i:(i+8),j:(j+8)])


# Mostrar el resultado para toda la imagen
plt.figure()
plt.imshow(dct, cmap='gray', vmax = np.max(dct)*0.01, vmin = 0)
plt.title("8x8 DCTs de la imagen")
plt.show()

In [None]:
# Umbralización
thresh = 0.020
dct_thresh = dct * (abs(dct) > (thresh*np.max(dct)))


plt.figure()
plt.imshow(dct_thresh,cmap='gray',vmax = np.max(dct)*0.01,vmin = 0)
plt.title( "8x8 DCTs umbralizados de la imagen")
plt.show()

percent_nonzeros = np.sum(dct_thresh != 0.0 ) / (imsize[0]*imsize[1]*1.0)

print(f"Se mantienen solo el {percent_nonzeros*100.0:.2f}% de los coeficientes DCT")

In [None]:
im_dct = np.zeros(imsize)

for i in r_[:imsize[0]:8]:
    for j in r_[:imsize[1]:8]:
        im_dct[i:(i+8),j:(j+8)] = idct2(dct_thresh[i:(i+8),j:(j+8)])

cv2.imwrite("lenna_compressed.jpg", im_dct)

plot_images([lenna, im_dct], ["Original", "Comprimida"])

In [None]:
r = 7 # Radio del círculo para la máscara
rr, cc = disk((0, 0), r, shape=(8,8))
mask = np.zeros((8,8), dtype=np.uint8)
mask[rr, cc] = 1
print('Usando máscaras para compresión: ')
print(mask)

In [None]:
dct_t = np.zeros(imsize)

# Aplicar máscara a cada región de 8x8
for i in r_[:imsize[0]:8]:
    for j in r_[:imsize[1]:8]:
        dct_t[i:(i+8),j:(j+8)] = dct[i:(i+8),j:(j+8)]*mask

percent_nonzeros = np.sum(dct_t != 0.0 ) / (imsize[0]*imsize[1]*1.0)
print(f"Se mantienen solo el {percent_nonzeros*100.0:.2f}% de los coeficientes DCT")

# Mostrar el resultado para toda la imagen
plt.figure()
plt.imshow(dct_t, cmap='gray', vmax = np.max(dct_t)*0.01, vmin = 0)
plt.title("8x8 DCTs de la imagen")
plt.show()

In [None]:
im_dct = np.zeros(imsize)

for i in r_[:imsize[0]:8]:
    for j in r_[:imsize[1]:8]:
        im_dct[i:(i+8),j:(j+8)] = idct2(dct_t[i:(i+8),j:(j+8)])
        
plot_images([lenna, im_dct], ["Original", "Comprimida"])

**Copyright**

The notebooks are provided as [Open Educational Resource](https://de.wikipedia.org/wiki/Open_Educational_Resources). Feel free to use the notebooks for your own educational purposes. The text is licensed under [Creative Commons Attribution 4.0](https://creativecommons.org/licenses/by/4.0/), the code of the IPython examples under the [MIT license](https://opensource.org/licenses/MIT).