In [None]:
import numpy as np
from matplotlib import image
import matplotlib.pyplot as plt
import matplotlib.colors as clr

In [None]:
"""
Returns an array of type:
 - [x, y] for grayscale images
 - [x, y, [R, G, B]] for RGB images
 - [x, y, [R, G, B, A]] for RGBA images
"""
def read_image(filename):
    img = image.imread(filename)
    return img

In [None]:
"""
Função para mostrar uma imagem. Aceita um colormap definido pelo utilizador ou os do matplotlib

"""
    
def show_image(img, colormap = None):    
    plt.figure(figsize=(8,8))
    
    # Imagens com apenas uma coponenete: R, G, B ou Grayscale
    if len(img.shape) == 2:
        plt.imshow(img, cmap = colormap)
    else:
        if colormap != None:
            new_img = img[:, :, 0]
            plt.imshow(new_img, cmap = colormap)
        else:
            plt.imshow(img)

    plt.axis('off')
    plt.show()

> # Semana 1
Na diretória imagens estão presentes as imagens jpeg com baixa, média e alta qualidade, consoante os nomes das pastas;


In [None]:
#img = read_image('imagens/peppers.bmp')
#img = read_image('imagens/barn_mountains.bmp')
img = read_image('imagens/logo.bmp')

show_image(img)


Tamanho dos ficheiros .bmp

|        | Barn | Peppers | Logo |
|:------:|:----:|:-------:|:----:|
|  size  |   356.5KB  |    589.9KB   |   421.6KB  |


<br>
Tamanho dos ficheiros após compressão para JPEG

|        | Barn | Peppers | Logo |
|:------:|:----:|:-------:|:----:|
|   Low  |   43.4KB  |    35.2KB    |   21.9KB  |
| Medium |   51.5KB  |    41.3KB    |   23.1KB  |
|  High  |   67.5KB  |    57.7KB    |   27.3KB  |

<br>
Rácio de compressão

|        | Barn | Peppers | Logo |
|:------:|:----:|:-------:|:----:|
|   Low  |   8.2:1  |    16.7:1    |   19.3:1  |
| Medium |   6.9:1  |    14.3:1    |   18.3:1  |
|  High  |   5.2:1  |    10.2:1    |   15.4:1  |

In [None]:
low = image.imread('imagens/Low/peppers.jpg')
low.shape

In [None]:
medium = image.imread('imagens/Medium/peppers.jpg')
medium.shape

In [None]:
# ColorMaps
cm_gray = clr.LinearSegmentedColormap.from_list('gray', [(0,0,0), (1, 1, 1)], N = 256)
cm_red = clr.LinearSegmentedColormap.from_list('red', [(0,0,0), (1, 0, 0)], N = 256)
cm_green = clr.LinearSegmentedColormap.from_list('green', [(0,0,0), (0, 1, 0)], N = 256)
cm_blue = clr.LinearSegmentedColormap.from_list('blue', [(0,0,0), (0, 0, 1)], N = 256)


# Adaptado de https://jakevdp.github.io/PythonDataScienceHandbook/04.07-customizing-colorbars.html
cmap = plt.cm.get_cmap(cm_gray)
gray = cmap(np.arange(cmap.N))

cmap = plt.cm.get_cmap(cm_red)
red = cmap(np.arange(cmap.N))

cmap = plt.cm.get_cmap(cm_green)
green = cmap(np.arange(cmap.N))

cmap = plt.cm.get_cmap(cm_blue)
blue = cmap(np.arange(cmap.N))

fig, ax = plt.subplots(4, figsize=(10, 5),subplot_kw=dict(xticks=[], yticks=[]))
ax[0].imshow([gray], extent=[0, 10, 0, 1])
ax[1].imshow([red], extent=[0, 10, 0, 1])
ax[2].imshow([green], extent=[0, 10, 0, 1])
ax[3].imshow([blue], extent=[0, 10, 0, 1])


In [None]:
"""
Separar uma imagem RGB nos seus componentes
"""
def separate_rgb(img):
    r = img[:, :, 0]
    g = img[:, :, 1]
    b = img[:, :, 2]
    
    return r, g, b

In [None]:
r, g, b = separate_rgb(img)
show_image(r, cm_red)
show_image(g, cm_green)
show_image(b, cm_blue)

In [None]:
"""
Juntar as coponentes R, G e B para formar uma imagem
"""
def join_rgb(r, g, b):
    return np.dstack((r, g, b))

In [None]:
img = join_rgb(r, g, b)
show_image(img)

In [None]:
"""
Recebe uma imagem e altera as suas dimensões (m,n) para (16*p, 16*q).
Isto é realizado através da cópia da ultima coluna/linha até atingir o valor multiplo de 16.
Devolva as dimensoes (m,n) originais e a imagem com as novas dimensoes (16*p, 16*q)
"""
def padding(img : np.array):
    img = img.copy()
    shape = img.shape[:2]
    
    while img.shape[0]%16 != 0:
        img = np.concatenate((img, [img[-1]]), axis = 0)
    while img.shape[1]%16 != 0:
        
        img = np.concatenate((img, img[:,-1:]), axis = 1)
    return shape, img

In [None]:
"""
Recebe uma imagem e as dimensoes originais dela.
Enquanto as dimensoes da imagem forem diferentes das dimensoes de entrada, remove linhas/colunas 
até voltar ao tamanho original;
"""
def unpad(img : np.array, shape):
    img = img.copy()
    while img.shape[0] != shape[0]:
        img = img[:-1]
    while img.shape[1] != shape[1]:
        img = img[:,:-1]
    return img

In [None]:
#img = read_image("imagens/barn_mountains.bmp")

#TODO: FIX THIS SHIT!!!!!!! PADDING

show_image(img)
shape, pad_img = padding(img)
unpad_img = unpad(img, shape)
show_image(unpad_img)

print(f"Original shape: {img.shape}")
print(f"Padding shape: {pad_img.shape}")
print(f"After Padding and Unpadding shape: {unpad_img.shape}")

In [None]:
"""
Converte imagem no formato RGB para imagem no formato yCbCr;
"""
def rgb_to_ycbcr(img : np.array):
    img.copy()
    
    y_cb_cr_mat = np.array([ [0.299    , 0.587    , 0.114    ]
                            ,[-0.168736, -0.331264, 0.5      ]
                            ,[0.5      , -0.418688, -0.081312] ])
    
    y  = y_cb_cr_mat[0,0] * img[:,:,0] + y_cb_cr_mat[0,1] * img[:,:,1] + y_cb_cr_mat[0,2]*img[:,:,2]
    cb = y_cb_cr_mat[1,0] * img[:,:,0] + y_cb_cr_mat[1,1] * img[:,:,1] + y_cb_cr_mat[1,2]*img[:,:,2] + 128
    cr = y_cb_cr_mat[2,0] * img[:,:,0] + y_cb_cr_mat[2,1] * img[:,:,1] + y_cb_cr_mat[2,2]*img[:,:,2] + 128
    
    y_cb_cr = np.dstack((y, cb, cr))
    return y_cb_cr

In [None]:
"""
Converte imagem no formato yCbCr para imagem no formato RGB;
"""
def ycbcr_to_rgb(img : np.array):
    img = img.copy()
    
    y_cb_cr_mat_inv = np.linalg.inv(
                                np.array([ [0.299    , 0.587    , 0.114    ]
                                        ,  [-0.168736, -0.331264, 0.5      ]
                                        ,  [0.5      , -0.418688, -0.081312] ])
                                    )
    y = img[:,:,0]
    cb = img[:, :, 1] - 128
    cr = img[:, :, 2] - 128
    
    r = y + y_cb_cr_mat_inv[0,2]*cr
    g = y + y_cb_cr_mat_inv[1,1]*cb + y_cb_cr_mat_inv[1,2]*cr
    b = y + y_cb_cr_mat_inv[2,1]*cb
    
    rgb = np.dstack((r,g,b))
    np.round(rgb)
    rgb[rgb > 255] = 255
    rgb[rgb < 0] = 0
    
    return np.array(rgb, dtype = np.uint8)

In [None]:
#img = read_image("imagens/logo.bmp")

ycbcr = rgb_to_ycbcr(img)
rgb = ycbcr_to_rgb(ycbcr)

show_image(img)
show_image(rgb)

In [None]:
y, cb, cr = separate_rgb(ycbcr)

#cm_y = clr.LinearSegmentedColormap.from_list('y', [(0.299, 0.587, 0.114), (1, 1, 1)], N = 256)
#cm_cb = clr.LinearSegmentedColormap.from_list('cb', [(0.16, 0.33, 0.5), (1, 1, 0)], N = 256)
#cm_cr = clr.LinearSegmentedColormap.from_list('cr', [(0, 0.41, 0), (0.5, 1, 1)], N = 256)

show_image(y, cm_gray)
show_image(cb, cm_gray)
show_image(cr, cm_gray)