## Processamento Digital de Imagens - PDI - 2026.1

### Prof. Francisco Zampirolli

### Prof. Celso Kurashima

***

# Aula 01 - Prática

***

## Roteiro

0. Apresentação da disciplina
1. Fundamentos
2. Formação da imagem
3. Histórico
4. Aplicações
5. Elementos de um sistema de processamento de imagens digitais
6. <font color=blue>**Processamento de imagem utilizando Python**</font>
7. <font color=blue>**Exercícios**</font>


# 6 - Processamento de imagem utilizando Python



- Ambiente de programação: Google Colab ou Jupyter Notebook, com Python 3

- Bibliotecas
    - numpy (pip install numpy)
    - cv2 (pip install opencv-python)
    - etc.

- **Algumas Importações:**

In [None]:
# instalar bibliotecas
if 1:
    !pip install -U numpy
    !pip install opencv-python
    !pip install matplotlib
    !pip install scikit-image
    !pip install pillow

In [None]:
import numpy as np
import cv2
from google.colab.patches import cv2_imshow # for image display
from skimage import io
from PIL import Image
import matplotlib.pylab as plt

print("np:",np.__version__)
print("cv2:",cv2.__version__)
print("plt:",plt.__version__)

In [None]:
urls = ["https://iiif.lib.ncsu.edu/iiif/0052574/full/800,/0/default.jpg",
        "https://iiif.lib.ncsu.edu/iiif/0016007/full/800,/0/default.jpg"
        ]

for url in urls:
  image = io.imread(url)
  image_2 = cv2.cvtColor(image, cv2.COLOR_BGR2RGB)
  final_frame = cv2.hconcat((image, image_2))
  cv2_imshow(final_frame)
  print('\n')

In [None]:
# Check the image matrix data type (could know the bit depth of the image)
print(image.dtype)
print(image.shape)

## Pegar uma banda, recortar e fazer threashold (limiarização)

In [None]:
image_gray = image[:,:,2]
cv2_imshow(image_gray) # banda 0

In [None]:
# ou
image_gray = cv2.cvtColor(image, cv2.COLOR_BGR2GRAY)
cv2_imshow(image_gray)

In [None]:
image_gray.shape

In [None]:
img2 = image_gray[50:550,120:500]
_ = plt.imshow(img2, 'gray')

In [None]:
print (img2.shape)
h,w = img2.shape

limiar = 120
img3 = np.zeros_like(img2)
for i in range(h): # para cada linha
    for j in range(w): # para cada coluna
        if img2[i,j] > limiar:
            img3[i,j] = 255

plt.figure(figsize=(5,5))
_ = plt.imshow(img3, 'gray')

In [None]:
# ou simplesmente
plt.figure(figsize=(5,5))
img3 = img2>limiar
_ = plt.imshow(img3, 'gray')

In [None]:
print(img3.dtype)

In [None]:
img3

In [None]:
img4=img3.astype('int')  # typy int
print(img4.dtype)
img4

In [None]:
np.array(img3,dtype='uint8')

## Matrizes

- Para criar uma matriz:

In [None]:
a = [0,0]*10
print(a)
print(len(a))

In [None]:
b = [a]*10
print(np.array(b))

In [None]:
np.ones((10,10),dtype='uint8')*255

In [None]:
A = np.matrix('3 1; 6 4')
print(A)
print(type(A))

In [None]:
B = np.matrix('3 5; 0 2')
print(B)

In [None]:
print(A+10)

In [None]:
print(A+B)

In [None]:
print(A*B)
C = A*B

In [None]:
C.T # transposta de C

## Para ler/mostrar uma imagem pequena

Muito útil para _debugar_ algoritmos de Processamento de Imagens

#### Criar uma função

In [None]:
def imprimirImagem(m):
  l,c = m.shape
  digitos = '%' + str(len(str(np.max(m)))+1) + 'd '
  print('"'+digitos+'"')
  st = ''
  for i in range(l): # para cada linha
    for j in range(c): # para cada coluna
      st += digitos % m[i][j]
    st += '\n'
  return st

#### Criar uma matriz de números aleatórios entre 0 e 255:


In [None]:
H, W = 4, 6
K = 255 # tente com um valor maior. O que está ocorrendo?
matriz = (np.random.rand(H, W)*K).astype('uint8')
for lin in matriz:
  print(*lin)
print()
print(imprimirImagem(matriz))

#### Mostrar como uma imagem

In [None]:
plt.figure(figsize=(5,5))
_ = plt.imshow(matriz, 'gray')

In [None]:
# para mostrar inteiros no eixo vertical
plt.ylim([3.5, -.5])
locs, labels = plt.yticks()
yint = [int(v) for v in locs]
plt.yticks(yint)
_ = plt.imshow(matriz, 'gray')

### Elaborando funções

In [None]:
import matplotlib.pyplot as plt
import numpy as np
from PIL import Image
import cv2

In [None]:
def drawImage(f):
    """ Converts the input image f into a string representation suitable for printing.
    Args:
        f (ndarray): The input image.
    Returns:
        A string representing the input image.
    Example:
        string_representation = drawImage(f)
        print(string_representation) """
    l, c = f.shape
    if np.min(f) < 0:
        digits = '%' + str(1 + len(str(np.max(f)))) + 'd '
    else:
        digits = '%' + str(len(str(np.max(f)))) + 'd '
    #print('"'+digits+'"')
    string_representation = ''
    for i in range(l):
        for j in range(c):
            string_representation += digits % f[i][j]
        string_representation += '\n'
    return string_representation

In [None]:
def randomImage(h, w, maxValue=9):
    """ This function creates a random image of size h x w with integer in [0,maxValue].
    input: size of image: height, width and max value
    output: image
    Example:
      >>> randomImage(3, 3, maxValue=5)
      The function will return a random NumPy array, such as:
      array([[2, 1, 3],
             [0, 4, 2],
             [5, 1, 5]], dtype=uint8)"""
    return np.random.randint(maxValue + 1, size=(h, w)).astype('uint8')

In [None]:
matriz = randomImage(4,5,150)

In [None]:
print(drawImage(matriz))

In [None]:
import matplotlib.pyplot as plt; import numpy as np
from PIL import Image; from skimage import io

def drawImagePlt(f):
    """ Displays the input image f using Matplotlib.
    Args: f (ndarray): The input image.
    Example: drawImagePlt(f) """
    h, w = f.shape
    m = min(h, w)
    # Set up the plot.
    plt.figure(figsize=(m, m))
    plt.rcParams['xtick.bottom'] = plt.rcParams['xtick.labelbottom'] = False
    plt.rcParams['xtick.top'] = plt.rcParams['xtick.labeltop'] = True
    # Display the image.
    _ = plt.imshow(f, 'gray')
    # Set the tick marks and labels.
    plt.yticks(range(h))
    plt.xticks(range(w))
    plt.ylabel('y')
    plt.xlabel('x')
    # Add grid lines.
    [plt.axvline(i + .5, 0, h, color='r') for i in range(w - 1)]
    [plt.axhline(j + .5, 0, w, color='r') for j in range(h - 1)]

In [None]:
help(drawImagePlt)

In [None]:
drawImagePlt(matriz)
plt.savefig('imagePlt.png')

### Utilizando a biblioteca IPython.display

<center>
<img src="https://drive.google.com/uc?export=view&id=19_1Coz-RA-QqMjMql3mNIoZm6aPuxGap" width="550">
</center>


Para usar uma imagem em uma url do GDrive

In [None]:
!pip install -U --no-cache-dir gdown --pre
path0 = 'https://drive.google.com/file/d/19_1Coz-RA-QqMjMql3mNIoZm6aPuxGap/view?usp=sharing'
id = '19_1Coz-RA-QqMjMql3mNIoZm6aPuxGap'
path1 = 'https://drive.google.com/uc?export=view&id='+id
print(path0)
print(path1) # abra a célula de texto anterior e veja a url da imagem

# ou simplesmente
!gdown --id 19_1Coz-RA-QqMjMql3mNIoZm6aPuxGap

In [None]:
img = read('https://www.dropbox.com/s/ekjbzp14jt90bfq/00004.jpg?dl=1')

In [None]:
img.shape

In [None]:
def color(img):
    """ Converts an image to RGB color space.
    input: <numpy.ndarray> Image in BGR, grayscale, or RGBA format.
    output: RGB image in <numpy.ndarray> format.
    Example:
    >>> img = cv2.imread('image.png')
    >>> img_rgb = convert_to_rgb(img) """
    if len(img.shape) == 2:
        img = cv2.cvtColor(img, cv2.COLOR_GRAY2RGB)
    elif len(img.shape) == 3 and img.shape[2] == 4:
        img = cv2.cvtColor(img, cv2.COLOR_RGBA2RGB)
    elif len(img.shape) == 3 and img.shape[2] == 3:
        img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    else:
        raise ValueError("Unsupported image format.")
    return img

In [None]:
def gray(img):
    """ Converts a color image to grayscale.
    input: <numpy.ndarray> Input color image.
    output: grayscale image.
    Examples
    --------
    >>> img = cv2.imread('image.png')
    >>> img_gray = gray(img) """
    if len(img.shape) == 3 and img.shape[2] == 4:
        return cv2.cvtColor(img, cv2.COLOR_BGRA2GRAY)
    else:
        return cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)

In [None]:
def threshad(img, limiar=0):
    """ Thresholds an input image by a specified threshold value or using Otsu's method.
    input: <numpy.ndarray> Input image to be thresholded.
    output: <numpy.ndarray> Thresholded image.
    Examples
    --------
    >>> img = read('image.png')
    >>> th = threshad(img)
    """
    if limiar == 0:
        value, th = cv2.threshold(img, 0, 255, cv2.THRESH_BINARY + cv2.THRESH_OTSU)
    else:
        value, th = cv2.threshold(img, limiar, 255, cv2.THRESH_BINARY)
    return th

In [None]:
th = cv2.threshold(gray(img))
type(th)

In [None]:
img = read('id=19_1Coz-RA-QqMjMql3mNIoZm6aPuxGap')
th = cv2.threshold(gray(img),180)
show(color(img),th,ero(th))

In [None]:
def readImg(h, w):
    """ This function reads an image from standard input and returns it as a NumPy array.
    input: size of image: height and width
    output: image
    Example:
      >>> readImg(3, 4)
      0 1 0 0
      1 1 1 1
      0 1 0 0 """
    m = np.zeros((h, w), dtype='uint8')
    # Loop over each row of the image and read it from standard input.
    for l in range(h):
        # Split the row into individual pixel values and convert them to integers.
        m[l] = [int(i) for i in input().split() if i]
    return m

In [None]:
def readImg2():
    """ This function reads an image of varying size from standard input.
    Example:
      >>> readImg2()
      255   0  255
      128  64  192
      0   192  128 """
    b = []
    read_row = input()
    while read_row:  # Read each line of the input until there is no more input.
      # Split the line into individual pixel values and convert them to integers.
      row = [int(i) for i in read_row.split() if i]
      b.append(row) # Add the row to the list of rows.
      read_row = input()
    return np.array(b).astype('uint8')

In [None]:
def readImg2():
    """This function will read image f of random size
    output:
      - img: image
    """
    b = []
    ler_linha = input()
    while ler_linha:
      b.append([int(i) for i in ler_linha.split(' ') if i])
      ler_linha = input()
    b = np.array(b).astype('uint8')
    return b

In [None]:
def randomImage(h, w, maxValue=9):
    """ This function creates a random image of size h x w with integer in [0,maxValue].
    input: size of image: height, width and max value
    output: image
    Example:
      >>> randomImage(3, 3, maxValue=5)
      The function will return a random NumPy array, such as:
      array([[2, 1, 3],
             [0, 4, 2],
             [5, 1, 5]], dtype=uint8)"""
    return np.random.randint(maxValue + 1, size=(h, w)).astype('uint8')

In [None]:
randomImage(9,9,9)

In [None]:
!wget https://drive.google.com/uc?id=19_1Coz-RA-QqMjMql3mNIoZm6aPuxGap -O lixo.png

In [None]:
# para fazer upload utilizando Botão
from google.colab import files
#files.upload()

In [None]:
# para mostrar imagem usando recursos do colab
from IPython.display import Image
#pathImgs = '../imgs/' # local utilizando Jupyter Notebook
pathImgs = './' # colab
img0 = Image(pathImgs+'aula01fig03a.png')
img0

### Muito importante padronizar uma função de leitura

Sugestão: utilizar a do OpenCV

In [None]:
type(img0)

In [None]:
img0

### Utilizando a biblioteca cv2

In [None]:
img1 = cv2.imread(pathImgs+"aula01fig03a.png")

In [None]:
import os
os.mkdir('imgs')

In [None]:
type(img1)

In [None]:
img1.shape

In [None]:
plt.figure(figsize=(5,5)) # define tamanho da exibição da imagem
_ = plt.imshow(img1)

In [None]:
img1

### Utilizando a biblioteca matplotlib

In [None]:
img2 = plt.imread(pathImgs+"aula01fig03a.png")

In [None]:
type(img2)

In [None]:
img2.shape

In [None]:
plt.figure(figsize=(5,5))
_ = plt.imshow(img2)

In [None]:
img2

## Descompactar um zip com imagens

In [None]:
!wget --no-check-certificate http://www.imageprocessingplace.com/downloads_V3/dip3e_downloads/dip3e_book_images/DIP3E_CH02_Original_Images.zip -O DIP3E_CH02_Original_Images.zip
import zipfile
from PIL import Image
from matplotlib import pyplot as plt

local_zip = './DIP3E_CH02_Original_Images.zip' # 8.22 MB
zip_ref = zipfile.ZipFile(local_zip, 'r')
zip_ref.extractall('imgs')
zip_ref.close()
path = './imgs/DIP3E_Original_Images_CH02/'

In [None]:
img2 = plt.imread(path+'Fig0220(a)(chronometer 3692x2812  2pt25 inch 1250 dpi).tif')
plt.figure(figsize=(10,10))
_ = plt.imshow(img2, 'gray')

# 7 - Exercícios

## Exercício 1
Desenvolva um algoritmo (python) que permita:
- Ler 3 imagens, de sua escolha, do site (pode ser também de outros sites): http://www.imageprocessingplace.com/root_files_V3/image_databases.htm, uma em níveis de cinza, outra colorida, e uma de sua escolha;
- Mostrar as imagens recebidas;
- Determinar o valor médio dos níveis de brilho da imagem em níveis de cinza e o valor médio de cada faixa red, green e blue da imagem colorida;
- Extrair uma região de 70×100 pixels da imagem colorida e salvar em um arquivo no formato "*.tif";
- Mostrar a imagem "*.tif";
- Imprimir as informações da imagem "*.tif".

In [None]:
# implemente a sua solução

In [None]:
img1 = cv2.imread("aula01fig03b.png")
#print(img1.shape)

## Exercício 2

Desenvolva um algoritmo (python) que permita:
- Ler 2 imagens, de sua escolha, em escala de cinza e 8-bits de quantização, do site (pode ser também de outros sites): http://www.imageprocessingplace.com/root_files_V3/image_databases.htm;
- Mostrar as imagens recebidas;
- Imprimir as informações das imagens;
- Modificar a quantização das imagens para 1-bit;
- Mostrar as imagens resultantes.

In [None]:
# implemente a sua solução

# Nesse roteiro analisamos:
- O que é uma imagem digital?
- O que é PDI?
- História do PDI.
- Exemplos de PDI.
- Etapas no PDI.
- Alguns comandos para manipular imagem no python.

<hr>