In [51]:
# Import das bibliotecas
import cv2
import numpy as np
from matplotlib import pyplot as plt

In [52]:
# Funções
def imgShow(img, nome):
    # Mostra a imagem
    cv2.imshow(nome, img)
    # Espera que uma tecla seja pressionada
    cv2.waitKey(0)
    # Limpa a instância do opencv
    img.release()
    # Fecha a janela
    cv2.destroyAllWindows()

def mostraInfos(img):
    # Mostra imagem
    print("Matriz da imagem:")
    print (img)
    # Mostra as informações da imagem
    print("Informações da imagem:")
    print (img.shape)
    # Mostra o tipo da imagem
    print("Tipo da imagem:")
    print (type(img))

def threshold_binary(img, min, max):
    gray = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
    ret, thresh = cv2.threshold(gray, min, max, cv2.THRESH_BINARY)
    return thresh

# def capShow(cap):

    

## 1. Leitura de imagens

In [None]:
# Começa com a leitura da imagem
img = cv2.imread('./media/memes.jfif')
# # A imagem é composta por 3 matrizes, uma camada azul, uma verde e outra vermelha, para RGB
print (img)
# # Imprime uma tupla com a altura, largura e quantidade de camadas da imagem
# # 597 pixels de altura, 599 pixels de largura e 3 camadas de imagem
print (img.shape)
print (type(img))
# # Script comumente usando para visualizar a imagem
# # Método que mostra a imagem
cv2.imshow('image', img)
# # Key para quando pressionada feche a imagem
cv2.waitKey(0)
# # Método para fechar a imagem quando a tecla for pressionada
cv2.destroyAllWindows()

In [None]:
# Adicionando uma flag de leitura em preto e branco
img2 = cv2.imread('./media/memes.jfif', cv2.IMREAD_GRAYSCALE)

mostraInfos(img2)
imgShow(img2, 'imagem')

# Salvar a imagem no disco, é possível ler em um formato e salvar em outro
cv2.imwrite('output.jpg', img2)

## 2. Personalizando a imagem

In [4]:
# Desenhar nas imagens:
img3 = cv2.imread('./media/memes.jfif')
# Desenhar uma linha
# Passa primeiro a imagem, em seguida a coordenada de inicio, coordenada final, cor, espessura da linha
# O plano cartesionado funciona normal para o eixo x e o crescente do y é para baixo:
cv2.line(img3, (0,0), (100,100), (255,255,255), 15)
# imgShow(img3)

# Desenhar shapes
# Desenhar um retângulo, mesmos args da linha
img4 = cv2.imread('./media/memes.jfif')
cv2.rectangle(img4, (0,0), (100,100), (180,40,30), 15)
# imgShow(img4)

# Desenhar pontos
img5 = cv2.imread('./media/memes.jfif')
pts = np.array([[10,5], [20,30], [100,140]], np.int32)
# Recebe uma imagem, um array com os pontos, para fechar o ultimo ponto com os primeiros, chamamos True, recebe cor e a borda
# cv2.polyLines(img5, [pts], True, (0,255,0), 15)
# imgShow(img5)

# Desenhar circulo
img6 = cv2.imread('./media/memes.jfif')
# cv2.circle(img6, (0,0), (100,100), (180,40,30), 15)
# imgShow(img6)

## 3. Leitura de vídeo

In [7]:
# Para armazenar o vídeo em uma variável
cap = cv2.VideoCapture('./media/video.mp4')
# Para ler a webcam chama-se o index
cap2 = cv2.VideoCapture(0)
# Para ler a captura
while(True):
    ok, frame = cap.read()
    # Se a imagem não tiver sido lida, o programa vai parar
    if not ok:
        break
    cv2.imshow('frame', frame)
    # Aqui ele espera por um evento do teclado, e responde em 100 ms, o ord('q') faz com que quando o q seja pressionado o programa pare
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
# Limpa o vídeo da memória
cap.release()
cv2.destroyAllWindows()

## 4. Lendo a WebCam

In [None]:
n = 0
# Lendo a webcam
while(True):
    ok2, frame2 = cap2.read()
    # Se a imagem não tiver sido lida, o programa vai parar
    if not ok2:
        break
    # Imprime um texto na imagem em todos os frames da imagem
    cv2.putText(frame2, 
               'Hello world', 
               (100, 50), 
               cv2.FONT_ITALIC, 
               1, 
               (15,30,40), 
               cv2.LINE_4)
    n = n + 1
    # Imprimir a quantidade de frames, atualizando a string de frame-a-frame
    cv2.putText(frame2, 
               str(n), 
               (150, 50), 
               cv2.FONT_ITALIC, 
               1, 
               (150,40,150), 
               cv2.LINE_4)
    # A leitura das cores é (B,G,R)
    cv2.imshow('frame', frame2)
    # Aqui ele espera por um evento do teclado, e responde em 100 ms, o ord('q') faz com que quando o q seja pressionado o programa pare
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap2.release()
cv2.destroyAllWindows()

## 5. Gravando e armazenando vídeo

In [None]:
# Essa condição é importante para processar um vídeo que roda por um algoritmo e não seja real time
cap = cv2.VideoCapture(0)
# Cria um codec de processamento, simples mas eficaz no windows
codec = cv2.VideoWriter_fourcc(*'XVID') # type: ignore
# Salva o vídeo, nome, codec, taxa de processamento, tamanho
writer = cv2.VideoWriter('out.avi', codec, 20, (640,480))
while(True):
    ok, frame = cap.read()
    if not ok:
        break
    # Escreve o video no frame
    # Basicamente o que ele tá fazendo aqui é gerando um vídeo e salvando ele em uma matriz
    writer.write(frame)
    cv2.imshow('frame', frame)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
cap.release()
writer.release()
cv2.destroyAllWindows()

## 6. Recorte

In [None]:
matrix = np.array([
    [1,2,3,4,5,6,7,8,9],
    [10,20,30,40,50,60,70,80,90],
    [100,200,300,400,500,600,700,800,900],
    [1000,2000,3000,4000,5000,6000,7000,8000,9000]
])
# Vai retornar as linas de 0 a 2 sem entrar a 2 e o indice 4
croped = matrix[0:2,4]
print(croped)
img = cv2.imread('./memes.jfif')
cv2.imshow('image', img)
cv2.waitKey(0)
# Eixo Y, Eixo X
croped2 = img[100:400, 50:400]
cv2.imshow('image', croped2)
cv2.waitKey(0)
# E se eu quisesse começar em um ponto e ele fizesse a leitura de 500px a partir daquele ponto
y = 100
h = 500 # Altura
x = 50
w = 400 # Largura
# Supondo que os pontos iniciais foram pegues através de uma feature
croped3 = img[y:y+h, x:x+w]
cv2.imshow('image', croped3)
cv2.waitKey(0)
cv2.destroyAllWindows()

## 7. Operações matemáticas

In [None]:
def show(img):
    plt.imshow(img)
    plt.show()

In [None]:
img = cv2.imread('./media/memes.jfif')
show(img)
# Percebe-se que as tonalidades da imagem são diferentes
# O openCV lê em BGR, enquanto o matplot lê em RGB
img2 = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
show(img2)

In [None]:
# Mostra as cores em determinado pixel
img[55,55]

In [None]:
# Substitui as cores de um pixel por outras cores
img2[55,55] = np.array([0,0,0])
show(img2)

In [None]:
# Substitui em um intervalo
img2[100:300, 100:200] = [255, 255, 255]
show(img2)

In [None]:
# Soma duas imagens
res = img * img2
show(res)
# Subtrai duas imagens
res2 = img2 - img
show(res2)
# Soma duas imagens
res = cv2.add(img, img2)
show(res)

## 8. Thresholding

In [None]:
import cv2
import matplotlib.pyplot as plt

# Threshold (limiarização) é uma técnica de processamento de imagens que consiste em separar pixels de uma imagem em duas categorias distintas, normalmente preto e branco, a partir de um valor limiar. Esse valor é escolhido com base em características da imagem que se deseja destacar ou ignorar.

# Importa imagem
res = cv2.imread('./media/memes.jfif')

# Converte de BGR para gray
gray = cv2.cvtColor(res, cv2.COLOR_BGR2GRAY)

# Converte a imagem para gray a partir da leitura dela
gray2 = cv2.imread('./media/memes.jfif' , cv2.IMREAD_GRAYSCALE)

min = 127
max = 255

# Aplicando o Thresholding
#ret, thresh1 = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
# pixel, variável = cv2.threshold(imagem_cinza, menor valor de cor, maior valor de cor, tipo de threshold)
ret, thresh1 = cv2.threshold(gray, min, max, cv2.THRESH_BINARY)
ret, thresh2 = cv2.threshold(gray, min, max, cv2.THRESH_BINARY_INV)
ret, thresh3 = cv2.threshold(gray, min, max, cv2.THRESH_TRUNC)
ret, thresh4 = cv2.threshold(gray, min, max, cv2.THRESH_TOZERO)
ret, thresh5 = cv2.threshold(gray, min, max, cv2.THRESH_TOZERO_INV)

# Convertendo BGR para RBG para que o matplot imprima
res2 = cv2.cvtColor(res, cv2.COLOR_BGR2RGB)

titles = ['Normal BGR', 'Normal RGB', 'Cinza', 'Binary', 'Binary Inv', 'Trunc', 'To Zero', 'To Zero Inv']
imgs = [res, res2, gray, thresh1, thresh2, thresh3, thresh4, thresh5]


for i in range(len(imgs)):
    plt.subplot(2,4,i+1)
    plt.imshow(imgs[i], 'gray', vmin = 0, vmax = 255)
    plt.title(titles[i])
    plt.xticks([]),plt.yticks([])

plt.show()

# cv2.imshow('normal', imgs[0])
# cv2.imshow('imagem', gray)
# cv2.waitKey(0)
# cv2.destroyAllWindows()

thresh_types_bgr = cv2.imread('./media/thresholding_types.png')
thresh_types = cv2.cvtColor(thresh_types_bgr, cv2.COLOR_BGR2RGB)
plt.subplot(1,1,1)
plt.imshow(thresh_types, 'gray')
plt.title('Tipos de thresholding')
plt.xticks([]),plt.yticks([])
plt.show()

### 8.1. Filtros

In [None]:
import cv2
import matplotlib.pyplot as plt

min = 127
max = 255

def threshold_binary(gray, min, max):
    ret, thresh = cv2.threshold(gray, min, max, cv2.THRESH_BINARY)
    return thresh

img = cv2.imread('./media/memes.jfif', cv2.IMREAD_GRAYSCALE)
thresh = threshold_binary(img, min, max)

# Incrementa um borrão na imagem, 5, 7, 9, ..., n
img2 = cv2.medianBlur(img, 9)


# Os filtros são utilizados para realçar ou suavizar caracteristícas de uma imagem. 

# Filtro Gaussiano: reduz ruídos, suaviza a imagem e retira detalhes desnecessários.
blur = cv2.GaussianBlur(thresh, (5,5), 0)
# Parâmetros:
# void cv::GaussianBlur	(	InputArray 	src,
#                             OutputArray dst,
#                                  Size ksize,
#                                 double sigmaX,
#                                 double sigmaY = 0,
#                                 int borderType = BORDER_DEFAULT,
#                                 AlgorithmHint hint = cv::ALGO_HINT_DEFAULT 
# )

# blur = cv2.GaussianBlur(thresh, )

titles = ['Cinza', 'Thresholding', 'MedianBlur', 'GaussianBlur']
resultados = [img, thresh, img2, blur]

for i in range(len(resultados)):
    plt.subplot(1,4,i+1)
    plt.imshow(resultados[i], cmap='gray')
    plt.title(titles[i])
    plt.xticks([]),plt.yticks([])

plt.show()


# for i in range(len(resultados)):
#     cv2.imshow(titles[i], resultados[i])


# Filtro Laplaciano: Realça as bordas da imagem
laplacian = cv2.Laplacian(blur, cv2.CV_64F)
# Deve receber a imagem suavizada e um filtro, o utilizado foi padrão 3x3

# cv2.imshow('Threshold', thresh)
cv2.imshow('Filtro Gaussiano', blur)
cv2.imshow('Laplacian', laplacian)
cv2.waitKey(0)
cv2.destroyAllWindows()


### 8.2. Adaptive Thresholding

In [None]:
import cv2
import matplotlib.pyplot as plt

# Em casos onde há mais de uma fonte de iluminação pode não ser apropriado colocar um valor global para o Thresholding ([[ret]], thresh = ...), ao invés disso se torna interessante colocar um limiar adaptativo. Onde o algoritmo determina o limite de um pixel com base em uma pequena região ao seu redor. Portanto, obtemos limites diferentes para diferentes regiões da mesma imagem, o que fornece melhores resultados para imagens com iluminação variável.

min = 127
max = 255
blocksize = 11
c = 2

img = cv2.imread('./media/memes.jfif', cv2.IMREAD_GRAYSCALE)

# Threshold binario
ret, th1 = cv2.threshold(img, min, max, cv2.THRESH_BINARY)
# Threshold adaptativo
th2 = cv2.adaptiveThreshold(img, max, cv2.ADAPTIVE_THRESH_MEAN_C, cv2.THRESH_BINARY, blocksize, c)
th3 = cv2.adaptiveThreshold(img, max, cv2.ADAPTIVE_THRESH_GAUSSIAN_C, cv2.THRESH_BINARY, blocksize, c)
# blockSize: Size of a pixel neighborhood that is used to calculate a threshold value for the pixel: 3, 5, 7, and so on.
# C: Constant subtracted from the mean or weighted mean (see the details below). Normally, it is positive but may be zero or negative as well.

titles = ['Cinza', 'Threshold', 'AdaptiveMeanC', 'AdaptiveGaussianC']
images = [img, th1, th2, th3]

for i in range(len(images)):
    plt.subplot(2,2,i+1)
    plt.imshow(images[i], cmap='gray')
    plt.title(titles[i])
    plt.xticks([])
    plt.yticks([])

plt.show()

# cv2.imshow('Imagem', img)
# cv2.waitKey(0)
# cv2.destroyAllWindows()
    

## 9. Transformações

Diminuir a imagem:

In [None]:
import cv2

escalaX = 0.5
escalaY = 0.5

img = cv2.imread('./media/transform.jpeg')
# fx e fy são escalas em porcentagem do tamanho real
res = cv2.resize(img, None, fx=escalaX, fy=escalaY, interpolation= cv2.INTER_AREA)
# INTER_AREA = Escolher
# INTER_CUBIC = ampliar (lento)
# INTER_LINEAR = ampliar (rápido)

cv2.imshow('original', img)
cv2.imshow('resized', res)

cv2.waitKey(0)
cv2.destroyAllWindows()

In [None]:
# Desenha em pontos
import cv2
import numpy as np

img = cv2.imread('./media/transform.jpeg')
pts = np.array([[200,5], [20,30], [100,140], [300, 100]], np.int32)
cv2.polylines(img, [pts], True, (0,255,0))

cv2.imshow('Pontos', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

In [None]:
# Armazena coordenadas de pontos definidos pelo usuario

import cv2

img = cv2.imread('./media/transform.jpeg')

points = []
def draw_circle(event, x, y, flags, param):
    if event == cv2.EVENT_LBUTTONDOWN:
        if len(points) < 4:
            points.append([x, y])
            cv2.circle(img, (x,y), 5, (255, 0, 0))

cv2.namedWindow('Pontos')
cv2.setMouseCallback('Pontos', draw_circle)

while True:
    cv2.imshow('Pontos', img)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        cv2.destroyAllWindows()
        break

print(points)

Transformação de perspectiva:

In [None]:
import cv2
import numpy as np

escalaX = 0.5
escalaY = 0.5

# Ajusta a escala
img = cv2.imread('./media/transform.jpeg')
img = cv2.resize(img, None, None, fx=escalaX, fy=escalaY, interpolation= cv2.INTER_LINEAR)
print(img.shape)

# Recolhe os pontos
points = []
def draw_circle(event, x, y, flags, param):
    if event == cv2.EVENT_LBUTTONDOWN:
        if len(points) < 4:
            points.append([x, y])
            cv2.circle(img, (x,y), 5, (255,0,0), -1)

cv2.namedWindow('Pontos')
cv2.setMouseCallback('Pontos', draw_circle)

while (1):
    cv2.imshow('Pontos', img)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        cv2.destroyAllWindows()
        break

print(points)

# Ele relaciona os pontos, joga o primeiro ponto para o primeiro ponto do outro vetor
points = np.float32(points)
pts2 = np.float32([[0,0], [450,0], [0,800], [450,800]])

M = cv2.getPerspectiveTransform(points, pts2)
dst = cv2.warpPerspective(img, M, (450,800))

cv2.imshow('Input', img)
cv2.imshow('Output', dst)

cv2.waitKey(0)
cv2.destroyAllWindows()


## 10. Object Tracking

1. Take each frame of the video
2. Convert from BGR to HSV color-space
3. We threshold the HSV image for a range of blue color
4. Now extract the blue object alone, we can do whatever we want on that image.

In [None]:
import cv2
import numpy as np

# Defina a cor em formato BGR (Blue, Green, Red)
color = np.uint8([[[0, 255, 0]]]) # A matriz agora é 1x1x3

# Converta a cor de BGR para HSV
hsv_color = cv2.cvtColor(color, cv2.COLOR_BGR2HSV)

# Imprima o resultado
print(hsv_color)

In [None]:
import cv2
import numpy as np

capture = cv2.VideoCapture(0)

while True:

    # 1. Leitura do vídeo
    _, frame = capture.read()

    # 2. Converte de BGR para HSV
    hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)

    # Define a escala das cores do Threshold em escala HSV
    # A ideia é que todas as cores abaixo do intervalo ou acima não estarão sendo indentificadas
    lower_blue = np.array([106,5,102])
    upper_blue = np.array([147,255,255])

    # 3. Threshold the HSV image to get only blue colors
    mask = cv2.inRange(hsv, lower_blue, upper_blue)

    # Bitwise-AND mask and original image
    res = cv2.bitwise_and(frame,frame, mask= mask)

    
    cv2.imshow('frame',frame)
    cv2.imshow('mask',mask)
    cv2.imshow('res',res)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break
 
capture.release()
cv2.destroyAllWindows()

## 11. Erosão

A ideia básica de erosão é apenas como a erosão do solo, ela corrói os limites do objeto em primeiro plano (sempre tente manter o primeiro plano em branco). Então, o que ele faz? O kernel desliza pela imagem (como na convolução 2D). Um pixel na imagem original (1 ou 0) será considerado 1 somente se todos os pixels sob o kernel forem 1, caso contrário, ele será erodido (feito a zero).

Então, o que acontece é que todos os pixels próximos ao limite serão descartados dependendo do tamanho do kernel. Portanto, a espessura ou o tamanho do objeto em primeiro plano diminui ou simplesmente a região branca diminui na imagem

In [None]:
import cv2
import numpy as np

img = cv2.imread('./media/erosion.png', cv2.IMREAD_GRAYSCALE)
ret, thresh = cv2.threshold(img, 127, 255, cv2.THRESH_BINARY)

# Criação do Kernel
kernel = np.ones((5,5), np.uint8)
erosion = cv2.erode(thresh, kernel, iterations=1)

cv2.imshow('erosion', erosion)
cv2.imshow('imagem', img)
cv2.waitKey(0)
cv2.destroyAllWindows()


In [None]:
import cv2
import numpy as np

cap = cv2.VideoCapture(0)
kernel = np.ones((5,5), np.uint8)

while True:
    _, frame = cap.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    ret, thresh = cv2.threshold(gray, 127, 255, cv2.THRESH_BINARY)
    erosion = cv2.erode(thresh, kernel, iterations=1)

    cv2.imshow('Erosion', erosion)
    cv2.imshow('Thresh', thresh)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cv2.destroyAllWindows()
cap.release()


## 12. Canny Edge

A detecção de bordas de Canny (Canny Edge Detection) é um dos algoritmos mais populares e amplamente utilizados na visão computacional para a detecção de bordas em imagens. Desenvolvido por John F. Canny em 1986, o objetivo principal desse algoritmo é identificar bordas significativas em uma imagem, ou seja, regiões onde há uma variação abrupta na intensidade de pixels, o que normalmente corresponde aos contornos de objetos.

In [None]:
import cv2
import numpy as np

img = cv2.imread('./media/memes.jfif', cv2.IMREAD_GRAYSCALE)

edges = cv2.Canny(img,130,200)

cv2.imshow('Canny', edges)
cv2.imshow('Normal', img)

cv2.waitKey(0)
cv2.destroyAllWindows()

In [None]:
import cv2
import numpy as np

cap = cv2.VideoCapture(0)

while True:
    ret, frame = cap.read()
    edges = cv2.Canny(frame,130,200)

    cv2.imshow('Canny', edges)
    cv2.imshow('Normal', frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cv2.destroyAllWindows()
cap.release()

In [None]:
import utils

cap = cv2.VideoCapture(0)
kernel = np.ones((5,5), np.uint8)

while True:
    _, frame = cap.read()
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    blur = cv2.GaussianBlur(gray, (5,5), 1) # Tratamento de ruidos
    #r, thresh = cv2.threshold(blur, 127, 255, cv2.THRESH_BINARY) # Binarizou 
    erosion = cv2.erode(blur, kernel, iterations=1) # Tratamento dos ruidos brancos
    edges = cv2.Canny(erosion,130,200) # Bordas e ruídos

    # cv2.imshow('Thresh', thresh)
    cv2.imshow('Canny', edges)
    cv2.imshow('Erosion', erosion)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cv2.destroyAllWindows()
cap.release()


## 13. Contornos

### Getting Start

Contours can be explained simply as a curve joining all the continuous points (along the boundary), having same color or intensity. The contours are a useful tool for shape analysis and object detection and recognition.

- For better accuracy, use binary images. So before finding contours, apply threshold or canny edge detection.
- Since OpenCV 3.2, findContours() no longer modifies the source image.
- In OpenCV, finding contours is like finding white object from black background. So remember, object to be found should be white and background should be black.

In [None]:
import utils
import cv2

img = cv2.imread('./media/memes.jfif')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
ret, thresh = cv2.threshold(gray, 127, 255, 0, cv2.THRESH_BINARY)
contours, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
contours2, hierarchy = cv2.findContours(thresh, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

mostrar = cv2.drawContours(img, contours, -1, (0,255,0), 3)
mostrar2 = cv2.drawContours(img, contours2, -1, (0,255,0), 3)

# cv2.imshow('Contornos', thresh)
cv2.imshow('Mostrar', mostrar)
cv2.imshow('Mostrar2', mostrar2)
cv2.waitKey(0)
cv2.destroyAllWindows()

#gray = cv2.cvtColor

In [None]:
import utils

cap = cv2.VideoCapture(0)

while True:
    _, frame = cap.read()
    cap_ = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    _, thresh = cv2.threshold(cap_, 127, 255, 0)
    contours1, hierarchy = cv2.findContours(thresh, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)

    mostrar1 = cv2.drawContours(frame, contours1, -1, (0,255,0), -2)

    cv2.imshow('Gray', cap_)
    cv2.imshow('Gray', thresh)
    cv2.imshow('Mostrar1', mostrar1)


    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

## 14. HughLines

### 14.1 Exemplos

In [None]:
import cv2
import numpy as np

# Captura de vídeo
cap = cv2.VideoCapture(0)

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # Converter para escala de cinza
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # Detectar bordas usando Canny
    edges = cv2.Canny(gray, 50, 150, apertureSize=3)

    # Detectar linhas usando Hough Transform Probabilística
    lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=30, minLineLength=10, maxLineGap=40)

    # Desenhar as linhas detectadas na imagem
    if lines is not None:
        for x1, y1, x2, y2 in lines[:, 0]:
            cv2.line(frame, (x1, y1), (x2, y2), (0, 0, 255), 2)

    # Exibir o quadro resultante
    cv2.imshow('Linhas detectadas', frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberar a captura e fechar janelas
cap.release()
cv2.destroyAllWindows()


In [None]:
import cv2
import numpy as np

# Captura de vídeo
cap = cv2.VideoCapture(0)

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # Converter para escala de cinza
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)

    # Detectar bordas usando Canny
    edges = cv2.Canny(gray, 50, 150, apertureSize=3)

    # Detectar linhas usando Hough Transform (Método Padrão)
    lines = cv2.HoughLines(edges, 1, np.pi / 180, 100)

    # Desenhar as linhas detectadas na imagem
    if lines is not None:
        for rho, theta in lines[:, 0]:
            a = np.cos(theta)
            b = np.sin(theta)
            x0 = a * rho
            y0 = b * rho
            x1 = int(x0 + 1000 * (-b))
            y1 = int(y0 + 1000 * (a))
            x2 = int(x0 - 1000 * (-b))
            y2 = int(y0 - 1000 * (a))
            cv2.line(frame, (x1, y1), (x2, y2), (0, 0, 255), 2)

    # Exibir o quadro resultante
    cv2.imshow('Linhas detectadas', frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberar a captura e fechar janelas
cap.release()
cv2.destroyAllWindows()


In [None]:
import cv2
import numpy as np

def find_paper_contour(frame):
    """ Detecta a folha de papel e retorna o contorno e a máscara. """
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    blurred = cv2.GaussianBlur(gray, (5, 5), 0)
    edges = cv2.Canny(blurred, 50, 150)

    # Encontrar contornos
    contours, _ = cv2.findContours(edges, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

    # Assumir que o maior contorno é a folha de papel
    if contours:
        largest_contour = max(contours, key=cv2.contourArea)
        mask = np.zeros_like(gray)
        cv2.drawContours(mask, [largest_contour], -1, 255, thickness=cv2.FILLED)
        return largest_contour, mask
    return None, None

# Captura de vídeo
cap = cv2.VideoCapture(0)  # 0 para câmera padrão, ou caminho para um vídeo

while cap.isOpened():
    ret, frame = cap.read()
    if not ret:
        break

    # Encontrar o contorno da folha e a máscara
    contour, mask = find_paper_contour(frame)

    if mask is not None:
        # Detecção de bordas
        gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
        edges = cv2.Canny(gray, 50, 150)

        # Detectar linhas usando Hough Transform
        lines = cv2.HoughLinesP(edges, 1, np.pi / 180, threshold=50, minLineLength=50, maxLineGap=10)

        if lines is not None:
            for x1, y1, x2, y2 in lines[:, 0]:
                # Verificar se ambos os pontos da linha estão dentro da máscara
                if mask[y1, x1] and mask[y2, x2]:
                    cv2.line(frame, (x1, y1), (x2, y2), (0, 0, 255), 2)

        # Desenhar o contorno da folha
        if contour is not None:
            cv2.drawContours(frame, [contour], -1, (0, 255, 0), 2)

    # Exibir o quadro resultante
    cv2.imshow('Linhas detectadas', frame)

    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

# Liberar a captura e fechar janelas
cap.release()
cv2.destroyAllWindows()

### 14.2 Real

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('./media/memes.jfif')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Sem o median blur
minThresh = 127
maxThresh = 255
_, thresh = cv2.threshold(gray, minThresh, maxThresh, cv2.THRESH_BINARY)

# Erosões
qntErosions = 3
iterations = [3,30,300]
kernelSize = (1,1)

# Canny
threshMin = 100
threshMax = 200

# Plot imagens
linhas = 2
col = 3

img_erosion = []
img_edges = []

kernel = np.ones(kernelSize, np.uint8)
for i in range(qntErosions):
    erosion = cv2.erode(thresh, kernel, iterations= iterations[i])
    img_erosion.append(erosion)
    edge = cv2.Canny(erosion, threshMin, threshMax)
    img_edges.append(edge)

j = 0
for i in range(linhas*col):
    plt.subplot(linhas, col, i+1)
    if i + 1 <= 3:
        plt.imshow(img_erosion[i], cmap='gray')
        plt.title(f'Interações: {iterations[i]}')
    if i + 1 > 3:
        plt.imshow(img_edges[j], cmap='gray')
        plt.title(f'Interações: {iterations[j]}')
        j += 1

# Bordas da imagem
edges = cv2.Canny(img,130,200)


plt.tight_layout()
plt.show()

# cv2.imshow('teste', img_edges[0])
# cv2.waitKey(0)
# cv2.destroyAllWindows()

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('./media/br.jpg')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Threshold
minThresh = 150
maxThresh = 255
_, thresh = cv2.threshold(gray, minThresh, maxThresh, cv2.THRESH_BINARY)

# Kernel
kernelSize = (1,1)
kernel = np.ones(kernelSize, np.uint8)

# Erosion
iterations = 1
erosion = cv2.erode(thresh, kernel, iterations= iterations)

# Canny
threshMin = 100
threshMax = 200
aperture = 3
edge = cv2.Canny(erosion, threshMin, threshMax, apertureSize= aperture)

# Houghlines
rho_ = 1
thresh_ = 100
minLenght = 20
maxGap = 5
lines = cv2.HoughLinesP(edge,rho_,np.pi/180, thresh_,minLineLength=minLenght,maxLineGap=maxGap)

if lines is not None:
    for line in lines:
        x1, y1, x2, y2 = line[0]
        cv2.line(img, (x1, y1), (x2, y2), (0, 255, 0), 2)
else:
    print("Nenhuma linha foi detectada.")

mostrar = [thresh, erosion, edge, img]
titles = ['thresh', 'erosion', 'edge', 'img']
linhas = 2
colunas = 2

plt.figure(figsize=(10, 10))
for i in range(len(mostrar)):
    if i+1 >= 1:
        plt.subplot(linhas, colunas, i+1)
        plt.imshow(mostrar[i], cmap='gray')
        plt.title(titles[i])
        plt.axis('off')
plt.show()

In [None]:
cv2.imshow('Gray', gray)
cv2.imshow('Thresh', thresh)
cv2.imshow('Erosion', erosion)
cv2.imshow('Edge', edge)
cv2.imshow('Final', img)
cv2.waitKey(0)
cv2.destroyAllWindows()

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

img = cv2.imread('./media/linhas/1.png')
img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)
equalization_gray = cv2.equalizeHist(gray)

# print(img.shape)
# mask = np.zeros(img.shape[:2], np.uint8)
# mask[480:960, 0:1280] = 255
# masked_img = cv2.bitwise_and(img, img, mask=mask)


# Threshold
minThresh = 80
maxThresh = 255
_, thresh = cv2.threshold(gray, minThresh, maxThresh, cv2.THRESH_BINARY)

# Kernel
kernelSize = (1,1)
kernel = np.ones(kernelSize, np.uint8)

# Erosion
iterations = 1
erosion = cv2.erode(thresh, kernel, iterations= iterations)

# Canny
threshMin = 100
threshMax = 200
aperture = 3
edge = cv2.Canny(erosion, threshMin, threshMax, apertureSize= aperture)

# Hughlines
rho_ = 1
thresh_ = 100
minLenght = 10
maxGap = 5
lines = cv2.HoughLinesP(edge,rho_,np.pi/180, thresh_,minLineLength=minLenght,maxLineGap=maxGap)

if lines is not None:
    for line in lines:
        x1, y1, x2, y2 = line[0]
        cv2.line(img, (x1, y1), (x2, y2), (0, 255, 0), 2)
else:
    print("Nenhuma linha foi detectada.")

mostrar = [gray, equalization_gray, thresh, erosion, edge, img]
titles = ['gray', 'equalizado', 'thresh', 'erosion', 'edge', 'img']
linhas = 3
colunas = 2

plt.figure(figsize=(10, 10))
for i in range(len(mostrar)):
    if i+1 >= 1:
        plt.subplot(linhas, colunas, i+1)
        plt.imshow(mostrar[i], cmap='gray')
        plt.title(titles[i])
        plt.axis('off')
plt.show()


'''
Proposta:
    - Auto ajuste do thresholding. 
        Possível solução:
            Diminuir/Aumentar valor de acordo com a quantidade de linhas detectadas dentro de uma máscara.
                Local da máscara:
                    Visão ocular do motorista.
'''

In [None]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

cap = cv2.VideoCapture('./media/linhas/video_teste.mp4')

while True:
    _, frame = cap.read()
    _, norm = cap.read()

    escalaX = 0.2
    escalaY = 0.2
    frame = cv2.resize(frame, None, fx=escalaX, fy=escalaY, interpolation= cv2.INTER_AREA)
    norm = cv2.resize(norm, None, fx=escalaX, fy=escalaY, interpolation= cv2.INTER_AREA)

    # Convertendo de BGR para HSV
    hsv = cv2.cvtColor(frame, cv2.COLOR_BGR2HSV)
    # Filtros de cores
    # Amarelo
    lower_yellow = np.array([20,50,70])
    upper_yellow = np.array([35,255,255])
    mask_yellow = cv2.inRange(hsv, lower_yellow, upper_yellow)
    # Branco
    lower_white = np.array([0, 0, 130])
    upper_white = np.array([130,25,255])
    mask_white = cv2.inRange(hsv, lower_white, upper_white)
    # Resultado do filtro
    combined_mask = cv2.bitwise_or(mask_yellow, mask_white)
    result = cv2.bitwise_or(frame, frame, mask=combined_mask)

    # Imagem cinza
    gray = cv2.cvtColor(frame, cv2.COLOR_BGR2GRAY)
    # Histograma equalizado
    equalized = cv2.equalizeHist(gray)
    # Thresh para binário
    _, thresh = cv2.threshold(gray, 100, 255, cv2.THRESH_BINARY)
    # Erosão - Diminuição das linhas brancas
    erosion = cv2.erode(thresh, (3,3), iterations=1)
    # Testar aplicando a dilatação
    
    # Bordas da imagem
    edges = cv2.Canny(erosion, 127, 255)
    # Inserindo as linhas
    lines = cv2.HoughLinesP(edges, 1, np.pi/180, 127, minLineLength=5, maxLineGap=30)

    # Caso nenhuma linha tenha sido detectada
    if lines is not None:
        for line in lines:
            x1, y1, x2, y2 = line[0]
            cv2.line(frame, (x1, y1), (x2, y2), (0, 255, 0), 2)
    else:
        print("Nenhuma linha foi detectada.")

    # Resultado das imagens
    # cv2.imshow('Branca', mask_white)
    # cv2.imshow('Amarela', mask_yellow)
    cv2.imshow('Edges', edges)
    cv2.imshow('original', norm)
    # Resultado do bitwise    
    cv2.imshow('Máscaras', result)
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cap.release()
cv2.destroyAllWindows()

In [None]:
import cv2
import numpy as np
import json
import os

# Função de callback para as trackbars
def nothing(x):
    pass

# Função para atualizar a imagem com base nos valores das trackbars
def update_image():
    # Ler a imagem
    img = cv2.imread('./road.jpg')
    img = cv2.cvtColor(img, cv2.COLOR_BGR2RGB)
   
    # Converter a imagem para escala de cinza
    gray = cv2.cvtColor(img, cv2.COLOR_RGB2GRAY)
   
    # Obter valores das trackbars
    threshold1 = cv2.getTrackbarPos('Threshold 1', 'Trackbars')
    threshold2 = cv2.getTrackbarPos('Threshold 2', 'Trackbars')
    erosion_size = cv2.getTrackbarPos('Erosion Size', 'Trackbars')
   
    # Aplicar o thresholding
    _, thresh = cv2.threshold(gray, threshold1, threshold2, cv2.THRESH_BINARY)
   
    # Aplicar a erosão
    kernel = np.ones((erosion_size, erosion_size), np.uint8)
    eroded = cv2.erode(thresh, kernel, iterations=1)
   
    # Criar a área para as trackbars (painel lateral)
    height, width = img.shape[:2]
    panel_height = height
    panel_width = 200  # Largura do painel lateral
    panel = np.zeros((panel_height, panel_width, 3), dtype=np.uint8)

    # Mostrar a imagem processada
    cv2.imshow('Processed Image', eroded)

    # Atualizar a imagem do painel
    cv2.imshow('Trackbars', panel)

# Função para salvar os valores das trackbars em um arquivo JSON
def save_values():
    values = {
        'Threshold 1': cv2.getTrackbarPos('Threshold 1', 'Trackbars'),
        'Threshold 2': cv2.getTrackbarPos('Threshold 2', 'Trackbars'),
        'Erosion Size': cv2.getTrackbarPos('Erosion Size', 'Trackbars')
    }
    with open('trackbar_values.json', 'w') as f:
        json.dump(values, f)

# Função para carregar os valores das trackbars a partir de um arquivo JSON
def load_values():
    if os.path.exists('trackbar_values.json'):
        with open('trackbar_values.json', 'r') as f:
            values = json.load(f)
            cv2.setTrackbarPos('Threshold 1', 'Trackbars', values.get('Threshold 1', 0))
            cv2.setTrackbarPos('Threshold 2', 'Trackbars', values.get('Threshold 2', 255))
            cv2.setTrackbarPos('Erosion Size', 'Trackbars', values.get('Erosion Size', 1))

# Criar a janela para a imagem
cv2.namedWindow('Processed Image')

# Criar a janela para o painel de trackbars
cv2.namedWindow('Trackbars', cv2.WINDOW_NORMAL)
cv2.resizeWindow('Trackbars', 200, 600)

# Criar as trackbars na janela 'Trackbars'
cv2.createTrackbar('Threshold 1', 'Trackbars', 0, 255, nothing)
cv2.createTrackbar('Threshold 2', 'Trackbars', 255, 255, nothing)
cv2.createTrackbar('Erosion Size', 'Trackbars', 1, 20, nothing)

# Carregar valores anteriores, se existirem
load_values()

while True:
    update_image()
   
    key = cv2.waitKey(1) & 0xFF
    if key == 27:  # ESC key to exit
        break
    elif key == ord('s'):  # 's' key to save values
        save_values()

# Fechar todas as janelas
cv2.destroyAllWindows()

In [9]:
import cv2
import numpy as np
import matplotlib.pyplot as plt

def nothing(x):
    pass

# Carregando a imagem
img = cv2.imread('./media/road.jpg')
gray = cv2.cvtColor(img, cv2.COLOR_BGR2GRAY)

# Trackbar Threshold
cv2.namedWindow('Threshold')
cv2.resizeWindow('Threshold', 600, 75)
cv2.createTrackbar('thresh_value', 'Threshold', 0,255, nothing)
cv2.createTrackbar('max_value', 'Threshold', 0,255, nothing)

# Trackbar Erosion
cv2.namedWindow('Erosion')
cv2.resizeWindow('Erosion', 600, 75)
cv2.createTrackbar('kernel_size', 'Erosion', 1,15, nothing)
cv2.createTrackbar('iterations', 'Erosion', 0,10, nothing)

# Trackbar Bordas
cv2.namedWindow('Edges')
cv2.resizeWindow('Edges', 600, 120)
cv2.createTrackbar('min_value', 'Edges', 0,255, nothing)
cv2.createTrackbar('max_value', 'Edges', 0,255, nothing)
cv2.createTrackbar('aperture', 'Edges', 3,7, nothing)

# Trackbar Linhas
cv2.namedWindow('Linhas')
cv2.resizeWindow('Linhas', 600, 150)
cv2.createTrackbar('rho', 'Linhas', 1,100, nothing)
cv2.createTrackbar('thresh_hough', 'Linhas', 0,255, nothing)
cv2.createTrackbar('minLenght', 'Linhas', 0,100, nothing)
cv2.createTrackbar('maxGap', 'Linhas', 0,100, nothing)

while True:
    # Thresh
    thresh_value = cv2.getTrackbarPos('thresh_value', 'Threshold')
    max_value = cv2.getTrackbarPos('max_value', 'Threshold')
    _, thresh = cv2.threshold(gray, thresh_value, max_value, cv2.THRESH_BINARY)

    # Erosão
    k = cv2.getTrackbarPos('kernel_size', 'Erosion')
    kernel_value = (k,k)
    iterarions_value = cv2.getTrackbarPos('iterations', 'Erosion')
    erode = cv2.erode(thresh, kernel_value, iterations=iterarions_value)

    # Bordas
    min_value = cv2.getTrackbarPos('min_value', 'Edges')
    max_value = cv2.getTrackbarPos('max_value', 'Edges')
    aperture = cv2.getTrackbarPos('aperture', 'Edges')
    edges = cv2.Canny(erode, min_value, max_value, apertureSize=aperture)

    # Linhas
    rho_value = cv2.getTrackbarPos('rho', 'Linhas')
    thresh_hough = cv2.getTrackbarPos('thresh_hough', 'Linhas')
    minLenght = cv2.getTrackbarPos('minLenght', 'Linhas')
    maxGap = cv2.getTrackbarPos('maxGap', 'Linhas')
    lines = []
    if cv2.waitKey(1) & 0xFF == ord('a'):
        lines = cv2.HoughLinesP(edges,rho_value,np.pi/180, thresh_hough,minLineLength=minLenght,maxLineGap=maxGap)

    if lines is not None:
        img_copy = img.copy()
        for line in lines:
            x1, y1, x2, y2 = line[0]
            cv2.line(img_copy, (x1, y1), (x2, y2), (0, 255, 0), 2)
    else:
        print("Nenhuma linha foi detectada.")

    cv2.imshow('Imagem', img_copy)
    cv2.imshow('Bordas', edges)
    
    if cv2.waitKey(1) & 0xFF == ord('q'):
        break

cv2.destroyAllWindows()

