<a href="https://colab.research.google.com/github/Frankl1sales/yolo-basic-course/blob/main/YOLO_v4_Detec%C3%A7%C3%A3o_de_Objetos_em_V%C3%ADdeos_com_OpenCV.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Detectando objetos em vídeos com YOLOv4 e OpenCV

## Etapa 1 - Importando as bibliotecas

In [None]:
import cv2
print(cv2.__version__)

In [None]:
!pip install opencv-python==4.9.0.80

In [None]:
import cv2
import numpy as np
import time
import os
import matplotlib.pyplot as plt
from google.colab.patches import cv2_imshow
import zipfile
print(cv2.__version__)

## Etapa 2 - Conectando com o Google Drive

In [None]:
from google.colab import drive
drive.mount('/content/gdrive')

## Etapa 3 - Carregando os arquivos do modelo treinado

In [None]:
path =  '/content/gdrive/MyDrive/home/2. PESQUISAS/4. Org. Cursos/Udemy/YOLO/modelo_YOLOv4.zip'
zip_object = zipfile.ZipFile(file=path, mode="r")
zip_object.extractall("./")
zip_object.close()

In [None]:
labels_path = os.path.sep.join(['/content/cfg', "coco.names"])
LABELS = open(labels_path).read().strip().split("\n")

In [None]:
weights_path = os.path.sep.join(['/content/', "yolov4.weights"])
config_path = os.path.sep.join(['/content/cfg', "yolov4.cfg"])

In [None]:
net = cv2.dnn.readNet(config_path, weights_path)

## Etapa 4 - Definindo mais configurações para a detecção

In [None]:
np.random.seed(42)
COLORS = np.random.randint(0, 255, size=(len(LABELS), 3), dtype="uint8")

In [None]:
ln = net.getLayerNames()
print("Todas as camadas (layers):")
print(ln)
print("Total: "+ str(len(ln)))
print("Camadas de saída: ")
print(net.getUnconnectedOutLayers())
ln = [ln[i - 1] for i in net.getUnconnectedOutLayers()]
print(ln)

## Etapa 5 - Criando as funções para detecção e processamento do video


### Função para exibir imagens no Colab

In [None]:
  fig = plt.gcf()
  fig.set_size_inches(16, 10)
  plt.axis("off")
  plt.imshow(cv2.cvtColor(img, cv2.COLOR_BGR2RGB))
  plt.show()

### Construindo o blob da imagem


In [None]:
def blob_imagem(net, imagem, mostrar_texto=True):
  inicio = time.time()
  blob = cv2.dnn.blobFromImage(imagem, 1 / 255.0, (416, 416), swapRB=True, crop=False)
  net.setInput(blob)
  layerOutputs = net.forward(ln)
  termino = time.time()
  if mostrar_texto:
    print("YOLO levou {:.2f} segundos".format(termino - inicio))
  return net, imagem, layerOutputs

### Realizando a detecção

In [None]:
def deteccoes(detection, _threshold, caixas, confiancas, IDclasses):
  scores = detection[5:]
  classeID = np.argmax(scores)
  confianca = scores[classeID]

  if confianca > _threshold:
      caixa = detection[0:4] * np.array([W, H, W, H])
      (centerX, centerY, width, height) = caixa.astype("int")

      x = int(centerX - (width / 2))
      y = int(centerY - (height / 2))

      caixas.append([x, y, int(width), int(height)])
      confiancas.append(float(confianca))
      IDclasses.append(classeID)

  return caixas, confiancas, IDclasses

### Mostrando o resultado da detecção no video

In [None]:
def funcoes_imagem(imagem, i, confiancas, caixas, COLORS, LABELS, mostrar_texto=True):
  (x, y) = (caixas[i][0], caixas[i][1])
  (w, h) = (caixas[i][2], caixas[i][3])

  cor = [int(c) for c in COLORS[IDclasses[i]]]
  cv2.rectangle(imagem, (x, y), (x + w, y + h), cor, 2)
  texto = "{}: {:.4f}".format(LABELS[IDclasses[i]], confiancas[i])
  if mostrar_texto:
    print("> " + texto)
    print(x,y,w,h)
  cv2.putText(imagem, texto, (x, y - 5), cv2.FONT_HERSHEY_SIMPLEX, 0.5, cor, 2)

  return imagem,x,y,w,h

## Etapa 6 - Carregando o vídeo onde será feita a detecção

### 6.1 - De uma url

In [None]:
!wget https://github.com/gabevr/yolo/raw/master/videos/video_pessoas01.mp4

### 6.2 - Do Google Drive

In [None]:
!cp /content/gdrive/MyDrive/home/2.\ PESQUISAS/4.\ Org.\ Cursos/Udemy/YOLO/videos/video_pessoas01.mp4 ./

### Lendo o arquivo de vídeo com o OpenCV

In [None]:
arquivo_video = 'video_pessoas01.mp4'
cap = cv2.VideoCapture(arquivo_video)
conectado, video = cap.read()

In [None]:
conectado

In [None]:
video.shape

In [None]:
video_largura = video.shape[1]
video_altura = video.shape[0]
video_largura, video_altura

## Etapa 7 - Redimensionamento do tamanho do video (opcional)

In [None]:
def redimensionar(largura, altura, largura_maxima = 600):
  if (largura > largura_maxima):
    proporcao = largura / altura
    video_largura = largura_maxima
    video_altura = int(video_largura / proporcao)
  else:
    video_largura = largura
    video_altura = altura

  return video_largura, video_altura

In [None]:
video_largura, video_altura = redimensionar(video.shape[1], video.shape[0])
print(video_largura,video_altura)

## Etapa 8 - Definindo as configurações do vídeo

- Mais exemplos de outras configurações com o fourcc que é possível usar: https://www.programcreek.com/python/example/89348/cv2.VideoWriter_fourcc

In [None]:
nome_arquivo = 'resultado.avi'
fourcc = cv2.VideoWriter_fourcc(*'XVID') # MP4V

In [None]:
fps = 24

In [None]:
saida_video = cv2.VideoWriter(nome_arquivo, fourcc, fps, (video_largura, video_altura))

## Etapa 9 - Definindo as variáveis

In [None]:
threshold = 0.5
threshold_NMS = 0.3
fonte_pequena, fonte_media = 0.4, 0.6
fonte = cv2.FONT_HERSHEY_SIMPLEX

In [None]:
amostras_exibir = 20
amostra_atual = 0

## Etapa 10 - Processamento do vídeo e exibição do resultado

In [None]:
while (cv2.waitKey(1) < 0):
  conectado, frame = cap.read()
  if not conectado:
    break
  t = time.time()
  frame = cv2.resize(frame, (video_largura, video_altura))
  try:
    (H, W) = frame.shape[:2]
  except:
    print('Erro')
    continue

  imagem_cp = frame.copy()
  net, frame, layerOutputs = blob_imagem(net, frame)
  caixas = []
  confiancas = []
  IDclasses = []

  for output in layerOutputs:
    for detection in output:
      caixas, confiancas, IDclasses = deteccoes(detection, threshold, caixas, confiancas, IDclasses)

  objs = cv2.dnn.NMSBoxes(caixas, confiancas, threshold, threshold_NMS)

  if len(objs) > 0:
    for i in objs.flatten():
      frame, x, y, w, h = funcoes_imagem(frame, i, confiancas, caixas, COLORS, LABELS, mostrar_texto=False)
      objeto = imagem_cp[y:y + h, x:x + w]

  cv2.putText(frame, " frame processado em {:.2f} segundos".format(time.time() - t),
              (20, video_altura-20), fonte, fonte_pequena, (250, 250, 250), 0, lineType=cv2.LINE_AA)

  if amostra_atual <= amostras_exibir:
    cv2_imshow(frame)
    amostra_atual += 1

  saida_video.write(frame)

print('Terminou')
saida_video.release()
cv2.destroyAllWindows()

In [None]:
\!du -h resultado.avi

In [None]:
!cp ./resultado.avi /content/gdrive/MyDrive/home/2.\ PESQUISAS/4.\ Org.\ Cursos/Udemy/YOLO/videos/resultado03.avi

## Alteração do formato do vídeo para codec h.264

In [None]:
!apt-get install ffmpeg


In [None]:
!ffmpeg -i "/content/gdrive/MyDrive/home/2. PESQUISAS/4. Org. Cursos/Udemy/YOLO/videos/resultado03.avi" \
-c:v libx264 -c:a aac -strict experimental \
"/content/gdrive/MyDrive/home/2. PESQUISAS/4. Org. Cursos/Udemy/YOLO/videos/resultado3_whatsapp3.mp4"

In [None]:
!ffmpeg -i "/content/gdrive/MyDrive/home/2. PESQUISAS/4. Org. Cursos/Udemy/YOLO/videos/resultado03.avi" \
-c:v libx264 -preset fast -crf 23 -vf "scale=trunc(iw/2)*2:trunc(ih/2)*2" -r 30 -c:a aac -b:a 128k -strict experimental \
"/content/gdrive/MyDrive/home/2. PESQUISAS/4. Org. Cursos/Udemy/YOLO/videos/resultado3_whatsapp3.mp4"
