<img src="http://meusite.mackenzie.br/rogerio/mackenzie_logo/UPM.2_horizontal_vermelho.jpg"  width=300, align="right">
<br>
<br>
<br>
<br>
<br>

# ***Detecção de Objetos com YOLO e OpenCV***
---

*Siga esse template para entrega do seu artigo/projeto. O código deste notebook precisa ser 100% executável.*

Neste projeto você vai explorar algumas tecnologias que são o estado da arte da IA e do Aprendizado de Máquina. Seu grupo deve escolher uma dentre as seguintes tecnologias ou conceitos para explorar:

* **Tools**
  * BERT, tradução ou sumarização de texto
  * Yolo e OpenCV, para detecção de objetos em Imagens
  * Yolo e OpenCV, para detecção de objetos Vídeos

* **Conceitos** 
  * Generative Adversarial Neural Networks
  * Transformers (outras aplicações que não NLP, como o BERT)
  * Sentiment Analysis (em Português)
  * Anomaly Detection 

Vocês devem produzir um *artigo*, a exemplo de artigos do *Medium* ou outros canais semelhantes, para que seu grupo ou leitores do artigo tenham aqui um ponto de partida para uso da tecnologia/conceito escolhido. 

<br>

<br>

**ATENÇÃO**

* Podem haver apenas 3 trabalhos para um mesmo tema. 
* Cadastre o nome completo de 1 aluno do grupo para selecionar o tema aqui [7G](https://docs.google.com/spreadsheets/d/1P4Pw7dXs3d_QGKiT6AmmZo3i4wOvXHhuF8cYWSSidGE/edit?usp=sharing) ou [7N](https://docs.google.com/spreadsheets/d/1QSstslQFsP2ecMlrYbwfQXcP-3stcdYJmb22zvu8ASw/edit?usp=sharing). Respeite a escolha dos Colegas!

In [None]:
#@title **Identificação do Grupo**

#@markdown Integrantes do Grupo, nome completo em orgem alfabética (*informe \<TIA\>,\<nome\>*)
Aluno1 = '41906861, Fernando Brito de Arruda Bertholino' #@param {type:"string"} 
Aluno2 = '41908961, Gabriel Vitor' #@param {type:"string"}
Aluno3 = '41905113, Rodrigo Skurczynski' #@param {type:"string"}
Aluno4 = '41903447, Thiago Perissinotti' #@param {type:"string"}
Aluno5 = '' #@param {type:"string"}



# **Resumo (*Abstract*)**




Nosso trabalho se resume em uma IA utilizando YOLO e OpenCV para identificação de objetos em vídeos, por exemplo carros, guarda-chuvas, pessoas, caminhões etc.

# **Referencial Teórico**

Apresente os principais conceitos da tecnologia ou princípio explorado no seu trabalho (o que é? como funciona? Suas aplicações). Não deixe de indicar referências e incluir ilustrações/esquemas quando necessário. Empregue 2-3 páginas. 





# **Conceitos Chave**

## 1. *Darknet YOLO* 
YOLO (You Only Look Once) é um método de fazer a detecção de objetos. É o algoritmo/estratégia por trás de como o código vai detectar objetos na imagem.
Estruturas de detecção anteriores examinavam diferentes partes da imagem várias vezes em diferentes escalas e redefiniam a técnica de classificação de imagem para detectar objetos. Essa abordagem é lenta e ineficiente. 
YOLO adota uma abordagem totalmente diferente. Ele examina a imagem inteira apenas uma vez, passa pela rede uma vez e detecta objetos. Daí o nome. É muito rápido. Essa é a razão pela qual se tornou tão popular.

## 2. *OpenCV* 
OpenCV é uma biblioteca de funções de programação voltada principalmente para visão computacional em tempo real.
O módulo DNN (Rede Neural Profunda) fazia inicialmente parte do repositório opencv_contrib. Ele foi movido para o branch master do opencv repo no ano passado, dando aos usuários a capacidade de executar inferência em modelos de aprendizado profundo pré-treinados dentro do próprio OpenCV.
(Uma coisa a observar aqui é que o módulo dnn não deve ser usado para treinamento. É apenas para executar inferência em imagens/vídeos.)

## 3. *Detecção de Objetos*
A detecção de objetos é uma tecnologia de computador relacionada à visão computacional e ao processamento de imagens que lida com a detecção de instâncias de objetos semânticos de uma determinada classe (como humanos, prédios ou carros) em imagens e vídeos digitais. Domínios bem pesquisados de detecção de objetos incluem detecção de rosto e detecção de pedestres. A detecção de objetos tem aplicações em muitas áreas da visão computacional, incluindo recuperação de imagens e vigilância por vídeo.

# **Exemplo de Aplicação**

Um problema que está aplicação pode resolver por exemplo é uma câmera de segurança/detecção de intrusos. Ela pode detectar uma movimentação em lugares calmos, por exemplo em casa, ela pode detectar se é uma pessoa que entrou em casa, se é um pacote que chegou, se é só um carro, se é um gato etc. Dessa forma pode avisar caso tenha uma movimentação de algum objeto, dizer qual foi o objeto, e deixar registrado ou até avisar como alarme.

Também é possível lidar com o problema de cuidar de pessoas ou animais que precisam por algum motivo ficar em repouso ou não podem sair de certo local ou demonstrar nenhum movimento. Por exemplo, existem problemas para lidar com pessoas mais idosas que já não estão mais tão cientes do que fazem e ficam tentando fugir de casa. Com essa aplicação é possível uma supervisão constante e remota para verificação desses individuos e sua segurança.

# **Exemplo de Código**



In [None]:
# Dependências
import cv2
import time
import numpy as np

# Cores
COLORS = [(0, 255, 255), (255, 255, 0), (0, 255, 0), (255, 0, 0)]

# Carrega as classes
class_names = []
with open("coco.names", "r") as f:
    class_names = [cname.strip() for cname in f.readlines()]

print(class_names[0])


#Captura do video
cap = cv2.VideoCapture("NY.mp4")

# Carrega os pesos da REDE NEURAL
# net = cv2.dnn.readNet("yolov4.weights", "yolov4.cfg")
net = cv2.dnn.readNet("yolov4-tiny.weights", "yolov4-tiny.cfg")

# Seta os parâmetros da NN
model = cv2.dnn_DetectionModel(net)
model.setInputParams(size=(416, 416), scale=1/255)

# Lendo Frame a Frame do Video
while True:

    # Captura Frame
    _, frame = cap.read()

    # Começo da contagem dos MS
    start = time.time()


    # Detecção
    classes, scores, boxes = model.detect(frame, 0.1, 0.2)

    # Fim da contagem dos MS
    end = time.time()

    # Percorrer todas as detecções
    for (classid, score, box) in zip(classes, scores, boxes):

        # Gerando uma cor para a classe
        color = COLORS[int(classid) % len(COLORS)]

        # Pegando o nome da classe pelo ID e o seu score de acuracia
        # label = f"{class_names[classid]} : {score}"
        label = f"{class_names[classid]}"

        # Desenha a caixa de detecção
        cv2.rectangle(frame, box, color, 2)

        # Escrevendo o nome da classe em cima da caixa
        cv2.putText(frame, label, (box[0], box[1] - 10), cv2.FONT_HERSHEY_SIMPLEX, 0.5, color, 2)

    # Calculando o tempo que levou para fazer a detecção
    fps_label = f"FPS: {round((1.0/(end - start)), 2)}"

    # Escrevendo o FPS na imagem
    cv2.putText(frame, fps_label, (0, 25), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 0, 0), 5)
    cv2.putText(frame, fps_label, (0, 25), cv2.FONT_HERSHEY_SIMPLEX, 1, (0, 255, 0), 3)

    # Mostrando a Imagem
    cv2.imshow("detections", frame)

    # Espera da Resposta
    if cv2.waitKey(1) == 27:
        break

# Liberação da camera e destroi todas as janelas
cap.release()
cv2.destroyAllWindows()

# **Uma ideia de Projeto de Aplicação**

Essa tecnologia pode ser utilizada por exemplo para medição de velocidade de diferentes tipos de veículos em movimento. A medida que a IA vai detectando o objeto, ela já diferencia de carro, caminhão, ônibus etc. Dessa forma já temos a diferenciação do veículo. Então, nós podemos realizar um cálculo para verificar a velocidade do veículo baseado em seu movimento no vídeo, conseguindo aplicar multas automáticas por exemplo para cada tipo específico de veículo.


# **Referências**

https://www.youtube.com/watch?v=Sx_HioMUtiY&t=26s&ab_channel=Jo%C3%A3oReis

# **Vídeo, GitHub e Publicação (opcional)** 

Produza um vídeo explicativo apresentando o seu trabalho. Salve em uma GitHub público seu notebook e o código completo (sem o texto intercalado) do seu projeto. Se bem avaliado, podemos publicar seu texto no Medium. 

# **Conclusão** 

Apresente a conclusão do seu estudo. Indique limitações da tecnologia/conceitos, novos avanços e compare com tecnologias/conceitos concorrentes.



---

In [None]:
#@title **Avaliação**
Referencial_Teorico = 10 #@param {type:"slider", min:0, max:10, step:1}

Conceitos_Chave = 9 #@param {type:"slider", min:0, max:10, step:1}

Exemplo_Aplicacao = 6 #@param {type:"slider", min:0, max:10, step:1}

Ideia_Projeto = 7 #@param {type:"slider", min:0, max:10, step:1}

Conclusao = 7 #@param {type:"slider", min:0, max:10, step:1}








In [None]:
#@title **Nota Final**
nota = Referencial_Teorico + Conceitos_Chave + 2*Exemplo_Aplicacao + 2*Ideia_Projeto + Conclusao

nota = nota / 7

print(f'Nota final do trabalho {nota :.1f}')

import numpy as np
import pandas as pd

alunos = pd.DataFrame()

lista_tia = []
lista_nome = []

for i in range(1,6):
  exec("if Aluno" + str(i) + " !='None':  lista = Aluno" + str(i) + ".split(','); lista_tia.append(lista[0]); lista_nome.append(lista[1].upper())")

alunos['tia'] = lista_tia
alunos['nome'] = lista_nome
alunos['nota'] = np.round(nota,1)
print()
display(alunos)

Nota final do trabalho 7.4



Unnamed: 0,tia,nome,nota
0,1115665,ADRIANA FUJITA,7.4
1,1115677,DANIEL HENRIQUE,7.4
