In [2]:
import cv2
import numpy as np
import math

In [3]:
def deteta_movimento(fundo, imagem_seguinte, threshold): 

    diff = cv2.absdiff(fundo, imagem_seguinte) 
    movimento = diff > threshold

    return movimento


def estima_fundo(fundo, imagem_seguinte, movimento, alfa = 0.9):
#     print("fundo: ", fundo)
    
    pixeis_fundo = fundo*movimento
    pixeis_movimento = cv2.addWeighted(fundo, alfa, imagem_seguinte, (1-alfa), 0)*np.invert(movimento)
#     print("pixeis_fundo: ", pixeis_fundo)
#     print("pixeis_movimento: ", pixeis_movimento)
    
    fundo = cv2.add(pixeis_fundo, pixeis_movimento)
    
#     print("fundo: ", fundo)
    return fundo


def obtemArea(contorno): 
    return round(cv2.contourArea(contorno), 2)

def obtemPerimetro(contorno): 
    return round(cv2.arcLength(contorno, True), 2)

def obtemCentroide(contorno):
    momentos = cv2.moments(contorno)
    centro_x = round(momentos['m10']/momentos['m00'])
    centro_y = round(momentos['m01']/momentos['m00'])
    
    return (centro_x, centro_y)

def obterRaio(contorno):
    area = obtemArea(contorno)
    raio = np.sqrt(area/np.pi)
    
    return round(raio, 2)

def obterCircularidade(contorno): 
    area = obtemArea(contorno)
    perimetro = obtemPerimetro(contorno)
    circularidade = round(np.abs(perimetro)**2/area)
    
    return circularidade



def obtemPropriedades(contornos, hierarquiaContornos, objecto = 0, prop = []):
    
    if(objecto == 0): 
        prop = []

    if(objecto >= 0): 

        contorno = contornos[objecto]
        hierarquia = hierarquiaContornos[objecto]

        propriedade = {"ID_objecto": objecto, 
                      "centroide": obtemCentroide(contorno), 
                       "area": obtemArea(contorno),
                       "raio": obterRaio(contorno), 
                       "perimetro": obtemPerimetro(contorno), 
                       "circularidade": obterCircularidade(contorno)
                      }
        prop.append(propriedade)

        # [Next, Previous, First Child, Parent]
        objecto = hierarquia[0]
        return obtemPropriedades(contornos, hierarquiaContornos, objecto, prop)

    else: 
        return prop
    
    


In [3]:
fundo = np.zeros((5,5))
fundo[0:3, 0:3] = 100

imagem = np.zeros((5,5))
imagem[1:5, 2] = 100
imagem[1:5, 3] = 50
imagem[1:5, 4] = 25

print("Fundo: ", fundo)
print("Imagem: ", imagem)

movimento = deteta_movimento(fundo, imagem, 24)

print("\n")
print("Movimento:\n", movimento)

novo_fundo = estima_fundo(fundo, imagem, movimento) 

print("\n")
print("Novo Fundo:\n", novo_fundo)


Fundo:  [[100. 100. 100.   0.   0.]
 [100. 100. 100.   0.   0.]
 [100. 100. 100.   0.   0.]
 [  0.   0.   0.   0.   0.]
 [  0.   0.   0.   0.   0.]]
Imagem:  [[  0.   0.   0.   0.   0.]
 [  0.   0. 100.  50.  25.]
 [  0.   0. 100.  50.  25.]
 [  0.   0. 100.  50.  25.]
 [  0.   0. 100.  50.  25.]]


Movimento:
 [[ True  True  True False False]
 [ True  True False  True  True]
 [ True  True False  True  True]
 [False False  True  True  True]
 [False False  True  True  True]]


Novo Fundo:
 [[100. 100. 100.   0.   0.]
 [100. 100. 100.   0.   0.]
 [100. 100. 100.   0.   0.]
 [  0.   0.   0.   0.   0.]
 [  0.   0.   0.   0.   0.]]


In [None]:
path = "video/"
capture = cv2.VideoCapture(path + 'camera1.mov')

def classificaObjecto(area, largura, altura): 
    if (altura>=largura) and (area > 500):
        nome = 'Pessoa'
        cor = (0, 0, 255)  

    elif (largura>=altura) and (area >= 500):
        nome = 'Carro'
        cor = (0, 255, 0)

    else:
        nome = 'Objecto'
        cor = (255, 0, 0)
        
    return nome, cor


def extracaoPropriedades(contornos, frameCount, objectos_encontrados = [], ID = 0):
    for cnt in contornos:         
        # Calculate area and remove small elements
        area = obtemArea(cnt)
        posx, posy, largura, altura = cv2.boundingRect(cnt)
        
        if ((largura,altura) >= (40,30)):
            
            centroide = obtemCentroide(cnt)
            nome, cor = classificaObjecto(area, largura, altura)
            
#             propriedades = {"ID_objecto": ID,
#                             "nome": nome, 
#                             "area": area, 
#                             "centroide": centroide, 
#                             "posx": posx, 
#                             "posy": posy, 
#                             "largura": largura,
#                             "altura": altura, 
#                             "cor": cor}
            
            propriedades = [ID, {"nome": nome, 
                            "area": area, 
                            "centroide": centroide, 
                            "posx": posx, 
                            "posy": posy, 
                            "largura": largura,
                            "altura": altura, 
                            "cor": cor}, 
                           frameCount]
            
            objectos_encontrados.append(propriedades)
            ID=+1
    return objectos_encontrados
    
# def classificaObjectos(objectos_encontrados): 
#     for objecto in objectos_encontrados: 
        
#         area = objecto["area"]
#         altura = objecto["altura"]
#         largura = objecto["largura"]
        
#         nome, cor = classificaObjecto(area, largura, altura)
        
#         objecto["nome"] = nome
#         objecto["cor"] = cor
        
def updateObjectOnTrack(old_object, new_object):
    # ID antigo, propriedades novas e frameID novo
    updated_object = [old_object[0], new_object[1], new_object[2]]
    
    return updated_object

path = "video/"
kernel_median = (5,5)
tracking_objects = []

capture = cv2.VideoCapture(path + "camera1.mov")
fps = capture.get(cv2.CAP_PROP_FPS)
print("FPS:", fps)

_, background = capture.read()
_, frame = capture.read()
frameCount = 1

while capture.isOpened():
    
    _, next_frame = capture.read()
    frameCount = frameCount + 1

    #     print(frameCount)
    cv2.imshow("background", background)
    cv2.imshow("Next Frame", next_frame)

    movimento = deteta_movimento(frame, next_frame, 25)
    background = estima_fundo(background, next_frame, movimento, 0.9)

    pixeis_ativos = movimento.astype(np.uint8)*255
    cv2.imshow("Pixeis ativos", pixeis_ativos)

    next_frame_g = cv2.cvtColor(pixeis_ativos, cv2.COLOR_BGR2GRAY)
    next_frame_g = cv2.blur(next_frame_g, kernel_median)
    th, binary = cv2.threshold(next_frame_g, 75, 255, cv2.THRESH_BINARY) 
#     print("Th: ", th)
    cv2.imshow("Binarizacao", binary)


    elementoEstruturante = cv2.getStructuringElement(cv2.MORPH_RECT, (3,3))
    fecho = cv2.morphologyEx(binary, cv2.MORPH_CLOSE, elementoEstruturante) 

    elementoEstruturante = cv2.getStructuringElement(cv2.MORPH_RECT, (10,10))
    dilatacao = cv2.dilate(fecho, elementoEstruturante, iterations = 3)

    elementoEstruturante = cv2.getStructuringElement(cv2.MORPH_RECT, (10,10))
    abertura = cv2.morphologyEx(dilatacao, cv2.MORPH_OPEN, elementoEstruturante)

    cv2.imshow("Fecho", fecho)
    cv2.imshow("Dilatacao", dilatacao)
    cv2.imshow("Abertura", abertura)
    
    contoured = next_frame.copy()
    contours, hierarquia = cv2.findContours(abertura, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    
    # Extração de propriedades e classificação de objectos
    frame_objects = []
    frame_objects = extracaoPropriedades(contours, frameCount, frame_objects)
    
    segment_objects = tracking_objects.copy()    
    for frame_object in frame_objects:
        object_exists = False
        for track_object in tracking_objects:
            obj_centroid = frame_object[1]["centroide"]
            trk_centroid = track_object[1]["centroide"]
            
            distancia = math.hypot(trk_centroid[0] - obj_centroid[0], trk_centroid[1] - obj_centroid[1])
            
            if(distancia < 10):
                # object in track
                object_exists = True
                track_object = updateObjectOnTrack(track_object, frame_object)
                continue
            
        if(not object_exists): 
            # new object on track
            segment_objects.append(frame_object)
             
    tracking_objects = []
    # Valida se os objectos em track foram identificados nas últimas 5 frames
    for objecto in segment_objects:
        last_frame_seen = objecto[2]
        if(frameCount - last_frame_seen < 5):
            tracking_objects.append(objecto) 
                
    
    contoured_frame = next_frame.copy()
    for objecto in tracking_objects: 
        cv2.rectangle(contoured_frame, (objecto[1]["posx"], objecto[1]["posy"]), (objecto[1]["posx"] + objecto[1]["largura"], objecto[1]["posy"] + objecto[1]["altura"]), objecto[1]["cor"], 2)
        cv2.putText(contoured_frame, str(objecto[0]) + " " + str(objecto[1]["nome"]), (objecto[1]["posx"], objecto[1]["posy"] - 7), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), thickness=1)
        
    
    cv2.imshow("Roi", next_frame)
    cv2.imshow("Frame", next_frame)
    cv2.imshow("Mask", background)  
    cv2.imshow("Contoured", contoured_frame) 
    
    frame = next_frame
    frameCount+=1

    key = cv2.waitKey(int(1000/fps))

    if(key == 27): 
        cv2.destroyAllWindows()
        capture.release()
        
cv2.destroyAllWindows()
capture.release()
    

FPS: 25.0


In [None]:
pixeis_ativos

array([[[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        ...,
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]],

       [[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        ...,
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]],

       [[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        ...,
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]],

       ...,

       [[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        ...,
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]],

       [[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        ...,
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]],

       [[0, 0, 0],
        [0, 0, 0],
        [0, 0, 0],
        ...,
        [0, 0, 0],
        [0, 0, 0],
        [0, 0, 0]]], dtype=uint8)

In [14]:
        
def deteccao_movimento(video_capture, ini, fin):
    retval, imagem = video_capture.read()
    
    img_anterior = cv2.blur(imagem, (5,5))
    count = ini

    while (count < fin):
        #print(count)
        retval, imagem = video_capture.read()
        #cv2.imshow('img_original', imagem)
        #cv2.imwrite("img_original/img_original%d.jpg" % count, imagem)

        img_presente = cv2.blur(imagem, (5,5))
        #cv2.imshow('img_presente_blur', img_presente)
        #cv2.imwrite("img_presente_blur/img_presente_blur%d.jpg" % count, img_presente)
        
        img_gray1 = cv2.cvtColor(img_anterior, cv2.COLOR_BGR2GRAY)
        img_gray2 = cv2.cvtColor(img_presente, cv2.COLOR_BGR2GRAY)
        diferenca_imagens = cv2.absdiff(img_gray1, img_gray2)
        
        thresh = cv2.threshold(diferenca_imagens, 10, 255, cv2.THRESH_BINARY)[1]
        #cv2.imshow('threshAdilatacao', thresh)
        #cv2.imwrite("threshAdilatacao/thresh_antes_dilatacao%d.jpg" % count, thresh)
        
        elemento = cv2.getStructuringElement(cv2.MORPH_RECT, (8, 4))
        
        dilation_imag = cv2.dilate(thresh, elemento, iterations=3)
        #cv2.imshow('dilation_imag', dilation_imag)
        #cv2.imwrite("dilation_imag/dilation_imag%d.jpg" % count, dilation_imag)
        
        contours, heranca = cv2.findContours(dilation_imag, cv2.RETR_EXTERNAL, cv2.CHAIN_APPROX_SIMPLE)

        #drawing = np.zeros(dilation_imag.shape, np.uint8)
        #cv2.drawContours(drawing, contours, -1, (255,255,0), 3)
        #cv2.imwrite("contours/contours%d.jpg" % count, drawing)
        
        for i in range(len(contours)):
            contorno = contours[i]
            
            (x,y), (w, h), r = cv2.minAreaRect(contorno)

            if((w,h) >= (30,20)):
                x, y, w, h = cv2.boundingRect(contorno)
                area = cv2.contourArea(contorno)
                
                if (h>=w) and (area > 330 and area < 3700):
                    nome = 'Pessoa'
                    cor = (0, 0, 255)  
                
                elif (w>=h) and (area >= 3700):
                    nome = 'Carro'
                    cor = (0, 255, 0)
                
                elif area <= 330:
                    nome = 'Objecto'
                    cor = (255, 0, 0)
                
                else:
                    continue
                    
                cv2.rectangle(imagem, (x,y), (x+w, y+h), cor, 2)
                cv2.putText(imagem, nome, (x+10, y-10),cv2.FONT_HERSHEY_SIMPLEX, 1, cor, 2)
            
        cv2.imshow('window-name', imagem)
        #cv2.imwrite("cam_princi/cam_princi%d.jpg" % count, imagem)
        img_anterior = img_presente
        
        count += 1
        
        if (cv2.waitKey(5) & 0xFF == ord('q')):
            video_capture.release()
            break
    
    cv2.destroyAllWindows()
             

path = "video/"
video_capture = cv2.VideoCapture(path + 'camera1.mov')
video_length = int(video_capture.get(cv2.CAP_PROP_FRAME_COUNT))
deteccao_movimento(video_capture, 0, video_length-1) #3064 frames , entao frames de [0 a 3063]


In [36]:
path = "video/"
capture = cv2.VideoCapture(path + 'camera1.mov')

def classificaObjecto(area, largura, altura): 
    if (altura>=largura) and (area > 330 and area < 3700):
        nome = 'Pessoa'
        cor = (0, 0, 255)  

    elif (largura>=altura) and (area >= 3700):
        nome = 'Carro'
        cor = (0, 255, 0)

    else:
        nome = 'Objecto'
        cor = (255, 0, 0)
        
    return nome, cor


def extracaoPropriedades(contornos, objectos_encontrados = [], ID = 0):
    for cnt in contornos:         
        # Calculate area and remove small elements
        area = obtemArea(cnt)
        
        if area > 100:
            
            centroide = obtemCentroide(cnt)
            posx, posy, largura, altura = cv2.boundingRect(cnt)
            
            propriedades = {"ID_objecto": ID, 
                            "nome": "", 
                            "area": area, 
                            "centroide": centroide, 
                            "posx": posx, 
                            "posy": posy, 
                            "largura": largura,
                            "altura": altura, 
                           "cor": None}
            
            objectos_encontrados.append(propriedades)
    return objectos_encontrados
    
def classificaObjectos(objectos_encontrados): 
    for objecto in objectos_encontrados: 
        
        area = objecto["area"]
        altura = objecto["altura"]
        largura = objecto["largura"]
        
        nome, cor = classificaObjecto(area, largura, altura)
        
        objecto["nome"] = nome
        objecto["cor"] = cor
        
        
# Object detection
object_detector = cv2.createBackgroundSubtractorMOG2(history=100, varThreshold = 40)
tracking_objects = {}
count = 0

while True: 
    ret, frame = capture.read()
    height, width, _ = frame.shape
    
    #Extract Region of interest
    roi = frame[0:width, 0:width]
    
    # Object Detection
    mask = object_detector.apply(roi)
    _, mask = cv2.threshold(mask, 254, 255, cv2.THRESH_BINARY)
    contours, hierarchy = cv2.findContours(mask, cv2.RETR_TREE, cv2.CHAIN_APPROX_SIMPLE)
    
    # Extração de propriedades
    frame_objects = []
    frame_objects = extracaoPropriedades(contours, frame_objects)
            
#     print("objectos encontrados")
#     print(frame_objects)
    
    # Classifica objectos
    classificaObjectos(frame_objects)
    
#     print("objectos encontrados2")
#     print(frame_objects)
      
    # Tracking objectos
    if(count <= 2): 
        for objecto in frame_objects:
            for tracked_obj in tracking_objects: 
                distance = math.hypot(tracked_obj["centroide"][0] - objecto["centroide"][0], tracked_obj["centroide"][1] - objecto["centroide"][1])
#                 print("Distance: ", distance)
                
                if distance < 20: 
                    tracked_obj["centroide"] = objecto["centroide"]
                    tracked_obj["posx"] = objecto["posx"]
                    tracked_obj["posy"] = objecto["posy"]
    
    else: 
        for tracked_obj in tracking_objects.copy(): 
            object_exists = False
            
            for objecto in frame_objects.copy(): 
                distance = math.hypot(tracked_obj["centroide"][0] - objecto["centroide"][0], tracked_obj["centroide"][1] - objecto["centroide"][1])
                                
                if distance < 20: 
                    if objecto in frame_objects: 
                        tracked_obj["centroide"] = objecto["centroide"]
                        tracked_obj["posx"] = objecto["posx"]
                        tracked_obj["posy"] = objecto["posy"]
                        frame_objects.pop(objecto)
                        object_exists = True
                        continue
                    
            if not object_exists:
                tracking_objects.pop(tracked_obj)
        
        for objecto in frame_objects: 
            tracking_objects.append(objecto)
        
#     print(" ")
#     print("Tracking Objects: ")
#     print(tracking_objects)
    for objecto in tracking_objects: 
        cv2.rectangle(roi, (objecto["posx"], objecto["posy"]), (objecto["posx"] + objecto["largura"], objecto["posy"] + objecto["altura"]), objecto["cor"], 2)
        cv2.putText(roi, str(objecto["ID_objecto"]) + " " + str(objecto["nome"]), (objecto["posx"], objecto["posy"] - 7), cv2.FONT_HERSHEY_SIMPLEX, 0.5, (255, 255, 255), thickness=1)
        
    
    tracking_objects = frame_objects.copy()
    cv2.imshow("Roi", roi)
    cv2.imshow("Frame", frame)
    cv2.imshow("Mask", mask)
    
    key = cv2.waitKey(30)
    
    if key == 27: 
        break

capture.release()
cv2.destroyAllWindows()