In [1]:
import datetime

def seconds_to_time(seconds):
    hours = seconds // 3600  # Integer number of hours
    remaining_seconds = seconds % 3600  # Seconds remaining after hours

    minutes = remaining_seconds // 60  # Integer number of minutes
    final_seconds = remaining_seconds % 60  # Seconds remaining after minutes

    time = datetime.time(hours, minutes, final_seconds)
    
    return time

In [2]:
# calcular o tempo que cada deteccao esteve no video
def video_detection_time(frames_counter, video_fps):
    if frames_counter is not None:
        detection_time = {}
        
        for id, qtde_frames in frames_counter.items():
            seconds = qtde_frames / fps
            detection_time[id] = seconds_to_time(seconds)
            
        return detection_time

In [3]:
import cv2
from ultralytics import YOLO
import supervision as sv
import numpy as np

box_annotator = sv.BoxAnnotator(
    thickness=2,
    text_thickness=1,
    text_scale=0.5
)

model_name = "yolov8n.pt"
video_path = "/home/nomevini/Documentos/Iniciação Cientifica/Projeto/tracking_people_in_videos/app/yolov8/people-walking-640x360.mp4"

model = YOLO(model_name)

# Abre o vídeo de entrada e obtem as configurações
input_video = cv2.VideoCapture(video_path)
fps = input_video.get(cv2.CAP_PROP_FPS)
width = int(input_video.get(cv2.CAP_PROP_FRAME_WIDTH))
height = int(input_video.get(cv2.CAP_PROP_FRAME_HEIGHT))

# Define o codec e as configurações do vídeo de saída
fourcc = cv2.VideoWriter_fourcc(*'mp4v')
output_video = cv2.VideoWriter('output.mp4', fourcc, fps, (width, height))

# contar os frames que cada deteccao apareceu
frames_detect_counter = {}

for result in model.track(source=video_path, stream=True, agnostic_nms=True, classes=[0]):
    frame = result.orig_img
    detections = sv.Detections.from_yolov8(result)

    if result.boxes.id is not None:
        detections.tracker_id = result.boxes.id.cpu().numpy().astype(int)
        
        # contar todas as deteccoes do frame
        for identifier in result.boxes.id:
            id_int = int(identifier)
            if id_int in frames_detect_counter.keys(): 
                frames_detect_counter[id_int] = frames_detect_counter[id_int] + 1
            else:
                frames_detect_counter[id_int] = 1

    detections = detections[(detections.class_id == 0)]

    
    labels = [
        f"{tracker_id} {confidence:0.2f}"
        for _, confidence , _, tracker_id
        in detections
    ]

    frame = box_annotator.annotate(
        scene=frame, 
        detections=detections,
        labels=labels
    )

    # Escreve o quadro processado no arquivo de vídeo de saída
    output_video.write(frame)
    cv2.imwrite('nova_imagem.png', frame)
    
    cv2.imshow(model_name, frame)

    if (cv2.waitKey(30) == 27):
        break
        
# calcular o tempo que cada deteccao permaneceu no vídeo
video_detection_time = video_detection_time(frames_detect_counter, fps)

# Libera os objetos do vídeo e fecha a janela
input_video.release()
output_video.release()
cv2.destroyAllWindows()


image 1/1 /home/nomevini/Documentos/Iniciação Cientifica/Projeto/tracking_people_in_videos/app/yolov8/print.png: 384x640 13 persons, 106.2ms
Speed: 1.0ms preprocess, 106.2ms inference, 1.8ms postprocess per image at shape (1, 3, 640, 640)


TypeError: 'float' object cannot be interpreted as an integer

In [None]:
# O maximo id registrado corresponde a quantidade de pessoas que passaram pelo video
qtde_pessoas = int(max(result.boxes.id))
qtde_pessoas

In [None]:
# Cada boxes desse corresponde a uma das detecções daqueles frame
# cada posição nessa detecção corresponde a uma pessoa detectada
# com base nos seus id - 1 , ou seja, a pessoa de id 8, seu xyxy está em
## xyxy[7]
result.boxes.xyxy[12]

In [None]:
# confianca da deteccao
result.boxes.conf[12]

In [None]:
for x in result.boxes.id:
    print(int(x))

In [None]:
for id in result.boxes.id:
    frames_detect_counter[int(id)] = frames_detect_counter[int(id)] + 1

In [None]:
for id, qtde_frames in frames_detect_counter.items():
    print(id, qtde_frames)

In [None]:
frames_detect_counter

In [None]:
'''
CONTAR O TEMPO EM QUE CADA UM FICOU NO VÍDEO

para contar as pessoas, devo fazer um dicionario onde a chave é o id
de cada pessoa e o dado eh um contador de frames. 

para cada frame, eu devo iterar pela lista de ids encontrados e atualizar 
o contador de cada Pessoa.

Ao final, terei a quantidade de frames de cada pessoa no vídeo

Basta chamar a função que converte isso para minutos, que retornará
um dicionario ou lista com todos oS tempos desse ids 

chave = id, 
valor = tempo em horas, minutos e segundos


'''

In [None]:
import numpy as np
np.array(result.boxes.xywh[1])