In [None]:
import os
import cv2
from collections import defaultdict

In [None]:
video_dir = folders = [
    r"C:\Users\Olenka\Downloads\1-1004",
    r"C:\Users\Olenka\Downloads\1005-2004",
    r"C:\Users\Olenka\Downloads\2005-2804",
    r"C:\Users\Olenka\Downloads\2805-3319",
    r"C:\Users\Olenka\Downloads\3320-3954",
]

classes = ["A", "B1", "B2", "B4", "B5", "B6", "G"]

In [None]:
def extract_labels(file):
    parts = file[:-4].split("label_")
    if len(parts) < 2:
        return [0] * len(classes)
    return [1 if cls in parts[1].split('-') else 0 for cls in classes]


In [None]:
def get_video_duration_sec(video_path):
    cap = cv2.VideoCapture(video_path)
    if not cap.isOpened():
        return 0
    fps = cap.get(cv2.CAP_PROP_FPS)
    frames = cap.get(cv2.CAP_PROP_FRAME_COUNT)
    duration = frames / fps if fps > 0 else 0
    cap.release()
    return duration

In [None]:
class_counts = defaultdict(int)

for folder in video_dir:
    for file in os.listdir(folder):
        video_path = os.path.join(folder, file)
        duration = get_video_duration_sec(video_path)
        if duration <= 60:
            labels = extract_labels(file)
            if sum(labels) == 1:
                for i, val in enumerate(labels):
                    if val == 1:
                        class_counts[classes[i]] += 1



In [None]:
print("Кількість відео < 1 хв для кожного класу:")
for cls in classes:
    print(f"{cls}: {class_counts[cls]}")

In [None]:
import matplotlib.pyplot as plt

labels = list(class_counts.keys())
values = list(class_counts.values())

plt.figure(figsize=(10, 6))

bars = plt.bar(labels, values, color='skyblue', edgecolor='black', width=0.6)

plt.title("Кількість відео < 1 хв для кожного класу", fontsize=14)
plt.xlabel("Клас", fontsize=12)
plt.ylabel("Кількість відео", fontsize=12)
plt.grid(axis='y', linestyle='-', alpha=0.6)

plt.grid(axis='x', linestyle='-', alpha=0.6)
plt.tight_layout()
plt.show()


In [None]:
class_counts_2 = defaultdict(int)

for folder in video_dir:
    for file in os.listdir(folder):
        video_path = os.path.join(folder, file)
        duration = get_video_duration_sec(video_path)
        if 60 < duration <= 120:
            labels = extract_labels(file)
            if sum(labels) == 1:
                for i, val in enumerate(labels):
                    if val == 1:
                        class_counts_2[classes[i]] += 1

In [None]:
print("Кількість відео < 1 хв для кожного класу:")
for cls in classes:
    print(f"{cls}: {class_counts_2[cls]}")


In [None]:
labels = list(class_counts_2.keys())
values = list(class_counts_2.values())

plt.figure(figsize=(10, 6))

bars = plt.bar(labels, values, color='skyblue', edgecolor='black', width=0.6)

plt.title("Кількість відео тривалістю 61-120 секунд для кожного класу", fontsize=14)
plt.xlabel("Клас", fontsize=12)
plt.ylabel("Кількість відео", fontsize=12)
plt.grid(axis='y', linestyle='-', alpha=0.6)

plt.grid(axis='x', linestyle='-', alpha=0.6)
plt.tight_layout()
plt.show()


In [None]:
import numpy as np

durations = []
for folder in video_dir:
    for file in os.listdir(folder):
        video_path = os.path.join(folder, file)
        durations.append(get_video_duration_sec(video_path))

In [None]:
mean_duration = np.mean(durations)
median_duration = np.median(durations)
std_duration = np.std(durations)
min_duration = np.min(durations)
max_duration = np.max(durations)

print(f"Середня тривалість відео: {mean_duration:.2f} хв")
print(f"Медіанна тривалість відео: {median_duration:.2f} хв")
print(f"Стандартне відхилення: {std_duration:.2f} хв")
print(f"Мінімальна тривалість відео: {min_duration:.2f} хв")
print(f"Максимальна тривалість відео: {max_duration:.2f} хв")

In [None]:
fps = set()
for folder in video_dir:
    for file in os.listdir(folder):
        video_path = os.path.join(folder, file)
        cap = cv2.VideoCapture(video_path)
        fps.add(cap.get(cv2.CAP_PROP_FPS))
        
        cap.release()

print(f"FPS: {fps}")


In [None]:

video_lengths = {}
classes = ["A", "B1", "B2", "B4", "B5", "B6", "G"]
video_dir = "C:/Users/Olenka/PycharmProjects/violence_detection/train"
class_counts = defaultdict(float)


In [None]:
for video in os.listdir(video_dir):
    video_path = os.path.join(video_dir, video)
    duration = get_video_duration_sec(video_path)
    labels = extract_labels(video)
    for i, val in enumerate(labels):
        if val == 1:
            class_counts[classes[i]] += duration / 75

In [None]:
print(class_counts)

In [None]:
for cls in classes:
    print(f"{cls}: {class_counts[cls]}")