In [1]:
#!pip install tensorflow opencv-python numpy

In [2]:
import cv2
import numpy as np
from tensorflow.keras.applications.mobilenet import MobileNet, preprocess_input, decode_predictions
from tensorflow.keras.preprocessing import image

In [3]:
model = MobileNet(weights='imagenet')

In [4]:
def prepare_frame(frame):
    """Подготовка кадра для обработки моделью"""
    # Изменение размера до 224x224 (ожидаемый размер для MobileNet)
    frame_resized = cv2.resize(frame, (224, 224))
    # Конвертация в формат изображения (3 канала)
    img_array = image.img_to_array(frame_resized)
    # Добавление размерности батча
    img_array = np.expand_dims(img_array, axis=0)
    # Предобработка для MobileNet
    img_array = preprocess_input(img_array)
    return img_array


In [5]:
def predict_frame(frame):
    """Обработка кадра и предсказание классов"""
    # Подготовка кадра
    processed_frame = prepare_frame(frame)
    
    # Предсказание
    preds = model.predict(processed_frame)
    
    # Декодирование предсказаний
    decoded_preds = decode_predictions(preds, top=3)[0]  # Топ-3 предсказания
    
    return decoded_preds

In [6]:
def draw_predictions(frame, predictions):
    """Отрисовка предсказаний на кадре"""
    font = cv2.FONT_HERSHEY_SIMPLEX
    y_offset = 30
    
    for i, (imagenet_id, label, prob) in enumerate(predictions):
        text = f"{label}: {prob:.2f}"
        cv2.putText(frame, text, (10, y_offset + i*30), font, 0.7, (0, 255, 0), 2)
    
    return frame

In [7]:
def process_video(video_source=0):
    """Обработка видео потока"""
    cap = cv2.VideoCapture(video_source)
    
    if not cap.isOpened():
        print("Ошибка открытия видео потока")
        return
    
    while True:
        ret, frame = cap.read()
        if not ret:
            break
            
        # Создаем копию кадра для отображения
        display_frame = frame.copy()
        
        # Получаем предсказания
        predictions = predict_frame(frame)
        
        # Отрисовываем предсказания
        display_frame = draw_predictions(display_frame, predictions)
        
        # Показываем результат
        cv2.imshow('MobileNet Object Detection', display_frame)
        
        # Выход по нажатию 'q'
        if cv2.waitKey(1) & 0xFF == ord('q'):
            break
    
    cap.release()
    cv2.destroyAllWindows()

if __name__ == "__main__":
    print("Выберите источник видео:")
    print("1 - Веб-камера")
    print("2 - Видео файл")
    choice = input("Введите 1 или 2: ")
    
    if choice == '1':
        process_video(0)  # 0 - индекс веб-камеры по умолчанию
    elif choice == '2':
        video_path = input("Введите путь к видео файлу: ")
        process_video(video_path)
    else:
        print("Неверный выбор")

Выберите источник видео:
1 - Веб-камера
2 - Видео файл


Введите 1 или 2:  2
Введите путь к видео файлу:  C:\Users\Computer\Videos\2025-05-19 21-39-36.mkv


[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 533ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 41ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 40ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 42ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 38ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 38ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 38ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 38ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 40ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 40ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 39ms/step
[1m1/1[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m0s[0m 3