In [None]:
import tensorflow as tf

print("TensorFlow version:", tf.__version__)
print("Num GPUs Available: ", len(tf.config.list_physical_devices('GPU')))
if tf.test.gpu_device_name():
    print('Default GPU Device: {}'.format(tf.test.gpu_device_name()))
else:
    print("TensorFlow did not find a GPU.")



TensorFlow version: 2.15.0
Num GPUs Available:  1
Default GPU Device: /device:GPU:0


In [None]:

# IMPORTANT: RUN THIS CELL IN ORDER TO IMPORT YOUR KAGGLE DATA SOURCES
# TO THE CORRECT LOCATION (/kaggle/input) IN YOUR NOTEBOOK,
# THEN FEEL FREE TO DELETE THIS CELL.
# NOTE: THIS NOTEBOOK ENVIRONMENT DIFFERS FROM KAGGLE'S PYTHON
# ENVIRONMENT SO THERE MAY BE MISSING LIBRARIES USED BY YOUR
# NOTEBOOK.

import os
import sys
from tempfile import NamedTemporaryFile
from urllib.request import urlopen
from urllib.parse import unquote, urlparse
from urllib.error import HTTPError
from zipfile import ZipFile
import tarfile
import shutil

CHUNK_SIZE = 40960
DATA_SOURCE_MAPPING = 'ucf-crime-dataset:https%3A%2F%2Fstorage.googleapis.com%2Fkaggle-data-sets%2F1710176%2F2799594%2Fbundle%2Farchive.zip%3FX-Goog-Algorithm%3DGOOG4-RSA-SHA256%26X-Goog-Credential%3Dgcp-kaggle-com%2540kaggle-161607.iam.gserviceaccount.com%252F20240316%252Fauto%252Fstorage%252Fgoog4_request%26X-Goog-Date%3D20240316T180501Z%26X-Goog-Expires%3D259200%26X-Goog-SignedHeaders%3Dhost%26X-Goog-Signature%3D2842d28577dc06e6747891ffef3075cd507e1f7e5a6bc04aa4eafe7f273aebcd7574fe1e576d9e3eae2964d49c2b7f7dfeed58763b867bf9911b99a4464aa01c60fdcf6b048a9f34ec496377044ae4f104fef33ac774acc5824925529d5bc7ca02f24f788255e618076495c92570393499899692488a4de35501bf3c0dde7fc6ec00c4f4f337eed350923e4c50cb68dc2895c9eefc1aa293517c80d74c453bc29f4319ba0e82f1a1bffd09c87718eed474b8cbed4a5aa34a8b51fad8f3b7f48c96ff0d200465648afceeaa1f973a0e9b655c586a64488b311d80ee7df7ab9a600c1216cc0b63069a3ea9a2d14f35af1b1ce9ebb7d2fe6b65fd2bc603c89aca78'

KAGGLE_INPUT_PATH='/kaggle/input'
KAGGLE_WORKING_PATH='/kaggle/working'
KAGGLE_SYMLINK='kaggle'

!umount /kaggle/input/ 2> /dev/null
shutil.rmtree('/kaggle/input', ignore_errors=True)
os.makedirs(KAGGLE_INPUT_PATH, 0o777, exist_ok=True)
os.makedirs(KAGGLE_WORKING_PATH, 0o777, exist_ok=True)

try:
  os.symlink(KAGGLE_INPUT_PATH, os.path.join("..", 'input'), target_is_directory=True)
except FileExistsError:
  pass
try:
  os.symlink(KAGGLE_WORKING_PATH, os.path.join("..", 'working'), target_is_directory=True)
except FileExistsError:
  pass

for data_source_mapping in DATA_SOURCE_MAPPING.split(','):
    directory, download_url_encoded = data_source_mapping.split(':')
    download_url = unquote(download_url_encoded)
    filename = urlparse(download_url).path
    destination_path = os.path.join(KAGGLE_INPUT_PATH, directory)
    try:
        with urlopen(download_url) as fileres, NamedTemporaryFile() as tfile:
            total_length = fileres.headers['content-length']
            print(f'Downloading {directory}, {total_length} bytes compressed')
            dl = 0
            data = fileres.read(CHUNK_SIZE)
            while len(data) > 0:
                dl += len(data)
                tfile.write(data)
                done = int(50 * dl / int(total_length))
                sys.stdout.write(f"\r[{'=' * done}{' ' * (50-done)}] {dl} bytes downloaded")
                sys.stdout.flush()
                data = fileres.read(CHUNK_SIZE)
            if filename.endswith('.zip'):
              with ZipFile(tfile) as zfile:
                zfile.extractall(destination_path)
            else:
              with tarfile.open(tfile.name) as tarfile:
                tarfile.extractall(destination_path)
            print(f'\nDownloaded and uncompressed: {directory}')
    except HTTPError as e:
        print(f'Failed to load (likely expired) {download_url} to path {destination_path}')
        continue
    except OSError as e:
        print(f'Failed to load {download_url} to path {destination_path}')
        continue

print('Data source import complete.')


Failed to load (likely expired) https://storage.googleapis.com/kaggle-data-sets/1710176/2799594/bundle/archive.zip?X-Goog-Algorithm=GOOG4-RSA-SHA256&X-Goog-Credential=gcp-kaggle-com%40kaggle-161607.iam.gserviceaccount.com%2F20240316%2Fauto%2Fstorage%2Fgoog4_request&X-Goog-Date=20240316T180501Z&X-Goog-Expires=259200&X-Goog-SignedHeaders=host&X-Goog-Signature=2842d28577dc06e6747891ffef3075cd507e1f7e5a6bc04aa4eafe7f273aebcd7574fe1e576d9e3eae2964d49c2b7f7dfeed58763b867bf9911b99a4464aa01c60fdcf6b048a9f34ec496377044ae4f104fef33ac774acc5824925529d5bc7ca02f24f788255e618076495c92570393499899692488a4de35501bf3c0dde7fc6ec00c4f4f337eed350923e4c50cb68dc2895c9eefc1aa293517c80d74c453bc29f4319ba0e82f1a1bffd09c87718eed474b8cbed4a5aa34a8b51fad8f3b7f48c96ff0d200465648afceeaa1f973a0e9b655c586a64488b311d80ee7df7ab9a600c1216cc0b63069a3ea9a2d14f35af1b1ce9ebb7d2fe6b65fd2bc603c89aca78 to path /kaggle/input/ucf-crime-dataset
Data source import complete.


In [None]:
!pip install image-classifiers
!pip install vit-keras



## Введение

Мы будем работать с набором данных UCF-Crime, крупномасштабным набором видеозаписей наблюдения, содержащим 128 часов реальных видеозаписей наблюдения. Набор данных состоит из 1900 длинных и неотрезанных видеороликов, которые зафиксировали различные аномальные активности, включая Злоупотребление, Арест, Поджог, Нападение, Дорожное происшествие, Кражу, Взрыв, Драку, Грабеж, Стрельбу, Кражу, Магазинный воровство и Вандализм. Эти аномалии были выбраны из-за их значительного воздействия на общественную безопасность. Этот набор данных может использоваться для двух основных задач:

* Задача 1: Общее обнаружение аномалий
В рамках этой задачи мы будем рассматривать все аномалии в одной группе и все нормальные активности в другой группе. Целью является разработка моделей, способных обнаруживать любую аномалию на видеозаписях наблюдения.

* Задача 2: Распознавание аномалий
Для этой задачи мы стремимся распознавать каждую из конкретных аномальных активностей индивидуально. Мы будем обучать модели идентифицировать и классифицировать каждый тип аномалии.

В качестве метрики качестве решения задачи мы будем использовать плошадь под AUC кривой для каждого класса аномалиий.

In [None]:
!pip install tensorflow_addons



In [None]:
import os
import glob

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
from matplotlib import animation, rc
rc('animation', html='jshtml')
import seaborn as sns
import plotly.express as px
import cv2
from tqdm import tqdm
from vit_keras import vit, utils
import tensorflow as tf
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from sklearn.preprocessing import LabelBinarizer
from sklearn.metrics import roc_curve, auc, roc_auc_score, accuracy_score
from classification_models.keras import Classifiers

from IPython.display import clear_output
import warnings
warnings.filterwarnings('ignore')

## Константы Эксперимента

In [None]:
TRAIN_DIR = "../input/ucf-crime-dataset/Train/"
TEST_DIR = "../input/ucf-crime-dataset/Test/"
NUM_CLASSES = 14
CLASS_LABELS = ['Abuse','Arrest','Arson','Assault',
                'Burglary','Explosion','Fighting',
                "Normal",'RoadAccidents','Robbery',
                'Shooting','Shoplifting','Stealing',
                'Vandalism']
CLASS_LABELS_NEW = ['Arrest','Assault',
                'Burglary','Explosion','Fighting',
                "Normal",'RoadAccidents','Robbery','Shoplifting','Stealing',]
CLASS_LABELS_1 = ['not normal','normal']
NUM_CLASSES_1 = 2
SEED = 42
np.random.seed(SEED)

## Загрузка данных и предварительная обработка

В этом разделе мы рассмотрим этапы загрузки данных и предварительной обработки. Это включает в себя чтение видеоданных, извлечение кадров и подготовку набора данных для обучения моделей.

In [None]:
data_hyperparams = {
    'img_size': (64, 64),
    'batch_size': 256,
    #'preprocessing_function': tf.keras.applications.densenet.preprocess_input,
}

### Проблема дисбаланса классов

Датасет, который нам представлен, имеет дисбаланс классов -- примеров с  меткой "Normal" сильно больше, чем остальных классов вместе взятых. Данное свойство может ухудшить качество обучения нейронной сети.

Для решений данной проблемы мы можем применить аугментацию примеров, неявляющихся классов "Normal" . Аугментация - это процесс улучшения или расширения данных изображения путем применения различных техник. Эти методы могут включать в себя изменение размеров, поворот, изменение контрастности и другие преобразования. Аугментация данных часто используется в машинном обучении, чтобы улучшить производительность модели на новых данных путем предоставления ей разнообразных вариантов входных изображений.


In [None]:
# Случайный перевод изображения в черно-белую цветовую схему
def random_grayscale(x):
    if np.random.randint(0, 2) == 1:
        return tf.image.rgb_to_grayscale(x)
    return x

train_datagen = ImageDataGenerator(
    rescale=1./255,  # Масштабирование значений пикселей в диапазон [0, 1]
    rotation_range=20,  # Угол поворота в градусах
    width_shift_range=0.2,  # Сдвиг по ширине
    height_shift_range=0.2,  # Сдвиг по высоте
    shear_range=0.2,  # Изгиб
    zoom_range=0.2,  # Масштабирование
    horizontal_flip=True,  # Горизонтальное отражение
    fill_mode='nearest',  # Заполнение пикселей после аугментации
    preprocessing_function=random_grayscale
)

test_datagen = ImageDataGenerator(
    rescale = 1./255
)

In [None]:
# Создадим список путей к файлам для создания обучающего датасета
filenames = []
labels = []

for root, subdirs, files in tqdm(os.walk(TRAIN_DIR)):
    for subdir in subdirs:
        for file in os.listdir(TRAIN_DIR+subdir):
            if file.lower().endswith('.png'):
                # Берём только половину кадров из нормального класса
                if subdir == 'NormalVideos':
                    if np.random.randint(0, 2) == 1:
                        filenames.append(TRAIN_DIR+subdir+'/'+file)
                        labels.append(subdir)
                else:
                    filenames.append(TRAIN_DIR+subdir+'/'+file)
                    labels.append(subdir)

df_train = pd.DataFrame({
    'filename': filenames,
    'class': labels
})
df_train.head()

0it [00:00, ?it/s]


Unnamed: 0,filename,class


In [None]:
indexNames = df_train[df_train['class'] == 'Shooting'].index
df_train.drop(indexNames, inplace=True)
indexNames = df_train[df_train['class'] == 'Vandalism'].index
df_train.drop(indexNames, inplace=True)
indexNames = df_train[df_train['class'] == 'Abuse'].index
df_train.drop(indexNames, inplace=True)
indexNames = df_train[df_train['class'] == 'Arson'].index
df_train.drop(indexNames, inplace=True)
df_train.head()

Unnamed: 0,filename,class


In [None]:
# Создадим список путей к файлам для создания тестового датасета
filenames = []
labels = []

for root, subdirs, files in tqdm(os.walk(TEST_DIR)):
    for subdir in subdirs:
        for file in os.listdir(TEST_DIR+subdir):
            if file.lower().endswith('.png'):
                # Берём только половину кадров из нормального класса
                if subdir == 'NormalVideos':
                    if np.random.randint(0, 2) == 1:
                        filenames.append(TEST_DIR+subdir+'/'+file)
                        labels.append(subdir)
                else:
                    filenames.append(TEST_DIR+subdir+'/'+file)
                    labels.append(subdir)

df_test = pd.DataFrame({
    'filename': filenames,
    'class': labels
})

df_test.head()

0it [00:00, ?it/s]


Unnamed: 0,filename,class


In [None]:
indexNames = df_test[df_test['class'] == 'Shooting'].index
df_test.drop(indexNames, inplace=True)
indexNames = df_test[df_test['class'] == 'Vandalism'].index
df_test.drop(indexNames, inplace=True)
indexNames = df_test[df_test['class'] == 'Abuse'].index
df_test.drop(indexNames, inplace=True)
indexNames = df_test[df_test['class'] == 'Arson'].index
df_test.drop(indexNames, inplace=True)
df_test.head()
df_train['class'].unique()

array([], dtype=float64)

In [None]:

df_train['main_class'] = df_train['class'].apply(lambda x: 'normal' if x == 'NormalVideos' else 'not normal')
df_test['main_class'] = df_test['class'].apply(lambda x:'normal' if x == 'NormalVideos' else 'not normal')
df_train['main_class'].unique()


array([], dtype=float64)

In [None]:
train_generator = train_datagen.flow_from_dataframe(
    df_train, directory=None,
    x_col='filename', y_col='main_class',
    weight_col=None,
    color_mode='rgb',
    class_mode='categorical',
    target_size = data_hyperparams['img_size'],
    batch_size = data_hyperparams['batch_size'],
    shuffle=True, seed=SEED,
    save_prefix='', save_format='png',
    subset=None, interpolation='nearest',
    validate_filenames=True
)
train_generator

KeyError: 'main_class'

In [None]:
test_generator = test_datagen.flow_from_dataframe(
    df_test, directory=None,
    x_col='filename', y_col='main_class',
    weight_col=None,
    color_mode='rgb',
    class_mode='categorical',
    target_size = data_hyperparams['img_size'],
    batch_size = data_hyperparams['batch_size'],
    shuffle=True, seed=SEED,
    save_prefix='', save_format='png',
    subset=None, interpolation='nearest',
    validate_filenames=True
)
test_generator

In [None]:
# Генерация и визуализация изображений после аугментации
for i in range(130,133):
    img, label = train_generator[i]
    plt.figure(figsize=(10, 10))
    for j in range(3):
        plt.subplot(1, 4, j+1)
        plt.imshow(img[j])
        plt.axis('off')
    plt.show()

## EDA (Исследовательский анализ данных)

Исследовательский анализ данных (EDA) является важным этапом для понимания набора данных и его характеристик. В этом разделе мы будем проводить EDA, чтобы получить представление о наборе данных UCF-Crime. Мы исследуем статистику, распределения и наличие каких-либо паттернов в данных.

### Распределение примеров по категориям

Важно рассмотреть распределение выборок по аномальным активностям и нормальным активностям. Мы визуализируем распределение классов, чтобы понять потенциальные дисбалансы классов.

In [None]:
fig = px.bar(x = CLASS_LABELS_1,
             y = [list(train_generator.classes).count(i)
                  for i in np.unique(train_generator.classes)] ,
             color = np.unique(train_generator.classes) ,
             color_continuous_scale="Viridis")
fig.update_xaxes(title="Classes")
fig.update_yaxes(title = "Number of Images")
fig.update_layout(showlegend = True,
    title = {
        'text': 'Train Data Distribution ',
        'y': 0.95,
        'x': 0.5,
        'xanchor': 'center',
        'yanchor': 'top'})
fig.show()

In [None]:
fig = px.bar(x = CLASS_LABELS_1,
             y = [list(test_generator.classes).count(i)
                  for i in np.unique(test_generator.classes)] ,
             color = np.unique(train_generator.classes) ,
             color_continuous_scale="Sunset")
fig.update_xaxes(title="Classes")
fig.update_yaxes(title = "Number of Images")
fig.update_layout(showlegend = True,
    title = {
        'text': 'Test Data Distribution ',
        'y':0.95,
        'x':0.5,
        'xanchor': 'center',
        'yanchor': 'top'})
fig.show()

### Распределение примеров нормального класса и остальных классов

In [None]:
n_total_train = len(train_generator.classes)
n_normal_train = list(train_generator.classes).count(CLASS_LABELS_1.index('normal'))

fig = px.bar(x = ['normal', 'not normal'],
             y = [n_normal_train, n_total_train-n_normal_train],
             color = ['normal', 'not normal'],
             color_continuous_scale="Viridis")
fig.update_xaxes(title="Classes")
fig.update_yaxes(title = "Number of Images")
fig.update_layout(showlegend = False,
    title = {
        'text': 'Train Data Distribution ',
        'y': 0.95,
        'x': 0.5,
        'xanchor': 'center',
        'yanchor': 'top'})
fig.show()

In [None]:
n_total_test = len(test_generator.classes)
n_normal_test = list(test_generator.classes).count(CLASS_LABELS_1.index('normal'))

fig = px.bar(x = ['Normal', 'Not Normal'],
             y = [n_normal_test, n_total_test-n_normal_test],
             color = ['Normal', 'Not Normal'],
             color_continuous_scale="Viridis")
fig.update_xaxes(title="Classes")
fig.update_yaxes(title = "Number of Images")
fig.update_layout(showlegend = False,
    title = {
        'text': 'Test Data Distribution ',
        'y': 0.95,
        'x': 0.5,
        'xanchor': 'center',
        'yanchor': 'top'})
fig.show()

### Визуализация индивидуального видео

Чтобы лучше понять содержание набора данных, мы выберем и визуализируем кадры из индивидуального видеоролика. Это поможет нам понять сложности и вариации в наборе данных.

In [None]:
def load_png_line(path):
    t_paths = sorted(
        glob.glob(os.path.join(path,"*")),
        key=lambda x: x,
    )
    images = []
    for i,filename in enumerate(np.array(t_paths)):
        if i%2==0:
            data = cv2.imread(filename)
            if data.max() == 0:
                continue
            images.append(data)
    return images


def create_animation(ims):
    fig=plt.figure(figsize=(6,6))
    plt.axis('off')
    im=plt.imshow(cv2.cvtColor(ims[0],cv2.COLOR_BGR2RGB))

    def animate_func(i):
        im.set_array(cv2.cvtColor(ims[i],cv2.COLOR_BGR2RGB))
        return [im]

    return animation.FuncAnimation(fig, animate_func, frames=len(ims), interval=1000//10)

In [None]:
category = 'Arson'  # category of crime to visualize
images = load_png_line(f"/kaggle/input/ucf-crime-dataset/Test/{category}")
create_animation(images)

In [None]:
category = 'Robbery'  # category of crime to visualize
images = load_png_line(f"/kaggle/input/ucf-crime-dataset/Test/{category}")
create_animation(images)

## Моделирование

В разделе моделирования мы разработаем и оценим различные модели для решения поставленной задачи. Общая архитектура каждой модели имеет следующий вид: извлечение признаков + классификатор.

### Классификатор

В качестве классификатора мы использует Многослойный персептрон (Multilayer Perceptron, MLP). MLP представляет собой нейронную сеть, состоящую из нескольких слоев нейронов, включая входной слой, один или несколько скрытых слоев и выходной слой.



In [None]:
mlp_hyperparams = {
    'pooling': 'average',
    'sizes': (64, 128, 256),
    'activations': ('relu', 'relu', 'relu'),
    'dropouts': (0.3, 0.3, 0.3),
    'num_classes': NUM_CLASSES_1
}

def mlp_classifier(inputs, hyperparams):
    if hyperparams['pooling'] == 'average':
        x = tf.keras.layers.GlobalAveragePooling2D()(inputs)
    else:
        x = inputs

    # hidden layers
    for i in range(len(hyperparams['sizes'])):
        x = tf.keras.layers.Dense(hyperparams['sizes'][i],
                                  activation=hyperparams['activations'][i])(x)
        x = tf.keras.layers.Dropout(hyperparams['dropouts'][i])(x)

    # output layer
    x = tf.keras.layers.Dense(hyperparams['num_classes'],
                              activation="softmax",
                              name="classification")(x)

    return x

### Вспомогательный функции для оценки качества модели

In [None]:
def evaluate(model, data_generator, model_name=''):
    y_test = []
    preds = []
    for idx, batch in tqdm(enumerate(data_generator)):
        batch_preds = model.predict(batch[0], verbose=False)
        preds.append(batch_preds)
        y_test.append(batch[1])  # Keep the original one-hot encoding
        if idx == len(data_generator) - 1:  # Correct the off-by-one error
            break

    y_test = np.concatenate(y_test)
    preds = np.concatenate(preds)

    fig, c_ax = plt.subplots(1,1, figsize = (15,8))

    def multiclass_roc_auc_score(y_test, y_pred, average="macro"):
        lb = LabelBinarizer()
        if y_test.shape[1] == 1:  # Binary classification
            y_test = lb.fit_transform(y_test)
        else:
            lb.fit(y_test)
            y_test = y_test
        y_pred = y_pred

        for (idx, c_label) in enumerate(CLASS_LABELS_1):  # Ensure CLASS_LABELS_1 matches the number of classes
            fpr, tpr, thresholds = roc_curve(y_test[:, idx].astype(int), y_pred[:, idx])
            c_ax.plot(fpr, tpr, lw=2, label='%s (AUC:%0.2f)' % (c_label, auc(fpr, tpr)))
        c_ax.plot(fpr, fpr, 'k--', lw=4, label='Random Guessing')
        roc_auc = roc_auc_score(y_test, y_pred, average=average)
        c_ax.legend(loc="lower right")
        plt.title(f'{model_name} ROC AUC = {roc_auc:.2f}')
        plt.show()

        return roc_auc

    roc_auc_score_value = multiclass_roc_auc_score(y_test, preds, average="micro")
    print('ROC AUC score:', roc_auc_score_value)
    return y_test, preds, roc_auc_score_value

## ResNet 50

Изучим качество предобученной на imagenet модели архитектуры [ResNet50](https://arxiv.org/abs/1512.03385) в качестве извлекателя признаков.



In [None]:
def resnet50_extractor(inputs, hyperparams):
    feature_extractor = tf.keras.applications.resnet50.ResNet50(
        include_top=False,
        weights='imagenet',
        input_shape=hyperparams['input_shape'],
        pooling=hyperparams['pooling'],
        classes=1000
    )(inputs)
    return feature_extractor

In [None]:
resnet50_hyperparams = {
    'input_shape': (64, 64, 3),
    'weights': "imagenet",
    'classes': 1000,
    'pooling': None,  # 'avg' или 'max'
    'trainable': False,
    'lr': 0.001
}

with tf.device('/GPU:0'):
  inputs = tf.keras.layers.Input(shape=resnet50_hyperparams['input_shape'])
  feature_extractor = resnet50_extractor(inputs, resnet50_hyperparams)
  classification_output = mlp_classifier(feature_extractor, mlp_hyperparams)
  model = tf.keras.Model(inputs=inputs, outputs = classification_output)
  model.layers[1].trainable = resnet50_hyperparams['trainable']
  model.compile(optimizer=tf.keras.optimizers.SGD(resnet50_hyperparams['lr']),
            loss='categorical_crossentropy',
            metrics = [tf.keras.metrics.AUC()])

clear_output()
model.summary()


In [None]:
history = model.fit(x = train_generator,
                    validation_data=test_generator,
                    epochs = 1)
model.save('my_model')


### Validation

In [None]:
y_test, preds, roc_auc_score = evaluate(model, test_generator, 'ResNet50')

In [None]:

threshold = 0.3

accuracy_results = {}
for i in range(len(CLASS_LABELS_1)):
    y_pred_i = preds[:, i] > threshold
    if y_test.ndim > 1:
        y_test_i = y_test[:, i] == 1
    else:
        y_test_i = y_test == i
    accuracy_results[CLASS_LABELS_1[i]] = accuracy_score(y_test_i, y_pred_i)

accuracy_results