## Librerias

In [4]:
#pip install tensorflow

In [7]:
#pip install keras

In [43]:
import os
import glob
import cv2
import numpy as np
import random
import matplotlib.pyplot as plt
import tensorflow as tf
import math
from PIL import Image
from math import log10, sqrt

from keras.models import Sequential
from keras.layers import Convolution2D
from keras.layers import MaxPooling2D
from keras.layers import Flatten
from keras.layers import Dense
from keras.layers import Input
from keras.layers import Dropout

from tensorflow.keras.callbacks import TensorBoard, ModelCheckpoint
from tensorflow import keras
from tensorflow.keras.regularizers import l2
from tensorflow.keras.layers import BatchNormalization
from tensorflow.keras.optimizers import Adam

## Lectura de imagenes

In [19]:
def leer_imagenes_automatico(img_path):
    # Obtener lista de archivos en la carpeta
    files_names = os.listdir(img_path)
    
    # Asegurar que sea un archivo de imagen
    image_extensions = ['.tiff', '.png', '.jpg', '.jpeg']
    image_files = [file for file in files_names if os.path.splitext(file)[1].lower() in image_extensions]
    
    # Crear un diccionario donde las claves son 'ruta_imagen_1', 'ruta_imagen_2', etc.
    rutas_imagenes = {}
    for i, file in enumerate(image_files):
        ruta_imagen = os.path.join(img_path, file)
        rutas_imagenes[f"ruta_imagen_{i+1}"] = ruta_imagen
    
    return rutas_imagenes

def procesar_imagenes(rutas_imagenes):
    imagenes_procesadas = {}
    
    for nombre_variable, ruta in rutas_imagenes.items():
        input_image1 = cv2.imread(ruta, cv2.IMREAD_COLOR)  # Leer la imagen
        input_image = cv2.cvtColor(input_image1, cv2.COLOR_BGR2RGB)  # Convertir a RGB
        input_image = cv2.resize(input_image, (320, 320))
        imagenes_procesadas[nombre_variable] = input_image
    
    return imagenes_procesadas

In [20]:
img_path_no_violence = r"C:\Users\Contratista\Documents\GitHub\proyecto_vision_PC\violence_dataset\non_violence"
img_path_violence = r"C:\Users\Contratista\Documents\GitHub\proyecto_vision_PC\violence_dataset\violence"
rutas_imagenes_no_violence = leer_imagenes_automatico(img_path_no_violence)
rutas_imagenes_violence = leer_imagenes_automatico(img_path_violence)

imagenes_no_violence = procesar_imagenes(rutas_imagenes_no_violence)
imagenes_violence = procesar_imagenes(rutas_imagenes_violence)

## Training y Testing

In [21]:
# Función training - testing
def split_data(data, train_size=0.8):
    split_point = int(train_size * len(data))
    return data[:split_point], data[split_point:]


In [22]:
# Daata aleatorizada
data_no_violence = [(0, img) for img in imagenes_no_violence]  # Etiqueta 0 para no violencia
data_violence = [(1, img) for img in imagenes_violence]  # Etiqueta 1 para violencia
random.Random(0).shuffle(data_no_violence)
random.Random(0).shuffle(data_violence)

# Dividir no violencia y violencia en entrenamiento y prueba
train_no_violence, test_no_violence = split_data(data_no_violence)
train_violence, test_violence = split_data(data_violence)

# Training y tetsing completo aleatorizado
train_data = train_no_violence + train_violence
test_data = test_no_violence + test_violence
random.Random(0).shuffle(train_data)
random.Random(0).shuffle(test_data)

In [27]:
#Verificar tamaño training - testing
print(len(imagenes_no_violence))
print(len(train_no_violence))
print(len(test_no_violence))

print(len(imagenes_no_violence))
print(len(train_violence))
print(len(test_no_violence))

5231
4184
1047
5231
4665
1047


In [32]:
# Arreglos 
x_train, y_train = [], []
x_test, y_test = [], []

for i, sample in enumerate(train_data):
    label = sample[0]
    img = sample[1]
    x_train.append(img)
    y_train.append(label)

for i, sample in enumerate(test_data):
    label = sample[0]
    img = sample[1]
    x_test.append(img)
    y_test.append(label)

# Convertir a arreglos de NumPy para TensorFlow
x_train = np.array(x_train)
x_test = np.array(x_test)

y_train = np.array(y_train)
y_test = np.array(y_test)


## One hot encoding

In [39]:
possible_labels = [0,1]
y_trainOneHot = tf.one_hot(y_train, len(possible_labels))
y_testOneHot = tf.one_hot(y_test, len(possible_labels))

## Red neuronal convolucional

Se construye y retorna una Red Neuronal Convolucional (CNN) con el siguiente flujo:

Capas convolucionales: Se utilizan varias capas convolucionales, cada una de ellas seguida por:
- Activación ReLU: Función de activación que introduce no linealidades en el modelo.
- Normalización por lotes (Batch Normalization): Ayuda a estabilizar y acelerar el entrenamiento normalizando la activación de cada capa.
- Max-Pooling: Reduce las dimensiones de las características, manteniendo las más relevantes y reduciendo el tamaño del modelo.
- Capas densas: Después de extraer las características mediante las capas convolucionales, se añaden capas densas (fully connected) para realizar la clasificación final.

Regularización L2: Se aplica para reducir el riesgo de sobreajuste, penalizando los pesos excesivamente grandes.

- Compilación del modelo: Se usa el optimizador Adam (Adaptive Moment Estimation), que ajusta los pesos del modelo de manera eficiente durante el entrenamiento. La función de pérdida utilizada es la entropía cruzada categórica, adecuada para problemas de clasificación multiclase.


Tomado de https://www.kaggle.com/code/kevinprieto20/deteccion-violencia/notebook#Insertando-los-datos-(training,-validacion-y-testing)-en-arrays-de-numpy


In [36]:
def cnn_model():
    model = Sequential()  # Modelo secuencial
    model.add(Input(shape=(320, 320, 3)))  # Capa de entrada para imágenes de 320x320 con 3 canales (RGB)
    
    # Primera capa convolucional
    model.add(Convolution2D(32, (3, 3), activation="relu", kernel_regularizer=l2(0.001)))  # 32 filtros 3x3, ReLU, regularización L2
    model.add(BatchNormalization())  # Normalización por lotes
    model.add(MaxPooling2D(pool_size=(2, 2)))  # Max-pooling para reducir dimensiones
    
    # Segunda capa convolucional
    model.add(Convolution2D(64, (3, 3), activation="relu", kernel_regularizer=l2(0.001)))  # 64 filtros 3x3, ReLU, regularización L2
    model.add(BatchNormalization())  # Normalización por lotes
    model.add(MaxPooling2D(pool_size=(2, 2)))  # Max-pooling para reducir dimensiones
    
    # Tercera capa convolucional
    model.add(Convolution2D(128, (3, 3), activation="relu", kernel_regularizer=l2(0.001)))  # 128 filtros 3x3, ReLU, regularización L2
    model.add(BatchNormalization())  # Normalización por lotes
    model.add(MaxPooling2D(pool_size=(2, 2)))  # Max-pooling para reducir dimensiones
    
    # Cuarta capa convolucional
    model.add(Convolution2D(256, (3, 3), activation="relu", kernel_regularizer=l2(0.001)))  # 256 filtros 3x3, ReLU, regularización L2
    model.add(BatchNormalization())  # Normalización por lotes
    model.add(MaxPooling2D(pool_size=(2, 2)))  # Max-pooling para reducir dimensiones
    
    model.add(Flatten())  # Aplana el tensor en una sola dimensión
    
    # Primera capa densa (fully connected)
    model.add(Dense(512, activation="relu", kernel_regularizer=l2(0.001)))  # Capa densa con 512 neuronas, ReLU, regularización L2
    model.add(BatchNormalization())  # Normalización por lotes
    
    # Segunda capa densa
    model.add(Dense(256, activation="relu", kernel_regularizer=l2(0.001)))  # Capa densa con 256 neuronas, ReLU, regularización L2
    model.add(BatchNormalization())  # Normalización por lotes
    
    # Capa de salida
    model.add(Dense(len(possible_labels), activation="softmax"))  # Capa de salida con softmax para clasificación multiclase
    
    # Compilación del modelo
    model.compile(optimizer="adam", loss="categorical_crossentropy", metrics=["accuracy"])  # Optimizador Adam, pérdida de entropía cruzada categórica
    return model  


In [42]:
model = cnn_model()
print(model.summary())

None


## Guardar el mejor modelo según el Accuracy

In [None]:
log_dir = "logs/cnn_logs/train"
os.makedirs(log_dir, exist_ok=True)
checkpoint = ModelCheckpoint('best_model.keras', monitor='val_accuracy', save_best_only=True, mode='max', verbose=1)
tensorboard_callback = TensorBoard(log_dir=log_dir, histogram_freq = 1)