# 6. Modelo Combinado (Ensemble)

Nessa etapa combinamos os melhores modelos. No caso como não foi possível fazer um treinamento com a base mista, excluí dessa combinação o modelo EfficientNetV2 visto que nos teste ele não generalizou e preveu todos como “fake”, errando assim todos os vídeos reais.

Dessa forma o nosso “Ensemble” contará com o modelo Mesonet e o melhor modelo de decomposição de espectro. Como o modelo de decomposição é composto de duas etapas, decomposição da imagem em um array e classificação com um modelo tradicional (Regressão logística ou SVM), tínhamos algumas variações para comparar. Optei pelo modelo que utiliza um SVM com os parametros (SVC(C=6.37, kernel='rbf', gamma=0.86)) que obteve os melhores resultados.

A combinação foi feita através de uma função que roda os dois modelos, captura as predições e calcula aplicando como peso a média das acurácias que obtivemos nos testes anteriores.

Esse cálculo é aplicado para cada predição (face extraída do vídeo), e o resultado final é a média.
A combinação foi feita através de uma função que roda os dois modelos, captura as predições e calcula aplicando como peso a média das acurácias que obtivemos nos testes anteriores.

$$
\text{Prob.Deepfake} = \frac{{(\text{prob.model1} \times \text{peso1}) + (\text{prob.model2} \times \text{peso2})}}{{\text{peso1} + \text{peso2}}}
$$

Esse cálculo é aplicado para cada predição (face extraída do vídeo), e o resultado final é a média de todas as predições.


## Modelo

In [None]:
import mlflow
mlflow.set_experiment('Projeto Aplicado XPE - Detector de Deep Fake')
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
from tensorflow.keras.layers import Input, Dense, Flatten, Conv2D, MaxPooling2D, BatchNormalization, Dropout, Reshape, Concatenate, LeakyReLU
from tensorflow.keras.preprocessing.image import ImageDataGenerator
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.models import Model
import pickle
from scipy.interpolate import griddata
from glob import glob
import cv2
import shutil
import os
from sklearn.metrics import accuracy_score
from sklearn.metrics import confusion_matrix
from sklearn.metrics import classification_report
from sklearn.metrics import roc_curve, roc_auc_score

# Tamanho a imagem e canais
image_dimensions = {'height':256, 'width':256, 'channels':3}

# Classe do classificador
class Classifier:
    def __init__():
        self.model = 0 
    def predict(self, x):
        return self.model.predict(x)  
    def fit(self, x, y):
        return self.model.train_on_batch(x, y)
    def get_accuracy(self, x, y):
        return self.model.test_on_batch(x, y)
    def load(self, path):
        self.model.load_weights(path)

# Rede Mesonet usando o Classificador
class Meso4(Classifier):
    def __init__(self, learning_rate = 0.001):
        self.model = self.init_model()
        optimizer = Adam(lr = learning_rate)
        self.model.compile(optimizer = optimizer,
                           loss = 'mean_squared_error',
                           metrics = ['accuracy'])
    
    def init_model(self): 
        x = Input(shape = (image_dimensions['height'],
                           image_dimensions['width'],
                           image_dimensions['channels']))
        
        x1 = Conv2D(8, (3, 3), padding='same', activation = 'relu')(x)
        x1 = BatchNormalization()(x1)
        x1 = MaxPooling2D(pool_size=(2, 2), padding='same')(x1)
        
        x2 = Conv2D(8, (5, 5), padding='same', activation = 'relu')(x1)
        x2 = BatchNormalization()(x2)
        x2 = MaxPooling2D(pool_size=(2, 2), padding='same')(x2)
        
        x3 = Conv2D(16, (5, 5), padding='same', activation = 'relu')(x2)
        x3 = BatchNormalization()(x3)
        x3 = MaxPooling2D(pool_size=(2, 2), padding='same')(x3)
        
        x4 = Conv2D(16, (5, 5), padding='same', activation = 'relu')(x3)
        x4 = BatchNormalization()(x4)
        x4 = MaxPooling2D(pool_size=(4, 4), padding='same')(x4)
        
        y = Flatten()(x4)
        y = Dropout(0.5)(y)
        y = Dense(16)(y)
        y = LeakyReLU(alpha=0.1)(y)
        y = Dropout(0.5)(y)
        y = Dense(1, activation = 'sigmoid')(y)

        return Model(inputs = x, outputs = y)
    
# Utilização de pesos já treinados
meso = Meso4()
meso.load('../src/models/Meso4_DF.h5')

def modelo_meso4():
    dataGenerator = ImageDataGenerator(rescale=1./255)
    directory = '../data/interim/'
    generator = dataGenerator.flow_from_directory(
        directory,
        target_size=(256, 256),
        class_mode=None,
        batch_size=1,
        shuffle=False
    )
    frame = []
    real = []
    fake = []
    for i in range(10):
        X = generator.next()
        pred = meso.predict(X)[0][0]
        frame.append(i)
        real.append(pred)
        fake.append(1-pred)
    resultado_real = sum(real)/len(real)
    resultado_fake = 1 - resultado_real
    return (frame,real,fake,resultado_real,resultado_fake)

# Modelo de análise de Espectro:
def azimuthalAverage(image, center=None):
    y, x = np.indices(image.shape)
    if not center:
        center = np.array([(x.max()-x.min())/2.0, (y.max()-y.min())/2.0])
    r = np.hypot(x - center[0], y - center[1])
    ind = np.argsort(r.flat)
    r_sorted = r.flat[ind]
    i_sorted = image.flat[ind]
    r_int = r_sorted.astype(int)
    deltar = r_int[1:] - r_int[:-1]
    rind = np.where(deltar)[0]
    nr = rind[1:] - rind[:-1]
    csim = np.cumsum(i_sorted, dtype=float)
    tbin = csim[rind[1:]] - csim[rind[:-1]]
    radial_prof = tbin / nr
    return radial_prof
modelo_espec = pickle.load(open('../src/models/model_espectro.pkl','rb'))

def modelo_analise_de_espectro():
    epsilon = 1e-8
    N = 300
    number_iter = 10
    psd1D_total = np.zeros([number_iter, N])
    label_total = np.zeros([number_iter])
    cont = 0
    real = []
    fake = []
    for face in glob('../data/interim/faces/*jpg'):
        img = cv2.imread(face,0)
        f = np.fft.fft2(img)
        fshift = np.fft.fftshift(f)
        fshift += epsilon
        magnitude_spectrum = 20*np.log(np.abs(fshift))
        psd1D = azimuthalAverage(magnitude_spectrum)
        points = np.linspace(0,N,num=psd1D.size) 
        xi = np.linspace(0,N,num=N)
        interpolated = griddata(points,psd1D,xi,method='cubic')
        interpolated /= interpolated[0]
        psd1D_total[cont,:] = interpolated             
        label_total[cont] = 1
        cont+=1     
    pred = modelo_espec.predict(psd1D_total)
    real = list(pred)
    fake = list(1-pred)
    resultado_real = sum(real)/len(real)
    resultado_fake = 1 - resultado_real
    return (real,fake,resultado_real,resultado_fake)

# função que combina os modelos e calcula o resultado ponderado
def roda_modelo():
    modelo1 = modelo_meso4()
    frame = modelo1[0]
    modelo2 = modelo_analise_de_espectro()
    peso1 = 0.616
    peso2 = 0.707
    peso_total = peso1+peso2
    real_modelo1 =[]
    real_modelo2 =[]
    fake_modelo1 =[]
    fake_modelo2 =[]
    real = []
    fake = []
    for i in modelo1[1]: real_modelo1.append(i*peso1)
    for i in modelo2[0]: real_modelo2.append(i*peso2)
    for i in modelo1[2]: fake_modelo1.append(i*peso1)
    for i in modelo2[1]: fake_modelo2.append(i*peso2)
    for i in [x + y for x, y in zip(real_modelo1, real_modelo2)]: real.append(i/peso_total)
    for i in [x + y for x, y in zip(fake_modelo1, fake_modelo2)]: fake.append(i/peso_total)
    resultado_real = sum(real)/len(real)
    resultado_fake = 1 - resultado_real
    return (frame,real,fake,resultado_real,resultado_fake)
 


***
## Teste do modelo

### Dataset CELEBDF

In [None]:
# dataframe
dataset = 'celebdf'
dataframe_faces= pd.read_csv('../data/processed/dataset_'+dataset+'/metadados_faces.csv', sep=';', dtype=str)
dataframe_faces_teste = dataframe_faces[dataframe_faces['particao']=='teste'].reset_index(drop=True)
# Predição
teste_ensemble_label = []
teste_ensemble_proba = []
for i in dataframe_faces_teste['face']:
    path_interim = i.replace('processed/dataset_celebdf/','interim/faces/').replace('real_face/','').replace('fake_face/','')
    shutil.copy(i,path_interim)
    pred = roda_modelo()
    teste_ensemble_label.append(pred[3].round())
    teste_ensemble_proba.append(pred[3].round(4))
    os.remove(path_interim) 
dataframe_faces_teste['test_pred_label'] = teste_ensemble_label
dataframe_faces_teste['test_pred'] = teste_ensemble_proba
dataframe_faces_teste.head()


In [12]:
# captura de resultados:
previsoes = dataframe_faces_teste['test_pred_label'].astype(int)
y = dataframe_faces_teste['label'].astype(int)
prob_previsao = dataframe_faces_teste['test_pred']
processamento = 'Ensemble_'+dataset
with mlflow.start_run(run_name=processamento):
    report = classification_report(y, previsoes, output_dict=True)
    acuracia = accuracy_score(y, previsoes)
    mlflow.log_metric('accuracy', acuracia)
    mlflow.log_metric('precision_0', report['0']['precision'])
    mlflow.log_metric('recall_0', report['0']['recall'])
    mlflow.log_metric('f1-score_0', report['0']['f1-score'])
    mlflow.log_metric('precision_1', report['1']['precision'])
    mlflow.log_metric('recall_1', report['1']['recall'])
    mlflow.log_metric('f1-score_1', report['1']['f1-score'])
    auc = roc_auc_score(y, prob_previsao)
    mlflow.log_metric('roc_auc',auc)
    matriz_confusao = confusion_matrix(y,previsoes)
    mlflow.log_metric('0_True_matrix' ,matriz_confusao[0][0])
    mlflow.log_metric('0_False_matrix', matriz_confusao[0][1])
    mlflow.log_metric('1_False_matrix',matriz_confusao[1][0])
    mlflow.log_metric('1_True_matrix',matriz_confusao[1][1])

### Dataset Faceforensics

In [None]:
# dataframe
dataset = 'faceforensics'
dataframe_faces= pd.read_csv('../data/processed/dataset_'+dataset+'/metadados_faces.csv', sep=';', dtype=str)
dataframe_faces_teste = dataframe_faces[dataframe_faces['particao']=='teste'].reset_index(drop=True)
# Predição
teste_ensemble_label = []
teste_ensemble_proba = []
for i in dataframe_faces_teste['face']:
    path_interim = i.replace('processed/dataset_faceforensics/','interim/faces/').replace('real_face/','').replace('fake_face/','')
    shutil.copy(i,path_interim)
    pred = roda_modelo()
    teste_ensemble_label.append(pred[3].round())
    teste_ensemble_proba.append(pred[3].round(4))
    os.remove(path_interim) 

In [14]:
# Captura de resultados
dataframe_faces_teste['test_pred_label'] = teste_ensemble_label
dataframe_faces_teste['test_pred'] = teste_ensemble_proba
previsoes = dataframe_faces_teste['test_pred_label'].astype(int)
y = dataframe_faces_teste['label'].astype(int)
prob_previsao = dataframe_faces_teste['test_pred']
processamento = 'Ensemble_'+dataset
with mlflow.start_run(run_name=processamento):
    report = classification_report(y, previsoes, output_dict=True)
    acuracia = accuracy_score(y, previsoes)
    mlflow.log_metric('accuracy', acuracia)
    mlflow.log_metric('precision_0', report['0']['precision'])
    mlflow.log_metric('recall_0', report['0']['recall'])
    mlflow.log_metric('f1-score_0', report['0']['f1-score'])
    mlflow.log_metric('precision_1', report['1']['precision'])
    mlflow.log_metric('recall_1', report['1']['recall'])
    mlflow.log_metric('f1-score_1', report['1']['f1-score'])
    auc = roc_auc_score(y, prob_previsao)
    mlflow.log_metric('roc_auc',auc)
    matriz_confusao = confusion_matrix(y,previsoes)
    mlflow.log_metric('0_True_matrix' ,matriz_confusao[0][0])
    mlflow.log_metric('0_False_matrix', matriz_confusao[0][1])
    mlflow.log_metric('1_False_matrix',matriz_confusao[1][0])
    mlflow.log_metric('1_True_matrix',matriz_confusao[1][1])

### Dataset DFDC

In [None]:
# dataframe
dataset = 'dfdc'
dataframe_faces= pd.read_csv('../data/processed/dataset_'+dataset+'/metadados_faces.csv', sep=';', dtype=str)
dataframe_faces_teste = dataframe_faces[dataframe_faces['particao']=='teste'].reset_index(drop=True)
# Predição
teste_ensemble_label = []
teste_ensemble_proba = []
for i in dataframe_faces_teste['face']:
    path_interim = i.replace('processed/dataset_dfdc/','interim/faces/').replace('real_face/','').replace('fake_face/','')
    shutil.copy(i,path_interim)
    pred = roda_modelo()
    teste_ensemble_label.append(pred[3].round())
    teste_ensemble_proba.append(pred[3].round(4))
    os.remove(path_interim) 

In [16]:
# Captura de resultados
dataframe_faces_teste['test_pred_label'] = teste_ensemble_label
dataframe_faces_teste['test_pred'] = teste_ensemble_proba
previsoes = dataframe_faces_teste['test_pred_label'].astype(int)
y = dataframe_faces_teste['label'].astype(int)
prob_previsao = dataframe_faces_teste['test_pred']
processamento = 'Ensemble_'+dataset
with mlflow.start_run(run_name=processamento): 
    report = classification_report(y, previsoes, output_dict=True)
    acuracia = accuracy_score(y, previsoes)
    mlflow.log_metric('accuracy', acuracia)
    mlflow.log_metric('precision_0', report['0']['precision'])
    mlflow.log_metric('recall_0', report['0']['recall'])
    mlflow.log_metric('f1-score_0', report['0']['f1-score'])
    mlflow.log_metric('precision_1', report['1']['precision'])
    mlflow.log_metric('recall_1', report['1']['recall'])
    mlflow.log_metric('f1-score_1', report['1']['f1-score'])
    auc = roc_auc_score(y, prob_previsao)
    mlflow.log_metric('roc_auc',auc)
    matriz_confusao = confusion_matrix(y,previsoes)
    mlflow.log_metric('0_True_matrix' ,matriz_confusao[0][0])
    mlflow.log_metric('0_False_matrix', matriz_confusao[0][1])
    mlflow.log_metric('1_False_matrix',matriz_confusao[1][0])
    mlflow.log_metric('1_True_matrix',matriz_confusao[1][1])