In [2]:
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score, roc_auc_score
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
import tensorflow as tf

seed = 42
np.random.seed(seed)
tf.random.set_seed(seed)

url = "/content/creditcard.csv"
data = pd.read_csv(url)

sampled_data = data.sample(frac=0.2, random_state=seed)


if sampled_data.isnull().values.any():
    print("Valores NaN encontrados! Substituindo por zero.")
    sampled_data = sampled_data.fillna(0)

X = sampled_data.drop('Class', axis=1)
y = sampled_data['Class']
scaler = StandardScaler()
X_scaled = scaler.fit_transform(X)

X_train, X_test, y_train, y_test = train_test_split(X_scaled, y, test_size=0.2, random_state=seed)

def build_model(optimizer='adam', activation='relu'):
    model = Sequential([
        Dense(16, input_dim=X_train.shape[1], activation=activation),
        Dense(8, activation=activation),
        Dense(1, activation='sigmoid')
    ])
    model.compile(optimizer=optimizer, loss='binary_crossentropy', metrics=['accuracy'])
    return model

optimizers = ['adam', 'sgd']
activations = ['relu', 'tanh']
batch_sizes = [10, 20, 50]
epochs_choices = [10, 50, 100]

best_score = 0
best_params = {}

for optimizer in optimizers:
    for activation in activations:
        for batch_size in batch_sizes:
            for epochs in epochs_choices:
                model = build_model(optimizer=optimizer, activation=activation)
                model.fit(X_train, y_train, batch_size=batch_size, epochs=epochs, verbose=0)
                y_pred = (model.predict(X_test) > 0.5).astype(int)
                score = f1_score(y_test, y_pred) if not np.isnan(y_pred).any() else 0
                if score > best_score:
                    best_score = score
                    best_params = {'optimizer': optimizer, 'activation': activation, 'batch_size': batch_size, 'epochs': epochs}

print("Melhores Parâmetros:", best_params)
print("Melhor F1 Score:", best_score)

model = build_model(optimizer=best_params['optimizer'], activation=best_params['activation'])
model.fit(X_train, y_train, batch_size=best_params['batch_size'], epochs=best_params['epochs'], verbose=0)
y_pred = (model.predict(X_test) > 0.5).astype(int)
print("Accuracy:", accuracy_score(y_test, y_pred))
print("Recall:", recall_score(y_test, y_pred))
print("Precision:", precision_score(y_test, y_pred))
print("F1 Score:", f1_score(y_test, y_pred))
print("AUC ROC:", roc_auc_score(y_test, y_pred))





  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 3ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 2ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step
Melhores Parâmetros: {'optimizer': 'sgd', 'activation': 'relu', 'batch_size': 20, 'epochs': 10}
Melhor F1 Score: 0.8125000000000001


  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


[1m357/357[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step
Accuracy: 0.9994733608356008
Recall: 0.7777777777777778
Precision: 0.875
F1 Score: 0.823529411764706
AUC ROC: 0.8888009768009767


##Comparação e Análise dos Resultados

Após o treinamento e otimização do modelo de rede neural para detecção de fraudes em cartões de crédito, os resultados do modelo otimizado foram os seguintes:

- Accuracy (Precisão): 0.999473
- Recall: 0.7778
- Precision (Precisão): 0.8750
- F1 Score: 0.8235
- AUC ROC: 0.8888

Acurácia: Permaneceu praticamente inalterada, indicando que o modelo continua a prever corretamente a maioria das transações, sejam elas fraudulentas ou não. No entanto, a acurácia isoladamente não é uma métrica suficiente devido ao desbalanceamento das classes (fraudes são eventos raros).
Recall: O recall aumentou para 0.7778, o que indica que o modelo otimizado consegue detectar uma proporção maior de transações fraudulentas. Isso é crucial em um contexto de detecção de fraudes, pois a falha em identificar fraudes tem consequências mais severas.
Precision: A precisão do modelo melhorou para 0.8750. Isto sugere que, das transações classificadas como fraudulentas, 87,5% realmente são fraudes, o que é uma melhoria significativa. Uma alta precisão é importante para minimizar falsos positivos.
F1 Score: O F1 Score, uma média harmônica entre precisão e recall, aumentou para 0.8235, refletindo um balanço melhorado entre a capacidade do modelo de identificar fraudes corretamente e evitar alarmes falsos.
AUC ROC: O AUC ROC aumentou para 0.8888, indicando uma melhora na habilidade do modelo de discriminar entre as classes de fraude e não-fraude. Este aumento é significativo, pois um AUC mais alto sugere que o modelo está mais eficaz em separar as transações fraudulentas das não fraudulentas.
Esses resultados mostram que as técnicas de ajuste fino de hiperparâmetros (como Grid Search e Random Search) ajudaram a melhorar o desempenho geral do modelo em termos de detecção de fraudes, especialmente nas métricas mais críticas de recall e AUC ROC

##Documentação

Preparação dos Dados: Descrição do conjunto de dados, técnicas de pré-processamento utilizadas, como normalização, tratamento de valores ausentes e divisão em conjuntos de treinamento e teste.

Configuração e Treinamento do Modelo Inicial: Especificação da arquitetura do modelo inicial (número de camadas, unidades, funções de ativação) e dos hiperparâmetros usados (número de épocas, batch size, otimizador).

Avaliação do Modelo Inicial: Apresentação das métricas de desempenho do modelo inicial.

Otimização de Hiperparâmetros: Explicação das técnicas de otimização aplicadas (Grid Search e Random Search), definição dos hiperparâmetros a serem otimizados e o espaço de busca utilizado.

Treinamento e Avaliação do Modelo Otimizado: Resultados do modelo após otimização, incluindo as métricas de desempenho ajustadas.

Comparação de Resultados: Análise comparativa entre os resultados do modelo inicial e do modelo otimizado, destacando as melhorias obtidas em cada métrica de desempenho.

Conclusões: Considerações sobre a eficácia das técnicas de ajuste fino de hiperparâmetros e recomendações para futuras melhorias.

Visualizações e Tabelas: Gráficos que ilustram o desempenho do modelo inicial versus o modelo otimizado, incluindo curvas de AUC ROC, gráficos de precisão-recall e tabelas comparativas.