## Otimização de Modelo Pré-Treinado para Detecção de Fraudes em Cartões de Crédito

### Descrição:

Otimizar um modelo de rede neural pré-treinado para detecção de fraudes em cartões de crédito. Aplicar técnicas avançadas de ajuste fino de hiperparâmetros, como grid search e random search, com o objetivo de aprimorar as métricas de desempenho do modelo, incluindo precisão, recall, F1-score e AUC-ROC. A atividade também exige uma comparação entre o modelo otimizado e o modelo original, permitindo avaliar o impacto das modificações nos hiperparâmetros sobre o desempenho geral.

### Instruções:

Para realizar esta atividade, você deve começar treinando o modelo de rede neural para detecção de fraudes em cartões de crédito. Os dados do cartão podem ser encontrados no link de conteúdo. Depois, obtenha as métricas de desempenho deste modelo como a precisão, recall, F1-score e AUC-ROC.  


Em seguida, defina uma faixa de valores para os hiperparâmetros que deseja otimizar. Aplique técnicas de ajuste fino de hiperparâmetros para melhorar o desempenho do modelo. Você pode usar métodos como grid search e random search para encontrar as melhores combinações de hiperparâmetros.


Após otimizar o modelo, compare os resultados obtidos com os resultados do modelo original. Analise como as mudanças nos hiperparâmetros impactaram o desempenho, considerando cada uma das métricas mencionadas. Por fim, documente todas as etapas realizadas e as observações feitas durante o processo.

In [62]:
import seaborn as sns
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import tensorflow as tf
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.utils import resample

In [63]:

print("\nCarregamento do dataset + primeiras linhas do dataset:")
df = pd.read_csv('/content/creditcard.csv.crdownload')
print(df.head())


Carregamento do dataset + primeiras linhas do dataset:
   Time        V1        V2        V3        V4        V5        V6        V7  \
0     0 -1.359807 -0.072781  2.536347  1.378155 -0.338321  0.462388  0.239599   
1     0  1.191857  0.266151  0.166480  0.448154  0.060018 -0.082361 -0.078803   
2     1 -1.358354 -1.340163  1.773209  0.379780 -0.503198  1.800499  0.791461   
3     1 -0.966272 -0.185226  1.792993 -0.863291 -0.010309  1.247203  0.237609   
4     2 -1.158233  0.877737  1.548718  0.403034 -0.407193  0.095921  0.592941   

         V8        V9  ...       V21       V22       V23       V24       V25  \
0  0.098698  0.363787  ... -0.018307  0.277838 -0.110474  0.066928  0.128539   
1  0.085102 -0.255425  ... -0.225775 -0.638672  0.101288 -0.339846  0.167170   
2  0.247676 -1.514654  ...  0.247998  0.771679  0.909412 -0.689281 -0.327642   
3  0.377436 -1.387024  ... -0.108300  0.005274 -0.190321 -1.175575  0.647376   
4 -0.270533  0.817739  ... -0.009431  0.798278 -0.137458 

In [64]:
print("\nInformações gerais sobre o dataset:")
print(df.info())


Informações gerais sobre o dataset:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 60185 entries, 0 to 60184
Data columns (total 31 columns):
 #   Column  Non-Null Count  Dtype  
---  ------  --------------  -----  
 0   Time    60185 non-null  int64  
 1   V1      60185 non-null  float64
 2   V2      60185 non-null  float64
 3   V3      60185 non-null  float64
 4   V4      60185 non-null  float64
 5   V5      60185 non-null  float64
 6   V6      60185 non-null  float64
 7   V7      60185 non-null  float64
 8   V8      60185 non-null  float64
 9   V9      60185 non-null  float64
 10  V10     60185 non-null  float64
 11  V11     60185 non-null  float64
 12  V12     60185 non-null  float64
 13  V13     60185 non-null  float64
 14  V14     60184 non-null  float64
 15  V15     60184 non-null  float64
 16  V16     60184 non-null  float64
 17  V17     60184 non-null  float64
 18  V18     60184 non-null  float64
 19  V19     60184 non-null  float64
 20  V20     60184 non-null  float64
 21

In [65]:
print("\nDescrição estatística do dataset:")
print(df.describe())


Descrição estatística do dataset:
               Time            V1            V2            V3            V4  \
count  60185.000000  60185.000000  60185.000000  60185.000000  60185.000000   
mean   31941.875550     -0.238644     -0.009610      0.688772      0.170824   
std    13711.051389      1.863046      1.655677      1.442914      1.384144   
min        0.000000    -56.407510    -72.715728    -32.965346     -5.172595   
25%    26391.000000     -0.994859     -0.581353      0.203717     -0.725951   
50%    35769.000000     -0.246692      0.075701      0.779575      0.184504   
75%    42219.000000      1.154741      0.732475      1.413276      1.052422   
max    49199.000000      1.960497     18.183626      4.101716     16.715537   

                 V5            V6            V7            V8            V9  \
count  60185.000000  60185.000000  60185.000000  60185.000000  60185.000000   
mean      -0.260232      0.102313     -0.114379      0.056342      0.059739   
std        1.391

In [66]:
print("\nValores ausentes por coluna:")
print(df.isnull().sum())


Valores ausentes por coluna:
Time      0
V1        0
V2        0
V3        0
V4        0
V5        0
V6        0
V7        0
V8        0
V9        0
V10       0
V11       0
V12       0
V13       0
V14       1
V15       1
V16       1
V17       1
V18       1
V19       1
V20       1
V21       1
V22       1
V23       1
V24       1
V25       1
V26       1
V27       1
V28       1
Amount    1
Class     1
dtype: int64


In [67]:
print("\nValores únicos em cada coluna:")
print(df.nunique())


Valores únicos em cada coluna:
Time      29446
V1        58904
V2        58904
V3        58904
V4        58904
V5        58904
V6        58904
V7        58904
V8        58904
V9        58904
V10       58904
V11       58904
V12       58904
V13       58904
V14       58903
V15       58903
V16       58903
V17       58903
V18       58903
V19       58903
V20       58903
V21       58903
V22       58903
V23       58903
V24       58903
V25       58903
V26       58903
V27       58903
V28       58903
Amount    14377
Class         2
dtype: int64


Balanceamento das classes:

In [68]:
df_majority = df[df.Class == 0]
df_minority = df[df.Class == 1]

df_minority_upsampled = resample(df_minority,
                                 replace=True,
                                 n_samples=len(df_majority),
                                 random_state=123)

df_balanced = pd.concat([df_majority, df_minority_upsampled])

Separação das características e rótulos:


In [69]:
X = df_balanced.drop('Class', axis=1)
y = df_balanced['Class']

Divisão em treino e teste:

In [70]:
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)


Normalização dos dados:

In [71]:
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

Tamanho do conjunto de treino e teste:

In [72]:
print("Tamanho do conjunto de treino:", X_train.shape)
print("Tamanho do conjunto de teste:", X_test.shape)

Tamanho do conjunto de treino: (84029, 30)
Tamanho do conjunto de teste: (36013, 30)


### Modelo de Rede Neural


#### Construção do Modelo:
Rede neural simples com duas camadas escondidas:
- Primeira camada: 16 neurônios, função de ativação ReLU.
- Segunda camada: 8 neurônios, função de ativação ReLU.
- Camada de saída: 1 neurônio com ativação sigmoide para prever a classe (0 ou 1).

#### Compilação:
- Otimizador escolhido é o Adam.
- Função de perda é binary_crossentropy porque é um problema de classificação binária.

#### Treinamento:
- O modelo é treinado por 10 épocas com um batch_size de 32.
- Foi utilizado 20% dos dados de treino para validação.

#### Avaliação:
- As previsões (y_pred) são comparadas com os valores reais para calcular as métricas de desempenho.
- O relatório de classificação fornece precisão, recall, F1-score e suporte para cada classe.
- O AUC-ROC é calculado para avaliar a capacidade do modelo em distinguir entre as classes.

In [73]:
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from sklearn.metrics import classification_report, roc_auc_score

Construção do modelo de rede neural:

In [74]:
model = Sequential([
    Dense(16, activation='relu', input_shape=(X_train.shape[1],)),
    Dense(8, activation='relu'),
    Dense(1, activation='sigmoid')
])

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)


Compilação do modelo:

In [75]:
model.compile(optimizer='adam',
              loss='binary_crossentropy',
              metrics=['accuracy'])

Treinamento do modelo:

In [76]:
history = model.fit(X_train, y_train, epochs=10, batch_size=32, validation_split=0.2, verbose=1)


Epoch 1/10
[1m2101/2101[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 2ms/step - accuracy: 0.9133 - loss: 0.2081 - val_accuracy: 0.9766 - val_loss: 0.0500
Epoch 2/10
[1m2101/2101[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 2ms/step - accuracy: 0.9869 - loss: 0.0388 - val_accuracy: 0.9930 - val_loss: 0.0250
Epoch 3/10
[1m2101/2101[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m6s[0m 2ms/step - accuracy: 0.9957 - loss: 0.0219 - val_accuracy: 0.9923 - val_loss: 0.0238
Epoch 4/10
[1m2101/2101[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m4s[0m 2ms/step - accuracy: 0.9971 - loss: 0.0153 - val_accuracy: 0.9968 - val_loss: 0.0131
Epoch 5/10
[1m2101/2101[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 2ms/step - accuracy: 0.9979 - loss: 0.0112 - val_accuracy: 0.9977 - val_loss: 0.0105
Epoch 6/10
[1m2101/2101[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m5s[0m 2ms/step - accuracy: 0.9984 - loss: 0.0095 - val_accuracy: 0.9980 - val_loss: 0.0096
Epoch 7/10
[1m2

Avaliação do modelo:

In [77]:
y_pred = model.predict(X_test)
y_pred_classes = (y_pred > 0.5).astype("int32")

[1m1126/1126[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step


Métricas de desempenho:

In [78]:
print("Relatório de Classificação:\n", classification_report(y_test, y_pred_classes))
print("AUC-ROC:", roc_auc_score(y_test, y_pred))

Relatório de Classificação:
               precision    recall  f1-score   support

         0.0       0.99      1.00      1.00     18141
         1.0       1.00      0.99      1.00     17872

    accuracy                           1.00     36013
   macro avg       1.00      1.00      1.00     36013
weighted avg       1.00      1.00      1.00     36013

AUC-ROC: 0.9998759098688642


### Hiperparâmetros

- Grid Search: Explora todas as combinações possíveis dos hiperparâmetros fornecidos.
- Random Search: Explora um subconjunto aleatório das combinações possíveis, o que pode ser mais rápido em grandes espaços de busca.

### Grid Search


In [79]:
pip install keras-tuner




In [80]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import precision_recall_fscore_support, roc_auc_score
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
import keras_tuner as kt
import plotly.graph_objs as go
import plotly.express as px

In [81]:
# Balanceamento das classes
from sklearn.utils import resample

df_majority = df[df.Class == 0]
df_minority = df[df.Class == 1]

df_minority_upsampled = resample(df_minority,
                                 replace=True,  # sample with replacement
                                 n_samples=len(df_majority),  # to match majority class
                                 random_state=123)  # reproducible results

df_balanced = pd.concat([df_majority, df_minority_upsampled])

# Separar características e rótulos
X = df_balanced.drop('Class', axis=1)
y = df_balanced['Class']

# Dividir em treino e teste
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, random_state=42)

# Normalizar os dados
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Verificar shapes dos conjuntos de treino e teste
print("Tamanho do conjunto de treino:", X_train.shape)
print("Tamanho do conjunto de teste:", X_test.shape)

# Definir a função para construir o modelo
def build_model(hp):
    model = Sequential()
    model.add(Dense(units=hp.Int('units_1', min_value=16, max_value=64, step=16), activation='relu', input_shape=(X_train.shape[1],)))
    model.add(Dense(units=hp.Int('units_2', min_value=8, max_value=32, step=8), activation='relu'))
    model.add(Dense(1, activation='sigmoid'))

    model.compile(optimizer=hp.Choice('optimizer', values=['adam', 'rmsprop']),
                  loss='binary_crossentropy',
                  metrics=['accuracy'])
    return model

# Criar o tuner
tuner = kt.RandomSearch(
    build_model,
    objective='val_accuracy',
    max_trials=10,
    executions_per_trial=1,
    directory='kt_dir',
    project_name='credit_card_fraud_detection'
)

# Realizar a busca de hiperparâmetros
tuner.search(X_train, y_train, epochs=10, validation_split=0.2, batch_size=32, verbose=1)

# Obter o melhor modelo
best_model = tuner.get_best_models(num_models=1)[0]

# Avaliar o modelo
y_pred = best_model.predict(X_test)
y_pred_classes = (y_pred > 0.5).astype("int32")

# Obter as métricas de desempenho
precision, recall, f1_score, _ = precision_recall_fscore_support(y_test, y_pred_classes, average='binary')
print("Precision:", precision)
print("Recall:", recall)
print("F1 Score:", f1_score)
print("AUC-ROC:", roc_auc_score(y_test, y_pred))


Trial 10 Complete [00h 00m 55s]
val_accuracy: 0.9993454813957214

Best val_accuracy So Far: 0.9995239973068237
Total elapsed time: 00h 10m 33s
[1m   1/1126[0m [37m━━━━━━━━━━━━━━━━━━━━[0m [1m56s[0m 51ms/step

  super().__init__(activity_regularizer=activity_regularizer, **kwargs)
  saveable.load_own_variables(weights_store.get(inner_path))


[1m1126/1126[0m [32m━━━━━━━━━━━━━━━━━━━━[0m[37m[0m [1m1s[0m 1ms/step
Precision: 0.9995525727069351
Recall: 1.0
F1 Score: 0.999776236294473
AUC-ROC: 0.999991400793259
