# Otimização de Modelo Pré-Treinado para Detecção de Fraudes em Cartões de Crédito

## Inteli - Sistemas de Informação - Programação
- **Professor**👨‍🏫: Jefferson de Oliveira Silva
- **Aluno**👨‍🎓: Pedro de Carvalho Rezende

### Objetivo🚨
Otimizar um modelo de rede neural pré-treinado para detecção de fraudes em cartões de crédito. Aplicar técnicas avançadas de ajuste fino de hiperparâmetros, como grid search e random search, com o objetivo de aprimorar as métricas de desempenho do modelo, incluindo precisão, recall, F1-score e AUC-ROC. A atividade também exige uma comparação entre o modelo otimizado e o modelo original, permitindo avaliar o impacto das modificações nos hiperparâmetros sobre o desempenho geral.


### Instruções📃
Para realizar esta atividade, você deve começar treinando o modelo de rede neural para detecção de fraudes em cartões de crédito. Os dados do cartão podem ser encontrados no link de conteúdo. Depois, obtenha as métricas de desempenho deste modelo como a precisão, recall, F1-score e AUC-ROC.  

Em seguida, defina uma faixa de valores para os hiperparâmetros que deseja otimizar. Aplique técnicas de ajuste fino de hiperparâmetros para melhorar o desempenho do modelo. Você pode usar métodos como grid search e random search para encontrar as melhores combinações de hiperparâmetros.

Após otimizar o modelo, compare os resultados obtidos com os resultados do modelo original. Analise como as mudanças nos hiperparâmetros impactaram o desempenho, considerando cada uma das métricas mencionadas. Por fim, documente todas as etapas realizadas e as observações feitas durante o processo.

Entregue o link do caderno `.ipynb` em um repositório GitHub.

# Instalações e Importações

In [3]:
%pip install -q -r requirements.txt

Downloading...
From (original): https://drive.google.com/uc?id=1Scb-zICL_-JG4n31I5F5_FM5X53zerWi
From (redirected): https://drive.google.com/uc?id=1Scb-zICL_-JG4n31I5F5_FM5X53zerWi&confirm=t&uuid=3866de40-54c6-4bdf-b99f-d895604e9d7d
To: c:\Users\pedro\OneDrive\Documentos\C.1 - GitHub\M11_ponderadas\src\semana4\creditcard.csv

  0%|          | 0.00/151M [00:00<?, ?B/s]
  0%|          | 524k/151M [00:00<01:33, 1.60MB/s]
  1%|          | 1.57M/151M [00:00<00:36, 4.10MB/s]
  2%|▏         | 2.62M/151M [00:00<00:26, 5.51MB/s]
  2%|▏         | 3.67M/151M [00:00<00:24, 6.06MB/s]
  3%|▎         | 4.72M/151M [00:00<00:23, 6.15MB/s]
  4%|▍         | 5.77M/151M [00:01<00:23, 6.25MB/s]
  5%|▍         | 6.82M/151M [00:01<00:21, 6.60MB/s]
  5%|▌         | 7.86M/151M [00:01<00:19, 7.26MB/s]
  6%|▌         | 8.91M/151M [00:01<00:18, 7.69MB/s]
  7%|▋         | 9.96M/151M [00:01<00:17, 8.22MB/s]
  7%|▋         | 11.0M/151M [00:02<00:37, 3.77MB/s]
  8%|▊         | 12.1M/151M [00:02<00:47, 2.93MB/s]
  8%|▊

Note: you may need to restart the kernel to use updated packages.


In [4]:
import pandas as pd
import numpy as np
import plotly.graph_objs as go
from plotly.subplots import make_subplots
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

import tensorflow as tf
import keras
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense
from tensorflow.keras.metrics import BinaryAccuracy, AUC
from tensorflow.keras.optimizers import Adam
from tensorflow.keras.losses import BinaryCrossentropy

from sklearn.metrics import accuracy_score, f1_score
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler

In [5]:
# baixando o dataset utilizado
!gdown 1Scb-zICL_-JG4n31I5F5_FM5X53zerWi

Downloading...
From (original): https://drive.google.com/uc?id=1Scb-zICL_-JG4n31I5F5_FM5X53zerWi
From (redirected): https://drive.google.com/uc?id=1Scb-zICL_-JG4n31I5F5_FM5X53zerWi&confirm=t&uuid=f0a8a186-06bb-47e8-8b36-2b92592a3eda
To: c:\Users\pedro\OneDrive\Documentos\C.1 - GitHub\M11_ponderadas\src\semana4\creditcard.csv

  0%|          | 0.00/151M [00:00<?, ?B/s]
  0%|          | 524k/151M [00:00<01:16, 1.97MB/s]
  1%|▏         | 2.10M/151M [00:00<00:24, 6.12MB/s]
  3%|▎         | 4.19M/151M [00:00<00:14, 10.2MB/s]
  4%|▍         | 6.29M/151M [00:00<00:11, 13.1MB/s]
  6%|▌         | 8.39M/151M [00:00<00:09, 15.0MB/s]
  7%|▋         | 10.5M/151M [00:00<00:08, 16.6MB/s]
  8%|▊         | 12.6M/151M [00:00<00:08, 15.6MB/s]
 10%|▉         | 14.7M/151M [00:01<00:09, 15.1MB/s]
 11%|█         | 16.8M/151M [00:01<00:08, 15.2MB/s]
 13%|█▎        | 18.9M/151M [00:01<00:08, 15.0MB/s]
 14%|█▍        | 21.0M/151M [00:01<00:08, 15.3MB/s]
 15%|█▍        | 22.5M/151M [00:01<00:08, 14.3MB/s]
 16%|█

# Exploratória do Dataset

O dataset escolhido foi de Detecção de fraudes em cartões de crédito (https://drive.google.com/file/d/1nriPPuYUMXeB6BkCjz_bQI_45WZfxViC/view?usp=drive_link). 

Este dataset contém informações sobre jogos disponíveis na plataforma Steam, incluindo o nome do jogo, a descrição, o preço, a data de lançamento, a avaliação dos usuários, entre outras informações.

In [None]:
df = pd.read_csv('steam.csv', usecols= lambda col: col not in ['appid', 'english', 'required_age', 'platforms', 'steamspy_tags'])
df