# 💳 Detecção de Fraudes em Transações com Cartão de Crédito

Este projeto tem como objetivo aplicar técnicas de ciência de dados para identificar transações financeiras fraudulentas usando algoritmos de machine learning.

In [None]:
# Bibliotecas
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.linear_model import LogisticRegression
from sklearn.ensemble import RandomForestClassifier
from xgboost import XGBClassifier
from sklearn.metrics import classification_report, confusion_matrix, roc_auc_score, roc_curve, precision_recall_curve

In [None]:
# Dataset simulado
from sklearn.datasets import make_classification
X, y = make_classification(n_samples=10000, n_features=30, n_classes=2, 
                           weights=[0.99], flip_y=0.01, random_state=42)
columns = [f'V{i}' for i in range(1, 29)]
df = pd.DataFrame(X, columns=['Time'] + columns + ['Amount'])
df['Class'] = y
df.head()

In [None]:
# Visualização da distribuição da classe
sns.countplot(x='Class', data=df)
plt.title('Distribuição das Classes (0 = Normal, 1 = Fraude)')
plt.show()

In [None]:
# Divisão de dados
X = df.drop('Class', axis=1)
y = df['Class']
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.3, stratify=y, random_state=42)

# Normalização
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [None]:
# Modelo: Random Forest
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train_scaled, y_train)
y_pred = model.predict(X_test_scaled)
y_proba = model.predict_proba(X_test_scaled)[:,1]

In [None]:
# Avaliação
print(confusion_matrix(y_test, y_pred))
print(classification_report(y_test, y_pred))
print("AUC:", roc_auc_score(y_test, y_proba))