# 💳 Projeto SQL Athena: Análise de Crédito


Este notebook utiliza dados simulados processados em Amazon Athena e exportados como `.csv`, com o objetivo de identificar padrões de comportamento de clientes no uso do crédito.

## 📦 Dataset
Os arquivos estão armazenados em `/kaggle/input/sql-athena-projeto-de-crdito/`.

## 📌 Objetivos principais:
- Detectar clientes com uso ineficiente de crédito
- Identificar perfis de inadimplência
- Analisar padrões por sexo, idade, escolaridade e faixa salarial


In [None]:
import pandas as pd
import matplotlib.pyplot as plt

# Carregar dados
query1 = pd.read_csv("/kaggle/input/sql-athena-projeto-de-crdito/query_1.csv")
query2 = pd.read_csv("/kaggle/input/sql-athena-projeto-de-crdito/query_2.csv")
query3 = pd.read_csv("/kaggle/input/sql-athena-projeto-de-crdito/query_3.csv")
query4 = pd.read_csv("/kaggle/input/sql-athena-projeto-de-crdito/query_4.csv")
query5 = pd.read_csv("/kaggle/input/sql-athena-projeto-de-crdito/query_5.csv")
query6 = pd.read_csv("/kaggle/input/sql-athena-projeto-de-crdito/query_6.csv")
extra1 = pd.read_csv("/kaggle/input/sql-athena-projeto-de-crdito/query_extra_1.csv")
extra2 = pd.read_csv("/kaggle/input/sql-athena-projeto-de-crdito/query_extra_2.csv")
extra3 = pd.read_csv("/kaggle/input/sql-athena-projeto-de-crdito/query_extra_3.csv")


## 1️⃣ Faixa Salarial vs Limite e Gasto Médio

In [None]:
query1["media_limite"] = query1["media_limite"].round(2)
query1["media_gasto"] = query1["media_gasto"].round(2)

# Gráfico de barras
plt.figure(figsize=(10,5))
plt.barh(query1["salario_anual"], query1["media_limite"])
plt.title("Limite Médio por Faixa Salarial")
plt.xlabel("Limite Médio (R$)")
plt.ylabel("Faixa Salarial")
plt.gca().invert_yaxis()
plt.tight_layout()
plt.show()

query1


**Insight**: Clientes com salários mais altos têm limites maiores, mas o gasto médio é semelhante entre todas as faixas — o que sugere uma política de crédito com baixa aderência ao comportamento real de consumo.


## 2️⃣ Clientes com Alto Limite e Baixo Uso

In [None]:
query2


**Insight**: Cartões do tipo *blue* concentram clientes com alta subutilização. Estratégias de ativação como cashback ou upgrade podem ser aplicadas para aumentar engajamento.


## 3️⃣ Escolaridade vs Gasto e Transações

In [None]:
query3


**Insight**: Níveis mais altos de escolaridade não implicam maior gasto, mas mostram maior volume de transações — sugerindo maior controle ou uso estratégico do crédito.


## 4️⃣ Perfil de Clientes Inadimplentes

In [None]:
query4.head()


**Insight**: Há clientes inadimplentes com limite elevado e baixo uso. Política de concessão deve ser reavaliada, considerando risco de crédito e histórico.


## ✅ Conclusão


Este projeto mostra que há discrepâncias entre o limite concedido e o uso real do crédito. O banco pode otimizar sua carteira:

- Reduzindo limites ociosos
- Segmentando clientes pouco ativos
- Reavaliando critérios como escolaridade e idade
- Oferecendo produtos adequados ao comportamento detectado

📊 O próximo passo pode ser aplicar clusterização ou scoring preditivo com Machine Learning.
