# Cr√©dito

<p style="text-align: center"><img src="./static/img/cover.png" width="500" height="500" alt="Imagem gr√°fica com nome cr√©dito e an√°lise."></p>


------
<b><p style="text-align: center"> An√°lise de Cr√©dito</p></b>

Com o intuito de otimizar as decis√µes de cr√©dito e reduzir o risco de inadimpl√™ncia, realizaremos uma an√°lise detalhada dos dados de cr√©dito, utilizando SQL. A identifica√ß√£o de padr√µes e tend√™ncias entre as diferentes classes econ√¥micas e sexos permitir√° a cria√ß√£o de modelos de cr√©dito mais precisos e eficazes.

Os dados utilizados nesta an√°lise foram extra√≠dos de um reposit√≥rio [GitHub](https://github.com/andre-marcos-perez/ebac-course-utils/tree/main/dataset). A base de dados cont√©m informa√ß√µes sobre as transa√ß√µes de cr√©dito realizadas de periodo n√£o indetificado, sendo 2.564 registros e 12 vari√°veis.

<br></br>

| Atributo | Descri√ß√£o |
| --- | --- |
| idade | idade do cliente |
| sexo | sexo do cliente (F ou M) |
| dependentes | n√∫mero de dependentes do cliente |
| escolaridade | n√≠vel de escolaridade do cliente |
| salario_anual | faixa salarial do cliente |
| tipo_cartao | tipo de cart√£o do cliente |
| qtd_produtos | quantidade de produtos comprados nos √∫ltimos 12 meses |
| iteracoes_12m | quantidade de itera√ß√µes/transa√ß√µes nos √∫ltimos 12 meses |
| meses_inativo_12m | quantidade de meses que o cliente ficou inativo |
| limite_credito | limite de cr√©dito do cliente |
| valor_transacoes_12m | valor das transa√ß√µes dos √∫ltimos 12 meses |
| qtd_transacoes_12m | quantidade de transa√ß√µes dos √∫ltimos 12 meses |


## Importa√ß√£o de Modulos

In [None]:
!pip install pandas plotly

In [10]:
import os
import pandas as pd
import plotly.express as px

## Extra√ß√£o dos dados

In [14]:
DATA_DIR = "./data/Query/"
get_data = lambda file_name: pd.read_csv(os.path.join(DATA_DIR,file_name))

## EDA

### Vis√£o geral

**Query:**
```sql
SELECT * from credito limit 10;
```

In [29]:
get_data('Query_5.csv')

Unnamed: 0,idade,sexo,dependentes,escolaridade,estado_civil,salario_anual,tipo_cartao,qtd_produtos,iteracoes_12m,meses_inativo_12m,limite_credito,valor_transacoes_12m,qtd_transacoes_12m
0,45,M,3,ensino medio,casado,$60K - $80K,blue,5,3,1,12691.51,1144.9,42
1,49,F,5,mestrado,solteiro,menos que $40K,blue,6,2,1,8256.96,1291.45,33
2,51,M,3,mestrado,casado,$80K - $120K,blue,4,0,1,3418.56,1887.72,20
3,40,F,4,ensino medio,na,menos que $40K,blue,3,1,4,3313.03,1171.56,20
4,40,M,3,sem educacao formal,casado,$60K - $80K,blue,5,0,1,4716.22,816.08,28
5,44,M,2,mestrado,casado,$40K - $60K,blue,3,2,1,4010.69,1088.07,24
6,51,M,4,na,casado,$120K +,gold,6,3,1,34516.72,1330.87,31
7,32,M,0,ensino medio,na,$60K - $80K,silver,2,2,2,29081.49,1538.32,36
8,37,M,3,sem educacao formal,solteiro,$60K - $80K,blue,5,0,2,22352.5,1350.14,24
9,48,M,2,mestrado,solteiro,$80K - $120K,blue,6,3,3,11656.41,1441.73,32


### Variedade de cart√µes oferecidos

**Query:**
```sql
SELECT DISTINCT tipo_cartao FROM credito
```

In [12]:
get_data('Query_9.csv')

Unnamed: 0,tipo_cartao
0,silver
1,blue
2,gold
3,platinum


### Valores extremos registrados: m√°ximo e m√≠nimo

**Query:**
```sql
select max(limite_credito) as "Maior Limite",min(limite_credito) as "Menor Limite" from credito
```

In [13]:
get_data('Query_1.csv')

Unnamed: 0,Maior Limite,Menor Limite
0,34516.99,1438.03


### Distribui√ß√£o do valor do cr√©dito por faixa de renda anual

**Query:**
```sql
SELECT avg(limite_credito) as "M√©dia de credito", salario_anual as "Sal√°rio Anual" FROM credito where salario_anual != 'na' group by salario_anual
```

In [14]:
get_data('Query_4.csv')

Unnamed: 0,M√©dia de credito,Sal√°rio Anual
0,17801.488,$120K +
1,14886.556,$80K - $120K
2,9096.028,$60K - $80K
3,5348.356,$40K - $60K
4,4099.476,menos que $40K


### Quanto mais ganha, mais gasta?

**Query:**
```sql
select avg(valor_transacoes_12m) as "M√©dia de gasto em 12 meses",salario_anual from credito where salario_anual != 'na' group by salario_anual order by "M√©dia de gasto em 12 meses" desc
```

In [15]:
get_data('Query_13.csv')

Unnamed: 0,M√©dia de gasto em 12 meses,salario_anual
0,1862.7195,menos que $40K
1,1838.2643,$40K - $60K
2,1818.6364,$60K - $80K
3,1755.2499,$80K - $120K
4,1701.4652,$120K +



### Quanto mais ganha, mais compra?

**Query:**
```sql
select avg(qtd_transacoes_12m) as "M√©dia de transa√ß√µes",salario_anual from credito where salario_anual != 'na' group by salario_anual order by "M√©dia de transa√ß√µes" desc
```



In [16]:
get_data('Query_14.csv')

Unnamed: 0,M√©dia de transa√ß√µes,salario_anual
0,42.825963,menos que $40K
1,42.06424,$40K - $60K
2,41.097561,$60K - $80K
3,40.446721,$80K - $120K
4,39.842342,$120K +


### Distribui√ß√£o dos sal√°rios: comparando homens e mulheres

**Query:**
```sql
select count(sexo) as "Quantitativo",salario_anual,sexo from credito where salario_anual != 'na' group by sexo,salario_anual order by salario_anual
```

In [17]:
df = get_data('Query_12.csv')

In [18]:
df.rename(columns={"salario_anual":"Sal√°rio Anual","sexo":"Sexo"},inplace=True)
df['Sal√°rio Anual'] = df['Sal√°rio Anual'].apply(lambda salary: salary.replace('-','a').replace('+','ou mais').replace('$','').replace('K',' mil').title())
df.sort_values('Quantitativo',ascending=False,inplace=True)

In [19]:
df.head()

Unnamed: 0,Quantitativo,Sal√°rio Anual,Sexo
5,597,Menos Que 40 Mil,F
4,488,80 Mil A 120 Mil,M
3,451,60 Mil A 80 Mil,M
1,274,40 Mil A 60 Mil,M
0,222,120 Mil Ou Mais,M


In [20]:
px.bar(df,x='Sal√°rio Anual',y='Quantitativo',color='Sexo',color_discrete_sequence=["#ff6361","#58508d"],title="Distribui√ß√£o dos sal√°rios: comparando homens e mulheres")

### Propor√ß√£o de clientes por g√™nero

**Query:**
```sql
SELECT count(*),sexo from credito group by sexo order by count(*) desc
```

In [21]:
df = get_data('Query_10.csv')

In [22]:
df.head()

Unnamed: 0,Quantitativo,sexo
0,1563,M
1,1001,F


In [23]:
px.pie(df,values='Quantitativo',names='sexo',color_discrete_sequence=["#58508d","#ff6361"],title="Distribui√ß√£o de clientes por sexo",hole=0.4,labels={"sexo":"Sexo"})

### Distribui√ß√£o et√°ria por sexo

**Query:**
```sql
select avg(idade) as "M√©dia de Idade",max(idade) as "Idade M√°xima",min(idade) as "Idade M√≠nima",sexo from credito group by sexo
```

In [24]:
get_data('Query_6.csv')

Unnamed: 0,M√©dia de Idade,Idade M√°xima,Idade M√≠nima,sexo
0,46.42957,67,26,F
1,45.573896,73,26,M


### Distribui√ß√£o das compras por sexo

**Query:**
```sql
select avg(qtd_transacoes_12m) as "M√©dia de Transa√ß√µes",sexo from credito group by sexo order by avg(qtd_transacoes_12m) desc
```

In [25]:
get_data('Query_3.csv')

Unnamed: 0,M√©dia de Transa√ß√µes,sexo
0,42.283716,F
1,41.333333,M


### Rela√ß√£o entre g√™nero e condi√ß√µes de cr√©dito

**Query:**
```sql
select avg(limite_credito) as "M√©dia de Cr√©dito",sexo from credito group by sexo order by avg(limite_credito) desc
```

In [26]:
df = get_data('Query_2.csv')

In [27]:
df.head()

Unnamed: 0,M√©dia de Cr√©dito,sexo
0,11201.357,M
1,5748.9844,F


In [28]:
px.bar(df,x='sexo',y='M√©dia de Cr√©dito',color='M√©dia de Cr√©dito',title='M√©dia de cr√©dito fornecido por sexo')

## Conclus√£o 

<aside>
üí° Descobertas a partir da visualiza√ß√£o dos dados.
</aside>

- Observamos um desequil√≠brio de g√™nero na amostra, com uma predomin√¢ncia significativa do sexo masculino (61%) em rela√ß√£o ao feminino (39%). Essa discrep√¢ncia pode influenciar os resultados da an√°lise e merece aten√ß√£o especial.

- H√° uma clara correla√ß√£o positiva entre o valor do cr√©dito concedido e a renda do solicitante. Ou seja, indiv√≠duos com maiores rendimentos tendem a obter cr√©ditos de maior valor.

- A an√°lise sugere que o modelo de concess√£o de cr√©dito atual pode estar privilegiando indiv√≠duos com maiores rendas. Essa abordagem pode estar excluindo segmentos da popula√ß√£o com menores rendimentos, que, apesar de apresentarem um volume maior de transa√ß√µes e gastos com cart√£o de cr√©dito, t√™m acesso a menores valores de cr√©dito.

- A an√°lise sugere que o modelo de concess√£o de cr√©dito atual pode estar privilegiando indiv√≠duos com maiores rendas. Essa abordagem pode estar excluindo segmentos da popula√ß√£o com menores rendimentos, que, apesar de apresentarem um volume maior de transa√ß√µes e gastos com cart√£o de cr√©dito, t√™m acesso a menores valores de cr√©dito.
