## Exploração e análise de dados de crédito com SQL

Dados:

* idade = idade do cliente
* sexo = sexo do cliente (F ou M)
* dependentes = número de dependentes do cliente
* estado_civil= estado civil do cliente
* escolaridade = nível de escolaridade do cliente
* salario_anual = faixa salarial do cliente
* tipo_cartao = tipo de cartao do cliente
* qtd_produtos = quantidade de produtos comprados nos últimos 12 meses
* iteracoes_12m = quantidade de iterações/transacoes nos ultimos 12 meses
* meses_inativo_12m = quantidade de meses que o cliente ficou inativo
* limite_credito = limite de credito do cliente
* valor_transacoes_12m = valor das transações dos ultimos 12 meses
* qtd_transacoes_12m = quantidade de transacoes dos ultimos 12 meses

A tabela foi criada no AWS Athena junto com o S3 Bucket com uma versão dos dados disponibilizados em: https://github.com/andre-marcos-perez/ebac-course-utils/tree/main/dataset. 
A base de dados contém mais linhas do que a seleção utilizada. 

## Exploração de dados:

Vamos conhecer nossa amostra de dados. 

Primeiras 10 linhas da base de dados:

**Query**: Select * From "default"."credito" limit 10

![image.png](attachment:7d095eb2-2513-435a-bc79-cf75a8cf21fc.png)

A base de dados possui valores nulos que estão especificados como (na) na tabela.

**Quantos clientes temos na base de dados?**

**Query**: Select count(*) From credito

Resposta: 2564 


**Quais os tipos de dados temos?**

**Query**: Describe credito

![image.png](attachment:91afef77-cf7f-4858-9ff7-4fb80f682a07.png)

**Quais os tipos de escolidade temos na base de dados?**

**Query**: Select Distinct escolaridade From credito

![image.png](attachment:05f60ed2-f320-411e-b9f5-c06434f37d48.png)





**Quais os tipos de estado civil temos na base de dados?**

**Query**: Select Distinct estado_civil From credito

![image.png](attachment:bf840d65-0a58-49f8-96a8-9ace5f5773c0.png)

**Quais os tipos de cartão temos na base de dados?**

**Query**: Select Distinct tipo_cartao From credito

![image.png](attachment:c64920eb-1e64-45df-88d3-6bdcefe04d30.png)

**Quais são as faixas salariais dos clientes da base de dados?**

**Query**: Select Distinct salario_anual From credito

![image.png](attachment:d8e4f82b-c77c-4cab-9d27-f5389ef52025.png)

## Análise de dados:


Vamos entender melhor o perfil dos clientes da nossa base de dados.

* Em relação ao **sexo**, podemos observar que 61% são do sexo masculino e 31% do sexo feminino.

**Query**: Select count(*) As qtd_clientes,sexo From credito group by sexo

![image.png](attachment:072d7c16-036e-450b-aeb2-4c8e90f283ad.png)

![image.png](attachment:35821678-ce56-4f52-825a-a5cbcef28d64.png)

* Em relação à **escolaridade** temos que a maioria dos clientes (810) possuem mestrado.

**Query**: select count(*), escolaridade from credito group by escolaridade

![image.png](attachment:83f315dc-4ab1-4f03-818f-7359590c64b4.png)

![image.png](attachment:c3bbe9b0-b93b-407f-ae36-36252a08a124.png)

* Em relação ao **estado civil**, temos que 1521 clientes são casados.

**Query**: select count(*), estado_civil from credito group by estado_civil

![image.png](attachment:5060fa81-f95b-4eaa-83a9-f438321a29e4.png)
![image.png](attachment:3eb03bd0-8ea5-4d34-8399-6fc482df8bb8.png)

* Em relação à **faixa salarial**, temos que 701 clientes, a maioria, recebe até 40 mil anual.

**Query**: select count(*), salario_anual from credito group by salario_anual

![image.png](attachment:b6a7b96a-4098-4545-bf47-13cbf6aec3a1.png)
![image.png](attachment:7c1e4c6b-8112-44c8-bb48-600230593286.png)


**Qual a relação entre o limite de credito com os valores das transações e o sexo dos clientes?**

**Query**:  select avg(valor_transacoes_12m) as media_valor_transacoes, avg(limite_credito) as media_limite_credito, sexo from credito group by sexo

![image.png](attachment:17df7364-0686-4583-859b-b6c8a82a7e8d.png)

Podemos observar que os clientes do sexo masculino possuem praticamente o dobro do valor de limite de credito que as clientes do sexo feminino possuem e a média de valores das transações são praticamente iguais entre os dois sexos.

**O salário impacta no limite de crédito?**

**Query**: select avg(limite_credito) as media_limite, salario_anual from credito where salario_anual != 'na' group by salario_anual

![image.png](attachment:0d7dc851-5509-4ef0-bcd0-3d46b99e1a04.png)
![image.png](attachment:e4dd2b61-99a4-459a-bc53-c783357b8adc.png)

Podemos observar que sim o salário impacta no limite de crédito, pois quanto maior a faixa salarial maior o limite de crédito.


**Qual a distribuição da faixa salarial por sexo e a relação de limite de credito?**

**Query:** select count(*) as qtd_clientes, avg(limite_credito) as limite_credito, salario_anual,sexo From credito where salario_anual !='na' group by salario_anual, sexo

![image.png](attachment:5e020812-418b-43d6-83c7-5426d275ee1b.png)

Na base de dados analisada temos que nas faixas salariais a cima de 60 mil anual não temos clientes do sexo feminino e a maioria delas ganha menos que 40 mil anual, já a maioria dos clientes do sexo masculino esta concentrada na faixa salarial de 80 a 120 mil anual e temos mais clientes do sexo masculino ganhando mais de 120 mil anual que aqueles que ganham menos de 40mil anual.


Como foi dito anteriormente o limite de credito aumenta com o aumento da faixa salarial, podemos observar que para as clientes do sexo feminino a diferença de limite de credito entre as que ganham menos de 40mil anual e as que ganham entre 40 e 60 mil é de 13% a mais e para os clientes do sexo masculino temos uma diferença de 40%. 

![image.png](attachment:b55bb963-7d88-4518-8209-e8c7d9124de4.png)

Através do gráfico podemos observar que os clientes que possuem limites de crédito e faixa salarial maiores tem valores de transações bem próximo aos outros clientes, que possuem limite de credito bem menor, por isso a empresa poderia utilizar estratégias de marketing para estimular uma maior utilização dos limites de crédito pelos clientes que possuem maior limite de crédito e maior faixa salarial. 


## Conclusão:

* A maioria dos clientes é do sexo masculino, possui mestrado, ganha menos de 40mil anual e é casado.
* Não temos grande diferença entre os valores de transações entre clientes do sexo masculino e feminino.
* Os clientes do sexo masculino possuem maior limite de crédito, em média 2x maior que o limite de credito das clientes do sexo feminino.
* O limite de crédito aumenta com o aumento da faixa salarial.
* As clientes do sexo feminino ganham até 60 mil anual e a maioria dos clientes do sexo masculino ganham mais de 80mil anual.
* Os valores de transações dos clientes que possuem maior limite de crédito é bem proximo dos valores de transações dos clientes que possuem limite de crédito menor.

