# Análise de Dados de Crédito com SQL

**1) Metodologia**

O objetivo desta análise é avaliar dados de crédito de uma instituição financeira no intuito de criar um plano de ação para aumentar o lucro da instituição, promovendo ações efetivas de engajamento dos clientes.

A linguagem de consulta utilizada na análise foi o SQL, utilizando o AWS S3 para armazenagem dos dados e o AWS Athena para execução das consultas em SQL.

Foi utilizado como banco de dados uma base de crédito extraída do Kaggle, presente no link a seguir:

https://github.com/pedro10abreu/ebac/blob/21276cc4beec36bc60391738acb516c4d8a763a9/base_credito.csv

**2) Exploração dos Dados:**

Agora na etapa de Exploração dos Dados vamos visualizar e verificar as principais características dos dados para analisá-los posteriormente com mais precisão.

A descrição das informações contidas nos dados é mostrada abaixo:

> idade |  int | idade dos clientes

> sexo |  string | sexo dos clientes

> dependentes |  int | n° dependentes dos clientes

> escolaridade |  string | escolaridade dos clientes

> estado_civil |  string | estado civil dos clientes

> faixa_salarial |  string | faixa salarial dos clientes

> tipo_cartao |  string | tipo de cartão dos clientes

> qtd_produtos |  int | quantidade de produtos utilizados pelos clientes

> interacoes_12m |  int | n° interacoes dos clientes no últimos 12 meses

> meses_inativo_12m |  int | n° meses inativos  dos clientes no último 12 meses

> limite_credito |  bigint | limite de crédito dos clientes

> valor_transacoes_12m |  bigint | valor transacionado pelos clientes no últimos 12 meses

> qtd_transacoes_12m |  bigint | quantidade de transações realizadas pelos clientes nos últimos 12 meses

Agora vamos realizar algumas consultas para importar a base para do AWS S3 para o AWS Athena e verificar a qualidade dos dados:

> **Query 1 : Criação da tabela credito**

![](https://raw.githubusercontent.com/pedro10abreu/ebac/a4c541414b57513d7705695c3748a213931da5e0/query%201%20code.png)

> **Query 2: Visualização dos dados**

![](https://github.com/pedro10abreu/ebac/blob/main/query%202%20code.png?raw=true)

![](https://github.com/pedro10abreu/ebac/blob/main/query%202%20result.png?raw=true)

> **Query 3 - Quantos clientes existem na base a ser analisada?**

![](https://github.com/pedro10abreu/ebac/blob/main/query%203%20code.png?raw=true)

![](https://github.com/pedro10abreu/ebac/blob/main/query%203%20result.png?raw=true)

> **Query 4 - Quem gasta e transaciona mais, homens ou mulheres? Qual o ticket médio por transação para cada sexo?**

Do total de gasto pelos clientes,homens correspondem a 60% do total e mulheres correspondem a 39%, sendo assim os homens gastam mais que as mulheres embora o ticket médio tenha o mesmo valor para ambos os sexos. 

![](https://github.com/pedro10abreu/ebac/blob/main/query%204%20code.png?raw=true)

![](https://github.com/pedro10abreu/ebac/blob/main/query%204%20result.png?raw=true)

> **Query 5 - Qual a faixa de idade dos clientes?**

A idade dos clientes varia entre 26 e 73 anos.

![](https://github.com/pedro10abreu/ebac/blob/main/query%205%20code.png?raw=true)

![](https://github.com/pedro10abreu/ebac/blob/main/query%205%20result.png?raw=true)

> **Query 6 - Como a faixa de idade influencia as demais variáveis?**

A faixa de idade com maior média de gasto e transações por cliente é a faixa entre 21 e 30 anos, porém a faixa de idade que mais gasta em valor é a faixa entre 31 e 40 anos, com média bem próxima a média da faixa mais jovem.

A faixa de idade que menos gasta é a faixa de idade acima de 60 anos e a faixa com menor média de gastos e transações por cliente é a faixa entre 51 e 60 anos.

As faixas de idade com maior quantidade de clientes são as faixas entre 41 e 50 anos e entre 51 e 60 anos, já a faixa de idade com menor número de clientes é a faixa entre 21 e 30 anos.

![](https://github.com/pedro10abreu/ebac/blob/main/query%206%20code.png?raw=true)

![](https://github.com/pedro10abreu/ebac/blob/main/query%206%20result.png?raw=true)

> **Query 7 - O sexo influencia na análise por faixa de idade**

Os valores da média de gastos e da média de transações são bem próximos para homens e mulheres na mesma faixa de idade, por outro lado, os homens gastam mais que as mulheres em todas as faixas e transacionam mais em todas as faixas, exceto na faixa acima de 60 anos, onde as mulheres transacionam mais.

![](https://github.com/pedro10abreu/ebac/blob/main/query%207%20code.png?raw=true)

![](https://github.com/pedro10abreu/ebac/blob/main/query%207%20result.png?raw=true)


> **Query 8 - Qual a faixa de credito dos clientes?**

O menor crédito disponível para um cliente é de 1438 e o maior é de 33078.

![](https://github.com/pedro10abreu/ebac/blob/main/query%208%20code.png?raw=true)

![](https://github.com/pedro10abreu/ebac/blob/main/query%208%20result.png?raw=true)


> **Query 9 - Como o limite de crédito influencia as demais variáveis?**

A maioria dos clientes possui entre 1k e 5k de crédito disponível, porém a média de gastos e transações por cliente são semelhantes para todas as faixas de crédito disponível,logo este não é um fator que influencia significativamente o gasto médio e número médio de transações por cliente.

![](https://github.com/pedro10abreu/ebac/blob/main/query%209%20code.png?raw=true)

![](https://github.com/pedro10abreu/ebac/blob/main/query%209%20result.png?raw=true)

> **Query 10 - O sexo influencia na análise por limite de crédito?**

Mulheres gastam mais e transacionam mais que os homens em geral para uma mesma faixa de limite de crédito disponível.

![](https://github.com/pedro10abreu/ebac/blob/main/query%2010%20code.png?raw=true)

![](https://github.com/pedro10abreu/ebac/blob/main/query%2010%20result.png?raw=true)

Conclusões
> As homens gastaram mais que as mulheres embora o ticket médio tenha o mesmo valor para ambos os sexos. Os homens são responsáveis por 60% dos gastos, enquanto as mulheres são responsáveis por 40%. Descontos para clientes do sexo feminino podem ser atraentes para prospecção de clientes.

> A expansão de crédito para clientes mais jovens, entre 21 e 30 anos pode ser uma opção para captar mais recursos pois estes possuem o maior ticket médio de gasto por compra e um número baixo de clientes.

> Programas de desconto em compras de alto valor podem captar mais recursos visando aumento de ticket médio geral e principalmente nas faixas de idade que incluem as idades entre 41 e 60 anos, as quais possuem gastos altos porém com ticket médio gasto mais baixo.

> A faixa salarial influencia pouco no gasto médio e não influencia o número médio de transações realizadas.

> Quando analisamos por sexo as mulheres gastam mais que os homens quando ao possuem a mesma quantidade de crédito disponível, desta forma pode-se propor uma ação de aumento de crédito para clientes do sexo feminino, pois irão gastar mais.

















