[<img align="left" src="https://www.kaggle.com/static/images/open-in-kaggle.svg">](https://www.kaggle.com/code/ederfr/explora-o-e-an-lise-de-dados-de-cr-dito-com-sql)<br>

# **Exploração e análise de dados de crédito com SQL: Conclusões e Insights**


## **Introdução**

Este documento apresenta uma análise detalhada dos dados bancários fornecidos por meio de consultas realizadas em um banco de dados. A partir das queries executadas, foram extraídas diversas conclusões e insights sobre o comportamento dos clientes, distribuição demográfica, produtos financeiros e outros aspectos relevantes para o banco.

### **Os dados**

Neste conjunto de dados, é possível encontrar informações sobre os clientes de um banco, que foram organizadas em colunas que incluem:

* **idade:** Idade do cliente;
* **sexo:** Sexo do cliente (F ou M);
* **dependentes:** Número de dependentes do cliente;
* **escolaridade:** Nível de escolaridade do clientes;
* **salario_anual:** Faixa salarial do cliente;
* **tipo_cartao:** Tipo de cartao do cliente;
* **qtd_produtos:** Quantidade de produtos comprados nos últimos 12 meses;
* **iteracoes_12m:** Quantidade de iterações/transacoes nos ultimos 12 meses;
* **meses_inativo_12m:** Quantidade de meses que o cliente ficou inativo;
* **limite_credito:** Limite de credito do cliente;
* **valor_transacoes_12m:** Valor das transações dos ultimos 12 meses;
* **qtd_transacoes_12m:** Quantidade de transacoes dos ultimos 12 meses.


*A tabela foi criada no AWS Athena em conjunto com o S3 Bucket, utilizando uma versão dos dados fornecidos pela plataforma da EBAC.*

*Esta ação foi realizada com base no conteúdo do material disponibilizado em:<br>
https://www.kaggle.com/code/marianeneiva/credit-eda-and-analysis/notebook<br>
Os dados originais estão disponíveis em:<br>
https://github.com/andre-marcos-perez/ebac-course-utils/tree/main/dataset*


**1. Qual é o volume de informações contidas em nossa base de dados?**

* ***Query:*** SELECT COUNT(*) FROM credito;

Esta query retorna o número total de registros na tabela "credito", fornecendo uma visão geral da quantidade de clientes representados nos dados.

>**Resultado:** Existem 2564 linhas.


**2. Como são os dados dos clientes?**

* ***Query:*** SELECT * FROM credito LIMIT 10;

![Resultado_query2](https://github.com/eder-fr/SLQ-project/blob/main/credito-limit_10-2.jpg?raw=true)

Esta query retorna uma amostra dos 10 primeiros registros da tabela "credito", exibindo várias informações sobre os clientes, como limite de crédito, educação, estado civil, sexo, idade, salário anual, tipo de cartão, entre outros.


**3. Quais são os tipos de cada dado?**

* ***Query:*** DESCRIBE credito;

![Resultado_query3](https://github.com/eder-fr/SLQ-project/blob/main/describe-3.jpg?raw=true)

Esta query fornece informações sobre os nomes das colunas e seus respectivos tipos de dados.


**4. Como são os níveis de escolaridade dos clientes?**

* ***Query:*** SELECT DISTINCT escolaridade FROM credito;

![Resultado_query4](https://github.com/eder-fr/SLQ-project/blob/main/escolaridade-4.jpg?raw=true)

Esta query retorna uma lista de valores únicos encontrados na coluna "escolaridade" da tabela "credito", mostrando os diferentes níveis de escolaridade dos clientes.

>Os clientes têm uma variedade de níveis de escolaridade, desde "sem educação formal" até "doutorado", indicando uma ampla base de clientes com diferentes formações acadêmicas.

>Os diferentes níveis de escolaridade podem indicar diferentes demandas e necessidades financeiras dos clientes, influenciando os produtos e serviços que procuram.


**5. Como são os estados civis dos clientes?**

* ***Query:***

    SELECT estado_civil, COUNT(*) AS total_clientes<br>
    FROM credito<br>
    GROUP BY estado_civil;

![Resultado_query5](https://github.com/eder-fr/SLQ-project/blob/main/estado_civil-5.jpg?raw=true)

Esta query retorna o número de clientes para cada estado civil listado na tabela "credito", fornecendo uma contagem detalhada da distribuição dos clientes por estado civil.

![Grafico1](https://github.com/eder-fr/SLQ-project/blob/main/clientes-estado_civil.jpg?raw=true)

>Os clientes estão distribuídos em categorias como "casado", "divorciado", "solteiro" e "na" (não aplicável).

>Clientes solteiros e casados são os mais representativos.


**6. Como são os salários anuais dos clientes?**

* ***Query:*** SELECT DISTINCT salario_anual FROM credito;

![Resultado_query6](https://github.com/eder-fr/SLQ-project/blob/main/salario_anual-6.jpg?raw=true)

Esta query retorna uma lista de valores únicos encontrados na coluna "salario_anual" da tabela "credito", oferecendo uma visão dos diferentes níveis de salário anual dos clientes.

>Os salários anuais dos clientes estão distribuídas em faixas como "menos que 40 mil", "40 a 60 mil", "60 a 80 mil", "80 a 120 mil", "mais que 120 mil" e "na" (não aplicável).


**7. Quais são os tipos de cartão dos clientes?**

* ***Query:*** SELECT DISTINCT tipo_cartao FROM credito;

![Resultado_query7](https://github.com/eder-fr/SLQ-project/blob/main/tipo_cartao-7.jpg?raw=true)

Esta query retorna uma lista de valores únicos encontrados na coluna "tipo_cartao" da tabela "credito", mostrando os diferentes tipos de cartão de crédito disponíveis para os clientes.

>O banco oferece uma variedade de tipos de cartão, como silver, blue, gold e platinum, adaptados às necessidades e preferências dos clientes.

>Os tipos de cartão permitem ao banco segmentar sua base de clientes com base em critérios como renda, histórico de crédito e preferências de serviços.


### **Análise dos dados**


**1. Como é a distribuição dos clientes por faixa salarial?**

* ***Query:***

    SELECT salario_anual, COUNT(*) AS total_clientes<br>
    FROM credito<br>
    GROUP BY salario_anual<br>
    ORDER BY total_clientes DESC;

![Resultado_query1](https://github.com/eder-fr/SLQ-project/blob/main/clientes-faixa_salarial-1.jpg?raw=true)

Esta query calcula o número de clientes agrupados por faixa salarial na tabela "credito", mostrando a contagem de clientes em cada faixa salarial. Os resultados são ordenados em ordem decrescente com base no número total de clientes em cada faixa salarial, permitindo uma visualização clara das faixas salariais mais comuns entre os clientes.

![Grafico2](https://github.com/eder-fr/SLQ-project/blob/main/clientes-salario_anual.jpg?raw=true)

>Os clientes estão distribuídos em faixas salariais variadas, com diferentes níveis de renda representados.

>As faixas salariais podem ser usadas para segmentar os clientes e adaptar os produtos e serviços do banco às suas necessidades específicas.


**2. Como é a distribuição dos clientes por gênero?**

* ***Query:*** SELECT COUNT(*) AS quantidade, sexo FROM credito GROUP BY sexo;

![Resultado_query2](https://github.com/eder-fr/SLQ-project/blob/main/faixa_genero-2.jpg?raw=true)

Esta query retorna a contagem de clientes para cada valor único encontrado na coluna "sexo" da tabela "credito", mostrando a distribuição de gênero dos clientes.

![Grafico3](https://github.com/eder-fr/SLQ-project/blob/main/distribuicao-clientes_genero.jpg?raw=true)

>A maioria dos clientes é do sexo masculino (1563), seguido por clientes do sexo feminino (1001).


**3. Quais são os maiores e menores limites de crédito por escolaridade, tipo de cartão e sexo?**

* ***Query maiores limites:***

    SELECT MAX(limite_credito) AS limite_credito, escolaridade, tipo_cartao, sexo<br>
    FROM credito<br>
    WHERE escolaridade != 'na' AND tipo_cartao != 'na'<br>
    GROUP BY escolaridade, tipo_cartao, sexo<br>
    ORDER BY limite_credito DESC<br>
    LIMIT 10;

![Resultado_query3.1](https://github.com/eder-fr/SLQ-project/blob/main/limite_credito-desc-3.jpg?raw=true)

Esta query retorna os maiores limites de crédito para diferentes grupos de clientes com base em sua escolaridade, tipo de cartão e sexo.

* ***Query menores limites:***

    SELECT MAX(limite_credito) AS limite_credito, escolaridade, tipo_cartao, sexo<br>
    FROM credito<br>
    WHERE escolaridade != 'na' AND tipo_cartao != 'na'<br>
    GROUP BY escolaridade, tipo_cartao, sexo<br>
    ORDER BY limite_credito ASC<br>
    LIMIT 10;<br>

![Resultado_query3.2](https://github.com/eder-fr/SLQ-project/blob/main/limite_credito-asc-3.jpg?raw=true)

Esta query retorna os menores limites de crédito para diferentes grupos de clientes com base em sua escolaridade, tipo de cartão e sexo.

>Clientes com níveis mais altos de escolaridade tendem a ter limites de crédito mais altos, com destaque para clientes com doutorado.

>Não há uma disparidade significativa entre os limites de crédito atribuídos a clientes masculinos e femininos.

>Há uma associação entre o tipo de cartão e o limite de crédito, com clientes com mestrado tendo limites mais altos, especialmente para cartões gold e blue.

>A análise revela padrões variados na atribuição de limites de crédito com base no sexo e na escolaridade dos clientes.


**4. Como é o comportamento de gastos dos clientes por sexo?**

* ***Query:***

    SELECT MAX(valor_transacoes_12m) AS maior_valor_gasto,<br>
    AVG(valor_transacoes_12m) AS media_valor_gasto,<br>
    MIN(valor_transacoes_12m) AS min_valor_gasto, sexo<br>
    FROM credito<br>
    GROUP BY sexo;

![Resultado_query4](https://github.com/eder-fr/SLQ-project/blob/main/valor_gasto-genero-4.jpg?raw=true)

Esta query retorna os maiores, menores e médias de valor de transações realizadas nos últimos 12 meses para clientes de diferentes sexos.

>Os clientes do sexo masculino tendem a realizar transações de valor médio mais alto.


**5. Como é o comportamento de compras dos clientes por sexo e faixa salarial?**

* ***Query:***

    SELECT AVG(qtd_produtos) AS media_qtd_produtos,<br>
    AVG(valor_transacoes_12m) AS media_valor_transacoes,<br>
    AVG(limite_credito) AS media_limite, sexo, salario_anual<br>
    FROM credito<br>
    WHERE salario_anual != 'na'<br>
    GROUP by sexo, salario_anual<br>
    ORDER BY AVG(valor_transacoes_12m) DESC;

![Resultado_query5](https://github.com/eder-fr/SLQ-project/blob/main/comportamento-compras-5.jpg?raw=true)

Esta query fornece informações sobre o comportamento de compras dos clientes com base em seu sexo e faixa salarial, incluindo a média de produtos adquiridos, o valor médio das transações e o limite de crédito médio.

![Grafico9](https://github.com/eder-fr/SLQ-project/blob/main/valor_transacoes-media_salario.jpg?raw=true)

>Clientes que adquirem mais produtos tendem a realizar transações com valores médios mais altos.


**6. Como é a distribuição dos tipos de cartão por escolaridade?**

* ***Query:***

    SELECT escolaridade, tipo_cartao, COUNT(*) AS total_clientes,<br>
    AVG(limite_credito) AS media_limite_credito<br>
    FROM credito<br>
    GROUP BY escolaridade, tipo_cartao;

![Resultado_query6](https://github.com/eder-fr/SLQ-project/blob/main/tipo_cartao-escolaridade-6.jpg?raw=true)

Esta query retorna a distribuição dos tipos de cartão entre os diferentes níveis de escolaridade dos clientes, juntamente com a contagem total de clientes e a média de limite de crédito.

![Grafico4](https://github.com/eder-fr/SLQ-project/blob/main/distribuicao-tipo_cartao.jpg?raw=true)

>Os clientes com níveis mais altos de escolaridade tendem a ter acesso a tipos de cartão mais exclusivos.


**7. Como é a distribuição de idade dos clientes?**

* ***Query:***

    SELECT idade, COUNT(*) AS quantidade_clientes<br>
    FROM credito<br>
    GROUP BY idade<br>
    ORDER BY idade;

![Resultado_query7.1](https://github.com/eder-fr/SLQ-project/blob/main/idade_clientes1-7.jpg?raw=true)
![Resultado_query7.2](https://github.com/eder-fr/SLQ-project/blob/main/idade_clientes2-7.jpg?raw=true)
<div style="text-align:center; margin-bottom: 20px;">
    <img src="https://github.com/eder-fr/SLQ-project/blob/main/idade_clientes3-7.jpg?raw=true" alt="Resultado_query7.3">
</div>

<div style="margin-bottom: 20px;">
    Esta query mostra a distribuição de idade dos clientes, fornecendo a contagem de clientes em cada faixa etária.
</div>

<div style="margin-bottom: 20px;">
    <img src="https://github.com/eder-fr/SLQ-project/blob/main/qtde_clientes-idade.jpg?raw=true" alt="Grafico6">
</div>

>A distribuição dos clientes mostra um pico de quantidade entre as idades de 35 a 45 anos, com uma queda gradual após os 45 anos. Isso sugere que a maioria dos clientes está na faixa etária intermediária.


**8. Como o número de dependentes influencia o limite de crédito médio dos clientes?**

* ***Query:***

    SELECT dependentes, AVG(limite_credito) AS media_limite_credito<br>
    FROM credito<br>
    WHERE dependentes IS NOT NULL<br>
    GROUP BY dependentes<br>
    ORDER BY dependentes;

![Resultado_query8](https://github.com/eder-fr/SLQ-project/blob/main/dependentes-media_limite-8.jpg?raw=true)

Esta query mostra como o número de dependentes dos clientes está relacionado ao limite de crédito médio, fornecendo a média do limite de crédito para cada quantidade de dependentes.

![Gráfico5](https://github.com/eder-fr/SLQ-project/blob/main/limite_credito-dependentes.jpg?raw=true)

>O limite de crédito médio tende a aumentar conforme o número de dependentes do cliente aumenta.


**9. Como é a inatividade dos clientes nos últimos 12 meses?**

* ***Query:***

    SELECT meses_inativo_12m, COUNT(*) AS quantidade_clientes<br>
    FROM credito<br>
    GROUP BY meses_inativo_12m<br>
    ORDER BY meses_inativo_12m;

![Resultado_query9](https://github.com/eder-fr/SLQ-project/blob/main/meses_inativo-9.jpg?raw=true)

Esta query mostra a quantidade de meses de inatividade dos clientes nos últimos 12 meses, oferecendo insights sobre a frequência de atividade dos clientes.

![Grafico7](https://github.com/eder-fr/SLQ-project/blob/main/qtde_clientes-meses_inativos.jpg?raw=true)

>A maioria dos clientes esteve inativa por 1, 2 ou 3 meses nos últimos 12 meses, destacando a importância de estratégias para reengajamento.

>Estratégias para reengajar clientes inativos podem ser desenvolvidas com base na análise dos períodos de inatividade.


**10. Como o número de produtos adquiridos pelos clientes está relacionado ao valor médio das transações?**

* ***Query:***

    SELECT qtd_produtos, AVG(valor_transacoes_12m) AS media_valor_transacoes<br>
    FROM credito<br>
    GROUP BY qtd_produtos<br>
    ORDER BY qtd_produtos;

![Resultado_query10](https://github.com/eder-fr/SLQ-project/blob/main/qtde_produtos-transacoes-10.jpg?raw=true)

Esta query analisa a relação entre o número de produtos adquiridos pelos clientes e o valor médio das transações realizadas nos últimos 12 meses.

![Grafico8](https://github.com/eder-fr/SLQ-project/blob/main/transacoes-qtde_produtos.jpg?raw=true)

>Clientes com mais produtos tendem a realizar transações com valores médios mais altos, indicando oportunidades de aumento de receita.


**11. Como a faixa salarial dos clientes se relaciona com o tipo de cartão que possuem?**

* ***Query:***

    SELECT salario_anual, tipo_cartao, COUNT(*) AS quantidade_clientes<br>
    FROM credito<br>
    GROUP BY salario_anual, tipo_cartao<br>
    ORDER BY salario_anual, quantidade_clientes DESC;

![Resultado_query11](https://github.com/eder-fr/SLQ-project/blob/main/salarios-tipo_cartao-11.jpg?raw=true)

Esta query mostra a distribuição dos tipos de cartão de crédito entre diferentes faixas salariais dos clientes, oferecendo insights sobre as preferências de cartão em relação ao salário anual.

>A distribuição dos tipos de cartão varia de acordo com a faixa salarial dos clientes, com tendência de acesso a cartões mais exclusivos para clientes com salários mais altos.

## **Conclusão**

As análises realizadas oferecem uma visão abrangente do comportamento dos clientes em várias dimensões, incluindo demografia, comportamento de compra, limites de crédito e associação a produtos financeiros. Essas conclusões podem ser utilizadas pelo banco para informar estratégias de marketing, desenvolvimento de produtos e serviços, segmentação de clientes e tomada de decisões estratégicas em geral.