 # **Análise e Exploração de Dados com SQL**

*Esse notebook faz parte do módulo de SQL do curso de análise de dados da EBAC.*

# * **Introdução:**

O foco desse projeto é analisar os padrões de consumo dos clientes de um cartão de crédito, para entender se existe uma desigualdade nos limites de crédito concedidos para diferentes faixas salariais e gêneros.

# * **Explorando os Dados**


* **Os dados:**

Os dados representam informações de clientes de um banco e contam com as seguintes colunas:

idade = idade do cliente

sexo = sexo do cliente (F ou M)

dependentes = número de dependentes do cliente

escolaridade = nível de escolaridade do clientes

salario_anual = faixa salarial do cliente

tipo_cartao = tipo de cartao do cliente

qtd_produtos = quantidade de produtos comprados nos últimos 12 meses

iteracoes_12m = quantidade de iterações/transacoes nos ultimos 12 meses

meses_inativo_12m = quantidade de meses que o cliente ficou inativo

limite_credito = limite de credito do cliente

valor_transacoes_12m = valor das transações dos ultimos 12 meses

qtd_transacoes_12m = quantidade de transacoes dos ultimos 12 meses


*A tabela foi criada no SQL Server*

* **Quantos registros vamos analisar?**

    Query: SELECT COUNT(*) AS total_registros FROM credito;

*Reposta: 2564 linhas*

* **Como estão organizados os dados?**

    Query: SELECT TOP 10 * FROM credito;

![Captura de tela 2024-10-15 175652.png](attachment:ca927838-6449-44ea-aaa6-b4bb2610e1f0.png)

Podemos ver uma tabela estruturada, com alguns dados nulos. Mais a frente vamos entender esses dados.

* **Tipos de dados**

    Query: 
    SELECT COLUMN_NAME, DATA_TYPE
    FROM INFORMATION_SCHEMA.COLUMNS
    WHERE TABLE_NAME = 'credito';
       
![Captura de tela 2024-10-15 180013.png](attachment:98085d51-7ac0-4aeb-92b9-2b7e6c8ecf3a.png)

* **Generos:**

    Query: 
    SELECT sexo, COUNT(*) AS total_clientes
    FROM credito
    GROUP BY sexo;

![Captura de tela 2024-10-15 193041.png](attachment:44bccd02-8ce7-41dc-89e5-1f6dfb84b38e.png)

* **Estado civil**

    Query: 
    SELECT estado_civil, 
    COUNT(*) AS total_clientes
    FROM credito
    GROUP BY estado_civil
    ORDER BY total_clientes DESC;
    
![Captura de tela 2024-10-15 200138.png](attachment:3f834092-9cd3-45de-b17b-370718c5eac4.png)

* **Escolaridade**

    Query: 
    SELECT escolaridade, 
    COUNT(*) AS total_clientes
    FROM credito
    GROUP BY escolaridade
    ORDER BY total_clientes DESC;
    
    ![Captura de tela 2024-10-15 200248.png](attachment:8de94e8a-7baa-48c6-b41e-c4767d3b9075.png)

* **Faixa Salarial** 

    Query:
    SELECT salario_anual, 
    COUNT(*) AS total_clientes
    FROM credito
    GROUP BY salario_anual
    ORDER BY 
    CASE 
        WHEN salario_anual = 'menos que $40K' THEN 1
        WHEN salario_anual = '$40K - $60K' THEN 2
        WHEN salario_anual = '$60K - $80K' THEN 3
        WHEN salario_anual = '$80K - $120K' THEN 4
        WHEN salario_anual = 'acima de $120K' THEN 5
    ELSE 6
    END ASC;
    
    
    
![Captura de tela 2024-10-16 143634.png](attachment:bec1c479-1c93-4209-9511-8951220a4c8d.png)


*Podemos notar nesse resultado que a faixa salárial que mais tem clientes é até 40K por ano.*

* **Qual o numero exato de homens e mulheres em cada faixa salarial?**

    Query: 
    SELECT salario_anual, 
    sexo, 
    COUNT(*) AS total_clientes
    FROM credito
    GROUP BY salario_anual, sexo
    ORDER BY salario_anual ASC, sexo;
  
![Captura de tela 2024-10-16 165130.png](attachment:912bebc7-a833-4ef5-bf5b-c7ddfeb89d66.png)


* **Temos aqui um gráfico que ilustra bem isso:**

![Captura de tela 2024-10-16 171438.png](attachment:a439f08c-db47-4f58-a6d9-887fd4f83b52.png)

*O gráfico já indica uma diferença significativa entre homens e mulheres em relação aos altos salários. As mulheres estão concentradas apenas nas faixas salariais mais baixas.*

* **Quais são os limites dos cartões de crédito?**
    
    Query: 
    SELECT 
    MIN(limite_credito) AS menor_limite,
    MAX(limite_credito) AS maior_limite,
    ROUND(AVG(limite_credito), 2) AS media_limite
    FROM credito;
    
    ![Captura de tela 2024-10-16 144401.png](attachment:98a86453-8c40-4bbc-995f-8d85b3a7ca33.png)

* **Como são divididos esses limites entre os gêneros?**

    Query:
    SELECT sexo, 
    MIN(limite_credito) AS menor_limite_credito,
    MAX(limite_credito) AS maior_limite_credito,
    ROUND(AVG(limite_credito), 2) AS media_limite_credito
    FROM credito
    GROUP BY sexo;
        
![Captura de tela 2024-10-16 144941.png](attachment:11427905-c767-4c75-82bb-50610a057f48.png)****

*Com essa análise, já podemos observar que, embora ambos os gêneros apareçam entre os maiores limites de crédito, na média geral, o limite dos cartões dos homens é mais que o dobro do limite dos cartões das mulheres.*


* **Grafico para ilustrar os limites entre gêneros:**

![Captura de tela 2024-10-16 171707.png](attachment:be0dedf0-eed5-4737-95fa-f04a5017dc9d.png)

*Mais uma vez, o gráfico mostra que tanto homens quanto mulheres podem ter limites altos e baixos. No entanto, ao observarmos a média, fica evidente a diferença significativa entre os gêneros.*

* **E como está distribuido os limites dentro das faixas salariais?**

    Query:
    SELECT salario_anual, 
    ROUND(AVG(limite_credito), 2) AS media_limite_credito
    FROM credito
    GROUP BY salario_anual
    ORDER BY 
    CASE 
        WHEN salario_anual = 'menos que $40K' THEN 1
        WHEN salario_anual = '$40K - $60K' THEN 2
        WHEN salario_anual = '$60K - $80K' THEN 3
        WHEN salario_anual = '$80K - $120K' THEN 4
        WHEN salario_anual = 'acima de $120K' THEN 5
        ELSE 6
        END ASC;
        
        
        
 ![Captura de tela 2024-10-16 145949.png](attachment:b8a48a11-9dc0-4bf0-a2bf-b7ce378e02c5.png)

* **Vamos analisar a média de limite do cartão por faixa salarial e gênero:**

    Query: 
    SELECT salario_anual, 
    sexo,
    ROUND(AVG(limite_credito), 2) AS media_limite_credito
    FROM credito
    GROUP BY salario_anual, sexo
    ORDER BY salario_anual ASC, sexo;
    
    ![Captura de tela 2024-10-16 151234.png](attachment:6b734fd9-ab8f-4023-8788-fa42cbbe0b78.png)
    
*Em uma breve análise, já pudemos observar que não há mulheres nas faixas salariais mais altas.*

* **Usarei um gráfico para ilustar melhor essa distribuição de limite entre os generos e faixas salariais.**

![Captura de tela 2024-10-16 172727.png](attachment:5980e61b-30d8-4e77-be41-660e5e1e200a.png)

*Analisando o gráfico, poderíamos pensar que o crédito entre homens e mulheres está bem equilibrado. No entanto, mais uma vez, temos a evidência da ausência de mulheres nas faixas salariais mais altas. Nas três faixas salariais em que elas estão presentes, justamente na mais alta, as mulheres possuem um crédito menor.*

* **Como é o perfil de gastos por genero? Vamos analisar mais de perto:**

* Valor Total de Quantidade de Transações e Valor de Transações:

    Query 1: 
    SELECT sexo, 
    SUM(qtd_produtos) AS total_produtos_comprados, 
    SUM(valor_transacoes_12m) AS total_valor_transacoes
    FROM credito
    GROUP BY sexo;

![image.png](attachment:3cae80b6-dd8a-4d60-b24d-8a8dfa4bc1b9.png)

* Média de quantidade de transações e valor de transações:

    Query 2: 
    SELECT sexo, 
    ROUND(AVG(qtd_transacoes_12m), 2) AS media_qtd_transacoes,
    ROUND(AVG(valor_transacoes_12m), 2) AS media_valor_transacoes
    FROM credito
    GROUP BY sexo;
  
![image.png](attachment:c873fc89-4593-4409-a62d-a05111a404f2.png)

*Na média, homens e mulheres estão consumindo de forma bastante semelhante, tanto em relação à quantidade de transações quanto aos valores das transações.*

* **Quando adicionamos as faixas salarias será que conseguimos alguma nova informação?**

    Query:
    SELECT salario_anual, 
    sexo, 
    ROUND(AVG(qtd_transacoes_12m), 2) AS media_qtd_transacoes,
    ROUND(AVG(valor_transacoes_12m), 2) AS media_valor_transacoes
    FROM credito
    GROUP BY salario_anual, sexo
    ORDER BY salario_anual ASC, sexo;
    
![image.png](attachment:f2455a81-b001-44fa-957c-ebf9b75eed82.png)

![image.png](attachment:2656df96-d087-4e1e-9cbb-18c784d96f8f.png)

![Captura de tela 2024-10-16 194634.png](attachment:3200c21a-5115-4c5b-bb79-be37149d70e6.png)

*Os gráficos demonstram que, mesmo com comportamentos de gastos e salários semelhantes, os homens tendem a ter um crédito maior do que as mulheres.*

# # **Conclusão**

*Essas foram as principais análises realizadas com base nos dados de crédito. Abaixo estão alguns insights relevantes que surgiram durante a exploração dos dados:*

* *A maioria dos clientes são homens*.
* *A maior parte dos clientes se encontra na faixa salarial de até 40K por ano.*
* *Não há mulheres ganhando mais de 60K por ano.*
* *Em média, o limite de crédito dos homens é mais do que o dobro do limite concedido às mulheres.*
* *Homens e mulheres apresentam médias de gastos anuais bastante semelhantes.*

*Com base nesses dados, é evidente que, mesmo nas faixas salariais mais altas, as mulheres possuem um limite de crédito inferior ao dos homens. Para corrigir essa discrepância e aumentar a satisfação e o uso do cartão entre as clientes do sexo feminino, sugere-se uma revisão nas políticas de concessão de crédito.*

