<a href="https://colab.research.google.com/github/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/An%C3%A1lise_de_dados_de_cr%C3%A9dito_sql_aws_athena.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#Análise de Dados de Crédito no Athena
## Introdução
Nesta análise, vou explorar um dataset de clientes de cartão de crédito para entender seus perfis, hábitos de consumo e limites de crédito.

Usarei a linguagem SQL no Amazon (AWS) Athena para processar os dados e apresentar insights relevantes.

# Exploração de dados

Com o bucket configurado e a tabela criada no AWS vou tentar explorar um pouco a estrutuda dos dados para garimpar alguns insights, pra isso utilizei algumas queries:

A querie `DESCRIBE credito;` retorna os nomes das colunas e os tipos de dados conforme abaixo;

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/describe.png?raw=true" width="250"/>

A querie `SELECT COUNT(*) AS total_clientes FROM credito;` retorna o total de clientes renomeando também a coluna;

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/total_clientes.png?raw=true" width="250"/>

*Percebemos no print acima que temos um total de 2564 clientes ao total para analisar*


A querie `SELECT sexo,
       COUNT(*) AS qtd_por_sexo,
       ROUND((COUNT(*) * 100.0 / (SELECT COUNT(*) FROM credito WHERE sexo IN ('M', 'F'))), 2) AS porcentagem
FROM credito
WHERE sexo IN ('M', 'F')
GROUP BY sexo;` retorna o total e a porcentagem de clientes por sexo.


<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/porcentagem_por_sexo.png?raw=true" width="1000"/>

*Podemos perceber que temos 60,96% dos clientes são do sexo masculino e 39,04% feminino, uma diferença de 21,92%*

# Análises Detalhadas

## Distribuição de Clientes por Faixa Salarial
- **Objetivo:** Entender a quantidade de clientes por faixa salarial e sexo.

*Query:*
<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/qtd_clientes_sexo_salario.png?raw=true" width="1000"/>

*Gráfico:*

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/qtd_clientes_sexo_salario-grafico.png?raw=true" width="1000"/>

# Análise do Gráfico

## Faixa Salarial Menos que 40K
- **Total de clientes:** 701 (597 mulheres e 104 homens)
- **Percentual do total de clientes:** 27,34%
- **Conclusão:** Grande parte da base de clientes pertence às faixas salariais mais baixas.

## Distribuição por Sexo

### Mulheres
- **Maioria na faixa menos que 40K:** 597 clientes
- **40K-$60K:** 193 clientes

### Homens
- **Maioria nas faixas superiores a 60K:**
  - **80K-120K:** 488 clientes
  - **60K-80K:** 451 clientes

**Padrão observado:** Mulheres estão mais concentradas nas faixas de menor rendimento.

## Faixas Salariais com Menor Representatividade
- **Faixa "$120K+":** 222 homens e nenhuma mulher registrada.
- **Conclusão:** O banco ou serviço financeiro tem menor penetração entre clientes de alta renda.

## Padrões e Tendências

### Distribuição Desigual entre Gêneros
- **Mulheres na faixa menos que 40K:** Quantidade muito superior à dos homens.
- **Homens:** Representação aumenta conforme os salários aumentam, tornando-se predominante nas faixas mais altas.

**Possíveis explicações:**
- Diferenças salariais no mercado de trabalho.
- Seleção de clientes do serviço financeiro analisado.

### Concentração de Clientes nas Faixas Inferiores
- **Maioria dos clientes:** Concentrados nas faixas menos que 40K e 40K-$60K.
- **Conclusão:** Público com menor capacidade de consumo e, potencialmente, menor acesso a crédito de alto valor.

## Possíveis Explicações
1. O produto financeiro pode ser mais atrativo para clientes de baixa renda.
2. Critérios de concessão de crédito podem favorecer clientes de renda menor.
3. Diferenças salariais e de ocupação entre homens e mulheres impactam a distribuição.


# Qual Faixa Salarial Tem o Maior Limite de Crédito?

*Query usada: `SELECT salario_anual, AVG(limite_credito) AS media_limite_credito
FROM credito
WHERE salario_anual != 'na'
GROUP BY salario_anual
ORDER BY media_limite_credito;`*

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/media_limite_por_salario.png?raw=true" width="1000"/>

*Gráfico:*

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/media_limite_por_salario-grafico.png?raw=true" width="1000"/>

### Análise do gráfico
Os dados mostram uma tendência clara de que, à medida que a faixa salarial aumenta, o limite de crédito médio também cresce. Isso indica que a empresa concede maiores limites de crédito para clientes com maior poder aquisitivo, possivelmente devido a um menor risco de inadimplência e uma maior capacidade de pagamento.

- Clientes com renda inferior a 40K possuem, em média, um limite de crédito de aproximadamente 4.099, enquanto aqueles com renda superior a 120K possuem um limite médio de 17.801, um aumento significativo.
- A maior variação ocorre entre as faixas de 60K-80K e 80K-120K, sugerindo que a empresa adota critérios mais seletivos ao aumentar os limites de crédito para rendas mais altas.

# Qual o Perfil dos Clientes Que Mais Gastam?

*Query usada: `SELECT sexo, escolaridade, salario_anual, AVG(valor_transacoes_12m) AS media_gastos
FROM credito
WHERE salario_anual != 'na' AND escolaridade != 'na'
GROUP BY sexo, escolaridade, salario_anual
ORDER BY media_gastos DESC
LIMIT 10;`*

Tabela com média do top 10 perfis de clientes que mais gastam
<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/media_gastos_salario_formacao.png?raw=true" width="1000"/>

### Análise da tabela
A amostra analisada revela algumas tendências interessantes:

- A média de gastos varia dentro de cada faixa salarial, independentemente do nível de escolaridade.
- Clientes com doutorado, mestrado e graduação apresentam padrões de gastos distintos, mas nem sempre os mais escolarizados têm os maiores gastos.
- Clientes com menores rendimentos (menos que $40K) apresentam uma distribuição de gastos relativamente alta, próxima ou superior à de clientes com faixas salariais maiores.

Embora a renda tenha influência nos gastos médios, a escolaridade também pode ter um impacto significativo nos hábitos de consumo. Algumas observações incluem:

- Clientes com doutorado e mestrado aparecem em diferentes faixas salariais, com variações nos gastos médios.
- Clientes sem educação formal podem ter gastos similares ou até superiores a clientes com ensino superior, o que pode indicar outros fatores como hábitos de consumo, responsabilidades financeiras ou estilo de vida.
- A presença de clientes com altos salários ($120K+) e gastos relativamente baixos sugere um possível comportamento mais conservador no consumo ou maior propensão a investimentos.


# Clientes por Faixa Salarial e Tipo de Cartão, com Valor Total de Transações

*Query usada: `SELECT
  salario_anual,
  tipo_cartao,
  COUNT(*) AS quantidade_clientes,
  SUM(valor_transacoes_12m) AS valor_total_transacoes
FROM
  credito
WHERE salario_anual != 'na' -- Filtra salários válidos
GROUP BY
  salario_anual,
  tipo_cartao
ORDER BY
  valor_total_transacoes`*

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/faixa-salarial_tipo-cartao_total-transacoes.png?raw=true" width="1000"/>

A tabela apresenta a faixa salarial, o tipo de cartão, a quantidade de clientes em cada grupo e o valor total de transações realizadas por esse grupo de clientes.

### Análise da tabela

- A faixa salarial `120K+` apresenta clientes em todas as categorias de cartões, com destaque para o Blue e o Silver.
- A análise revela que a base de clientes é composta majoritariamente por indivíduos com renda inferior a $40K e com cartão Blue.
- A empresa pode considerar segmentar seus clientes com base na faixa salarial e tipo de cartão, oferecendo produtos e serviços mais adequados a cada perfil.
- Estratégias de marketing podem ser direcionadas para os grupos de clientes mais relevantes, maximizando o retorno sobre o investimento.
- A análise do comportamento de gastos dos clientes por faixa salarial e tipo de cartão pode fornecer insights valiosos para a tomada de decisões estratégicas da empresa.

A análise da relação entre faixa salarial, tipo de cartão e valor total de transações revela insights importantes sobre o perfil dos clientes da empresa. Os resultados sugerem que a empresa pode se beneficiar de uma segmentação mais precisa de seus clientes, oferecendo produtos e serviços personalizados para cada grupo. A análise do comportamento de gastos dos clientes também pode fornecer informações valiosas para a tomada de decisões estratégicas da empresa.

## Recomendações Estratégicas:
- **Segmentação de Clientes**: A empresa pode se beneficiar de uma segmentação mais precisa, oferecendo produtos e serviços personalizados para cada grupo (por exemplo, pacotes de benefícios para clientes com cartões Silver e Gold).
- **Marketing Direcionado**: Estratégias de marketing podem ser ajustadas para focar em clientes com maior potencial de gastos, como aqueles nas faixas salariais mais altas.
- **Análise de Comportamento**: Uma análise mais profunda dos hábitos de consumo dos clientes pode revelar oportunidades para aumentar a fidelização e a satisfação do cliente.

Em resumo, a análise fornece uma visão clara do perfil dos clientes e suas preferências, permitindo que a empresa tome decisões mais informadas e estratégicas para melhorar seus produtos e serviços.

## Conecte-se Comigo!

Aqui estão os links para minhas redes profissionais e portfólios. Sinta-se à vontade para entrar em contato ou acompanhar meus projetos:

- **LinkedIn:** [Meu Perfil no LinkedIn](https://www.linkedin.com/in/alexmdebarros/)  
  Conecte-se comigo no LinkedIn para networking e oportunidades profissionais.

- **GitHub:** [Meu Repositório no GitHub](https://github.com/alexmdebarros)  
  Confira meus projetos de código aberto e contribuições no GitHub.

- **Kaggle:** [Meu Perfil no Kaggle](https://www.kaggle.com/code/alexmartinsdebarros/an-lise-de-dados-de-cr-dito-sql-aws-athena)  
  Acompanhe minhas análises de dados e competições no Kaggle.

Fique à vontade para explorar e entrar em contato! 😊