<a href="https://colab.research.google.com/github/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/An%C3%A1lise_de_dados_de_cr%C3%A9dito_sql_aws_athena.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

#An√°lise de Dados de Cr√©dito no Athena
## Introdu√ß√£o
Nesta an√°lise, vou explorar um dataset de clientes de cart√£o de cr√©dito para entender seus perfis, h√°bitos de consumo e limites de cr√©dito.

Usarei a linguagem SQL no Amazon (AWS) Athena para processar os dados e apresentar insights relevantes.

# Explora√ß√£o de dados

Com o bucket configurado e a tabela criada no AWS vou tentar explorar um pouco a estrutuda dos dados para garimpar alguns insights, pra isso utilizei algumas queries:

A querie `DESCRIBE credito;` retorna os nomes das colunas e os tipos de dados conforme abaixo;

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/describe.png?raw=true" width="250"/>

A querie `SELECT COUNT(*) AS total_clientes FROM credito;` retorna o total de clientes renomeando tamb√©m a coluna;

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/total_clientes.png?raw=true" width="250"/>

*Percebemos no print acima que temos um total de 2564 clientes ao total para analisar*


A querie `SELECT sexo,
       COUNT(*) AS qtd_por_sexo,
       ROUND((COUNT(*) * 100.0 / (SELECT COUNT(*) FROM credito WHERE sexo IN ('M', 'F'))), 2) AS porcentagem
FROM credito
WHERE sexo IN ('M', 'F')
GROUP BY sexo;` retorna o total e a porcentagem de clientes por sexo.


<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/porcentagem_por_sexo.png?raw=true" width="1000"/>

*Podemos perceber que temos 60,96% dos clientes s√£o do sexo masculino e 39,04% feminino, uma diferen√ßa de 21,92%*

# An√°lises Detalhadas

## Distribui√ß√£o de Clientes por Faixa Salarial
- **Objetivo:** Entender a quantidade de clientes por faixa salarial e sexo.

*Query:*
<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/qtd_clientes_sexo_salario.png?raw=true" width="1000"/>

*Gr√°fico:*

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/qtd_clientes_sexo_salario-grafico.png?raw=true" width="1000"/>

# An√°lise do Gr√°fico

## Faixa Salarial Menos que 40K
- **Total de clientes:** 701 (597 mulheres e 104 homens)
- **Percentual do total de clientes:** 27,34%
- **Conclus√£o:** Grande parte da base de clientes pertence √†s faixas salariais mais baixas.

## Distribui√ß√£o por Sexo

### Mulheres
- **Maioria na faixa menos que 40K:** 597 clientes
- **40K-$60K:** 193 clientes

### Homens
- **Maioria nas faixas superiores a 60K:**
  - **80K-120K:** 488 clientes
  - **60K-80K:** 451 clientes

**Padr√£o observado:** Mulheres est√£o mais concentradas nas faixas de menor rendimento.

## Faixas Salariais com Menor Representatividade
- **Faixa "$120K+":** 222 homens e nenhuma mulher registrada.
- **Conclus√£o:** O banco ou servi√ßo financeiro tem menor penetra√ß√£o entre clientes de alta renda.

## Padr√µes e Tend√™ncias

### Distribui√ß√£o Desigual entre G√™neros
- **Mulheres na faixa menos que 40K:** Quantidade muito superior √† dos homens.
- **Homens:** Representa√ß√£o aumenta conforme os sal√°rios aumentam, tornando-se predominante nas faixas mais altas.

**Poss√≠veis explica√ß√µes:**
- Diferen√ßas salariais no mercado de trabalho.
- Sele√ß√£o de clientes do servi√ßo financeiro analisado.

### Concentra√ß√£o de Clientes nas Faixas Inferiores
- **Maioria dos clientes:** Concentrados nas faixas menos que 40K e 40K-$60K.
- **Conclus√£o:** P√∫blico com menor capacidade de consumo e, potencialmente, menor acesso a cr√©dito de alto valor.

## Poss√≠veis Explica√ß√µes
1. O produto financeiro pode ser mais atrativo para clientes de baixa renda.
2. Crit√©rios de concess√£o de cr√©dito podem favorecer clientes de renda menor.
3. Diferen√ßas salariais e de ocupa√ß√£o entre homens e mulheres impactam a distribui√ß√£o.


# Qual Faixa Salarial Tem o Maior Limite de Cr√©dito?

*Query usada: `SELECT salario_anual, AVG(limite_credito) AS media_limite_credito
FROM credito
WHERE salario_anual != 'na'
GROUP BY salario_anual
ORDER BY media_limite_credito;`*

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/media_limite_por_salario.png?raw=true" width="1000"/>

*Gr√°fico:*

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/media_limite_por_salario-grafico.png?raw=true" width="1000"/>

### An√°lise do gr√°fico
Os dados mostram uma tend√™ncia clara de que, √† medida que a faixa salarial aumenta, o limite de cr√©dito m√©dio tamb√©m cresce. Isso indica que a empresa concede maiores limites de cr√©dito para clientes com maior poder aquisitivo, possivelmente devido a um menor risco de inadimpl√™ncia e uma maior capacidade de pagamento.

- Clientes com renda inferior a 40K possuem, em m√©dia, um limite de cr√©dito de aproximadamente 4.099, enquanto aqueles com renda superior a 120K possuem um limite m√©dio de 17.801, um aumento significativo.
- A maior varia√ß√£o ocorre entre as faixas de 60K-80K e 80K-120K, sugerindo que a empresa adota crit√©rios mais seletivos ao aumentar os limites de cr√©dito para rendas mais altas.

# Qual o Perfil dos Clientes Que Mais Gastam?

*Query usada: `SELECT sexo, escolaridade, salario_anual, AVG(valor_transacoes_12m) AS media_gastos
FROM credito
WHERE salario_anual != 'na' AND escolaridade != 'na'
GROUP BY sexo, escolaridade, salario_anual
ORDER BY media_gastos DESC
LIMIT 10;`*

Tabela com m√©dia do top 10 perfis de clientes que mais gastam
<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/media_gastos_salario_formacao.png?raw=true" width="1000"/>

### An√°lise da tabela
A amostra analisada revela algumas tend√™ncias interessantes:

- A m√©dia de gastos varia dentro de cada faixa salarial, independentemente do n√≠vel de escolaridade.
- Clientes com doutorado, mestrado e gradua√ß√£o apresentam padr√µes de gastos distintos, mas nem sempre os mais escolarizados t√™m os maiores gastos.
- Clientes com menores rendimentos (menos que $40K) apresentam uma distribui√ß√£o de gastos relativamente alta, pr√≥xima ou superior √† de clientes com faixas salariais maiores.

Embora a renda tenha influ√™ncia nos gastos m√©dios, a escolaridade tamb√©m pode ter um impacto significativo nos h√°bitos de consumo. Algumas observa√ß√µes incluem:

- Clientes com doutorado e mestrado aparecem em diferentes faixas salariais, com varia√ß√µes nos gastos m√©dios.
- Clientes sem educa√ß√£o formal podem ter gastos similares ou at√© superiores a clientes com ensino superior, o que pode indicar outros fatores como h√°bitos de consumo, responsabilidades financeiras ou estilo de vida.
- A presen√ßa de clientes com altos sal√°rios ($120K+) e gastos relativamente baixos sugere um poss√≠vel comportamento mais conservador no consumo ou maior propens√£o a investimentos.


# Clientes por Faixa Salarial e Tipo de Cart√£o, com Valor Total de Transa√ß√µes

*Query usada: `SELECT
  salario_anual,
  tipo_cartao,
  COUNT(*) AS quantidade_clientes,
  SUM(valor_transacoes_12m) AS valor_total_transacoes
FROM
  credito
WHERE salario_anual != 'na' -- Filtra sal√°rios v√°lidos
GROUP BY
  salario_anual,
  tipo_cartao
ORDER BY
  valor_total_transacoes`*

<img src="https://github.com/alexmdebarros/analise_credito_clientes_sql_aws/blob/main/faixa-salarial_tipo-cartao_total-transacoes.png?raw=true" width="1000"/>

A tabela apresenta a faixa salarial, o tipo de cart√£o, a quantidade de clientes em cada grupo e o valor total de transa√ß√µes realizadas por esse grupo de clientes.

### An√°lise da tabela

- A faixa salarial `120K+` apresenta clientes em todas as categorias de cart√µes, com destaque para o Blue e o Silver.
- A an√°lise revela que a base de clientes √© composta majoritariamente por indiv√≠duos com renda inferior a $40K e com cart√£o Blue.
- A empresa pode considerar segmentar seus clientes com base na faixa salarial e tipo de cart√£o, oferecendo produtos e servi√ßos mais adequados a cada perfil.
- Estrat√©gias de marketing podem ser direcionadas para os grupos de clientes mais relevantes, maximizando o retorno sobre o investimento.
- A an√°lise do comportamento de gastos dos clientes por faixa salarial e tipo de cart√£o pode fornecer insights valiosos para a tomada de decis√µes estrat√©gicas da empresa.

A an√°lise da rela√ß√£o entre faixa salarial, tipo de cart√£o e valor total de transa√ß√µes revela insights importantes sobre o perfil dos clientes da empresa. Os resultados sugerem que a empresa pode se beneficiar de uma segmenta√ß√£o mais precisa de seus clientes, oferecendo produtos e servi√ßos personalizados para cada grupo. A an√°lise do comportamento de gastos dos clientes tamb√©m pode fornecer informa√ß√µes valiosas para a tomada de decis√µes estrat√©gicas da empresa.

## Recomenda√ß√µes Estrat√©gicas:
- **Segmenta√ß√£o de Clientes**: A empresa pode se beneficiar de uma segmenta√ß√£o mais precisa, oferecendo produtos e servi√ßos personalizados para cada grupo (por exemplo, pacotes de benef√≠cios para clientes com cart√µes Silver e Gold).
- **Marketing Direcionado**: Estrat√©gias de marketing podem ser ajustadas para focar em clientes com maior potencial de gastos, como aqueles nas faixas salariais mais altas.
- **An√°lise de Comportamento**: Uma an√°lise mais profunda dos h√°bitos de consumo dos clientes pode revelar oportunidades para aumentar a fideliza√ß√£o e a satisfa√ß√£o do cliente.

Em resumo, a an√°lise fornece uma vis√£o clara do perfil dos clientes e suas prefer√™ncias, permitindo que a empresa tome decis√µes mais informadas e estrat√©gicas para melhorar seus produtos e servi√ßos.

## Conecte-se Comigo!

Aqui est√£o os links para minhas redes profissionais e portf√≥lios. Sinta-se √† vontade para entrar em contato ou acompanhar meus projetos:

- **LinkedIn:** [Meu Perfil no LinkedIn](https://www.linkedin.com/in/alexmdebarros/)  
  Conecte-se comigo no LinkedIn para networking e oportunidades profissionais.

- **GitHub:** [Meu Reposit√≥rio no GitHub](https://github.com/alexmdebarros)  
  Confira meus projetos de c√≥digo aberto e contribui√ß√µes no GitHub.

- **Kaggle:** [Meu Perfil no Kaggle](https://www.kaggle.com/code/alexmartinsdebarros/an-lise-de-dados-de-cr-dito-sql-aws-athena)  
  Acompanhe minhas an√°lises de dados e competi√ß√µes no Kaggle.

Fique √† vontade para explorar e entrar em contato! üòä