# Análise Exploratória de Clientes com Cartão de Crédito

### Exploração e análise de dados

Este projeto visa realizar uma análise exploratória de dados de clientes com cartão de crédito utilizando *AWS Athena*, *Amazon S3* e *SQL*. O trabalho é parte integrante do desenvolvimento de habilidades em consulta a grandes bases de dados no ambiente em nuvem, aplicando boas práticas de organização de queries, análise e interpretação dos resultados obtidos. Pretendemos responder questões como: Qual o perfil dos clientes com maior limite de crédito? Quem realiza mais transações? Existe alguma relação entre escolaridade, salário e consumo?

### Sobre os dados

A base de dados *credito8.csv* foi armazenada no *Amazon S3* e lida mediante uma tabela externa criada no *AWS Athena*. Foram aplicadas *queries* simples para validar o carregamento correto dos dados, visualizar suas principais características e garantir a integridade das colunas. Esta etapa é essencial para compreender a estrutura do dataset antes de realizar análises mais profundas.

Esses dados representam informações de clientes de um banco e contam com as seguintes colunas:

* idade = idade do cliente
* sexo = sexo do cliente (F ou M)
* dependentes = número de dependentes do cliente
* escolaridade = nível de escolaridade do clientes
* salario_anual = faixa salarial do cliente
* tipo_cartao = tipo de cartão do cliente
* qtd_produtos = quantidade de produtos comprados nos últimos 12 meses
* iteracoes_12m = quantidade de iterações/transações nos últimos 12 meses
* meses_inativo_12m = quantidade de meses que o cliente ficou inativo
* limite_credito = limite de crédito do cliente
* valor_transacoes_12m = valor das transações dos últimos 12 meses
* qtd_transacoes_12m = quantidade de transações dos últimos 12 meses

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/tabela-M8-query1.png?raw=true)

### Entendimento do Público
Nesta etapa, realizamos análises descritivas para entender o perfil demográfico dos clientes. Foram avaliadas as distribuições por sexo, escolaridade, e faixa salarial. Essas informações iniciais são fundamentais para orientar análises posteriores sobre comportamento financeiro e segmentação de clientes. Também foram utilizados gráficos para melhor visualização dessas informações. 

#### 1- Total de registros

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/tabela-M8-query2.png?raw=true)

#### 2- Escolaridade distinta

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/tabela-M8-query3.png?raw=true)

#### 3- Distribuição por faixa salarial

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/tabela-M8-query4.png?raw=true)

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/grafico-M8-query4.png?raw=true)

#### 4- Distribuição por sexo

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/tabela-M8-query5.png?raw=true)

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/grafico-M8-query5.png?raw=true)

### Perfil Financeiro

A partir das informações transacionais e de limite de crédito, investigamos como diferentes perfis de clientes se comportam financeiramente. Analisamos a média de produtos utilizados, o valor médio transacionado nos últimos 12 meses e o limite médio de crédito disponível, cruzando essas informações com variáveis como sexo e faixa salarial. Esses dados permitem identificar tendências de consumo e níveis de engajamento dos clientes, assim como perfis de maior movimentação ou potencial de crédito.

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/tabela-M8-query8.png?raw=true)

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/grafico-M8-query8.png?raw=true)

### Destaques e Perfis Específicos

Com foco em identificar clientes de maior valor para a instituição, analisamos quais perfis apresentam os maiores limites de crédito e os maiores valores transacionados. Este tipo de insight é estratégico para campanhas de fidelização, ofertas de produtos financeiros e gestão de riscos.

#### 1- Top 10 limites de crédito

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/tabela-M8-query6.png?raw=true)

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/grafico-M8-query6.png?raw=true)

#### 2- Valores transacionados por sexo

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/tabela-M8-query7.png?raw=true)

![](https://github.com/ThaisApdaCardoso/analise_exp_credito/blob/main/grafico-M8-query7.png?raw=true)


### Conclusões e Insights

A análise revelou que clientes com maior poder de transação e crédito tendem a ter escolaridade mais alta e maior faixa salarial. Além disso, a distribuição por sexo mostrou variações significativas tanto na média de transações quanto no limite de crédito concedido. Esses padrões reforçam a importância de segmentações mais detalhadas para melhores decisões comerciais, estratégias de retenção, e políticas de crédito.

### Próximos Passos

Este projeto pode ser expandido com análises preditivas, recomenda-se a aplicação de técnicas de Machine Learning para previsão de limite de crédito ou risco de inadimplência. A clusterização de perfis de clientes e a criação de dashboards interativos também são caminhos interessantes para aprofundar os insights.

### Dados e Referências

Fonte: Dataset uma versão dos dados disponibilizados em: *https://github.com/andre-marcos-perez/ebac-course-utils/tree/main/dataset*

Local de armazenamento: *Amazon S3*

Ambiente de análise: *AWS Athena*

Código e visualizações: *Google Colab* / *Kaggle*

Autor: Thais Cardoso *https://github.com/ThaisApdaCardoso/credit_exploratory_analysis*
*https://www.kaggle.com/code/thaisapdacardoso/credit-exploratory-data-analysis*