# Análise de Dados de Crédito usando Sql

## 1. Introdução
O objetivo deste projeto é analisar um conjunto de dados de crédito de clientes, buscando entender o perfil demográfico, socioeconômico e financeiro dos mesmos. A partir dessa análise, pretendemos identificar padrões, oportunidades e possíveis recomendações para o negócio.

## 2. Exploração Inicial dos Dados
Primeiramente, exploramos o dataset para entender sua estrutura, quantidade de registros e possíveis valores nulos. Também analisamos as primeiras linhas para ter uma visão geral das variáveis disponíveis, como idade, gênero, escolaridade, estado civil, faixa de renda, cor do cartão, entre outras.

**Quantidade de linhas no dataset**

![SELECT COUNT(*) as "quantidade" FROM credito;](/home/diego/Downloads/sql/query1.png)


**Ver as primeiras linhas**

![SELECT COUNT(*) as "quantidade" FROM credito;](/home/diego/Downloads/sql/query2.png)


**Verificar valores nulos por coluna**

![](/home/diego/Downloads/sql/query3.png)

- *Não temos dados nulos no dataset.*

**Estatísticas descritivas para colunas numéricas**

![](/home/diego/Downloads/sql/query4.png)

## 3. Análise Demográfica

Investigamos a distribuição de idade, gênero, escolaridade e estado civil dos clientes. Essa etapa permite identificar o público predominante, possíveis nichos e oportunidades de segmentação.

- **Exemplo:** Qual a faixa etária mais comum? Qual o percentual de clientes casados ou solteiros? Qual o nível de escolaridade predominante?

**Distribuição de escolaridade**

![](/home/diego/Downloads/sql/query5.png)

- *Curiosamente, a escolaridade predominante é de pessoas que possuem mestrado.*

**Distribuição de estado civil**

![](/home/diego/Downloads/sql/query6.png)

- *Temos uma predominancia de pessoas casadas no dataset.*

**Distribuição de clientes por sexo**

![](/home/diego/Downloads/sql/query7.png)

- *Temos mais clientes mulheres que homens.*

**Distribuição por faixa etaria**

![](/home/diego/Downloads/sql/query8.png)

- *Temos a predominancia de clientes entre 35 a 54 anos.* 

## 4. Análise Socioeconômica

Analisamos a distribuição dos clientes por faixa de renda, buscando entender o poder aquisitivo dos diferentes segmentos


**Distribuição por faixa de renda**

![](/home/diego/Downloads/sql/query9.png)

- *A faixa etaria predominate é menor que $40k.*

**Média de limite_credito por faixa de renda**

![](/home/diego/Downloads/sql/query10.png)

- *Como ja era esperado, quanto maior a faixa de renda, maior o limite de credito.*

## 5. Análise Financeira
Exploramos os valores de crédito e gastos dos clientes, identificando médias, desvios e possíveis outliers. Avaliamos a correlação entre idade e valor de crédito, além de analisar os clientes com maiores valores de crédito.

- **Exemplo:** Existe relação entre idade e valor de crédito? Quem são os clientes com maiores limites?

**Correlação entre idade e limite de crédito**

![](/home/diego/Downloads/sql/query11.png)

- *Não existe praticamente nenhuma corelação enter a idade e o limite de credito, pois uma correlação de 0.0129 é muito baixa.*

**Clientes com maior limite de credito**

![](/home/diego/Downloads/sql/query12.png)

- *Aqui conseguimos ver que os clientes com maior limite de credito estão na meia idade, com faixa salarial de $60k ou mais, todos com 3 produtos ou mais contratados além de ter uma quantidade significativa de transações.*

## 6. Segmentação de Clientes
Com base nas análises anteriores, segmentamos os clientes por características relevantes (escolaridade, faixa de renda, estado civil, gênero) para identificar grupos de interesse e possíveis estratégias de atuação.


**Média e soma do valor de transações por escolaridade**

![](/home/diego/Downloads/sql/query13.png)

**Média e soma do valor de transações por faixa de renda**

![](/home/diego/Downloads/sql/query14.png)

**Média e soma do valor de transações por estado civil**

![](/home/diego/Downloads/sql/query15.png)

**Média e soma do valor de transações por gênero**

![](/home/diego/Downloads/sql/query16.png)

**Identificar grupos subatendidos: segmentos com baixo total de transações**

![](/home/diego/Downloads/sql/query17.png)

## Conclusão

O projeto permitiu uma compreensão abrangente do perfil dos clientes, identificando padrões demográficos, socioeconômicos e financeiros que podem orientar estratégias de negócio. A partir das análises realizadas, destacam-se os seguintes pontos:

1. **Perfil Demográfico:**

    A maioria dos clientes está na faixa etária de 35 a 54 anos, é casada, possui mestrado e há uma predominância de mulheres. Isso sugere oportunidades de segmentação para produtos que atendam às necessidades desse grupo, como planos familiares ou serviços educacionais complementares.

2. **Características Socioeconômicas:**

    A faixa de renda mais comum é inferior a $40k, mas clientes comrenda acima de $60k apresentam os maiores limites de crédito. Isso reforça a importância de oferecer opções diferenciadas para clientes de alta renda, como cartões premium ou benefícios exclusivos.

3. **Comportamento Financeiro:**

    Não há correlação significativa entre idade e limite de crédito, indicando que políticas de crédito podem ser mais influenciadas por fatores como renda e histórico de transações. Os clientes com maiores limites tendem a ter múltiplos produtos contratados e alto volume de transações, sugerindo fidelização por meio de pacotes integrados. 

4. **Segmentação e Oportunidades:**

    Grupos como solteiros e clientes com ensino médio apresentaram menor volume de transações, indicando potencial para campanhas direcionadas. Além disso, a alta concentração de clientes com mestrado abre espaço para parcerias com instituições de ensino ou serviços especializados.       

**Recomendações:**

- Desenvolver programas de fidelização para clientes de alta renda, oferecendo benefícios como cashback ou taxas reduzidas.

- Criar campanhas de marketing direcionadas a grupos subatendidos (solteiros, ensino médio) para aumentar engajamento.

- Aprimorar políticas de crédito com base em renda e histórico de transações, em vez de fatores demográficos isolados.

**Próximos Passos:**

- Investigar as causas do baixo volume de transações em certos segmentos por meio de pesquisas qualitativas.

- Analisar o impacto de variáveis como tempo de relacionamento com o banco e inadimplência.

- Explorar técnicas de machine learning para prever propensão a contratar novos produtos.

Em resumo, a análise oferece um sólido embasamento para decisões estratégicas, destacando a importância de personalizar ofertas e otimizar políticas com base em dados concretos.