<a href="https://colab.research.google.com/github/DDricko/Ciencia_de_dados_Ebac/blob/main/Ebac_Project.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

##Etapa 1: Introdução

Este projeto tem como objetivo explorar um conjunto de dados de clientes de uma instituição financeira, realizando limpeza, visualização e análise para identificar padrões de comportamento e oportunidades de negócio.

##Etapa 2: Contexto de dados

1. Dicionário de dados

| Coluna                | Descrição                                                    |
| :-------------------- | :----------------------------------------------------------- |
| idade                 | Idade do cliente                                             |
| sexo                  | Sexo do cliente (M ou F)                                     |
| dependentes           | Número de dependentes do cliente                             |
| escolaridade          | Nível de escolaridade do cliente                             |
| estado_civil          | Estado civil do cliente                                      |
| salario_anual         | Faixa de salário anual do cliente                            |
| tipo_cartao           | Tipo de cartão de crédito do cliente (blue, silver, gold, platinum) |
| meses_de_relacionamento | Tempo de relacionamento com o banco (em meses)             |
| qtd_produtos          | Quantidade de produtos bancários adquiridos                |
| iteracoes_12m         | Número de interações com o banco nos últimos 12 meses        |
| meses_inativo_12m     | Número de meses inativo nos últimos 12 meses                 |
| limite_credito        | Limite de crédito disponível para o cliente                  |
| valor_transacoes_12m  | Valor total das transações realizadas nos últimos 12 meses   |
| qtd_transacoes_12m    | Quantidade de transações realizadas nos últimos 12 meses     |

##Etapa 3: Carregar e Preparar os dados.
###Objetivo: Ler o arquivo csv e preparar os dados pra análise.*italicized text*

1. Importar bibliotecas

In [None]:
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns

2. Carregar o arquivo:

In [None]:
df = pd.read_csv('Python_M11_support material.csv', index_col=0)

3. Corrigir formatação numérica(valores com virgula e ponto):

In [None]:
df['limite_credito'] = df['limite_credito'].str.replace('.', '').str.replace(',', '.').astype(float)
df['valor_transacoes_12m'] = df['valor_transacoes_12m'].str.replace('.', '').str.replace(',', '.').astype(float)

##Etapa 4: Exploração e limpeza
###Objetivo: Verificar dados ausentes e entender a estrutura.*italicized text*

1. Verificar valores ausentes:

In [None]:
df.isnull().sum()

2. Estatísticas descritivas:

In [None]:
df.describe(include='all')

##Etapa 5: Visualização de dados

###Objetivo: criar gráficos para entender padrões.

1. Distribuição de idade:

In [None]:
sns.histplot(df['idade'], bins=30, kde=True)

2. Distribuição por sexo:

In [None]:
sns.countplot(x='sexo', data=df)

3. Distribuição por escolaridade:

In [None]:
sns.countplot(x='escolaridade', data=df)

4. Distribuição por tipo de cartão:

In [None]:
sns.boxplot(x='tipo_cartao', y='valor_transacoes_12m')

##Etapa 6: Principais Descobertas


- A maioria dos clientes tem entre 40 e 50 anos.
- O cartão mais comum é o **blue**, mas os cartões **gold** e **platinum** têm limites de crédito mais altos.
- Clientes com maior escolaridade tendem a ter limites de crédito mais elevados.
- O valor de transações varia bastante entre os tipos de cartão, indicando perfis de uso distintos.


##Etapa 7: Conclusão



A análise revelou padrões importantes de inadimplência.
A análise revelou padrões importantes que podem ser usados para segmentar clientes, ajustar limites de crédito e personalizar ofertas. Como próximos passos, recomenda-se aplicar modelos preditivos para identificar clientes com maior risco