# PROJETO FINAL: AN√ÅLISE DE RECLAMA√á√ïES FINANCEIRAS - AGIBANK

**Trilha:** Dados - Agibank  
**Data:** Fevereiro 2025  
**Fonte:** Consumidor.gov.br (Senacon/MJSP)

---

## CONTEXTO DO PROJETO

Este projeto analisa **2.5+ milh√µes de reclama√ß√µes** do Consumidor.gov.br (2025), com foco estrat√©gico no **setor financeiro brasileiro**, abrangendo:

- üè¶ **Setor Financeiro Nacional** (bancos, fintechs, cart√µes de cr√©dito)
- üáßüá∑ **Brasil** (panorama geral do mercado financeiro)
- üèôÔ∏è **S√£o Paulo** (principal hub financeiro do pa√≠s)
- üè¢ **Agibank** (an√°lise competitiva e posicionamento)

---

## OBJETIVOS

### An√°lise do Setor Financeiro
1. Mapear principais problemas reportados por consumidores
2. Identificar tend√™ncias e padr√µes de reclama√ß√µes
3. Analisar taxas de resolu√ß√£o e tempo de resposta do setor
4. Comparar performance entre institui√ß√µes financeiras

---

## ESCOPO DAS AN√ÅLISES

### An√°lises Quantitativas
- Volume e distribui√ß√£o temporal de reclama√ß√µes
- Segmenta√ß√£o por tipo de produto financeiro
- M√©tricas de satisfa√ß√£o e resolu√ß√£o
- An√°lise geogr√°fica (foco em S√£o Paulo)

### An√°lises Qualitativas
- Categoriza√ß√£o de problemas recorrentes
- An√°lise de sentimento (quando aplic√°vel)
- Identifica√ß√£o de gargalos operacionais
- Benchmarking competitivo

### Insights Estrat√©gicos
- Oportunidades de melhoria no atendimento
- Produtos/servi√ßos com maior √≠ndice de reclama√ß√µes
- Recomenda√ß√µes para redu√ß√£o de churn
- Sugest√µes de expans√£o baseadas em gaps do mercado

---

## REQUISITOS ATENDIDOS

‚úÖ **A. Higiene dos Dados:** Importa√ß√£o, limpeza e tratamento  
‚úÖ **B. Performance (NumPy):** Vetoriza√ß√£o e classifica√ß√µes complexas  
‚úÖ **C. An√°lise Explorat√≥ria:** GroupBy e m√©tricas estat√≠sticas  
‚úÖ **D. Visualiza√ß√£o:** Gr√°ficos com storytelling  

---

## DADOS

- **Fonte:** Consumidor.gov.br (Senacon/MJSP)
- **Per√≠odo:** 2025
- **Volume Total:** 2.567.095 registros
- **Foco:** Setor Financeiro (bancos, fintechs, cart√µes, seguros)
- **Camadas:** Bronze ‚Üí Silver ‚Üí Gold
- **Granularidade:** Nacional, Regional (SP) e Empresa (Agibank)

In [1]:
# Importa√ß√£o de bibliotecas essenciais para an√°lise de dados, visualiza√ß√£o e manipula√ß√£o de arquivos, garantindo que todas as ferramentas necess√°rias estejam dispon√≠veis para realizar an√°lises secund√°rias de forma eficiente e eficaz.

import sys
from pathlib import Path

# Adicionar pasta raiz ao path (3 n√≠veis acima) --> garantir que os m√≥dulos customizados localizados na pasta 'lib' possam ser importados corretamente, facilitando a organiza√ß√£o do c√≥digo e a reutiliza√ß√£o de fun√ß√µes e classes em diferentes partes do projeto.

sys.path.append('../../..')

import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import warnings
import plotly.express as px        
import plotly.graph_objects as go  
import altair as alt               
from dash import Dash, dcc, html   
import warnings
from datetime import datetime

# Configura√ß√µes do projeto --> garantir que as an√°lises sejam realizadas com base em um ano espec√≠fico, e que os caminhos para salvar os resultados estejam definidos de forma clara e organizada, facilitando a gest√£o dos arquivos gerados durante o processo de an√°lise.

# M√≥dulo de carregamento de dados --> garantir que as bases de dados necess√°rias para as an√°lises secund√°rias sejam carregadas de forma eficiente e consistente, utilizando fun√ß√µes customizadas que facilitam a leitura e manipula√ß√£o dos dados, al√©m de fornecer informa√ß√µes sobre os arquivos dispon√≠veis e a estrutura das bases carregadas.
# Lib --> carregamento de dados, organiza√ß√£o e informa√ß√µes sobre as bases de dados, garantindo que os dados sejam acessados de forma eficiente e estruturada para as an√°lises subsequentes.

from lib.carregamento import (
    carregar_base_silver,
    carregar_base_gold_sp,
    carregar_base_agibank,
    carregar_base_filtrada,
    listar_arquivos_disponiveis,
    info_base
)

from lib.cores import (
    aplicar_tema_agibank,
    configurar_plotly,
    CORES_AGIBANK,
    PALETA_CATEGORICA,
    PALETA_AZUL,
    PALETA_VERDE,
    PLOTLY_COLORS,
    PLOTLY_PALETTE,
    PLOTLY_SCALE_AZUL,
    PLOTLY_SCALE_VERDE
)

from lib.visualizacoes import (
    grafico_barras,
    grafico_linha,
    grafico_pizza,
    grafico_boxplot,
    grafico_heatmap,
    grafico_distribuicao,
    grafico_comparativo_barras
)

print("‚úÖ Todos os m√≥dulos importados com sucesso!")



Tema Agibank aplicado - Tamanho: medio
‚úÖ Todos os m√≥dulos importados com sucesso!


In [2]:
warnings.filterwarnings('ignore')

# Configura√ß√µes de exibi√ß√£o do Pandas
pd.set_option('display.max_columns', None)
pd.set_option('display.max_rows', 100)
pd.set_option('display.float_format', '{:.2f}'.format)
pd.set_option('display.width', None)
pd.set_option('display.max_colwidth', 50)

# Aplicar temas visuais
aplicar_tema_agibank('grande')  # Matplotlib/Seaborn
configurar_plotly()              # Plotly

# Configura√ß√£o do Altair
alt.renderers.enable('default')
alt.data_transformers.disable_max_rows()

# Configura√ß√µes para gr√°ficos inline no Jupyter
try:
    get_ipython().run_line_magic('matplotlib', 'inline')
except:
    pass

plt.rcParams['savefig.dpi'] = 300
plt.rcParams['savefig.bbox'] = 'tight'

Tema Agibank aplicado - Tamanho: grande
Tema Agibank aplicado ao Plotly


In [3]:
# Ano de an√°lise e caminhos
ANO_ANALISE = 2025
RAIZ_PROJETO = Path.cwd()
CAMINHO_OUTPUT = RAIZ_PROJETO / 'output'
CAMINHO_OUTPUT.mkdir(exist_ok=True)

print(f"‚úÖ Configura√ß√µes iniciais conclu√≠das!")
print(f"Ambiente pronto para an√°lise do setor financeiro em {ANO_ANALISE}")

‚úÖ Configura√ß√µes iniciais conclu√≠das!
Ambiente pronto para an√°lise do setor financeiro em 2025


In [7]:
print("\n" + "=" * 80)
print("AMBIENTE CONFIGURADO COM SUCESSO")
print("=" * 80)

print(f"\nVersoes das bibliotecas:")
print(f"  Pandas: {pd.__version__}")
print(f"  NumPy: {np.__version__}")
print(f"  Matplotlib: {plt.matplotlib.__version__}")
print(f"  Seaborn: {sns.__version__}")

# Vers√£o do Plotly (importar o m√≥dulo base)
try:
    import plotly
    print(f"  Plotly: {plotly.__version__}")
except:
    print(f"  Plotly: instalado")

print(f"  Altair: {alt.__version__}")
print(f"  Python: {sys.version.split()[0]}")

print(f"\nConfiguracoes do projeto:")
print(f"  Ano de analise: {ANO_ANALISE}")
print(f"  Pasta de output: {CAMINHO_OUTPUT}")
print(f"  Path atual: {RAIZ_PROJETO}")

print(f"\nTema visual:")
print(f"  Tema Agibank aplicado (tamanho: grande)")
print(f"  Paleta Matplotlib: {len(PALETA_CATEGORICA)} cores")
print(f"  Paleta Plotly: {len(PLOTLY_PALETTE)} cores")

print("=" * 80)


AMBIENTE CONFIGURADO COM SUCESSO

Versoes das bibliotecas:
  Pandas: 2.3.3
  NumPy: 2.3.5
  Matplotlib: 3.10.7
  Seaborn: 0.13.2
  Plotly: 6.5.1
  Altair: 6.0.0
  Python: 3.13.5

Configuracoes do projeto:
  Ano de analise: 2025
  Pasta de output: c:\Users\caroline.coutinho\projeto_mediacao_bancaria\analises\silver\notebooks_silver\output
  Path atual: c:\Users\caroline.coutinho\projeto_mediacao_bancaria\analises\silver\notebooks_silver

Tema visual:
  Tema Agibank aplicado (tamanho: grande)
  Paleta Matplotlib: 6 cores
  Paleta Plotly: 6 cores


In [8]:
# Carrega e exibe os arquivos dispon√≠veis para an√°lise, garantindo que o usu√°rio tenha uma vis√£o clara dos dados que ser√£o utilizados nas an√°lises secund√°rias, e possa verificar a estrutura e o conte√∫do das bases de dados antes de prosseguir com as an√°lises.

print("\n" + "=" * 80)
print("CARREGAMENTO DA BASE SILVER")
print("=" * 80)

# Carregar base completa, e exibir informa√ß√µes sobre a estrutura, colunas, tipos de dados e amostra dos dados para garantir que a base foi carregada corretamente e que o usu√°rio tenha uma vis√£o clara do conte√∫do da base antes de prosseguir com as an√°lises secund√°rias.

df = carregar_base_silver()
info_base(df)

# Filtrar dados do setor financeiro, garantindo que as an√°lises subsequentes sejam focadas em um segmento espec√≠fico, e que os resultados sejam relevantes para o setor financeiro, utilizando a coluna de segmento/setor identificada na base de dados.

print("\n" + "=" * 80)
print("FILTRAGEM DO SETOR FINANCEIRO")
print("=" * 80)

# Identificar coluna de segmento/setor --> garantir que a filtragem seja realizada com base na coluna correta, mesmo que o nome da coluna possa variar entre diferentes bases de dados, aumentando a robustez do c√≥digo e a capacidade de lidar com diferentes estruturas de dados.

colunas_setor = ['segmento_mercado', 'grupo_economico', 'area', 'setor', 'ramo_atividade']
coluna_setor = None

# Verificar se alguma das colunas de setor est√° presente na base de dados, e atribuir a vari√°vel 'coluna_setor' com o nome da coluna encontrada para ser utilizada na filtragem dos dados do setor financeiro.

for col in colunas_setor:
    if col in df.columns:
        coluna_setor = col
        print(f"‚úÖ Coluna de segmento encontrada: {coluna_setor}")
        break

# Se nenhuma coluna de setor for encontrada, exibir uma mensagem de aviso e listar as colunas dispon√≠veis na base de dados para que o usu√°rio possa identificar a coluna correta para a filtragem dos dados do setor financeiro.

if not coluna_setor:
    print("‚ö†Ô∏è Coluna de segmento n√£o encontrada automaticamente")
    print("\nColunas dispon√≠veis:")
    print(df.columns.tolist())


CARREGAMENTO DA BASE SILVER
Carregando de: c:\Users\caroline.coutinho\projeto_mediacao_bancaria\analises\silver\notebooks_silver\..\..\..\data\silver\consumidor_gov_silver_v1.csv
Base carregada com sucesso!
Registros: 2,567,095
Colunas: 30
INFORMACOES DA BASE

Total de registros: 2,567,095
Total de colunas: 30
Periodo: 2024 a 2025
Memoria utilizada: 4203.42 MB

FILTRAGEM DO SETOR FINANCEIRO
‚úÖ Coluna de segmento encontrada: area
