# 1. Inspeção Inicial dos Dados do Consumidor.gov.br

Este notebook realiza a análise inicial dos dados de reclamações do Consumidor.gov.br.

In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
from datetime import datetime

%matplotlib inline
plt.style.use('seaborn')
sns.set_palette('Set2')

## 1.1 Carregamento dos Dados

In [None]:
# Carregar o dataset
df = pd.read_csv('../data/consumidor_gov_data.csv')

# Exibir as primeiras linhas
print('Dimensões do dataset:', df.shape)
df.head()

## 1.2 Análise Inicial das Variáveis

In [None]:
# Informações gerais do dataset
print('\nInformações do Dataset:')
df.info()

print('\nEstatísticas Descritivas:')
df.describe()

## 1.3 Distribuição das Notas

In [None]:
plt.figure(figsize=(10, 6))
sns.histplot(data=df, x='nota', bins=5)
plt.title('Distribuição das Notas de Satisfação')
plt.xlabel('Nota')
plt.ylabel('Frequência')
plt.show()

## 1.4 Análise Temporal

In [None]:
# Converter data para datetime
df['data'] = pd.to_datetime(df['data'])

# Agrupar por mês e calcular média das notas
notas_mensais = df.groupby(df['data'].dt.to_period('M'))['nota'].mean()

plt.figure(figsize=(12, 6))
notas_mensais.plot(kind='line')
plt.title('Evolução da Média de Notas ao Longo do Tempo')
plt.xlabel('Mês')
plt.ylabel('Média das Notas')
plt.xticks(rotation=45)
plt.tight_layout()
plt.show()