In [15]:
import pandas as pd 
from unidecode import unidecode 

### Extração dos dados

In [124]:
# extração dos dados
df_jan = pd.read_csv('dados/finalizadas_2024-01.csv', delimiter=';')
df_fev = pd.read_csv('dados/finalizadas_2024-02.csv', delimiter=';')
df_mar = pd.read_csv('dados/finalizadas_2024-03.csv', delimiter=';')

In [125]:
# realizando a junção dos dois dataframes em um só
df_concat = pd.concat([df_jan, df_fev, df_mar], ignore_index=True)

In [126]:
df_concat.head()

Unnamed: 0,Região,UF,Cidade,Sexo,Faixa Etária,Data Finalização,Tempo Resposta,Nome Fantasia,Segmento de Mercado,Área,Assunto,Grupo Problema,Problema,Como Comprou Contratou,Procurou Empresa,Respondida,Situação,Avaliação Reclamação,Nota do Consumidor
0,NE,BA,Salvador,F,entre 31 a 40 anos,2024-01-01,,Jadlog,Empresas de Serviços Postais e Logística,Demais Serviços,Serviços Postais,Entrega do Produto,Não entrega / demora na entrega do produto,Internet,S,N,Finalizada não avaliada,Não Avaliada,
1,NE,BA,Salvador,M,entre 31 a 40 anos,2024-01-01,10.0,Hipercard,"Bancos, Financeiras e Administradoras de Cartão",Serviços Financeiros,Cartão de Crédito / Cartão de Débito / Cartão ...,Cobrança / Contestação,Negativação indevida referente a cobrança não ...,Não comprei / contratei,S,S,Finalizada não avaliada,Não Avaliada,
2,SE,SP,Jundiaí,F,entre 41 a 50 anos,2024-01-01,,99App,Empresas de Intermediação de Serviços / Negócios,Demais Serviços,Aplicativo de mobilidade urbana,Cobrança / Contestação,Cobrança em duplicidade / Cobrança referente a...,Internet,S,N,Finalizada não avaliada,Não Avaliada,
3,NE,BA,Salvador,F,entre 31 a 40 anos,2024-01-01,10.0,iFood,Empresas de Intermediação de Serviços / Negócios,Demais Serviços,Serviços de entrega / delivery,Entrega do Produto,Produto entregue incompleto / diferente do pe...,Internet,S,S,Finalizada não avaliada,Não Avaliada,
4,NE,BA,Salvador,F,entre 51 a 60 anos,2024-01-01,10.0,Banco BMG,"Bancos, Financeiras e Administradoras de Cartão",Serviços Financeiros,Crédito Consignado (para servidores públicos o...,Cobrança / Contestação,Dificuldade para obter boleto de quitação ou i...,Telefone,S,S,Finalizada não avaliada,Não Avaliada,


### Transformação dos dados

In [127]:
# utilizando o método info para verificar os tipos e dados e valores não nulos e observar se os dados estão consistentes.
df_concat.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 335300 entries, 0 to 335299
Data columns (total 19 columns):
 #   Column                  Non-Null Count   Dtype  
---  ------                  --------------   -----  
 0   Região                  335300 non-null  object 
 1   UF                      335300 non-null  object 
 2   Cidade                  335300 non-null  object 
 3   Sexo                    335294 non-null  object 
 4   Faixa Etária            335300 non-null  object 
 5   Data Finalização        335300 non-null  object 
 6   Tempo Resposta          326649 non-null  float64
 7   Nome Fantasia           335300 non-null  object 
 8   Segmento de Mercado     335300 non-null  object 
 9   Área                    335300 non-null  object 
 10  Assunto                 335300 non-null  object 
 11  Grupo Problema          335300 non-null  object 
 12  Problema                335300 non-null  object 
 13  Como Comprou Contratou  335300 non-null  object 
 14  Procurou Empresa    

In [129]:
# eliminando colunas que não serão utilizadas
df_concat.drop(columns=['Região', 'Cidade', 'Data Finalização', 'Área', 'Assunto', 'Problema','Respondida'], inplace=True)

In [130]:
# normalizando os nomes das colunas removendo acentos, espaços e transformando em minúsculas.
df_concat.rename(columns=lambda x: unidecode(x).lower().replace(' ', '_'), inplace=True)

In [131]:
df_concat.head(1)

Unnamed: 0,uf,sexo,faixa_etaria,tempo_resposta,nome_fantasia,segmento_de_mercado,grupo_problema,como_comprou_contratou,procurou_empresa,situacao,avaliacao_reclamacao,nota_do_consumidor
0,BA,F,entre 31 a 40 anos,,Jadlog,Empresas de Serviços Postais e Logística,Entrega do Produto,Internet,S,Finalizada não avaliada,Não Avaliada,


In [132]:
# verificando se há dados duplicados e removendo
df_concat = df_concat.drop_duplicates()

In [133]:
df_concat.shape

(279358, 12)

In [134]:
# verificando o percentual de valores nulos por coluna
df_concat.isnull().sum()/df_concat.shape[0]*100

uf                         0.000000
sexo                       0.002148
faixa_etaria               0.000000
tempo_resposta             2.507177
nome_fantasia              0.000000
segmento_de_mercado        0.000000
grupo_problema             0.000000
como_comprou_contratou     0.000000
procurou_empresa           0.000000
situacao                   0.000000
avaliacao_reclamacao       0.000358
nota_do_consumidor        56.464823
dtype: float64

In [135]:
# removendo valores nulos das colunas tempo_resposta e sexo e avalicao_reclamacao
df_concat = df_concat.dropna(subset=['tempo_resposta', 'sexo', 'avaliacao_reclamacao'])

In [136]:
# preenchendo os valores ausentes na coluna nota_do_consumidor com 0
df_concat['nota_do_consumidor'] = df_concat['nota_do_consumidor'].fillna(0)

In [138]:
df_concat.reset_index()

Unnamed: 0,index,uf,sexo,faixa_etaria,tempo_resposta,nome_fantasia,segmento_de_mercado,grupo_problema,como_comprou_contratou,procurou_empresa,situacao,avaliacao_reclamacao,nota_do_consumidor
0,1,BA,M,entre 31 a 40 anos,10.0,Hipercard,"Bancos, Financeiras e Administradoras de Cartão",Cobrança / Contestação,Não comprei / contratei,S,Finalizada não avaliada,Não Avaliada,0.0
1,3,BA,F,entre 31 a 40 anos,10.0,iFood,Empresas de Intermediação de Serviços / Negócios,Entrega do Produto,Internet,S,Finalizada não avaliada,Não Avaliada,0.0
2,4,BA,F,entre 51 a 60 anos,10.0,Banco BMG,"Bancos, Financeiras e Administradoras de Cartão",Cobrança / Contestação,Telefone,S,Finalizada não avaliada,Não Avaliada,0.0
3,6,PE,F,entre 61 a 70 anos,10.0,Banco BMG,"Bancos, Financeiras e Administradoras de Cartão",Cobrança / Contestação,Loja física,S,Finalizada não avaliada,Não Avaliada,0.0
4,8,PE,F,entre 51 a 60 anos,10.0,Banco BMG,"Bancos, Financeiras e Administradoras de Cartão",Cobrança / Contestação,Loja física,S,Finalizada não avaliada,Não Avaliada,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...
272342,335281,BA,F,entre 21 a 30 anos,0.0,iFood,Empresas de Intermediação de Serviços / Negócios,Entrega do Produto,Internet,S,Finalizada avaliada,Resolvida,3.0
272343,335282,PI,M,entre 21 a 30 anos,0.0,iFood,Empresas de Intermediação de Serviços / Negócios,Cobrança / Contestação,Internet,N,Finalizada avaliada,Resolvida,5.0
272344,335283,SP,M,mais de 70 anos,0.0,iFood,Empresas de Intermediação de Serviços / Negócios,Atendimento / SAC,Internet,S,Finalizada avaliada,Resolvida,5.0
272345,335287,PR,F,entre 31 a 40 anos,0.0,Latam Airlines (Tam),Transporte Aéreo,Atendimento / SAC,Internet,S,Finalizada avaliada,Resolvida,5.0


In [140]:
df_concat.head(1)

Unnamed: 0,uf,sexo,faixa_etaria,tempo_resposta,nome_fantasia,segmento_de_mercado,grupo_problema,como_comprou_contratou,procurou_empresa,situacao,avaliacao_reclamacao,nota_do_consumidor
1,BA,M,entre 31 a 40 anos,10.0,Hipercard,"Bancos, Financeiras e Administradoras de Cartão",Cobrança / Contestação,Não comprei / contratei,S,Finalizada não avaliada,Não Avaliada,0.0


### Carregamento dos dados

In [141]:
# exportando o dataframe para um arquivo csv para realizar a análise 
df_concat.to_csv('dados/base_final.csv', index=False)

In [114]:
indice_resolucao = df_concat.groupby('nome_fantasia')['nota_do_consumidor'].sum()/df_concat.shape[0]*100
indice_resolucao.sort_values(ascending=False)

nome_fantasia
Vivo - Telefônica                8.843734
Claro Celular                    4.838734
Tim                              4.732176
Latam Airlines (Tam)             4.591838
Claro Residencial                3.787276
                                   ...   
Telecine                         0.000000
Delbank                          0.000000
Bayer - Divisão Agrícola         0.000000
Viacredi Alto Vale               0.000000
Traditio Companhia de Seguros    0.000000
Name: nota_do_consumidor, Length: 1014, dtype: float64

In [116]:
df_concat.groupby('nome_fantasia')['nota_do_consumidor'].mean().sort_values(ascending=False)

nome_fantasia
Civia                                  5.0
Águas de Jahu                          5.0
Click Telecom                          5.0
Unimed Regional Campo Mourão           5.0
Viação Expresso Brasileiro             5.0
                                      ... 
Unimed Sudoeste Paulista               0.0
Poupex                                 0.0
Unimed Santa Catarina                  0.0
Concessionária Rota do Oeste           0.0
SJ Administração de Imóveis - Ceará    0.0
Name: nota_do_consumidor, Length: 1014, dtype: float64

In [104]:
df_concat.groupby('segmento_de_mercado')['nota_do_consumidor'].mean().sort_values(ascending=False)

segmento_de_mercado
Operadoras de Telecomunicações (Telefonia, Internet, TV por assinatura)    2.044730
Transporte Aéreo                                                           1.801504
Programas de Fidelidade                                                    1.645619
Fabricantes - Produtos Alimentícios                                        1.627346
Farmácias                                                                  1.507622
Bancos de Dados e Cadastros de Consumidores                                1.451969
Editoras e Veículos de Imprensa                                            1.388000
Distribuidoras de Combustíveis / Gás                                       1.378717
Supermercados                                                              1.333333
Serviços Esportivos                                                        1.275100
Corretoras e Distribuidoras de Títulos e Investimentos                     1.259392
Empresas de Intermediação de Serviços / Negócios        

In [105]:
df_concat.groupby('nota_do_consumidor').size()

nota_do_consumidor
0.0    191502
1.0     59864
2.0      5723
3.0     10524
4.0     11824
5.0     46206
dtype: int64

In [115]:
df_concat[(df_concat['nome_fantasia'] == 'Vivo - Telefônica')]

Unnamed: 0,regiao,uf,cidade,sexo,faixa_etaria,data_finalizacao,tempo_resposta,nome_fantasia,segmento_de_mercado,area,assunto,grupo_problema,problema,como_comprou_contratou,procurou_empresa,respondida,situacao,avaliacao_reclamacao,nota_do_consumidor
34,NE,PB,João Pessoa,M,entre 31 a 40 anos,2024-01-04,8.0,Vivo - Telefônica,"Operadoras de Telecomunicações (Telefonia, Int...",Telecomunicações,Internet Fixa,Atendimento / SAC,Má qualidade no atendimento presencial ou outr...,Não comprei / contratei,S,S,Finalizada não avaliada,Não Avaliada,0.0
51,SE,RJ,Campos dos Goytacazes,M,entre 31 a 40 anos,2024-01-05,10.0,Vivo - Telefônica,"Operadoras de Telecomunicações (Telefonia, Int...",Telecomunicações,Telefonia Móvel Pós-paga,Cobrança / Contestação,Cobrança após cancelamento do serviço,Loja física,S,S,Finalizada não avaliada,Não Avaliada,0.0
81,SE,SP,São Paulo,M,entre 31 a 40 anos,2024-01-01,10.0,Vivo - Telefônica,"Operadoras de Telecomunicações (Telefonia, Int...",Telecomunicações,Internet Fixa,Cobrança / Contestação,Cobrança após cancelamento do serviço,Telefone,S,S,Finalizada não avaliada,Não Avaliada,0.0
111,NE,BA,Salvador,M,entre 41 a 50 anos,2024-01-05,9.0,Vivo - Telefônica,"Operadoras de Telecomunicações (Telefonia, Int...",Telecomunicações,Telefonia Móvel Pós-paga,Contrato / Oferta,Recusa em cancelar compra/serviço no prazo de ...,Loja física,S,S,Finalizada não avaliada,Não Avaliada,0.0
151,NE,PB,João Pessoa,M,entre 31 a 40 anos,2024-01-10,10.0,Vivo - Telefônica,"Operadoras de Telecomunicações (Telefonia, Int...",Telecomunicações,Internet Móvel,Contrato / Oferta,Oferta não cumprida / serviço não fornecido/ v...,Não comprei / contratei,S,S,Finalizada não avaliada,Não Avaliada,0.0
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
334794,S,SC,Florianópolis,F,entre 51 a 60 anos,2024-03-27,0.0,Vivo - Telefônica,"Operadoras de Telecomunicações (Telefonia, Int...",Telecomunicações,Internet Fixa,Cobrança / Contestação,Cobrança indevida / abusiva para alterar ou ca...,Internet,S,S,Finalizada avaliada,Resolvida,5.0
334837,SE,ES,Serra,F,entre 31 a 40 anos,2024-03-28,2.0,Vivo - Telefônica,"Operadoras de Telecomunicações (Telefonia, Int...",Telecomunicações,Telefonia Móvel Pós-paga,Contrato / Oferta,Recusa em cancelar compra/serviço no prazo de ...,Internet,S,S,Finalizada avaliada,Resolvida,3.0
334881,SE,SP,São Paulo,M,entre 31 a 40 anos,2024-03-27,1.0,Vivo - Telefônica,"Operadoras de Telecomunicações (Telefonia, Int...",Produtos de Telefonia e Informática,Demais aparelhos de comunicação,Cobrança / Contestação,Cobrança indevida / abusiva para alterar ou ca...,Telefone,S,S,Finalizada avaliada,Resolvida,5.0
334951,SE,SP,Cotia,M,entre 41 a 50 anos,2024-03-28,2.0,Vivo - Telefônica,"Operadoras de Telecomunicações (Telefonia, Int...",Produtos de Telefonia e Informática,Aparelho de telefone fixo / interfone,Dados Pessoais e Privacidade,Dificuldade de cancelamento / eliminação de da...,Não comprei / contratei,S,S,Finalizada avaliada,Resolvida,5.0


In [56]:
df_concat.groupby('situacao').size()

situacao
Finalizada avaliada        137224
Finalizada não avaliada    198076
dtype: int64

In [55]:
df_concat.groupby('area').size().sort_values(ascending=True)

area
Habitação                                     839
Alimentos                                    1615
Educação                                     2962
Saúde                                        7251
Produtos Eletrodomésticos e Eletrônicos     16495
Turismo/Viagens                             16683
Produtos de Telefonia e Informática         17196
Água, Energia, Gás                          19799
Demais Produtos                             22551
Transportes                                 25029
Telecomunicações                            35764
Demais Serviços                             45149
Serviços Financeiros                       123967
dtype: int64

In [19]:
df_concat.describe()

Unnamed: 0,Tempo Resposta,Nota do Consumidor
count,326649.0,137226.0
mean,6.314944,2.816361
std,3.133875,1.807622
min,0.0,1.0
25%,4.0,1.0
50%,7.0,3.0
75%,9.0,5.0
max,11.0,5.0
