# Análise das reclamações da LATAM
Análise das reclamações na plataforma *consumidor.gov.br* a partir das informações disponibilizadas no portal ANAC no período entre 2019 e 2022.

In [5]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns

In [6]:
## Leitura dos dados

df_2019 = pd.read_csv("DADOS/DadosDoConsumidor2019.csv", sep = ";", skiprows=1)
df_2020 = pd.read_csv("DADOS/DadosDoConsumidor2020.csv", sep = ";", skiprows=1)
df_2021 = pd.read_csv("DADOS/DadosDoConsumidor2021.csv", sep = ";", skiprows=1)
df_2022 = pd.read_csv("DADOS/DadosDoConsumidor2022.csv", sep = ";", skiprows=1)

FileNotFoundError: [Errno 2] No such file or directory: 'DADOS/DadosDoConsumidor2019.csv'

In [None]:
## conferência se todas as colunas possuem a mesma dimensão e se as bases foram carregadas corretamente
print(df_2019.shape, df_2020.shape, df_2021.shape, df_2022.shape)

(49866, 38) (66956, 38) (107609, 38) (114470, 38)


In [None]:
# concantenando as bases
df_final = pd.concat([df_2019, df_2020, df_2021, df_2022]).reset_index(drop = True)

## Avaliação da base final

In [None]:
df_final.shape

(338901, 38)

In [None]:
df_final.info

<bound method DataFrame.info of                                                    Gestor   CanalDeOrigem  \
0             Fundação de Proteção e Defesa do Consumidor  Plataforma Web   
1             Fundação de Proteção e Defesa do Consumidor  Plataforma Web   
2                       Secretaria Nacional do Consumidor  Plataforma Web   
3       Instituto Municipal de Proteção e Defesa do Co...  Plataforma Web   
4       Superintendência de Proteção e Defesa do Consu...  Plataforma Web   
...                                                   ...             ...   
338896  Nucleo de Defesa do Consumidor da Defensoria P...  Plataforma Web   
338897  Instituto Estadual de Proteção e Defesa do Con...  Plataforma Web   
338898                  Secretaria Nacional do Consumidor  Plataforma Web   
338899  Secretaria de Estado da Justiça e Cidadania de...  Plataforma Web   
338900         Coordenação Estadual do Procon de Rondônia  Plataforma Web   

       Região  UF                Cidade Sex

In [None]:
df_final.head()

Unnamed: 0,Gestor,CanalDeOrigem,Região,UF,Cidade,Sexo,FaixaEtária,AnoAbertura,MêsAbertura,DataAbertura,...,ComoComprouContratou,ProcurouEmpresa,Respondida,Situação,AvaliaçãoReclamação,NotaDoConsumidor,AnáliseDaRecusa,EdiçãoDeConteúdo,InteraçãoDoGestor,CódigoClassificadorANAC
0,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Barueri,M,entre 31 a 40 anos,2019,1,01/01/2019,...,Internet,S,S,Finalizada avaliada,Não Resolvida,4.0,,N,N,2205
1,Fundação de Proteção e Defesa do Consumidor,Plataforma Web,SE,SP,Ribeirão Pires,M,entre 31 a 40 anos,2019,1,01/01/2019,...,Não comprei / contratei,S,S,Finalizada avaliada,Não Resolvida,3.0,,N,N,2225/2315
2,Secretaria Nacional do Consumidor,Plataforma Web,NE,RN,Serra Negra do Norte,M,entre 31 a 40 anos,2019,1,01/01/2019,...,Internet,S,S,Finalizada não avaliada,Não Avaliada,,,N,N,0505
3,Instituto Municipal de Proteção e Defesa do Co...,Plataforma Web,SE,RJ,Rio de Janeiro,M,entre 31 a 40 anos,2019,1,01/01/2019,...,Internet,N,S,Finalizada avaliada,Resolvida,4.0,,N,N,3505
4,Superintendência de Proteção e Defesa do Consu...,Plataforma Web,CO,GO,Goiânia,F,entre 21 a 30 anos,2019,1,01/01/2019,...,Internet,S,S,Finalizada avaliada,Resolvida,5.0,,N,N,1400


In [None]:
df_final.groupby(['NomeFantasia'])["NomeFantasia"].count().sort_values(ascending=False)

NomeFantasia
Latam Airlines (Tam)                          116843
Gol Linhas Aéreas                              95442
Azul Linhas Aéreas                             46360
TAP Air Portugal                               23520
Avianca - Oceanair (DESATIVADA)                 8032
Alitalia                                        5056
Iberia Lineas Aereas                            4534
Avianca - Voos internacionais                   3976
Itapemirim Transportes Aéreos                   3846
Copa Airlines                                   3602
Itapemirim Transportes Aéreos (DESATIVADA)      3107
American Airlines                               2714
Air France                                      2059
Air Europa                                      1891
Aeromexico                                      1612
Lufthansa                                       1462
Aerolíneas Argentinas                           1461
KLM                                             1404
Qatar Airways                    

## Selecionando a base de interesse
Apenas reclamações relacionadas a Latam

In [None]:
df_latam = df_final.query("NomeFantasia == 'Latam Airlines (Tam)'")

In [None]:
df_latam.describe()

Unnamed: 0,AnoAbertura,MêsAbertura,PrazoAnaliseGestor,TempoResposta,NotaDoConsumidor
count,116843.0,116843.0,592.0,116618.0,65442.0
mean,2020.844912,6.38639,9.275338,5.390094,2.92948
std,1.055854,3.631838,5.269733,3.596036,1.751948
min,2019.0,1.0,0.0,0.0,1.0
25%,2020.0,3.0,4.0,2.0,1.0
50%,2021.0,6.0,12.0,5.0,3.0
75%,2022.0,10.0,14.0,8.0,5.0
max,2022.0,12.0,17.0,16.0,5.0


In [None]:
df_latam.info()

<class 'pandas.core.frame.DataFrame'>
Int64Index: 116843 entries, 0 to 338897
Data columns (total 38 columns):
 #   Column                   Non-Null Count   Dtype  
---  ------                   --------------   -----  
 0   Gestor                   116843 non-null  object 
 1   CanalDeOrigem            116843 non-null  object 
 2   Região                   116843 non-null  object 
 3   UF                       116843 non-null  object 
 4   Cidade                   116843 non-null  object 
 5   Sexo                     116841 non-null  object 
 6   FaixaEtária              116843 non-null  object 
 7   AnoAbertura              116843 non-null  int64  
 8   MêsAbertura              116843 non-null  int64  
 9   DataAbertura             116843 non-null  object 
 10  HoraAbertura             116843 non-null  object 
 11  DataResposta             116618 non-null  object 
 12  HoraResposta             116618 non-null  object 
 13  DataAnálise              592 non-null     object 
 14  Hora

In [None]:
df_latam.groupby(['NomeFantasia'])["NomeFantasia"].count().sort_values(ascending=False)

NomeFantasia
Latam Airlines (Tam)    116843
Name: NomeFantasia, dtype: int64

In [None]:
df_latam.groupby(['NomeFantasia','AnoAbertura'])["NomeFantasia"].count().sort_values(ascending=False)

NomeFantasia          AnoAbertura
Latam Airlines (Tam)  2022           41058
                      2021           33022
                      2020           26347
                      2019           16416
Name: NomeFantasia, dtype: int64

### Reclamações por mês
Comparação geral das reclamações mês x mês


In [None]:
reclamacoes_mes = df_latam.groupby(["AnoAbertura", "MêsAbertura"])["NomeFantasia"].count()

# Resetar o índice para tornar o DataFrame resultante mais fácil de manipular
reclamacoes_mes = reclamacoes_mes.reset_index()


In [None]:
reclamacoes_mes

Unnamed: 0,AnoAbertura,MêsAbertura,NomeFantasia
0,2019,1,1224
1,2019,2,1049
2,2019,3,1026
3,2019,4,1073
4,2019,5,1123
5,2019,6,1130
6,2019,7,1589
7,2019,8,1339
8,2019,9,1344
9,2019,10,1813


In [4]:
## Gráfico de reclamações por mes e ano
plt.figure(figsize=(12,6))
plt.bar(reclamacoes_mes["AnoAbertura"].astype(str) + "-" + reclamacoes_mes["MêsAbertura"].astype(str), reclamacoes_mes["NomeFantasia"], color='b')
plt.title('Contagem de Reclamações por Mês e Ano')
plt.xlabel('Mês e Ano')
plt.ylabel('Contagem de Reclamações')
plt.xticks(rotation=45)  # Rotacionar os rótulos do eixo x para melhor legibilidade (opcional)
plt.grid(True)
plt.tight_layout()
plt.show()

NameError: name 'reclamacoes_mes' is not defined

<Figure size 1200x600 with 0 Axes>

In [None]:
# Definir o estilo Seaborn
sns.set(style="whitegrid")

# Criar um gráfico de barras com Seaborn
plt.figure(figsize=(12, 6))  # Tamanho da figura (opcional)
sns.barplot(x=reclamacoes_mes["AnoAbertura"].astype(str) + "-" + reclamacoes_mes["MêsAbertura"].astype(str), y=reclamacoes_mes["NomeFantasia"], color='b')
plt.title('Contagem de Reclamações por Mês e Ano')
plt.xlabel('Mês e Ano')
plt.ylabel('Contagem de Reclamações')
plt.xticks(rotation=90)  # Rotacionar os rótulos do eixo x para melhor legibilidade (opcional)

# Mostrar o gráfico
plt.tight_layout()
plt.show()

NameError: name 'sns' is not defined