![anatel](img/anatel_logo.png "Logo Anatel")

# Análise de Dados da Anatel em Minas Gerais (2006 - 2019)

A Agência Nacional de Telecomunicaçõe ([Anatel](https://www.anatel.gov.br/institucional/)) foi criada em 16 de julho de 1997 com o objetivo de regular o setor de telecomunicações para contribuir com o desenvolvimento do Brasil. Neste estudo iremos explorar o conjunto de dados das **Reclamações Registradas na Anatel** no estado de Minas Gerais durante os anos de 2006 até 2019. Os dados foram baixaados do  website [Dados Abertos](http://www.dados.gov.br/dataset/solicitacoesregistradasnaanatel) e o [Dicionário de Dados Oficial](data/Reclamações_Glossário_e_Metadados.pdf) está disponível na pasta: [`data/Reclamações_Glossário_e_Metadados.pdf`](data/Reclamações_Glossário_e_Metadados.pdf).

## Exercícios
Faça as questões abaixo usando somente a biblioteca [pandas](https://pandas.pydata.org/).

1. Importe o pacote **pandas** como o nome pd.

In [1]:
import numpy as np
import pandas as pd

2. Carregue em memória o conjunto de dados disponível na pasta [`data/anatel_mg_2006_2019.csv`](data/anatel_mg_2006_2019.csv) para uma variável chamada **df**.

In [5]:
df = pd.read_csv('anatel_mg_2006_2019.csv')

3. Quantas linhas e quantas colunas foram carregadas em memória?

In [6]:
df.shape

(509706, 12)

4. Mostre as 5 primeiras linhas do *dataset*.

In [7]:
df[:5]

Unnamed: 0,DataExtracao,Ano,Mes,CanalEntrada,Condicao,GrupoEconNorm,Tipo,Servico,Modalidade,Motivo,UF,QtdeSolic
0,2016-04-28,2006,1,Atendimento Pessoal,Nova,Anatel,Denúncia,Radiodifusão (Rádio e TV),Rádio FM,Interferência,MG,3
1,2016-04-28,2006,1,Atendimento Pessoal,Nova,Anatel,Denúncia,Radiodifusão (Rádio e TV),Rádio FM,Outorga,MG,8
2,2016-04-28,2006,1,Atendimento Pessoal,Nova,NET,Reclamação,Serviço Telefônico Fixo Comutado - STFC,Local,Cobrança,MG,1
3,2016-04-28,2006,1,Atendimento Pessoal,Nova,OI,Reclamação,Móvel Pessoal,Pós-Pago,Serviços Adicionais,MG,1
4,2016-04-28,2006,1,Atendimento Pessoal,Nova,Outros,Reclamação,Móvel Pessoal,Pós-Pago,Clonagem,MG,1


5.  Quais são os tipos de dados de cada uma das colunas?

In [8]:
df.dtypes

DataExtracao     object
Ano               int64
Mes               int64
CanalEntrada     object
Condicao         object
GrupoEconNorm    object
Tipo             object
Servico          object
Modalidade       object
Motivo           object
UF               object
QtdeSolic         int64
dtype: object

6. Mostre a quantidade de colunas para cada um dos tipos de dados.

In [9]:
df.dtypes.value_counts()

object    9
int64     3
dtype: int64

7. Mostre as informações básicas do DataFrame.

In [10]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 509706 entries, 0 to 509705
Data columns (total 12 columns):
 #   Column         Non-Null Count   Dtype 
---  ------         --------------   ----- 
 0   DataExtracao   509706 non-null  object
 1   Ano            509706 non-null  int64 
 2   Mes            509706 non-null  int64 
 3   CanalEntrada   509706 non-null  object
 4   Condicao       509706 non-null  object
 5   GrupoEconNorm  509404 non-null  object
 6   Tipo           509706 non-null  object
 7   Servico        509706 non-null  object
 8   Modalidade     509706 non-null  object
 9   Motivo         509706 non-null  object
 10  UF             509706 non-null  object
 11  QtdeSolic      509706 non-null  int64 
dtypes: int64(3), object(9)
memory usage: 46.7+ MB


8. Verifique se existem dados ausentes (*misssing data*) no conjunto de dados.

In [11]:
df.isnull().values.any()

True

9. Qual é o número total de dados ausentes?

In [12]:
df.isnull().sum().sum()

302

10. Qual é o número total de dados ausentes por coluna? 

In [13]:
df.isnull().sum()

DataExtracao       0
Ano                0
Mes                0
CanalEntrada       0
Condicao           0
GrupoEconNorm    302
Tipo               0
Servico            0
Modalidade         0
Motivo             0
UF                 0
QtdeSolic          0
dtype: int64

11. Remova todos os dados ausentes encontrados.

In [14]:
df.dropna(subset=['GrupoEconNorm'], inplace=True)

12. Selecione o serviço que possui o maior número de solicitações `QtdeSolic` na Anatel.

In [15]:
df.loc[df.QtdeSolic == np.max(df.QtdeSolic), ['Servico']]

Unnamed: 0,Servico
139270,Serviço Telefônico Fixo Comutado - STFC


13. Qual é o menor número de solicitações `QtdeSolic` na Anatel.

In [16]:
df.QtdeSolic.min()

1

14. Mostre todas as linhs iguais ao menor número de solicitações `QtdeSolic` na Anatel.

In [17]:
df.loc[df.QtdeSolic == np.min(df.QtdeSolic)]

Unnamed: 0,DataExtracao,Ano,Mes,CanalEntrada,Condicao,GrupoEconNorm,Tipo,Servico,Modalidade,Motivo,UF,QtdeSolic
2,2016-04-28,2006,1,Atendimento Pessoal,Nova,NET,Reclamação,Serviço Telefônico Fixo Comutado - STFC,Local,Cobrança,MG,1
3,2016-04-28,2006,1,Atendimento Pessoal,Nova,OI,Reclamação,Móvel Pessoal,Pós-Pago,Serviços Adicionais,MG,1
4,2016-04-28,2006,1,Atendimento Pessoal,Nova,Outros,Reclamação,Móvel Pessoal,Pós-Pago,Clonagem,MG,1
5,2016-04-28,2006,1,Atendimento Pessoal,Reaberta,NET,Reclamação,Serviço Telefônico Fixo Comutado - STFC,Local,Reparo,MG,1
6,2016-04-28,2006,1,Atendimento Pessoal,Reaberta,Outros,Reclamação,Serviço Telefônico Fixo Comutado - STFC,Local,Cancelamento,MG,1
...,...,...,...,...,...,...,...,...,...,...,...,...
509701,2019-10-08,2019,9,Fale Conosco,Reencaminhada,VIVO,Reclamação,Celular Pré-Pago,Bloqueio ou Suspensão e Desbloqueio,Não consegue desbloquear aparelho,MG,1
509702,2019-10-08,2019,9,Fale Conosco,Reencaminhada,VIVO,Reclamação,Celular Pré-Pago,Portabilidade,Portabilidade recusada pela prestadora,MG,1
509703,2019-10-08,2019,9,Fale Conosco,Reencaminhada,VIVO,Reclamação,Celular Pré-Pago,"Qualidade, Funcionamento e Reparo",Não funcionamento de facilidade ou serviço adi...,MG,1
509704,2019-10-08,2019,9,Fale Conosco,Reencaminhada,VIVO,Reclamação,Telefone Fixo,Cancelamento,Cancelamento de serviço adicional não efetuado,MG,1


15. Mostre as contagens de solicitações `QtdeSolic` por tipo de serviço `Servico`.

In [18]:
pd.crosstab(df['QtdeSolic'],df['Servico'])

Servico,Banda Larga Fixa,Celular Pré-Pago,Celular Pós-Pago,Limitado Privado,Móvel Pessoal,Outros,Radioamador (PY),Radiochamada (Paging),Radiodifusão (Rádio e TV),Rádio do Cidadão (PX),Serviço Móvel Aeronáutico,Serviço Móvel Marítimo,Serviço Telefônico Fixo Comutado - STFC,Serviço de Comunicação Multimídia,Serviço de Rede e Transporte de Telecomunicações - SRTT,Serviços da Anatel,TV por Assinatura,Telefone Fixo,Troncalizado (Trunking)
QtdeSolic,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1,Unnamed: 9_level_1,Unnamed: 10_level_1,Unnamed: 11_level_1,Unnamed: 12_level_1,Unnamed: 13_level_1,Unnamed: 14_level_1,Unnamed: 15_level_1,Unnamed: 16_level_1,Unnamed: 17_level_1,Unnamed: 18_level_1,Unnamed: 19_level_1
1,29379,25065,38066,492,26838,582,851,23,2484,722,80,20,19117,12297,284,4944,40408,29135,333
2,9901,9844,15534,95,9451,129,230,1,517,211,12,0,6150,3224,71,1505,13267,9953,92
3,5068,5180,8767,27,5356,58,103,0,198,111,9,0,3301,1679,40,787,6698,5095,41
4,3102,3345,5732,13,3471,42,48,0,89,58,2,0,1964,970,31,464,4049,3246,24
5,2139,2319,4047,1,2505,23,31,0,52,41,1,0,1403,708,14,372,2791,2295,19
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
2954,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0
3000,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0
3058,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0
3238,0,0,0,0,0,0,0,0,0,0,0,0,1,0,0,0,0,0,0


16. Ao longo dos anos mostre o número de solicitações por mês?

In [19]:
df[['Ano', 'QtdeSolic', 'Mes']].groupby(['QtdeSolic', 'Mes']).mean()

Unnamed: 0_level_0,Unnamed: 1_level_0,Ano
QtdeSolic,Mes,Unnamed: 2_level_1
1,1,2015.050022
1,2,2015.001075
1,3,2014.883003
1,4,2014.973543
1,5,2014.907216
...,...,...
2954,1,2014.000000
3000,7,2013.000000
3058,2,2014.000000
3238,11,2013.000000


17. Crie o vetor **reclamacoes** com todos os dados que cuja coluna `Tipo` seja igual a "Reclamação".

In [20]:
reclamacoes = df[df.Tipo == "Reclamação"]
reclamacoes

Unnamed: 0,DataExtracao,Ano,Mes,CanalEntrada,Condicao,GrupoEconNorm,Tipo,Servico,Modalidade,Motivo,UF,QtdeSolic
2,2016-04-28,2006,1,Atendimento Pessoal,Nova,NET,Reclamação,Serviço Telefônico Fixo Comutado - STFC,Local,Cobrança,MG,1
3,2016-04-28,2006,1,Atendimento Pessoal,Nova,OI,Reclamação,Móvel Pessoal,Pós-Pago,Serviços Adicionais,MG,1
4,2016-04-28,2006,1,Atendimento Pessoal,Nova,Outros,Reclamação,Móvel Pessoal,Pós-Pago,Clonagem,MG,1
5,2016-04-28,2006,1,Atendimento Pessoal,Reaberta,NET,Reclamação,Serviço Telefônico Fixo Comutado - STFC,Local,Reparo,MG,1
6,2016-04-28,2006,1,Atendimento Pessoal,Reaberta,Outros,Reclamação,Serviço Telefônico Fixo Comutado - STFC,Local,Cancelamento,MG,1
...,...,...,...,...,...,...,...,...,...,...,...,...
509701,2019-10-08,2019,9,Fale Conosco,Reencaminhada,VIVO,Reclamação,Celular Pré-Pago,Bloqueio ou Suspensão e Desbloqueio,Não consegue desbloquear aparelho,MG,1
509702,2019-10-08,2019,9,Fale Conosco,Reencaminhada,VIVO,Reclamação,Celular Pré-Pago,Portabilidade,Portabilidade recusada pela prestadora,MG,1
509703,2019-10-08,2019,9,Fale Conosco,Reencaminhada,VIVO,Reclamação,Celular Pré-Pago,"Qualidade, Funcionamento e Reparo",Não funcionamento de facilidade ou serviço adi...,MG,1
509704,2019-10-08,2019,9,Fale Conosco,Reencaminhada,VIVO,Reclamação,Telefone Fixo,Cancelamento,Cancelamento de serviço adicional não efetuado,MG,1


18. Mostre o número total de solictiações `QtdeSolic` de reclamações para cada tipo de serviço `Servico`

In [21]:
df.groupby('Servico').QtdeSolic.count()

Servico
Banda Larga Fixa                                           60421
Celular Pré-Pago                                           56911
Celular Pós-Pago                                           96355
Limitado Privado                                             646
Móvel Pessoal                                              68399
Outros                                                       969
Radioamador (PY)                                            1350
Radiochamada (Paging)                                         24
Radiodifusão (Rádio e TV)                                   3476
Rádio do Cidadão (PX)                                       1240
Serviço Móvel Aeronáutico                                    105
Serviço Móvel Marítimo                                        20
Serviço Telefônico Fixo Comutado - STFC                    41299
Serviço de Comunicação Multimídia                          23210
Serviço de Rede e Transporte de Telecomunicações - SRTT      531
Serviços da Anate

19. Quais são os maiores ou maior motivo de solicitação de reclamações?

In [22]:
df['Motivo'].value_counts()

Cobrança                                                                     24408
Reparo                                                                       14832
Cancelamento                                                                 11259
Atendimento                                                                  11246
Outros                                                                       11193
                                                                             ...  
LDN/LDI - Não consegue cancelar o plano no menu da central de atendimento        1
Dados disponibilizados insuficientes                                             1
Laboratórios de Ensaio                                                           1
Plano Básico de TV                                                               1
LDN/LDI - Consumidor não consegue negociar a dívida                              1
Name: Motivo, Length: 360, dtype: int64

20. Faça um agrupamento de dados pela coluna `GrupoEconNorm`, mostrando um sumário estatístico da quantidade solicitações `QtdeSolic`.

In [23]:
df.groupby('GrupoEconNorm').QtdeSolic.describe()

Unnamed: 0_level_0,count,mean,std,min,25%,50%,75%,max
GrupoEconNorm,Unnamed: 1_level_1,Unnamed: 2_level_1,Unnamed: 3_level_1,Unnamed: 4_level_1,Unnamed: 5_level_1,Unnamed: 6_level_1,Unnamed: 7_level_1,Unnamed: 8_level_1
ALGAR,31030.0,3.07467,7.476908,1.0,1.0,1.0,2.0,259.0
Anatel,22833.0,2.537993,4.659411,1.0,1.0,1.0,2.0,128.0
BLUE,3105.0,1.616747,1.473557,1.0,1.0,1.0,2.0,18.0
Brisanet,5.0,1.0,0.0,1.0,1.0,1.0,1.0,1.0
CABO TELECOM,1.0,1.0,,1.0,1.0,1.0,1.0,1.0
CLARO,56270.0,7.248623,34.269337,1.0,1.0,2.0,4.0,1291.0
Correios Celular,258.0,1.131783,0.438956,1.0,1.0,1.0,1.0,4.0
Datora,2.0,1.5,0.707107,1.0,1.25,1.5,1.75,2.0
EMBRATEL,1425.0,2.041404,2.697345,1.0,1.0,1.0,2.0,26.0
GVT,6398.0,6.092685,19.560634,1.0,1.0,2.0,4.0,666.0
