![anatel](img/anatel_logo.png "Logo Anatel")

# Análise de Dados da Anatel em Minas Gerais (2006 - 2019)

A Agência Nacional de Telecomunicaçõe ([Anatel](https://www.anatel.gov.br/institucional/)) foi criada em 16 de julho de 1997 com o objetivo de regular o setor de telecomunicações para contribuir com o desenvolvimento do Brasil. Neste estudo iremos explorar o conjunto de dados das **Reclamações Registradas na Anatel** no estado de Minas Gerais durante os anos de 2006 até 2019. Os dados foram baixaados do  website [Dados Abertos](http://www.dados.gov.br/dataset/solicitacoesregistradasnaanatel) e o [Dicionário de Dados Oficial](data/Reclamações_Glossário_e_Metadados.pdf) está disponível na pasta: [`data/Reclamações_Glossário_e_Metadados.pdf`](data/Reclamações_Glossário_e_Metadados.pdf).

## Exercícios
Faça as questões abaixo usando somente a biblioteca [pandas](https://pandas.pydata.org/).

1. Importe o pacote **pandas** como o nome pd.

In [2]:
import numpy as np
import pandas as pd

2. Carregue em memória o conjunto de dados disponível na pasta [`data/anatel_mg_2006_2019.csv`](data/anatel_mg_2006_2019.csv) para uma variável chamada **df**.

In [None]:
df = pd.read_csv('anatel_mg_2006_2019.csv')

3. Quantas linhas e quantas colunas foram carregadas em memória?

In [None]:
len(df)

4. Mostre as 5 primeiras linhas do *dataset*.

In [None]:
df.head()

5.  Quais são os tipos de dados de cada uma das colunas?

In [None]:
df.info()

6. Mostre a quantidade de colunas para cada um dos tipos de dados.

In [None]:
df.describe()

7. Mostre as informações básicas do DataFrame.

In [None]:
df.info()

8. Verifique se existem dados ausentes (*misssing data*) no conjunto de dados.

In [None]:
df.isnull().values.any()

9. Qual é o número total de dados ausentes?

In [None]:
df.isnull().sum().sum()

10. Qual é o número total de dados ausentes por coluna? 

In [None]:
df.isnull().sum()

11. Remova todos os dados ausentes encontrados.

In [None]:
df = df.dropna(subset=['GrupoEconNorm'])

12. Selecione o serviço que possui o maior número de solicitações `QtdeSolic` na Anatel.

In [None]:
df['QtdeSolic'].max()

13. Qual é o menor número de solicitações `QtdeSolic` na Anatel.

In [None]:
menor_qtd = df['QtdeSolic'].min()
menor_qtd

14. Mostre todas as linhs iguais ao menor número de solicitações `QtdeSolic` na Anatel.

In [None]:
qtd_sol = np.where(df['QtdeSolic'] == menor_qtd) 
len(qtd_sol[0])

15. Mostre as contagens de solicitações `QtdeSolic` por tipo de serviço `Servico`.

In [None]:
grupo = df.groupby(['Servico'])['QtdeSolic'].sum()

grupo

16. Ao longo dos anos mostre o número de solicitações por mês?

In [None]:
por_ano = df.groupby(['Ano', 'Mes'])['QtdeSolic'].sum()
por_ano

17. Crie o vetor **reclamacoes** com todos os dados que cuja coluna `Tipo` seja igual a "Reclamação".

In [None]:
reclama = np.where(df['Tipo'] == "Reclamação")[0]

len(reclam)

18. Mostre o número total de solictiações `QtdeSolic` de reclamações para cada tipo de serviço `Servico`

In [None]:
tot_sol = df.where(df['Tipo'] == "Reclamação").groupby(['Servico']).sum()
tot_sol.QtdeSolic

19. Quais são os maiores ou maior motivo de solicitação de reclamações?

In [None]:
maiores = tot_sol.QtdeSolic.max()
maiores

20. Faça um agrupamento de dados pela coluna `GrupoEconNorm`, mostrando um sumário estatístico da quantidade solicitações `QtdeSolic`.

In [None]:
GrupoEconNorm = df.groupby(['GrupoEconNorm']).sum()

GrupoEconNorm.QtdeSolic