<a href="https://colab.research.google.com/github/adolfoguimaraes/datascience-tps/blob/main/code/atv_analise_banda_larga.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
import pandas as pd

# Atividade: Banda Larga Sergipe

Essa atividade consiste em fazer uma análise a partir dos dados de banda larga de Sergipe. Os dados foram coletados originalmente a partir do site [Base dos Dados](https://basedosdados.org/dataset/br-anatel-banda-larga-fixa?bdm_table=microdados). Foram selecionados os dados somente de Sergipe e salvos no arquivo `microdados_se.csv`. Para a primeira parte da atividade, os dados foram agrupados para mostrar os dados totais do estado. Na segunda parte, serão trabalhadas as informações por município.

A base possui os seguintes atributos (base agrupada): 

* **ano**: Ano correspondente aos dados.
* **mes**: Mês correspondente aos dados.
* **sigla_uf**: Sigla do estado (nesse caso assume somente SE).
* **cnpj**: CNPJ da empresa que oferece o serviço de banda larga.
* **empresa**: Nome da empresa que oferece o serviço de banda larga. 
* **porte_empresa**: Porte que caracteriza a empresa que fornece o serviço de banda larga. Assume os valores `Pequeno Porte` e `Grande Porte`.
* **tecnologia**: Tecnologia utilizada para o prover o serviço de banda larga. Assume os valores: `'ETHERNET', 'Wi-Fi', 'Fibra', 'FTTH', 'xDSL', 'FWA', 'Cable Modem', 'VSAT', 'HFC', 'FR', 'ATM', 'LTE', 'FTTB', 'ADSL2', 'SAT', 'HDSL', 'Indeterminado', 'Outra', 'ADSL1', 'WIMAX', 'TDMA', 'MMDS', 'Híbrido', 'NR', 'DWDM', 'PLC', 'OFDMA/TDD'`.
* **transmissao**: Meios de transmissão da banda larga. Assume os valores: `['Cabo Metálico', 'Rádio', 'Fibra', 'Cabo Coaxial', 'Satélite', 'LTE', 'Indeterminado', 'Outra', 'Híbrido']`.
* **velocidade**: Classificação da velocidade contratada. Assume os valores: `['2Mbps a 12Mbps', '512kbps a 2Mbps', '12Mbps a 34Mbps', '> 34Mbps', '0Kbps a 512Kbps', '64Kbps a 512Kbps', '0Kbps a 64Kbps', '2Mbps a 34Mbps']`.
* **acessos**: Número total de contratos da empresa para uma tecnologia, transmissao e velocidade em um determinando mês e ano.

O comando a seguir carrega os dados e os prepara para utilizar no formato adequado 

In [None]:
data = pd.read_csv("../datasets/internet_se/microdados_se.csv")
data_estado = data.drop(columns=["id_municipio"])
data_estado = data_estado.groupby(by=["ano","mes","sigla_uf","cnpj","empresa","porte_empresa","tecnologia","transmissao","velocidade"], as_index=False).sum()
data_estado 

Unnamed: 0,ano,mes,sigla_uf,cnpj,empresa,porte_empresa,tecnologia,transmissao,velocidade,acessos
0,2007,3,SE,2041460000193,OI,Grande Porte,FTTH,Fibra,64Kbps a 512Kbps,1
1,2007,3,SE,2041460000193,OI,Grande Porte,Outra,Outra,64Kbps a 512Kbps,1
2,2007,3,SE,3721699000177,GLOINFO 500 SOLUCOES EM TELEMATICA LTDA,Pequeno Porte,Wi-Fi,Rádio,0Kbps a 64Kbps,25
3,2007,3,SE,3721699000177,GLOINFO 500 SOLUCOES EM TELEMATICA LTDA,Pequeno Porte,Wi-Fi,Rádio,64Kbps a 512Kbps,18
4,2007,3,SE,3964292000170,CLARO,Grande Porte,SAT,Satélite,64Kbps a 512Kbps,21
...,...,...,...,...,...,...,...,...,...,...
31384,2022,2,SE,76535764000143,OI,Grande Porte,HDSL,Cabo Metálico,512kbps a 2Mbps,172
31385,2022,2,SE,76535764000143,OI,Grande Porte,HDSL,Cabo Metálico,> 34Mbps,4
31386,2022,2,SE,76535764000143,OI,Grande Porte,VSAT,Satélite,0Kbps a 512Kbps,2
31387,2022,2,SE,76535764000143,OI,Grande Porte,VSAT,Satélite,2Mbps a 12Mbps,4


## Analisando o Estado

A sua tarefa inicial é entender cada um dos atributos em relação a valores e quantidades. Em seguida, vocês devem analisar os dados informados e traçar um perfil da internet banda larga no estado de Sergipe ao longo dos anos. Procure responder as seguintes perguntas: 

* Como está distribuído o número de acessos de acordo com os atributos apresentados? 
* Quais as características em relação a tecnologia, transmissão e velocidade que predomina no estado hoje em dia?
* Como essas características mudaram ao longo do ano?
* Quais empresas com maior número de contratos considerando o porte da empresa? 
* Como o perfil do tipo de empresa mudou ao longo dos anos nos estados? Houve crescimento ou redução em relação a um tipo de porte específico?

Utilize mecanismos de análise para responder as perguntas levantadas. 

In [None]:
# Comece sua análise a partir desse ponto 

## Analisando os Municípios

E em relação aos municípios? Vamos considerar agora os dados sem o agrupamento por município e responder a seguinte pergunta. 

* Atualmente, usando os dados mais recentes da base, qual o perfil da distribuição de banda larga no estado de Sergipe?

Para essa tarefa considere os dados a seguir. 

In [None]:
data_municipios = data.query("ano == 2022 and mes == 2")
data_municipios = data_municipios.sort_values(by="id_municipio")
data_municipios

Unnamed: 0,ano,mes,sigla_uf,id_municipio,cnpj,empresa,porte_empresa,tecnologia,transmissao,velocidade,acessos
723,2022,2,SE,2800100,336701000104,Telecomunicacoes Brasileiras S.A. Telebras,Pequeno Porte,VSAT,Satélite,2Mbps a 12Mbps,1
40208,2022,2,SE,2800100,5206385000161,HUGHES TELECOMUNICACOES DO BRASIL LTDA,Pequeno Porte,VSAT,Satélite,2Mbps a 12Mbps,1
195907,2022,2,SE,2800100,76535764000143,OI,Grande Porte,FTTB,Fibra,12Mbps a 34Mbps,1
195906,2022,2,SE,2800100,76535764000143,OI,Grande Porte,ETHERNET,Cabo Metálico,512kbps a 2Mbps,4
195905,2022,2,SE,2800100,76535764000143,OI,Grande Porte,ADSL2,Cabo Metálico,2Mbps a 12Mbps,5
...,...,...,...,...,...,...,...,...,...,...,...
1355,2022,2,SE,2807600,6346446000159,Sitecnet Informatica Ltda,Pequeno Porte,FTTH,Fibra,> 34Mbps,1
1354,2022,2,SE,2807600,336701000104,Telecomunicacoes Brasileiras S.A. Telebras,Pequeno Porte,VSAT,Satélite,2Mbps a 12Mbps,5
1353,2022,2,SE,2807600,336701000104,Telecomunicacoes Brasileiras S.A. Telebras,Pequeno Porte,DWDM,Fibra,512kbps a 2Mbps,1
40344,2022,2,SE,2807600,5206385000161,HUGHES TELECOMUNICACOES DO BRASIL LTDA,Pequeno Porte,VSAT,Satélite,2Mbps a 12Mbps,6


In [None]:
# Comece sua análise a partir desse ponto 

## Baixar as bases 

Vocês podem trabalhar diretamente no notebook. Caso desejem trabalhar em outro aplicativo, execute os comandos a seguir para gerar os arquivos em formato `csv` que foram utilizados nessa atividade.

In [None]:
data_estado.to_csv("../output/data_estado.csv",index=False)
data_municipios.to_csv("../output/data_municipios.csv", index=False)

**Boa atividade :)**