#Obtenção dos dados de PIB dos municípios
Este notebook trata da importação dos dados do PIB (Produto Interno Bruto) dos municípios, obtidos via FTP no endereço https://ftp.ibge.gov.br/Pib_Municipios/, do IBGE (Instituto Brasileiro de Geografia e Estatística). Serão importados os dados referentes ao período de 2006 a 2018. O objetivo final é desenvolver um modelo com base no período de 2007 a 2018, o período de 2006 será utilizado posteriormente apenas para calcular a primeira variação do PIB.

In [21]:
from google.colab import drive
import os

# monta o drive no Google Drive para acesso aos dados
drive.mount('/content/drive/')

# Muda para a pasta de trabalho onde estão os dados
os.chdir("/content/drive/My Drive/Colab Notebooks/TCC/Pib_municipios/2018/base/")

Drive already mounted at /content/drive/; to attempt to forcibly remount, call drive.mount("/content/drive/", force_remount=True).


In [22]:
# importação de bibliotecas
import pandas as pd
import numpy as np
from zipfile import ZipFile

#altera o número máximo de colunas a serem exibidas
pd.options.display.max_columns = 16

## Obtenção dos dados de 2010 a 2018

In [23]:
# descompacta o arquivo
with ZipFile ('base_de_dados_2010_2018_xls.zip','r') as arq:
  arq.extractall()
  arq.printdir()


File Name                                             Modified             Size
PIB dos Municípios - base de dados 2010-2018.xls 2020-12-11 14:42:38     29066752


In [24]:
PIBMunicipios = pd.read_excel("PIB dos Municípios - base de dados 2010-2018.xls", squeeze=True)
print(PIBMunicipios)

        Ano  Código da Grande Região Nome da Grande Região  \
0      2010                        1                 Norte   
1      2010                        1                 Norte   
2      2010                        1                 Norte   
3      2010                        1                 Norte   
4      2010                        1                 Norte   
...     ...                      ...                   ...   
50110  2018                        5          Centro-oeste   
50111  2018                        5          Centro-oeste   
50112  2018                        5          Centro-oeste   
50113  2018                        5          Centro-oeste   
50114  2018                        5          Centro-oeste   

       Código da Unidade da Federação Sigla da Unidade da Federação  \
0                                  11                            RO   
1                                  11                            RO   
2                                  11     

In [25]:
PIBMunicipios.keys()

Index(['Ano', 'Código da Grande Região', 'Nome da Grande Região',
       'Código da Unidade da Federação', 'Sigla da Unidade da Federação',
       'Nome da Unidade da Federação', 'Código do Município',
       'Nome do Município', 'Região Metropolitana', 'Código da Mesorregião',
       'Nome da Mesorregião', 'Código da Microrregião', 'Nome da Microrregião',
       'Código da Região Geográfica Imediata',
       'Nome da Região Geográfica Imediata',
       'Município da Região Geográfica Imediata',
       'Código da Região Geográfica Intermediária',
       'Nome da Região Geográfica Intermediária',
       'Município da Região Geográfica Intermediária',
       'Código Concentração Urbana', 'Nome Concentração Urbana',
       'Tipo Concentração Urbana', 'Código Arranjo Populacional',
       'Nome Arranjo Populacional', 'Hierarquia Urbana',
       'Hierarquia Urbana (principais categorias)', 'Código da Região Rural',
       'Nome da Região Rural',
       'Região rural (segundo classificação d

In [26]:
# remoção de atributos que não serão utilizados
IndexDel = ['Código da Grande Região', 'Nome da Grande Região', 'Código da Unidade da Federação', 'Nome da Unidade da Federação', 'Região Metropolitana', 
            'Código da Mesorregião', 'Nome da Mesorregião', 'Código da Microrregião', 'Nome da Microrregião', 'Código da Região Geográfica Imediata', 
            'Nome da Região Geográfica Imediata', 'Município da Região Geográfica Imediata', 'Código da Região Geográfica Intermediária', 
            'Nome da Região Geográfica Intermediária', 'Município da Região Geográfica Intermediária', 'Código Concentração Urbana', 'Nome Concentração Urbana', 
            'Tipo Concentração Urbana', 'Código Arranjo Populacional', 'Nome Arranjo Populacional', 'Hierarquia Urbana', 'Hierarquia Urbana (principais categorias)', 
            'Código da Região Rural', 'Nome da Região Rural', 'Região rural (segundo classificação do núcleo)', 'Amazônia Legal', 'Semiárido', 
            'Cidade-Região de São Paulo', 'Valor adicionado bruto da Agropecuária, \na preços correntes\n(R$ 1.000)', 
            'Valor adicionado bruto da Indústria,\na preços correntes\n(R$ 1.000)', 
            'Valor adicionado bruto dos Serviços,\na preços correntes \n- exceto Administração, defesa, educação e saúde públicas e seguridade social\n(R$ 1.000)', 
            'Valor adicionado bruto da Administração, defesa, educação e saúde públicas e seguridade social, \na preços correntes\n(R$ 1.000)',
            'Valor adicionado bruto total, \na preços correntes\n(R$ 1.000)', 
            'Impostos, líquidos de subsídios, sobre produtos, \na preços correntes\n(R$ 1.000)', 
            'Produto Interno Bruto per capita, \na preços correntes\n(R$ 1,00)', 'Atividade com maior valor adicionado bruto', 'Atividade com segundo maior valor adicionado bruto', 
            'Atividade com terceiro maior valor adicionado bruto']
for i in IndexDel:
  del PIBMunicipios[i]


In [27]:
PIBMunicipios.keys()

Index(['Ano', 'Sigla da Unidade da Federação', 'Código do Município',
       'Nome do Município',
       'Produto Interno Bruto, \na preços correntes\n(R$ 1.000)'],
      dtype='object')

In [28]:
# Renomeia alguns campos
PIBMunicipios.rename(columns={'Sigla da Unidade da Federação': 'UF','Produto Interno Bruto, \na preços correntes\n(R$ 1.000)' : 'PIB'},inplace=True)
PIBMunicipios

Unnamed: 0,Ano,UF,Código do Município,Nome do Município,PIB
0,2010,RO,1100015,Alta Floresta D'Oeste,2.620769e+05
1,2010,RO,1100023,Ariquemes,1.364694e+06
2,2010,RO,1100031,Cabixi,6.961111e+04
3,2010,RO,1100049,Cacoal,1.186494e+06
4,2010,RO,1100056,Cerejeiras,2.220212e+05
...,...,...,...,...,...
50110,2018,GO,5222005,Vianópolis,4.402220e+05
50111,2018,GO,5222054,Vicentinópolis,3.223593e+05
50112,2018,GO,5222203,Vila Boa,1.034081e+05
50113,2018,GO,5222302,Vila Propício,1.637824e+05


##Obtenção dos dados de 2002 a 2009

In [29]:
# descompacta o arquivo
with ZipFile ('base_de_dados_2002_2009_xls.zip','r') as arq:
  arq.extractall()
  arq.printdir()

File Name                                             Modified             Size
PIB dos Municípios - base de dados 2002-2009.xls 2020-12-11 14:42:38     23921152


In [30]:
PIBMunicipios2009 = pd.read_excel("PIB dos Municípios - base de dados 2002-2009.xls", squeeze=True)
print(PIBMunicipios2009)

        Ano  Código da Grande Região Nome da Grande Região  \
0      2002                        1                 Norte   
1      2002                        1                 Norte   
2      2002                        1                 Norte   
3      2002                        1                 Norte   
4      2002                        1                 Norte   
...     ...                      ...                   ...   
44496  2009                        5          Centro-oeste   
44497  2009                        5          Centro-oeste   
44498  2009                        5          Centro-oeste   
44499  2009                        5          Centro-oeste   
44500  2009                        5          Centro-oeste   

       Código da Unidade da Federação Sigla da Unidade da Federação  \
0                                  11                            RO   
1                                  11                            RO   
2                                  11     

In [31]:
PIBMunicipios2009.keys()

Index(['Ano', 'Código da Grande Região', 'Nome da Grande Região',
       'Código da Unidade da Federação', 'Sigla da Unidade da Federação',
       'Nome da Unidade da Federação', 'Código do Município',
       'Nome do Município', 'Região Metropolitana', 'Código da Mesorregião',
       'Nome da Mesorregião', 'Código da Microrregião', 'Nome da Microrregião',
       'Código da Região Geográfica Imediata',
       'Nome da Região Geográfica Imediata',
       'Município da Região Geográfica Imediata',
       'Código da Região Geográfica Intermediária',
       'Nome da Região Geográfica Intermediária',
       'Município da Região Geográfica Intermediária',
       'Código Concentração Urbana', 'Nome Concentração Urbana',
       'Tipo Concentração Urbana', 'Código Arranjo Populacional',
       'Nome Arranjo Populacional', 'Hierarquia Urbana',
       'Hierarquia Urbana (principais categorias)', 'Código da Região Rural',
       'Nome da Região Rural',
       'Região rural (segundo classificação d

In [32]:
IndexDel = ['Código da Grande Região', 'Nome da Grande Região',
       'Código da Unidade da Federação', 
       'Nome da Unidade da Federação', 
       'Região Metropolitana', 'Código da Mesorregião',
       'Nome da Mesorregião', 'Código da Microrregião', 'Nome da Microrregião',
       'Código da Região Geográfica Imediata',
       'Nome da Região Geográfica Imediata',
       'Município da Região Geográfica Imediata',
       'Código da Região Geográfica Intermediária',
       'Nome da Região Geográfica Intermediária',
       'Município da Região Geográfica Intermediária',
       'Código Concentração Urbana', 'Nome Concentração Urbana',
       'Tipo Concentração Urbana', 'Código Arranjo Populacional',
       'Nome Arranjo Populacional', 'Hierarquia Urbana',
       'Hierarquia Urbana (principais categorias)', 'Código da Região Rural',
       'Nome da Região Rural',
       'Região rural (segundo classificação do núcleo)', 'Amazônia Legal',
       'Semiárido', 'Cidade-Região de São Paulo',
       'Valor adicionado bruto da Agropecuária, \na preços correntes\n(R$ 1.000)',
       'Valor adicionado bruto da Indústria,\na preços correntes\n(R$ 1.000)',
       'Valor adicionado bruto dos Serviços,\na preços correntes \n- exceto Administração, defesa, educação e saúde públicas e seguridade social\n(R$ 1.000)',
       'Valor adicionado bruto da Administração, defesa, educação e saúde públicas e seguridade social, \na preços correntes\n(R$ 1.000)',
       'Valor adicionado bruto total, \na preços correntes\n(R$ 1.000)',
       'Impostos, líquidos de subsídios, sobre produtos, \na preços correntes\n(R$ 1.000)',
       'Produto Interno Bruto per capita, \na preços correntes\n(R$ 1,00)']
for i in IndexDel:
  del PIBMunicipios2009[i]

In [33]:
# Renomeia alguns campos
PIBMunicipios2009.rename(columns={'Sigla da Unidade da Federação': 'UF','Produto Interno Bruto, \na preços correntes\n(R$ 1.000)' : 'PIB'},inplace=True)
PIBMunicipios2009

Unnamed: 0,Ano,UF,Código do Município,Nome do Município,PIB
0,2002,RO,1100015,Alta Floresta D'Oeste,1.112910e+05
1,2002,RO,1100023,Ariquemes,4.495928e+05
2,2002,RO,1100031,Cabixi,3.176752e+04
3,2002,RO,1100049,Cacoal,4.744431e+05
4,2002,RO,1100056,Cerejeiras,7.917361e+04
...,...,...,...,...,...
44496,2009,GO,5222005,Vianópolis,1.643363e+05
44497,2009,GO,5222054,Vicentinópolis,1.334304e+05
44498,2009,GO,5222203,Vila Boa,7.336738e+04
44499,2009,GO,5222302,Vila Propício,1.071254e+05


##Tratamento prévio dos dados, para unir os dados e eliminar períodos que não são de interesse

In [34]:
# concatena os dois dataframes
PIBMunicipios = PIBMunicipios2009.append(PIBMunicipios, ignore_index=True)
PIBMunicipios

Unnamed: 0,Ano,UF,Código do Município,Nome do Município,PIB
0,2002,RO,1100015,Alta Floresta D'Oeste,1.112910e+05
1,2002,RO,1100023,Ariquemes,4.495928e+05
2,2002,RO,1100031,Cabixi,3.176752e+04
3,2002,RO,1100049,Cacoal,4.744431e+05
4,2002,RO,1100056,Cerejeiras,7.917361e+04
...,...,...,...,...,...
94611,2018,GO,5222005,Vianópolis,4.402220e+05
94612,2018,GO,5222054,Vicentinópolis,3.223593e+05
94613,2018,GO,5222203,Vila Boa,1.034081e+05
94614,2018,GO,5222302,Vila Propício,1.637824e+05


In [35]:
# Exclui as linhas que forem de períodos inferiores a 2006
PIBMunicipios.drop(PIBMunicipios.loc[PIBMunicipios['Ano']<2006].index, inplace=True)
PIBMunicipios

Unnamed: 0,Ano,UF,Código do Município,Nome do Município,PIB
22244,2006,RO,1100015,Alta Floresta D'Oeste,1.688051e+05
22245,2006,RO,1100023,Ariquemes,7.906966e+05
22246,2006,RO,1100031,Cabixi,4.688382e+04
22247,2006,RO,1100049,Cacoal,7.431937e+05
22248,2006,RO,1100056,Cerejeiras,1.244150e+05
...,...,...,...,...,...
94611,2018,GO,5222005,Vianópolis,4.402220e+05
94612,2018,GO,5222054,Vicentinópolis,3.223593e+05
94613,2018,GO,5222203,Vila Boa,1.034081e+05
94614,2018,GO,5222302,Vila Propício,1.637824e+05


## Identificação dos municípios que apresentaram os maiores PIB médios no período, para restringir os dados

In [36]:
# Soma os PIB de todos os anos para cada municipio, para identificar os municipios com maior pib médio
PIBMunicipiosSomaAnos = PIBMunicipios.groupby(["Código do Município", "Nome do Município"],as_index=False).aggregate(np.sum)
PIBMunicipiosSomaAnos['PIB Médio'] = PIBMunicipiosSomaAnos['PIB']/13
PIBMunicipiosSomaAnos.drop(columns=['Ano','PIB'],inplace=True)
PIBMunicipiosSomaAnos

Unnamed: 0,Código do Município,Nome do Município,PIB Médio
0,1100015,Alta Floresta D'Oeste,3.339272e+05
1,1100023,Ariquemes,1.639173e+06
2,1100031,Cabixi,9.316844e+04
3,1100049,Cacoal,1.414566e+06
4,1100056,Cerejeiras,3.021999e+05
...,...,...,...
5565,5222005,Vianópolis,2.544859e+05
5566,5222054,Vicentinópolis,2.142591e+05
5567,5222203,Vila Boa,8.330372e+04
5568,5222302,Vila Propício,1.312996e+05


In [37]:
# obtem os códigos dos 200 municípios de maior PIB médio
PIBMunicipiosSomaAnos.sort_values("PIB Médio",ascending=False,inplace=True)
CodMaioresMunicipios = PIBMunicipiosSomaAnos["Código do Município"].values[0:200]
CodMaioresMunicipios

array([3550308, 3304557, 5300108, 3106200, 4106902, 1302603, 4314902,
       3534401, 2927408, 3509502, 2304400, 3518800, 3548708, 3301009,
       2611606, 3505708, 5208707, 3525904, 3549904, 3301702, 3552205,
       1501402, 3170206, 3543402, 3547809, 2111300, 3106705, 3118601,
       3205309, 4209102, 4125506, 3303302, 5002704, 3536505, 4305108,
       3538709, 3548500, 2408102, 5103403, 2905701, 3205002, 2704302,
       3302403, 4208203, 4205407, 4113700, 2507507, 3548807, 2211001,
       3554102, 4304606, 1505536, 3304904, 3303500, 3549805, 4202404,
       2800308, 3513801, 3136702, 4115200, 3300704, 3530607, 1100205,
       5201108, 3552403, 3529401, 2607901, 3304524, 4101804, 3506003,
       3513504, 3306305, 3170107, 3520509, 2910800, 3526902, 4119905,
       3303906, 4108304, 3205200, 3519071, 3501608, 3513009, 3509205,
       4309209, 3131307, 5201405, 3552502, 3524402, 3527306, 3548906,
       4104808, 1600303, 3522505, 3300100, 3543907, 4216602, 3515004,
       3302700, 3503

In [38]:
# remove os municípios de menores PIB médios da fonte de dados, deixando apenas os 200 maiores
indexMenores = PIBMunicipios.loc[~PIBMunicipios['Código do Município'].isin(CodMaioresMunicipios)].index
PIBMunicipios.drop(indexMenores, inplace=True)
PIBMunicipios

Unnamed: 0,Ano,UF,Código do Município,Nome do Município,PIB
22260,2006,RO,1100205,Porto Velho,4.093384e+06
22310,2006,AC,1200401,Rio Branco,2.936363e+06
22355,2006,AM,1302603,Manaus,3.277001e+07
22382,2006,RR,1400100,Boa Vista,2.902139e+06
22404,2006,PA,1500800,Ananindeua,2.694744e+06
...,...,...,...,...,...
94387,2018,GO,5201405,Aparecida de Goiânia,1.326587e+07
94427,2018,GO,5205109,Catalão,6.108292e+06
94463,2018,GO,5208707,Goiânia,4.936426e+07
94566,2018,GO,5218805,Rio Verde,9.602905e+06


In [39]:
PIBMunicipios.loc[PIBMunicipios['Código do Município'] == 3550308]  ## PIB de São Paulo 2006 ~ 2018

Unnamed: 0,Ano,UF,Código do Município,Nome do Município,PIB
26071,2006,SP,3550308,São Paulo,283840200.0
31635,2007,SP,3550308,São Paulo,321826000.0
37199,2008,SP,3550308,São Paulo,354089100.0
42764,2009,SP,3550308,São Paulo,389816200.0
48329,2010,SP,3550308,São Paulo,450492000.0
53894,2011,SP,3550308,São Paulo,501964400.0
59459,2012,SP,3550308,São Paulo,538877100.0
65025,2013,SP,3550308,São Paulo,582079700.0
70595,2014,SP,3550308,São Paulo,621917400.0
76165,2015,SP,3550308,São Paulo,653647000.0


## Salva os arquivos para testes e uso futuro

In [40]:
os.chdir("/content/drive/My Drive/Colab Notebooks/TCC/")
PIBMunicipios.to_excel('PIBMunicipios.xlsx', index=False)
PIBMunicipiosSomaAnos.to_excel('PIBMunicipiosSomaAnos.xlsx', index=False)
PIBMunicipios2009.to_excel('PIBMunicipios2009.xlsx', index=False)
pd.DataFrame(CodMaioresMunicipios,columns=['Código do Município']).to_excel('CodMaioresMunicipios.xlsx', index=False)