# Municípios Brasileiros

issue referente a [Raspagem de municípios brasileiros](https://github.com/incolume-jedi/academia-jedi/issues/14).


## Insumos
sources: https://cidades.ibge.gov.br/brasil/panorama > Aniversário dos Municípios > donwload (aniversariantes.cvs)

In [1]:
import json
import pandas as pd
import enum
import datetime as dt

from copy import copy
from dataclasses import dataclass
from pathlib import Path

In [2]:
data_path = Path().resolve().parent.joinpath('data_files')
Regiao = enum.Enum('Regiao', 'NORTE NORDESTE CENTROESTE SUDESTE SUL'.split())


@dataclass
class Estado:
    sigla: str
    estado: str
    capital: str
    regiao: Regiao


@dataclass
class Municipio:
    estado: Estado = ''
    nome: str = ''
    data: dt.datetime = None
    mes: int = 0
    dia: int = 0

In [3]:
estados = pd.read_json(data_path / 'estados_br.json')
estados

Unnamed: 0,SIGLA,ESTADO,CAPITAL,REGIAO
0,AC,Acre,Rio Branco,NORTE
1,AL,Alagoas,Maceió,NORDESTE
2,AP,Amapá,Macapá,NORTE
3,AM,Amazonas,Manaus,NORTE
4,BA,Bahia,Salvador,NORDESTE
5,CE,Ceará,Fortaleza,NORDESTE
6,DF,Distrito Federal,Brasília,CENTROESTE
7,ES,Espírito Santo,Vitória,SUDESTE
8,GO,Goiás,Goiânia,CENTROESTE
9,MA,Maranhão,São Luís,NORDESTE


In [4]:
municipios = pd.read_csv(data_path / 'aniversariantes.csv')
municipios

Unnamed: 0,UF,CODIGO_MUNICIPIO,NOME_MUNICIPIO,DIA,MES
0,AM,130080,Borba,1,1
1,PA,150611,Quatipuru,1,1
2,PA,150796,Terra Alta,1,1
3,TO,170770,Filadélfia,1,1
4,TO,171370,Monte Santo do Tocantins,1,1
...,...,...,...,...,...
5565,SP,350090,Altair,31,12
5566,SC,420550,Fraiburgo,31,12
5567,SC,420990,Lontras,31,12
5568,RS,430045,Alegria,31,12


In [5]:
municipios.to_dict(orient='records')

[{'UF': 'AM',
  'CODIGO_MUNICIPIO': 130080,
  'NOME_MUNICIPIO': 'Borba',
  'DIA': 1,
  'MES': 1},
 {'UF': 'PA',
  'CODIGO_MUNICIPIO': 150611,
  'NOME_MUNICIPIO': 'Quatipuru',
  'DIA': 1,
  'MES': 1},
 {'UF': 'PA',
  'CODIGO_MUNICIPIO': 150796,
  'NOME_MUNICIPIO': 'Terra Alta',
  'DIA': 1,
  'MES': 1},
 {'UF': 'TO',
  'CODIGO_MUNICIPIO': 170770,
  'NOME_MUNICIPIO': 'Filadélfia',
  'DIA': 1,
  'MES': 1},
 {'UF': 'TO',
  'CODIGO_MUNICIPIO': 171370,
  'NOME_MUNICIPIO': 'Monte Santo do Tocantins',
  'DIA': 1,
  'MES': 1},
 {'UF': 'TO',
  'CODIGO_MUNICIPIO': 172049,
  'NOME_MUNICIPIO': 'São Valério',
  'DIA': 1,
  'MES': 1},
 {'UF': 'TO',
  'CODIGO_MUNICIPIO': 172130,
  'NOME_MUNICIPIO': 'Tupiratins',
  'DIA': 1,
  'MES': 1},
 {'UF': 'MA',
  'CODIGO_MUNICIPIO': 210237,
  'NOME_MUNICIPIO': 'Cachoeira Grande',
  'DIA': 1,
  'MES': 1},
 {'UF': 'MA',
  'CODIGO_MUNICIPIO': 210390,
  'NOME_MUNICIPIO': 'Duque Bacelar',
  'DIA': 1,
  'MES': 1},
 {'UF': 'MA',
  'CODIGO_MUNICIPIO': 210570,
  'NOME_MUN

In [6]:
df0 = copy(estados)
df0.head()

Unnamed: 0,SIGLA,ESTADO,CAPITAL,REGIAO
0,AC,Acre,Rio Branco,NORTE
1,AL,Alagoas,Maceió,NORDESTE
2,AP,Amapá,Macapá,NORTE
3,AM,Amazonas,Manaus,NORTE
4,BA,Bahia,Salvador,NORDESTE


In [7]:
df0.columns = df0.columns.str.casefold()
df0.columns

Index(['sigla', 'estado', 'capital', 'regiao'], dtype='object')

In [8]:
df0.head()

Unnamed: 0,sigla,estado,capital,regiao
0,AC,Acre,Rio Branco,NORTE
1,AL,Alagoas,Maceió,NORDESTE
2,AP,Amapá,Macapá,NORTE
3,AM,Amazonas,Manaus,NORTE
4,BA,Bahia,Salvador,NORDESTE


In [9]:
ufs = [x for x in df0.to_dict(orient='records')]
ufs

[{'sigla': 'AC', 'estado': 'Acre', 'capital': 'Rio Branco', 'regiao': 'NORTE'},
 {'sigla': 'AL',
  'estado': 'Alagoas',
  'capital': 'Maceió',
  'regiao': 'NORDESTE'},
 {'sigla': 'AP', 'estado': 'Amapá', 'capital': 'Macapá', 'regiao': 'NORTE'},
 {'sigla': 'AM', 'estado': 'Amazonas', 'capital': 'Manaus', 'regiao': 'NORTE'},
 {'sigla': 'BA',
  'estado': 'Bahia',
  'capital': 'Salvador',
  'regiao': 'NORDESTE'},
 {'sigla': 'CE',
  'estado': 'Ceará',
  'capital': 'Fortaleza',
  'regiao': 'NORDESTE'},
 {'sigla': 'DF',
  'estado': 'Distrito Federal',
  'capital': 'Brasília',
  'regiao': 'CENTROESTE'},
 {'sigla': 'ES',
  'estado': 'Espírito Santo',
  'capital': 'Vitória',
  'regiao': 'SUDESTE'},
 {'sigla': 'GO',
  'estado': 'Goiás',
  'capital': 'Goiânia',
  'regiao': 'CENTROESTE'},
 {'sigla': 'MA',
  'estado': 'Maranhão',
  'capital': 'São Luís',
  'regiao': 'NORDESTE'},
 {'sigla': 'MT',
  'estado': 'Mato Grosso',
  'capital': 'Cuiabá',
  'regiao': 'CENTROESTE'},
 {'sigla': 'MS',
  'estado':

In [10]:
ufs = [Estado(**x) for x in df0.to_dict(orient='records')]
ufs

[Estado(sigla='AC', estado='Acre', capital='Rio Branco', regiao='NORTE'),
 Estado(sigla='AL', estado='Alagoas', capital='Maceió', regiao='NORDESTE'),
 Estado(sigla='AP', estado='Amapá', capital='Macapá', regiao='NORTE'),
 Estado(sigla='AM', estado='Amazonas', capital='Manaus', regiao='NORTE'),
 Estado(sigla='BA', estado='Bahia', capital='Salvador', regiao='NORDESTE'),
 Estado(sigla='CE', estado='Ceará', capital='Fortaleza', regiao='NORDESTE'),
 Estado(sigla='DF', estado='Distrito Federal', capital='Brasília', regiao='CENTROESTE'),
 Estado(sigla='ES', estado='Espírito Santo', capital='Vitória', regiao='SUDESTE'),
 Estado(sigla='GO', estado='Goiás', capital='Goiânia', regiao='CENTROESTE'),
 Estado(sigla='MA', estado='Maranhão', capital='São Luís', regiao='NORDESTE'),
 Estado(sigla='MT', estado='Mato Grosso', capital='Cuiabá', regiao='CENTROESTE'),
 Estado(sigla='MS', estado='Mato Grosso do Sul', capital='Campo Grande', regiao='CENTROESTE'),
 Estado(sigla='MG', estado='Minas Gerais', capi

In [11]:
municipios

Unnamed: 0,UF,CODIGO_MUNICIPIO,NOME_MUNICIPIO,DIA,MES
0,AM,130080,Borba,1,1
1,PA,150611,Quatipuru,1,1
2,PA,150796,Terra Alta,1,1
3,TO,170770,Filadélfia,1,1
4,TO,171370,Monte Santo do Tocantins,1,1
...,...,...,...,...,...
5565,SP,350090,Altair,31,12
5566,SC,420550,Fraiburgo,31,12
5567,SC,420990,Lontras,31,12
5568,RS,430045,Alegria,31,12


In [12]:
df = copy(municipios)

In [13]:
Municipio()

Municipio(estado='', nome='', data=None, mes=0, dia=0)

In [14]:
# [x for x in df.to_dict(orient='records')]

In [15]:
df.head()

Unnamed: 0,UF,CODIGO_MUNICIPIO,NOME_MUNICIPIO,DIA,MES
0,AM,130080,Borba,1,1
1,PA,150611,Quatipuru,1,1
2,PA,150796,Terra Alta,1,1
3,TO,170770,Filadélfia,1,1
4,TO,171370,Monte Santo do Tocantins,1,1


In [16]:
df0.head()

Unnamed: 0,sigla,estado,capital,regiao
0,AC,Acre,Rio Branco,NORTE
1,AL,Alagoas,Maceió,NORDESTE
2,AP,Amapá,Macapá,NORTE
3,AM,Amazonas,Manaus,NORTE
4,BA,Bahia,Salvador,NORDESTE


In [20]:
# df['estado'] =
# df.loc[df.UF == df0.sigla
df0.sigla

0     AC
1     AL
2     AP
3     AM
4     BA
5     CE
6     DF
7     ES
8     GO
9     MA
10    MT
11    MS
12    MG
13    PR
14    PB
15    PA
16    PE
17    PI
18    RN
19    RS
20    RJ
21    RO
22    RR
23    SC
24    SE
25    SP
26    TO
Name: sigla, dtype: object

In [21]:
df

Unnamed: 0,UF,CODIGO_MUNICIPIO,NOME_MUNICIPIO,DIA,MES
0,AM,130080,Borba,1,1
1,PA,150611,Quatipuru,1,1
2,PA,150796,Terra Alta,1,1
3,TO,170770,Filadélfia,1,1
4,TO,171370,Monte Santo do Tocantins,1,1
...,...,...,...,...,...
5565,SP,350090,Altair,31,12
5566,SC,420550,Fraiburgo,31,12
5567,SC,420990,Lontras,31,12
5568,RS,430045,Alegria,31,12


In [33]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 5570 entries, 0 to 5569
Data columns (total 5 columns):
 #   Column            Non-Null Count  Dtype 
---  ------            --------------  ----- 
 0   UF                5570 non-null   object
 1   CODIGO_MUNICIPIO  5570 non-null   int64 
 2   NOME_MUNICIPIO    5570 non-null   object
 3   DIA               5570 non-null   int64 
 4   MES               5570 non-null   int64 
dtypes: int64(3), object(2)
memory usage: 217.7+ KB


In [32]:
df.applymap(lambda x: type(x))

Unnamed: 0,UF,CODIGO_MUNICIPIO,NOME_MUNICIPIO,DIA,MES
0,<class 'str'>,<class 'int'>,<class 'str'>,<class 'int'>,<class 'int'>
1,<class 'str'>,<class 'int'>,<class 'str'>,<class 'int'>,<class 'int'>
2,<class 'str'>,<class 'int'>,<class 'str'>,<class 'int'>,<class 'int'>
3,<class 'str'>,<class 'int'>,<class 'str'>,<class 'int'>,<class 'int'>
4,<class 'str'>,<class 'int'>,<class 'str'>,<class 'int'>,<class 'int'>
...,...,...,...,...,...
5565,<class 'str'>,<class 'int'>,<class 'str'>,<class 'int'>,<class 'int'>
5566,<class 'str'>,<class 'int'>,<class 'str'>,<class 'int'>,<class 'int'>
5567,<class 'str'>,<class 'int'>,<class 'str'>,<class 'int'>,<class 'int'>
5568,<class 'str'>,<class 'int'>,<class 'str'>,<class 'int'>,<class 'int'>


In [34]:
df.apply(lambda x: type(x))

UF                  <class 'pandas.core.series.Series'>
CODIGO_MUNICIPIO    <class 'pandas.core.series.Series'>
NOME_MUNICIPIO      <class 'pandas.core.series.Series'>
DIA                 <class 'pandas.core.series.Series'>
MES                 <class 'pandas.core.series.Series'>
dtype: object

In [35]:
df.loc[:, ['MES', 'DIA']]

Unnamed: 0,MES,DIA
0,1,1
1,1,1
2,1,1
3,1,1
4,1,1
...,...,...
5565,12,31
5566,12,31
5567,12,31
5568,12,31


In [47]:
df.loc[:, ['MES', 'DIA']].apply(lambda x: x)

Unnamed: 0,MES,DIA
0,1,1
1,1,1
2,1,1
3,1,1
4,1,1
...,...,...
5565,12,31
5566,12,31
5567,12,31
5568,12,31


In [52]:
df.loc[:, ['DIA', 'MES']].values

array([[ 1,  1],
       [ 1,  1],
       [ 1,  1],
       ...,
       [31, 12],
       [31, 12],
       [31, 12]])

In [57]:
df.sort_values(by='NOME_MUNICIPIO').to_json(
    data_path / 'municipios_br.json', orient='records'
)