In [1]:
import pandas as pd
import matplotlib.pyplot as plt
from matplotlib.backends.backend_pdf import PdfPages

In [2]:
# Pegando a tabela com todos os municípios da planilha "Municípios"
todos_municipios = pd.read_excel('CD2022_Populacao_Coletada_Imputada_e_Total_Municipio_e_UF.xlsx', sheet_name='Municípios')

# Pegando a tabela com todas as UFs (Estados) da planilha "Unidades da Federação"
ufs = pd.read_excel('CD2022_Populacao_Coletada_Imputada_e_Total_Municipio_e_UF.xlsx', sheet_name='Unidades da Federação')

In [3]:
# Criando um dicionário que mapeia as UF para suas capitais
capitais = {
    'AC': 'Rio Branco',
    'AL': 'Maceió',
    'AP': 'Macapá',
    'AM': 'Manaus',
    'BA': 'Salvador',
    'CE': 'Fortaleza',
    'ES': 'Vitória',
    'GO': 'Goiânia',
    'MA': 'São Luís',
    'MT': 'Cuiabá',
    'MS': 'Campo Grande',
    'MG': 'Belo Horizonte',
    'PA': 'Belém',
    'PB': 'João Pessoa',
    'PR': 'Curitiba',
    'PE': 'Recife',
    'PI': 'Teresina',
    'RJ': 'Rio de Janeiro',
    'RN': 'Natal',
    'RS': 'Porto Alegre',
    'RO': 'Porto Velho',
    'RR': 'Boa Vista',
    'SC': 'Florianópolis',
    'SP': 'São Paulo',
    'SE': 'Aracaju',
    'TO': 'Palmas'
}

# Criando uma nova coluna chamada "É Capital" no DataFrame para eliminar as cidades que não são capitais
todos_municipios['É Capital'] = todos_municipios.apply(lambda row: row['NOME DO MUNICÍPIO'] == capitais.get(row['UF']), axis=1)

# Filtrando as linhas onde a coluna "É Capital" retorna "True" e adicionando no DataFrame "apenas_capitais"
apenas_capitais = todos_municipios[todos_municipios['É Capital']]

In [4]:
# Criando a coluna "Proporção" no DataFrame "apenas_capitais" e adicionado o valor da População total da Capital (coluna "POP. TOTAL" do DataFrame "apenas_capitais") pelo valor da População total do seu Estado (coluna "POP. TOTAL" do DataFrame "ufs")
apenas_capitais['Proporção'] = apenas_capitais.apply(lambda row: round((row['POP. TOTAL'] / ufs.loc[ufs['UF'] == row['UF'], 'POP. TOTAL'].values[0])*100, 1) if row['UF'] in ufs['UF'].values else None, axis=1)

# print(apenas_capitais)

A value is trying to be set on a copy of a slice from a DataFrame.
Try using .loc[row_indexer,col_indexer] = value instead

See the caveats in the documentation: https://pandas.pydata.org/pandas-docs/stable/user_guide/indexing.html#returning-a-view-versus-a-copy
  


In [5]:
# Pegando a planilha com a proporção da população das Capitais em relação aos seus Estados nos Censos de 1872 a 2022
proporcao = pd.read_excel('proporcao-populacao-1872-2022.xls')

# Criando um arquivo PDF para exportar os gráficos
pdf_arquivo = 'Proporcao.pdf'
pdf_paginas = PdfPages(pdf_arquivo)

# Definindo as cores para os gráficos de linha
cores = ['b', 'g', 'r', 'c', 'm', 'y', 'k'] # siglas de cores do Pandas

# Iterando o DataFrame "proporcao", criando o gráfico para cada linha do DataFrame e exportando para o PDF
for i in range(0, len(proporcao)):
    linha = proporcao.iloc[i]
    capital = linha['Capital']
    dados = linha[1:]  # Exclui a coluna 'Capital'
    
    # Criando o gráfico
    plt.figure()
    plt.plot(dados.index, dados.values, marker='o', linestyle='-', label=capital, color=cores[i % len(cores)])
    plt.xlabel('Datas do Censo Demográfico')
    plt.ylabel(f'Proporção (%)', fontsize=10)
    plt.title(f'Proporção da população de {capital} em relação à UF ao longo do tempo', fontsize=9, ha="center")
    plt.xticks(rotation=45)  # Rotacionando os rótulos do eixo X para melhor legibilidade
    plt.tight_layout()
    
    # Adicionando a página ao arquivo PDF
    pdf_paginas.savefig()

# Fechando o arquivo PDF
pdf_paginas.close()

print(f'Gráficos exportados para o arquivo PDF: {pdf_paginas}')



Gráficos exportados para o arquivo PDF: <matplotlib.backends.backend_pdf.PdfPages object at 0x000001C3BF8E6B00>
