In [2]:
import pandas as pd
import geopandas
import matplotlib.pyplot as plt

## Dados Geográficos dos Municípios

Fonte: https://www.ibge.gov.br/geociencias/organizacao-do-territorio/malhas-territoriais/15774-malhas.html

In [4]:
# Dados geograficos dos municipios
df_municipios_geo = geopandas.read_file("/content/SC_MUNICIPIOS_2023/SC_Municipios_2023.dbf")

DataSourceError: /content/SC_MUNICIPIOS_2023/SC_Municipios_2023.dbf: No such file or directory

In [2]:
df_municipios_geo.info()


NameError: name 'df_municipios_geo' is not defined

In [None]:
df_municipios_geo.head()

In [None]:
mapa = geopandas.read_file("/content/SC_MUNICIPIOS_2023/SC_Municipios_2023.shp")

In [None]:
mapa.plot()
plt.show()

## Dados da votação - TSE

Fonte:
https://dadosabertos.tse.jus.br/dataset/resultados-2022/resource/ff3e660a-6387-4632-97f7-9b60a477751a

In [None]:
# Dados dos votos
df_votos = pd.read_csv("/content/votacao_secao_2022_SC.csv", encoding="latin1", delimiter=";")

In [None]:
df_votos.info()

In [None]:
df_votos.head()

In [None]:
# Filtrar apenas votos para deputado federal
df_deputado_federal = df_votos[df_votos["DS_CARGO"] == "DEPUTADO FEDERAL"]

# Agregar os votos por município
aggregated = df_deputado_federal.groupby(["NM_MUNICIPIO"], as_index=False)["QT_VOTOS"].sum()

# Normalizar os nomes dos municípios
mapa["NM_MUNICIPIO"] = mapa["NM_MUN"].str.upper()
aggregated["NM_MUNICIPIO"] = aggregated["NM_MUNICIPIO"].str.upper()

result = mapa.merge(aggregated, on="NM_MUNICIPIO", how="left")

# Foi necessário preencher os municípios sem votos com 0 para fazer a devida agregação
result["QT_VOTOS"] = result["QT_VOTOS"].fillna(0)

result.plot(column="QT_VOTOS", cmap="Blues", legend=True)
plt.title("Votos para Deputado Federal por Município - SC")
plt.show()

## Dados do censo

Fonte:

In [None]:
# dados ja tratados
dist_pop = pd.read_csv("/content/dados/distribuicao_populacao.csv")

In [None]:
dist_pop.head()

In [None]:
pib_municipios = pd.read_csv("/content/dados/pib_municipios.csv")

In [None]:
pib_municipios.head()

In [None]:
mapa2 = geopandas.read_file("/content/SC_MUNICIPIOS_2023/SC_Municipios_2023.shp")

# Normalizar os nomes dos municípios
dist_pop["nm_mun"] = dist_pop["nm_mun"].str.upper()
mapa2["NM_MUNICIPIO"] = mapa2["NM_MUN"].str.upper()

# Merge dos dados de população com o mapa
mapa_pop = mapa2.merge(dist_pop, left_on="NM_MUNICIPIO", right_on="nm_mun", how="left")

# Preencher valores nulos com 0
mapa_pop["tot_pop"] = mapa_pop["tot_pop"].fillna(0)

mapa_pop.plot(column="tot_pop", cmap="OrRd", legend=True)
plt.title("População por Município - SC")
plt.show()

In [None]:
mapa_pib = geopandas.read_file("/content/SC_MUNICIPIOS_2023/SC_Municipios_2023.shp")

# Normalizar os nomes dos municípios
pib_municipios["nm_mun"] = pib_municipios["nm_mun"].str.upper()
mapa_pib["NM_MUNICIPIO"] = mapa_pib["NM_MUN"].str.upper()

# Merge dos dados do PIB com o mapa
mapa_pib = mapa_pib.merge(pib_municipios, left_on="NM_MUNICIPIO", right_on="nm_mun", how="left")

# Preencher valores nulos com 0
mapa_pib["pib"] = mapa_pib["pib"].fillna(0)

# Plotar o mapa com a coluna do PIB
mapa_pib.plot(column="pib", cmap="Greens", legend=True)
plt.title("PIB por Município - SC")
plt.show()

## Dados transferências municipais do estado de SC

Fonte dos dados: https://dados.sc.gov.br/dataset/transferencias

In [3]:
raw_data = pd.read_csv("content/transferencias-municipais.csv", delimiter=';', encoding='ISO-8859-1')

raw_data.head()

Unnamed: 0,nuanoexercicio,nmmunicipiocredor,cdunidadegestora,nmunidadegestora,cdcredor,nmcredor,nuidentificacao,cdtipoidentificacao,cdfuncao,nmfuncao,...,deobjeto,vlglobal,cdmodalidadeaplicacao,vlrepasse,vlcontrapartida,nucpfresponsavelconcedente,nmresponsavelconcedente,dtcelebracao,nupreparacaopagamento,dtlancamentoliquidacao
0,2022,VARGEAO,530001,Secretaria de Estado da Infraestrutura e Mobil...,5896,MUNICIPIO DE VARGEAO,83009928000164,1,26,Transporte,...,,,40,0,0,,,,,2022-03-08 00:00:00
1,2022,CACADOR,480091,Fundo Estadual de Saúde,227634,FUNDO MUNICIPAL DE SAUDE DE CACADOR,11583495000145,1,10,Saúde,...,,,41,0,0,,,,2022PP022908,2022-03-15 00:00:00
2,2022,CHAPECO,480091,Fundo Estadual de Saúde,118794,FUNDO MUNICIPAL DE SAUDE DE CHAPECO,80636475000108,1,10,Saúde,...,,,41,0,0,,,,2022PP022910,2022-03-15 00:00:00
3,2022,ITUPORANGA,480091,Fundo Estadual de Saúde,200338,FUNDO MUNICIPAL DE SAUDE DE ITUPORANGA,11407443000118,1,10,Saúde,...,,,41,0,0,,,,,2022-03-15 00:00:00
4,2022,SANTIAGO DO SUL,450001,Secretaria de Estado da Educação,91511,APP DA ESCOLA DE EDUCACAO BASICA SAO TIAGO,83697334000193,1,12,Educação,...,,,50,0,0,,,,2022PP003678,2022-01-27 00:00:00


In [4]:
import re

# Limpeza e correção de caracteres corrompidos
raw_data.columns = [col.strip().replace('Ã', 'A').replace('�', '') for col in raw_data.columns]
raw_data['nmmunicipiocredor'] = raw_data['nmmunicipiocredor'].str.replace('�', 'A')
raw_data['nmfuncao'] = raw_data['nmfuncao'].str.replace('�', 'A')
raw_data['nmsubfuncao'] = raw_data['nmsubfuncao'].str.replace('�', 'A')

def clean_text(text):
    text = text.upper()  
    text = re.sub(r'[Ã]', 'A', text)
    text = re.sub(r'[ÁÀÂÃ]', 'A', text)
    text = re.sub(r'[ÉÈÊ]', 'E', text)
    text = re.sub(r'[ÍÌÎ]', 'I', text)
    text = re.sub(r'[ÓÒÔÕ]', 'O', text)
    text = re.sub(r'[ÚÙÛ]', 'U', text)
    text = re.sub(r'[Ç]', 'C', text)
    text = re.sub(r'[^A-Z\s]', '', text)  
    return text

raw_data['nmmunicipiocredor'] = raw_data['nmmunicipiocredor'].apply(clean_text)

municipios_sc = df_municipios_geo['NM_MUN'].apply(clean_text).unique()

# Filtrar apenas municípios de SC com base em df_municipios_geo
raw_data = raw_data[raw_data['nmmunicipiocredor'].isin(municipios_sc)]

# Converter colunas de valor para numérico
raw_data['vlempenhado'] = pd.to_numeric(raw_data['vlempenhado'], errors='coerce')
raw_data['vlliquidado'] = pd.to_numeric(raw_data['vlliquidado'], errors='coerce')
raw_data['vlpagoorcamentario'] = pd.to_numeric(raw_data['vlpagoorcamentario'], errors='coerce')

# Remover linhas com valores nulos em "vlempenhado"
raw_data = raw_data.dropna(subset=['vlempenhado'])

# Agregar os valores por município e função
dados_transf = raw_data.groupby(['nmmunicipiocredor', 'nmfuncao'])[['vlempenhado', 'vlliquidado', 'vlpagoorcamentario']].sum().reset_index()

# Visualização: Top 10 municípios por valor total (emp., liqu. ou pago)
plt.figure(figsize=(12, 6))
dados_transf['valor_total'] = dados_transf['vlempenhado'] + dados_transf['vlliquidado'] + dados_transf['vlpagoorcamentario']
top_municipios = dados_transf.groupby('nmmunicipiocredor')['valor_total'].sum().nlargest(10)

top_municipios.plot(kind='bar', color='royalblue')
plt.title('Top 10 Municípios Catarinenses por Valor Total (2022)')
plt.xlabel('Município')
plt.ylabel('Valor Total (R$)')
plt.xticks(rotation=45, ha='right')
plt.tight_layout()
plt.show()

NameError: name 'df_municipios_geo' is not defined

In [None]:
# Carregar o arquivo .shp do mapa
mapa_transf = geopandas.read_file("content/SC_MUNICIPIOS_2023/SC_Municipios_2023.shp")

# Normalizar os nomes dos municípios
mapa_transf["NM_MUNICIPIO"] = mapa_transf["NM_MUN"].apply(clean_text)

# Mesclar os dados de transferência agregados com os dados geográficos
gdf_transferencias = mapa_transf.merge(dados_transf, left_on='NM_MUN', right_on='nmmunicipiocredor', how='left')

dados_transf.head(20)