In [11]:
import pandas as pd
import plotly

# Importar dataset SNIS e abrir como um Pandas DataFrame

In [12]:
# Abrir, Ler e atribuir a uma variável os dados .csv do snis de 2021
df_snis = pd.read_csv('snis_municipios.csv', sep=';', decimal=',', thousands='.', encoding='utf-16-le', index_col=False)

# Exibir o dataframe
df_snis.head()

Unnamed: 0,Código do IBGE,Código do Município,Município,Estado,Ano de Referência,Prestadores,Serviços,Natureza Jurídica,G06A - População urbana residente do(s) município(s) com abastecimento de água,G06B - População urbana residente do(s) município(s) com esgotamento sanitário,...,IN043_RS - Custo unitário médio do serviço de varrição (prefeitura + empresas contratadas),IN044_RS - Produtividade média dos varredores (prefeitura + empresas contratadas),IN045_RS - Taxa de varredores em relação à população urbana,IN046_RS - Incidência do custo do serviço de varrição no custo total com manejo de rsu,IN047_RS - Incidência de varredores no total de empregados no manejo de rsu,IN048_RS - Extensão total anual varrida per capita,IN051_RS - Taxa de capinadores em relação à população urbana,IN052_RS - Incidência de capinadores no total empregados no manejo de rsu,IN053_RS - Taxa de material recolhido pela coleta seletiva (exceto mat. orgânica) em relação à quantidade total coletada de resíduos sól. domésticos,IN054_RS - Massa per capita de materiais recicláveis recolhidos via coleta seletiva
0,3300100.0,330010,Angra dos Reis,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Água e Esgoto | Água | Res. Sólidos,Autarquia | Sociedade de economia mista com ad...,202458.0,202458.0,...,,,,,,,,,,27.65
1,3300100.0,330010,Angra dos Reis,RJ,2020,[33045500] Companhia Estadual de Águas e Esgot...,Água e Esgoto | Água | Res. Sólidos,Autarquia | Sociedade de economia mista com ad...,199446.0,199446.0,...,,,0.88,,40.42,,0.25,11.55,,0.85
2,3300100.0,330010,Angra dos Reis,RJ,2019,[33045500] Companhia Estadual de Águas e Esgot...,Água e Esgoto | Água | Res. Sólidos,Autarquia | Sociedade de economia mista com ad...,196306.0,196306.0,...,,,,,,,,,,0.96
3,,330010,Angra dos Reis,RJ,2018,[33001011] Serviço Autônomo de Água e Esgoto d...,Água e Esgoto | Água | Res. Sólidos,,193052.0,193052.0,...,,,,,,,,,,82.47
4,,330010,Angra dos Reis,RJ,2017,[33001011] Serviço Autônomo de Água e Esgoto d...,Água e Esgoto | Água | Res. Sólidos,,187477.0,187477.0,...,,,0.93,30.98,40.42,,0.27,11.55,11.91,31.31


# Data Cleaning

## Processo de Renomear as colunas do DataFrame

### Inicialmente separamos as colunas de código do SNIS das Colunas que não são de código para tratá-las de forma diferente.

**Atenção:** há 2 formas de iterar nas colunas do dataframe e retornar listas com os nomes das colunas, as duas formas estão descritas abaixo, são elas: List Comprehension e Laço For

In [13]:
# FORMAS DE FAZER LISTAS UTILIZANDO 'list comprehension'

# Construir uma lista "colunas_sem_codigo" iterando nas colunas até 8 do "df"
colunas_sem_codigo = [coluna for coluna in df_snis.columns[:8]]
# Construir uma lista "colunas_com_codigo" iterando nas colunas do "df" que não estão na lista "colunas_sem_codigo"
colunas_com_codigo = [coluna for coluna in df_snis.columns if coluna not in colunas_sem_codigo]

# OUTRA FORMA DE FAZER LISTAS UTILIZANDO Laço For

'''# Cria uma lista com o nome das colunas
# Itera nas colunas até 8 e adiciona/append a coluna na lista
colunas_sem_codigo = []
for coluna in df.columns[:8]:
    colunas_sem_codigo.append(coluna)

# Cria uma lista com o nome das colunas
# Itera nas colunas que não fazem parte da lista "colunas_sem_codigo"
# adiciona/append a coluna na lista "coluna_com_codigo"
colunas_com_codigo = []
for col in df.columns:
    if col not in colunas_sem_codigo:
        colunas_com_codigo.append(col)'''



'# Cria uma lista com o nome das colunas\n# Itera nas colunas até 8 e adiciona/append a coluna na lista\ncolunas_sem_codigo = []\nfor coluna in df.columns[:8]:\n    colunas_sem_codigo.append(coluna)\n\n# Cria uma lista com o nome das colunas\n# Itera nas colunas que não fazem parte da lista "colunas_sem_codigo"\n# adiciona/append a coluna na lista "coluna_com_codigo"\ncolunas_com_codigo = []\nfor col in df.columns:\n    if col not in colunas_sem_codigo:\n        colunas_com_codigo.append(col)'

In [14]:
# Limpar o nome textual e deixar somente os códigos das informações e indicadores do SNIS no dataframe "colunas"
colunas_com_codigo = [x[:x.find('-') -1 ] for x in colunas_com_codigo]

# Reunir as duas listas de colunas, com e sem código, em uma lista "colunas"
colunas = colunas_sem_codigo + colunas_com_codigo

# Exibir as colunas
colunas

['Código do IBGE',
 'Código do Município',
 'Município',
 'Estado',
 'Ano de Referência',
 'Prestadores',
 'Serviços',
 'Natureza Jurídica',
 'G06A',
 'G06B',
 'G12A',
 'G12B',
 'GE008',
 'GE009',
 'GE010',
 'GE011',
 'POP_TOT',
 'POP_URB',
 'GE201',
 'GE202',
 'AG001',
 'AG002',
 'AG003',
 'AG004',
 'AG005',
 'AG006',
 'AG007',
 'AG008',
 'AG010',
 'AG011',
 'AG012',
 'AG013',
 'AG014',
 'AG015',
 'AG017',
 'AG018',
 'AG019',
 'AG020',
 'AG021',
 'AG022',
 'AG024',
 'AG026',
 'AG027',
 'AG028',
 'ES001',
 'ES002',
 'ES003',
 'ES004',
 'ES005',
 'ES006',
 'ES007',
 'ES008',
 'ES009',
 'ES012',
 'ES013',
 'ES014',
 'ES015',
 'ES026',
 'ES028',
 'FN001',
 'FN002',
 'FN003',
 'FN004',
 'FN005',
 'FN006',
 'FN007',
 'FN008',
 'FN010',
 'FN011',
 'FN013',
 'FN014',
 'FN015',
 'FN016',
 'FN017',
 'FN018',
 'FN019',
 'FN020',
 'FN021',
 'FN022',
 'FN023',
 'FN024',
 'FN025',
 'FN026',
 'FN027',
 'FN028',
 'FN030',
 'FN031',
 'FN032',
 'FN033',
 'FN034',
 'FN035',
 'FN036',
 'FN037',
 'FN038',

In [15]:
# Atribuir o nome limpo das colunas que estão no dataframe "colunas" ao dataframe "df"
df_snis.columns = colunas

# Renomear os headers de todas as colunas para minúsculo
df_snis.columns = df_snis.columns.str.lower()

# Renomear os headers das colunas iniciais
df_snis = df_snis.rename(columns={"código do ibge": "cd_mun7", "código do município": "cd_mun6", "município":"nm_mun", "estado":"uf", "ano de referência":"ano_ref", 'serviços':'servicos', 'natureza jurídica':'nat_jur'})

# Exibir os registros iniciais
df_snis.head()

Unnamed: 0,cd_mun7,cd_mun6,nm_mun,uf,ano_ref,prestadores,servicos,nat_jur,g06a,g06b,...,in043_rs,in044_rs,in045_rs,in046_rs,in047_rs,in048_rs,in051_rs,in052_rs,in053_rs,in054_rs
0,3300100.0,330010,Angra dos Reis,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Água e Esgoto | Água | Res. Sólidos,Autarquia | Sociedade de economia mista com ad...,202458.0,202458.0,...,,,,,,,,,,27.65
1,3300100.0,330010,Angra dos Reis,RJ,2020,[33045500] Companhia Estadual de Águas e Esgot...,Água e Esgoto | Água | Res. Sólidos,Autarquia | Sociedade de economia mista com ad...,199446.0,199446.0,...,,,0.88,,40.42,,0.25,11.55,,0.85
2,3300100.0,330010,Angra dos Reis,RJ,2019,[33045500] Companhia Estadual de Águas e Esgot...,Água e Esgoto | Água | Res. Sólidos,Autarquia | Sociedade de economia mista com ad...,196306.0,196306.0,...,,,,,,,,,,0.96
3,,330010,Angra dos Reis,RJ,2018,[33001011] Serviço Autônomo de Água e Esgoto d...,Água e Esgoto | Água | Res. Sólidos,,193052.0,193052.0,...,,,,,,,,,,82.47
4,,330010,Angra dos Reis,RJ,2017,[33001011] Serviço Autônomo de Água e Esgoto d...,Água e Esgoto | Água | Res. Sólidos,,187477.0,187477.0,...,,,0.93,30.98,40.42,,0.27,11.55,11.91,31.31


## Abaixo vamos estudar a estrutura e o modelo de dados do nosso DataFrame para conhecê-lo um pouco melhor

In [16]:
# Exibindo as informações do dataframe
df_snis.info()

# Aqui temos informações sobre a quantidade de linhas e colunas e os tipos de dados que existem em nosso dataframe

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 461 entries, 0 to 460
Columns: 658 entries, cd_mun7 to in054_rs
dtypes: float64(483), int64(2), object(173)
memory usage: 2.3+ MB


In [17]:
# Exibir os tipos de dados como uma lista em que apareça o header da coluna e o tipo de dado

# Obtenha os headers de coluna e dtypes
headers = df_snis.columns
dtypes = df_snis.dtypes

# Crie um laço for para iterar sobre os headers de coluna
for header in headers:
    # Imprima o header de coluna e o dtype
    print(f"{header} - {dtypes[header]}")

cd_mun7 - object
cd_mun6 - object
nm_mun - object
uf - object
ano_ref - object
prestadores - object
servicos - object
nat_jur - object
g06a - float64
g06b - float64
g12a - float64
g12b - float64
ge008 - float64
ge009 - float64
ge010 - float64
ge011 - float64
pop_tot - int64
pop_urb - int64
ge201 - object
ge202 - object
ag001 - float64
ag002 - float64
ag003 - float64
ag004 - float64
ag005 - float64
ag006 - float64
ag007 - float64
ag008 - float64
ag010 - float64
ag011 - float64
ag012 - float64
ag013 - float64
ag014 - float64
ag015 - float64
ag017 - float64
ag018 - float64
ag019 - float64
ag020 - float64
ag021 - float64
ag022 - float64
ag024 - float64
ag026 - float64
ag027 - float64
ag028 - float64
es001 - float64
es002 - float64
es003 - float64
es004 - float64
es005 - float64
es006 - float64
es007 - float64
es008 - float64
es009 - float64
es012 - float64
es013 - float64
es014 - float64
es015 - float64
es026 - float64
es028 - float64
fn001 - float64
fn002 - float64
fn003 - float64
fn004 -

##  Filtrar o dataframe "df_snis" para formar um novo dataframe "df_snis_2021"

In [18]:
# Selecionar apenas as colunas de abastecimento que decidi trabalhar
df_filtrado = df_snis[['cd_mun7', 'cd_mun6', 'nm_mun', 'uf', 'ano_ref', 'prestadores', 'servicos', 'nat_jur',
                'ge009','ge011','es002','es004','es005','es006','es007','es008','es009','in015_ae','in016_ae','in021_ae','in046_ae',
                'ge008', 'ge010','ag003','ag004','ag005','ag021','ag022','ag008','ag010','ag011','ag012','in003_ae','in005_ae','in028_ae','in049_ae']]

# filtrando para 2021
df_snis_2021 = df_filtrado[df_filtrado['ano_ref'] == '2021']

# Alterando o index dos novos dataframes filtrados porque eles herdaram o index do dataframe "df_snis_abastecimento" e "df_snis_esgotamento"
df_snis_2021 = df_snis_2021.reset_index(drop=True)

#Exibir o dataframe
df_snis_2021

Unnamed: 0,cd_mun7,cd_mun6,nm_mun,uf,ano_ref,prestadores,servicos,nat_jur,ge009,ge011,...,ag021,ag022,ag008,ag010,ag011,ag012,in003_ae,in005_ae,in028_ae,in049_ae
0,3300100,330010,Angra dos Reis,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Água e Esgoto | Água | Res. Sólidos,Autarquia | Sociedade de economia mista com ad...,1.0,35.0,...,54616.0,25473.0,4472.22,15075.45,16985.16,0.00,2.76,2.83,78.64,30.20
1,3300159,330015,Aperibé,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Esgotos | Água | Água e Esgoto | Res. Sólidos,Administração pública direta | Sociedade de ec...,1.0,3.0,...,3578.0,3799.0,616.22,720.76,793.99,0.00,4.22,5.00,44.05,60.01
2,3300209,330020,Araruama,RJ,2021,[33002011] Concessionária Águas de Juturnaíba ...,Água e Esgoto | Res. Sólidos,Empresa privada | Administração pública direta,1.0,1.0,...,71225.0,66879.0,9641.86,15312.87,10581.55,21602.74,11.82,19.73,52.48,24.05
3,3300225,330022,Areal,RJ,2021,,,,,,...,,,,,,,,,,
4,3300233,330023,Armação dos Búzios,RJ,2021,[33007011] Prolagos S/A - Concessionária de Se...,Água e Esgoto | Res. Sólidos,Empresa privada | Administração pública direta,1.0,0.0,...,18628.0,23775.0,3417.00,3417.00,4242.00,6786.00,2.91,16.49,92.24,25.70
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
87,3306008,330600,Três Rios,RJ,2021,[33060011] Serviço Autônomo de Água e Esgoto d...,Água e Esgoto | Res. Sólidos,Autarquia | Administração pública direta,1.0,1.0,...,42821.0,27076.0,4698.00,9013.00,5306.00,10399.34,3.50,3.80,51.02,13.33
88,3306107,330610,Valença,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Esgotos | Água | Res. Sólidos,Administração pública direta | Sociedade de ec...,1.0,5.0,...,19105.0,19694.0,4302.72,5449.77,4350.79,0.00,5.82,4.45,37.72,52.75
89,3306156,330615,Varre-Sai,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Água | Res. Sólidos,Sociedade de economia mista com administração ...,,,...,1094.0,1060.0,164.64,200.15,254.80,0.00,11.62,5.08,61.69,51.54
90,3306206,330620,Vassouras,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Esgotos | Água | Res. Sólidos,Administração pública direta | Sociedade de ec...,1.0,1.0,...,11008.0,12285.0,1673.75,2042.68,2754.17,0.00,5.44,5.25,69.60,48.38


# Processamento

## Estatística Descritiva

In [19]:
# Calcular a estatística descritiva básica do dataset para cada coluna numérica
df_snis_2021.describe()

Unnamed: 0,ge009,ge011,es002,es004,es005,es006,es007,es008,es009,in015_ae,...,ag021,ag022,ag008,ag010,ag011,ag012,in003_ae,in005_ae,in028_ae,in049_ae
count,76.0,76.0,69.0,69.0,76.0,76.0,76.0,48.0,69.0,76.0,...,90.0,85.0,90.0,90.0,90.0,90.0,88.0,86.0,90.0,90.0
mean,0.986842,2.776316,32766.26087,297.737246,9382.600789,6618.056711,7679.223026,76437.54,39152.19,58.917895,...,42819.3,44884.98,6685.509667,28549.71,27164.31,23219.81,6.523864,5.853605,61.832889,41.820222
std,0.114708,5.395303,106369.522527,863.535445,46624.025374,39833.206268,48989.904382,288676.9,141497.6,35.637865,...,151504.7,175788.4,35104.123666,144528.1,143611.2,146628.5,4.292184,3.036881,26.303163,19.044687
min,0.0,0.0,315.0,0.97,0.0,0.0,0.0,320.0,320.0,0.0,...,1094.0,0.0,0.0,184.43,0.0,0.0,0.21,0.46,0.0,0.56
25%,1.0,0.0,3686.0,33.2,445.14,0.0,0.0,5109.5,3857.0,28.79,...,4800.75,3458.0,458.245,750.61,931.5025,0.0,3.875,5.0325,44.3375,27.2975
50%,1.0,1.0,10000.0,65.0,1828.405,123.22,0.0,18192.5,11500.0,64.92,...,11072.0,8646.0,1243.29,2087.1,2180.52,0.0,5.715,5.39,61.125,41.705
75%,1.0,3.0,32800.0,281.29,4111.5875,2103.905,427.72,56432.0,38531.0,100.0,...,36553.25,29166.0,3684.8,8797.068,7840.945,1947.7,7.7875,5.98,80.6575,56.4175
max,1.0,35.0,880189.0,7009.58,406681.07,346468.38,426632.08,2014093.0,1176971.0,100.0,...,1418384.0,1607079.0,332614.59,1285170.0,1289567.0,1368915.0,29.02,19.73,114.1,86.11


In [20]:
def calcula_media_metrica_ano(metrica: str, ano: int, df: pd.DataFrame) -> float:
    """
    Função para retornar a média de uma métrica em um determinado ano
    metrica: nome da métrica
    ano: ano da métrica
    df: DataFrame a ser analisado
    """
    return df[df['ano_ref'] == str(ano)][metrica.lower()].mean(skipna=True)

def calcula_total_metrica_ano(metrica: str, ano: int, df: pd.DataFrame) -> float:
    """
    Função para retornar o total de uma métrica em um determinado ano
    metrica: nome da métrica
    ano: ano da métrica
    df: DataFrame a ser analisado
    """
    return df[df['ano_ref'] == str(ano)][metrica.lower()].sum(skipna=True)

In [21]:
# dicionário com os nomes e os indicadores
dicionario_indicadores_total = dict()

# Cálculo de fato dos indicadores
# GE008 - Quantidade de sedes municipais atendidas com abastecimento de água
ge008 = calcula_total_metrica_ano('GE008',2021,df_snis)
dicionario_indicadores_total['ge008'] = ge008

# GE009 - Quantidade de sedes municipais atendidas com esgotamento sanitário
ge009 = calcula_total_metrica_ano('GE009',2021,df_snis)
dicionario_indicadores_total['ge009'] = ge009

# GE010 - Quantidade de localidades (excluídas as sedes) atendidas com abastecimento de água
ge010 = calcula_total_metrica_ano('GE010',2021,df_snis)
dicionario_indicadores_total['ge010'] = ge010

# GE011 - Quantidade de localidades (excluídas as sedes) atendidas com esgotamento sanitário
ge011 = calcula_total_metrica_ano('GE011',2021,df_snis)
dicionario_indicadores_total['ge010'] = ge010

# AG003 - Quantidade de economias ativas de água 
ag003 = calcula_total_metrica_ano('AG003',2021,df_snis)
dicionario_indicadores_total['ag003'] = ag003

# AG004 - Quantidade de ligações ativas de Água Micromedidas 
ag004 = calcula_total_metrica_ano('AG004',2021,df_snis)
dicionario_indicadores_total['ag004'] = ag004

# AG005 - Extensão da Rede de Água (km)
ag005 = calcula_total_metrica_ano('AG005',2021,df_snis)
dicionario_indicadores_total['ag005'] = ag005

# AG008 - Volume de água micromedido
ag008 = calcula_total_metrica_ano('AG008',2021,df_snis)
dicionario_indicadores_total['ag008'] = ag008

# AG010 - Volume de água consumido
ag010 = calcula_total_metrica_ano('AG010',2021,df_snis)
dicionario_indicadores_total['ag010'] = ag010

# AG011 - Volume de água faturado
ag011 = calcula_total_metrica_ano('AG011',2021,df_snis)
dicionario_indicadores_total['ag011'] = ag011

# AG012 - Volume de água Macromedido
ag012 = calcula_total_metrica_ano('AG012',2021,df_snis)
dicionario_indicadores_total['ag012'] = ag012

# AG021 - Quantidade de Ligações Totais de Água
ag021 = calcula_total_metrica_ano('AG021',2021,df_snis)
dicionario_indicadores_total['ag021'] = ag021

# AG022 - Quantidade de economias residenciais ativas de água Micromedidas
ag022 = calcula_total_metrica_ano('AG022',2021,df_snis)
dicionario_indicadores_total['ag022'] = ag022

# ES002 - Quantidade de ligações ativas de esgoto
es002 = calcula_total_metrica_ano('ES002',2021,df_snis)
dicionario_indicadores_total['es002'] = es002

# ES004 - Extensão da rede de esgotos
es004 = calcula_total_metrica_ano('ES004',2021,df_snis)
dicionario_indicadores_total['es004'] = es004

# ES005 - Volume de esgotos coletado
es005 = calcula_total_metrica_ano('ES005',2021,df_snis)
dicionario_indicadores_total['es005'] = es005

# ES006 - Volume de esgoto tratado
es006 = calcula_total_metrica_ano('ES006',2021,df_snis)
dicionario_indicadores_total['es006'] = es006

# AG007 - Volume de esgotos faturado
es007 = calcula_total_metrica_ano('ES007',2021,df_snis)
dicionario_indicadores_total['es007'] = es007

# ES008 - Quantidade de economias residenciais ativas de esgoto
es008 = calcula_total_metrica_ano('ES008',2021,df_snis)
dicionario_indicadores_total['es008'] = es008

# ES009 - Quantidade de ligações totais de esgoto
es009 = calcula_total_metrica_ano('ES009',2021,df_snis)
dicionario_indicadores_total['es009'] = es009

'''-------------------------------------------------------------------------------------------------------------'''

# * médias
# São calculadas usando do dataframe completo "df" e não o dataframe filtrado

# dicionário com os nomes e os indicadores
dicionario_indicadores_medias = dict()

# Cálculo de fato dos indicadores
# 'IN003_AE': Despesa total com os serviços por M³ faturado - (R$/M³)
# 'IN003_AE' = (FN017 / AG011 + ES007) * 1/1000
fn017 = calcula_media_metrica_ano('FN017', 2021, df_snis)
ag011 = calcula_media_metrica_ano('AG011', 2021, df_snis)
es007 = calcula_media_metrica_ano('ES007', 2021, df_snis)
in003_ae = (fn017 / ag011 + es007) * 1/1000
dicionario_indicadores_medias['in003_ae'] = in003_ae

# 'IN005_AE': Tarifa média de água - (R$/M³)
# 'IN005_AE' = (FN002 / AG011 - AG017 - AG019) * 1/1000
fn002 = calcula_media_metrica_ano('fn002', 2021, df_snis)
ag011 = calcula_media_metrica_ano('AG011', 2021, df_snis)
ag017 = calcula_media_metrica_ano('AG017', 2021, df_snis)
ag019 = calcula_media_metrica_ano('AG019', 2021, df_snis)
in005_ae = (fn002 / ag011 - ag017 - ag019) * 1/1000
dicionario_indicadores_medias['in005_ae'] = in005_ae

# 'IN049_AE': Índice de Perdas na Distribuição
# 'IN049_AE' = (AG006 + AG018 - AG010 - AG024 / AG006 + AG018 - AG024) * 100
ag006 = calcula_media_metrica_ano('ag006', 2021, df_snis)
ag010 = calcula_media_metrica_ano('ag010', 2021, df_snis)
ag018 = calcula_media_metrica_ano('ag018', 2021, df_snis)
ag024 = calcula_media_metrica_ano('ag024', 2021, df_snis)
in049_ae = (ag006 + ag018 - ag010 - ag024 / ag006 + ag018 - ag024) * 100
dicionario_indicadores_medias['in049_ae'] = in049_ae


# 'IN015_AE': Índice de Perdas na Distribuição (%)
# 'IN015_AE' = (ES005 / AG010 - AG019) * 100
es005 = calcula_media_metrica_ano('ES005', 2021, df_snis)
ag010 = calcula_media_metrica_ano('AG010',2021, df_snis)
ag019 = calcula_media_metrica_ano('AG019', 2021, df_snis)
in015_ae = (es005 / ag010 - ag019) * 100
dicionario_indicadores_medias['in015_ae'] = in015_ae

# 'IN016_AE': Índice de Perdas na Distribuição (%)
# 'IN016_AE' = (ES006 + ES014 + ES015 / ES005 + ES013) * 100
es005 = calcula_media_metrica_ano('ES005', 2021, df_snis)
es006 = calcula_media_metrica_ano('ES006', 2021, df_snis)
es013 = calcula_media_metrica_ano('ES013', 2021, df_snis)
es014 = calcula_media_metrica_ano('ES014', 2021, df_snis)
es015 = calcula_media_metrica_ano('ES015', 2021, df_snis)
in016_ae = (es006 + es014 + es015 / es005 + es013) * 100
dicionario_indicadores_medias['in016_ae'] = in016_ae

# 'IN021_AE': Extensão da rede de esgoto por ligação (m/lig)
# 'IN021_AE' = 
es004 = calcula_media_metrica_ano('ES004', 2021, df_snis)
es009 = calcula_media_metrica_ano('ES009', 2021, df_snis)
in021_ae = (es004 / es009) * 1000
dicionario_indicadores_medias['in021_ae'] = in021_ae

# 'IN046_AE': Índice de esgoto tratado referido a água consumida
# 'IN046_AE' = 
es006 = calcula_media_metrica_ano('ES006', 2021, df_snis)
es015 = calcula_media_metrica_ano('ES015', 2021, df_snis)
ag010 = calcula_media_metrica_ano('AG010', 2021, df_snis)
ag019 = calcula_media_metrica_ano('AG019', 2021, df_snis)
in046_ae = (es006 + es015 / ag010 - ag019) * 100
dicionario_indicadores_medias['in046_ae'] = in046_ae


In [22]:
linha_valor_erj = pd.DataFrame([
                                {'cd_mun7' : 333, 'cd_mun6': 333000, 'nm_mun': 'Valor para ERJ', 'uf':'RJ','ano_ref': '2021', 'prestadores': 'não se aplica', 'servicos': 'não se aplica', 'nat_jur':'nat_jur'}
                                |dicionario_indicadores_medias
                                |dicionario_indicadores_total
                                ])
linha_valor_erj.index = [92]

# inserindo linha com total e médias, nesta ordem
df_snis_2021 = pd.concat([df_snis_2021, linha_valor_erj])

df_snis_2021

Unnamed: 0,cd_mun7,cd_mun6,nm_mun,uf,ano_ref,prestadores,servicos,nat_jur,ge009,ge011,...,ag021,ag022,ag008,ag010,ag011,ag012,in003_ae,in005_ae,in028_ae,in049_ae
0,3300100,330010,Angra dos Reis,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Água e Esgoto | Água | Res. Sólidos,Autarquia | Sociedade de economia mista com ad...,1.0,35.0,...,54616.0,25473.0,4472.22,15075.45,16985.16,0.00,2.760000,2.830,78.64,3.020000e+01
1,3300159,330015,Aperibé,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Esgotos | Água | Água e Esgoto | Res. Sólidos,Administração pública direta | Sociedade de ec...,1.0,3.0,...,3578.0,3799.0,616.22,720.76,793.99,0.00,4.220000,5.000,44.05,6.001000e+01
2,3300209,330020,Araruama,RJ,2021,[33002011] Concessionária Águas de Juturnaíba ...,Água e Esgoto | Res. Sólidos,Empresa privada | Administração pública direta,1.0,1.0,...,71225.0,66879.0,9641.86,15312.87,10581.55,21602.74,11.820000,19.730,52.48,2.405000e+01
3,3300225,330022,Areal,RJ,2021,,,,,,...,,,,,,,,,,
4,3300233,330023,Armação dos Búzios,RJ,2021,[33007011] Prolagos S/A - Concessionária de Se...,Água e Esgoto | Res. Sólidos,Empresa privada | Administração pública direta,1.0,0.0,...,18628.0,23775.0,3417.00,3417.00,4242.00,6786.00,2.910000,16.490,92.24,2.570000e+01
...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...,...
88,3306107,330610,Valença,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Esgotos | Água | Res. Sólidos,Administração pública direta | Sociedade de ec...,1.0,5.0,...,19105.0,19694.0,4302.72,5449.77,4350.79,0.00,5.820000,4.450,37.72,5.275000e+01
89,3306156,330615,Varre-Sai,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Água | Res. Sólidos,Sociedade de economia mista com administração ...,,,...,1094.0,1060.0,164.64,200.15,254.80,0.00,11.620000,5.080,61.69,5.154000e+01
90,3306206,330620,Vassouras,RJ,2021,[33045500] Companhia Estadual de Águas e Esgot...,Esgotos | Água | Res. Sólidos,Administração pública direta | Sociedade de ec...,1.0,1.0,...,11008.0,12285.0,1673.75,2042.68,2754.17,0.00,5.440000,5.250,69.60,4.838000e+01
91,3306305,330630,Volta Redonda,RJ,2021,[33063011] Serviço Autônomo de Água e Esgoto d...,Água e Esgoto | Res. Sólidos,Autarquia | Administração pública direta,1.0,0.0,...,90548.0,117746.0,16935.17,18517.81,20977.73,36753.56,2.840000,3.000,57.08,4.962000e+01


# Conexão e Importação para Banco de Dados

## Usando a biblioteca sqlalchemy para importar os DataFrames após a etapa de Data Cleaning

In [43]:
# CONEXÃO COM BANCO DE DADOS LOCAL

from sqlalchemy import create_engine

# Substitua os valores entre chaves {} pelos seus próprios dados
conexao  = 'postgresql://{}:{}@localhost:{}/{}'.format('postgres','MudarePreciso123','5432','gisdb') # SINTAXE: usuario:senha@localhost:porta/database

#Criar uma engine de conexão
engine = create_engine(conexao)

# Exibir a string de conexão
print(conexao )

df_snis.to_sql('df_snis', engine, schema='saneamento', if_exists='replace', index=True)
df_snis_2021.to_sql('df_snis_2021', engine, schema='saneamento', if_exists='replace', index=True)

# Fecha a conexão com o banco
engine.dispose()

postgresql://postgres:MudarePreciso123@localhost:5432/gisdb
