In [None]:
import os
import json
import pandas as pd

In [None]:
import os
import json
import pandas as pd

folderPathPorData = '..\\..\\Bases\\PorData\\'
folderPathInePt = '..\\..\\Bases\\InePt\\'

# Função para ler o arquivo JSON e retornar seu conteúdo como uma lista de dicionários
def read_json_file(file_path):
    try:
        with open(file_path, 'r', encoding='utf-8') as file:
            return json.load(file)
    except FileNotFoundError:
        print(f"Error: O arquivo {file_path} não foi encontrado.")
    except json.JSONDecodeError:
        print(f"Error: Falha ao decodificar JSON no arquivo {file_path}.")
    return []

# Função para ler arquivos CSV a partir de uma pasta
def read_csv_files_from_folders(folder_path):
    dataframes = []
    for root, dirs, files in os.walk(folder_path):
        for file in files:
            if file.endswith('.csv'):
                file_path = os.path.join(root, file)
                print(f'Processando arquivo: {file_path}')
                try:
                    df = pd.read_csv(file_path, sep=',', encoding='utf-8', low_memory=False)
                    dataframes.append({
                        'df_folder': os.path.basename(root),
                        'df_name': os.path.splitext(file)[0],
                        'df': df
                    })
                except Exception as e:
                    print(f"Erro ao ler {file}: {e}")
    return dataframes

# Função para tratar o DataFrame de cultura e cinemas
def trata_df_cultura(df_cultura_cinemas):
    df_cultura_cinemas = df_cultura_cinemas[df_cultura_cinemas['03. Âmbito Geográfico'].notnull()]
    last_year = df_cultura_cinemas['01. Ano'].max()
    df_cultura_cinemas = df_cultura_cinemas[df_cultura_cinemas['01. Ano'] == last_year]

    df_cultura_cinemas = df_cultura_cinemas[['01. Ano', '02. Nome Região (Portugal)', '03. Âmbito Geográfico', '09. Valor']]
    df_cultura_cinemas = df_cultura_cinemas.rename(columns={
        '01. Ano': 'Ano',
        '02. Nome Região (Portugal)': 'Região',
        '03. Âmbito Geográfico': 'Âmbito Geográfico',
        '09. Valor': 'Valor'
    })
    df_cultura_cinemas['Ano'] = df_cultura_cinemas['Ano'].astype(int)
    df_cultura_cinemas['Valor'] = df_cultura_cinemas['Valor'].astype(int)
    return df_cultura_cinemas.reset_index(drop=True)

# Função para encontrar um DataFrame pelo nome
def find_df_by_name(dataframes, df_name):
    for df_info in dataframes:
        if df_info['df_name'] == df_name:
            return df_info['df']
    raise ValueError(f"DataFrame com o nome '{df_name}' não encontrado.")

dfs = []
def adiciona_df_tratado(Categoria, Nome, df):
    dfs.append({
    'Categoria': Categoria,
    'df_name': Nome,
    'df': df
    })

# Função para listar cidades com cinemas
def lista_cidades_cinemas(df_cultura_cinemas):
    df_cultura_cinemas = df_cultura_cinemas.groupby(['Região', 'Âmbito Geográfico']).agg({'Valor': 'sum'}).reset_index()
    df_cultura_cinemas = df_cultura_cinemas.sort_values(by='Valor', ascending=False).reset_index(drop=True)
    print("Cidades com mais cinemas:")
    for _, row in df_cultura_cinemas.iterrows():
        print(f"{row['Região']}: {row['Valor']} cinemas")

# Função para tratar o DataFrame de população residente
def trata_df_populacao_residente(df_populaccao_residente):
    df_populaccao_residente = df_populaccao_residente[df_populaccao_residente['04. Âmbito Geográfico'].notnull()]
    last_year = df_populaccao_residente['01. Ano'].max()
    df_populaccao_residente = df_populaccao_residente[df_populaccao_residente['01. Ano'] == last_year]

    df_sexo_pivot = df_populaccao_residente.pivot_table(
        index=['01. Ano', '03. Nome Região (Portugal)'],
        columns='05. Filtro 1',
        values='10. Valor',
        aggfunc='sum',
        fill_value=0
    )

    df_faixa_pivot = df_populaccao_residente.pivot_table(
        index=['01. Ano', '03. Nome Região (Portugal)'],
        columns='06. Filtro 2',
        values='10. Valor',
        aggfunc='sum',
        fill_value=0
    )

    df_polucao_final = pd.merge(df_sexo_pivot, df_faixa_pivot, on=['01. Ano', '03. Nome Região (Portugal)'], how='left')
    df_polucao_final.reset_index(inplace=True)
    df_polucao_final = df_polucao_final.rename(columns={
        '01. Ano': 'Ano',
        '03. Nome Região (Portugal)': 'Região',
        'Homens': 'Homens',
        'Mulheres': 'Mulheres',
        '0 - 4 anos': '0 - 4 anos',
        '5 - 9 anos': '5 - 9 anos',
        '10 - 14 anos': '10 - 14 anos',
        '15 - 19 anos': '15 - 19 anos',
        '20 - 24 anos': '20 - 24 anos',
        '25 - 29 anos': '25 - 29 anos',
        '30 - 34 anos': '30 - 34 anos',
        '35 - 39 anos': '35 - 39 anos',
        '40 - 44 anos': '40 - 44 anos',
        '45 - 49 anos': '45 - 49 anos',
        '50 - 54 anos': '50 - 54 anos',
        '55 - 59 anos': '55 - 59 anos',
        '60 - 64 anos': '60 - 64 anos',
        '65 - 69 anos': '65 - 69 anos',
        '70 - 74 anos': '70 - 74 anos',
        '75 - 79 anos': '75 - 79 anos',
        '80 - 84 anos': '80 - 84 anos',
        '85 ou mais anos': '85 ou mais anos',
        'Total_y': 'Total População'
    })

    df_polucao_final = df_polucao_final.astype({
        'Ano': 'int',
        'Região': 'str',
        'Homens': 'int',
        'Mulheres': 'int',
        '0 - 4 anos': 'int',
        '5 - 9 anos': 'int',
        '10 - 14 anos': 'int',
        '15 - 19 anos': 'int',
        '20 - 24 anos': 'int',
        '25 - 29 anos': 'int',
        '30 - 34 anos': 'int',
        '35 - 39 anos': 'int',
        '40 - 44 anos': 'int',
        '45 - 49 anos': 'int',
        '50 - 54 anos': 'int',
        '55 - 59 anos': 'int',
        '60 - 64 anos': 'int',
        '65 - 69 anos': 'int',
        '70 - 74 anos': 'int',
        '75 - 79 anos': 'int',
        '80 - 84 anos': 'int',
        '85 ou mais anos': 'int',
        'Total População': 'int'
    })

    # Calcular faixas etárias e proporções
    df_polucao_final['Total Crianças'] = df_polucao_final['0 - 4 anos'] + df_polucao_final['5 - 9 anos']
    df_polucao_final['Total Adolescentes'] = df_polucao_final['10 - 14 anos'] + df_polucao_final['15 - 19 anos']
    df_polucao_final['Total Jovens Adultos'] = df_polucao_final['20 - 24 anos']
    df_polucao_final['Total Adultos'] = df_polucao_final[['25 - 29 anos', '30 - 34 anos', '35 - 39 anos', '40 - 44 anos', 
                                                       '45 - 49 anos', '50 - 54 anos', '55 - 59 anos']].sum(axis=1)
    df_polucao_final['Total Idosos'] = df_polucao_final[['60 - 64 anos', '65 - 69 anos', '70 - 74 anos', '75 - 79 anos', 
                                                        '80 - 84 anos', '85 ou mais anos']].sum(axis=1)

    # Proporções de cada faixa etária
    df_polucao_final['Proporção Crianças'] = (df_polucao_final['Total Crianças'] / df_polucao_final['Total População']) * 100
    df_polucao_final['Proporção Adolescentes'] = (df_polucao_final['Total Adolescentes'] / df_polucao_final['Total População']) * 100
    df_polucao_final['Proporção Jovens Adultos'] = (df_polucao_final['Total Jovens Adultos'] / df_polucao_final['Total População']) * 100
    df_polucao_final['Proporção Adultos'] = (df_polucao_final['Total Adultos'] / df_polucao_final['Total População']) * 100
    df_polucao_final['Proporção Idosos'] = (df_polucao_final['Total Idosos'] / df_polucao_final['Total População']) * 100

    df_polucao_final = df_polucao_final.drop('Total_x', axis=1)

    return df_polucao_final.reset_index(drop=True)

# Função para listar cidades por grupo etário
def cidades_por_grupo(df, categoria='Todos', n=5):
    categorias = {
        'Crianças': 'Proporção Crianças',
        'Adolescentes': 'Proporção Adolescentes',
        'Jovens Adultos': 'Proporção Jovens Adultos',
        'Adultos': 'Proporção Adultos',
        'Idosos': 'Proporção Idosos',
        'Populosas': 'Total População'
    }
    
    if categoria not in categorias and categoria != 'Todos':
        print("Categoria inválida!")
        return
    
    if categoria == 'Todos':
        categorias_list = categorias.keys()
    else:
        categorias_list = [categoria]

    for cat in categorias_list:
        cidade_ordenada = df[['Ano', 'Região', categorias[cat]]].sort_values(by=categorias[cat], ascending=False).head(n)
        print(f"\nCidades com mais {cat} (%) - Top {n}:")
        for _, row in cidade_ordenada.iterrows():
            proporcao = row[categorias[cat]]
            print(f"{row['Região']}: {int(proporcao)}%")

def trata_df_populacao_densidade(df_densidade_populacional):

    df_densidade_populacional = df_densidade_populacional.dropna(axis=1, how='all')

    df_densidade_populacional = df_densidade_populacional[df_densidade_populacional['03. Nome Região (Portugal)'].notnull()]

    last_year = df_densidade_populacional['01. Ano'].max()
    df_densidade_populacional = df_densidade_populacional[df_densidade_populacional['01. Ano'] == last_year]

    df_densidade_populacional = df_densidade_populacional[df_densidade_populacional['03. Nome Região (Portugal)'] != 'Portugal']

    df_densidade_populacional = df_densidade_populacional[['01. Ano', '03. Nome Região (Portugal)', '04. Âmbito Geográfico', '10. Valor']]

    df_densidade_populacional.rename(columns={
        '01. Ano': 'Ano',
        '03. Nome Região (Portugal)': 'Região',
        '04. Âmbito Geográfico': 'Âmbito Geográfico',
        '10. Valor': 'Valor'
    }, inplace=True)

    df_densidade_populacional = df_densidade_populacional.astype({
        'Ano': 'int',
        'Região': 'str',
        'Âmbito Geográfico': 'str',
        'Valor': 'float'
    })

    return df_densidade_populacional.reset_index(drop=True)

def trata_crimes_catetoria(df_seguranca_crime_catetoria):
    
    df_seguranca_crime_catetoria = df_seguranca_crime_catetoria.dropna(axis=1, how='all')
    df_seguranca_crime_catetoria = df_seguranca_crime_catetoria[df_seguranca_crime_catetoria['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_seguranca_crime_catetoria['01. Ano'].max()
    df_seguranca_crime_catetoria = df_seguranca_crime_catetoria[df_seguranca_crime_catetoria['01. Ano'] == last_year]

    df_seguranca_crime_catetoria = df_seguranca_crime_catetoria[['01. Ano', '02. Nome Região (Portugal)', '03. Âmbito Geográfico', '04. Filtro 1', '09. Valor']]

    df_seguranca_crime_catetoria.rename(columns={
        '01. Ano': 'Ano',
        '02. Nome Região (Portugal)': 'Região',
        '03. Âmbito Geográfico': 'Âmbito Geográfico',
        '04. Filtro 1': 'Categoria',
        '09. Valor': 'Valor'
    }, inplace=True)

    df_seguranca_crime_catetoria = df_seguranca_crime_catetoria.astype({
        'Ano': 'int',
        'Região': 'str',
        'Âmbito Geográfico': 'str',
        'Categoria': 'str',
        'Valor': 'float'
    })

    # filtering the dataframe to show only rows where 'Total' is not null
    df_seguranca_crime_catetoria = df_seguranca_crime_catetoria[df_seguranca_crime_catetoria['Valor'].notnull()]

    df_seg_categoria = df_seguranca_crime_catetoria.pivot_table(
            index=['Ano', 'Região'],
            columns='Categoria',
            values='Valor',
            aggfunc='sum',
            fill_value=0
    )

    df_seg_categoria.reset_index(inplace=True)

    return df_seg_categoria

def trata_crimes_tipo(df_seg_crimes_tipo):
    df_seg_crimes_tipo = df_seg_crimes_tipo.dropna(axis=1, how='all')
    df_seg_crimes_tipo = df_seg_crimes_tipo[df_seg_crimes_tipo['03. Nome Região (Portugal)'] != 'Portugal']
    df_seg_crimes_tipo = df_seg_crimes_tipo[df_seg_crimes_tipo['03. Nome Região (Portugal)'].notna()]

    last_year = df_seg_crimes_tipo['01. Ano'].max()
    df_seg_crimes_tipo = df_seg_crimes_tipo[df_seg_crimes_tipo['01. Ano'] == last_year]

    df_seg_crimes_tipo = df_seg_crimes_tipo.drop( columns= ['09. Símbolo','08. Escala'], axis=1)

    df_seg_crimes_tipo = df_seg_crimes_tipo[['01. Ano', '03. Nome Região (Portugal)', '04. Âmbito Geográfico', '05. Filtro 1', '10. Valor']]

    df_seg_crimes_tipo.rename(columns={
        '01. Ano': 'Ano',
        '03. Nome Região (Portugal)': 'Região',
        '04. Âmbito Geográfico': 'Âmbito Geográfico',
        '05. Filtro 1': 'Tipo de Crime',
        '10. Valor': 'Valor'
    }, inplace=True)

    df_seg_crimes_tipo = df_seg_crimes_tipo.astype({
        'Ano': 'int',
        'Região': 'str',
        'Âmbito Geográfico': 'str',
        'Tipo de Crime': 'str',
        'Valor': 'float'
    })

    df_seg_crimes_tipo = df_seg_crimes_tipo.pivot_table(
            index=['Ano', 'Região'],
            columns='Tipo de Crime',
            values='Valor',
            aggfunc='sum',
            fill_value=0
    )

    return df_seg_crimes_tipo.reset_index(drop=False)

def trata_hospitais(df_saude_hospitais):
    df_saude_hospitais = df_saude_hospitais.dropna(axis=1, how='all')
    df_saude_hospitais = df_saude_hospitais[df_saude_hospitais['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_saude_hospitais['01. Ano'].max()
    df_saude_hospitais = df_saude_hospitais[df_saude_hospitais['01. Ano'] == last_year]

    df_saude_hospitais.drop(columns=['08. Símbolo'], inplace=True)

    df_saude_hospitais.rename(columns={
            '01. Ano': 'Ano',
            '02. Nome Região (Portugal)': 'Região',
            '03. Âmbito Geográfico': 'Âmbito Geográfico',
            '04. Filtro 1': 'Tipo hospital',
            '09. Valor': 'Valor'
        }, inplace=True)

    df_saude_hospitais = df_saude_hospitais.astype({
            'Ano': 'int',
            'Região': 'str',
            'Âmbito Geográfico': 'str',
            'Tipo hospital': 'str',
            'Valor': 'float'
        })

    df_saude_hospitais = df_saude_hospitais.pivot_table(
                index=['Ano', 'Região'],
                columns='Tipo hospital',
                values='Valor',
                aggfunc='sum',
                fill_value=0
        )

    df_saude_hospitais.reset_index(inplace=True)

    return df_saude_hospitais

def trata_farmacias(df_saude_farmacias):

    df_saude_farmacias = df_saude_farmacias.dropna(axis=1, how='all')
    df_saude_farmacias = df_saude_farmacias[df_saude_farmacias['02. Nome Região (Portugal)'] != 'Portugal']

    if df_saude_farmacias['08. Símbolo'].nunique() == 1:
        df_saude_farmacias = df_saude_farmacias.drop(columns=['08. Símbolo'])

    last_year = df_saude_farmacias['01. Ano'].max()
    df_saude_farmacias = df_saude_farmacias[df_saude_farmacias['01. Ano'] == last_year]

    df_saude_farmacias.rename(columns={
            '01. Ano': 'Ano',
            '02. Nome Região (Portugal)': 'Região',
            '03. Âmbito Geográfico': 'Âmbito Geográfico',
            '09. Valor': 'Valor'
        }, inplace=True)

    df_saude_farmacias = df_saude_farmacias.astype({
            'Ano': 'int',
            'Região': 'str',
            'Âmbito Geográfico': 'str',
            'Valor': 'float'
        })
    
    return df_saude_farmacias

def trata_ensino_n_superior(df_edu_ensino_n_superior):
    df_edu_ensino_n_superior = df_edu_ensino_n_superior.dropna(axis=1, how='all')
    df_edu_ensino_n_superior = df_edu_ensino_n_superior[df_edu_ensino_n_superior['02. Nome Região (Portugal)'] != 'Portugal']

    df_edu_ensino_n_superior = df_edu_ensino_n_superior.drop(columns=['08. Símbolo'])

    last_year = df_edu_ensino_n_superior['01. Ano'].max()
    df_edu_ensino_n_superior = df_edu_ensino_n_superior[df_edu_ensino_n_superior['01. Ano'] == last_year]

    df_edu_ensino_n_superior.rename(columns={
            '01. Ano': 'Ano',
            '02. Nome Região (Portugal)': 'Região',
            '03. Âmbito Geográfico': 'Âmbito Geográfico',
            '04. Filtro 1': 'Nível de Ensino',
            '05. Filtro 2': 'Tipo de Escola',
            '09. Valor': 'Valor'
        }, inplace=True)

    df_edu_ensino_n_superior = df_edu_ensino_n_superior.astype({
            'Ano': 'int',
            'Região': 'str',
            'Âmbito Geográfico': 'str',
            'Nível de Ensino': 'str',
            'Tipo de Escola': 'str',
            'Valor': 'float'
        })

    df_edu_escola_nivel = df_edu_ensino_n_superior.pivot_table(
            index=['Ano', 'Região'],
            columns='Nível de Ensino',
            values='Valor',
            aggfunc='sum',
            fill_value=0
        )

    df_edu_escola_nivel.reset_index(inplace=True)

    df_edu_escola_tipo= df_edu_ensino_n_superior.pivot_table(
            index=['Ano', 'Região'],
            columns='Tipo de Escola',
            values='Valor',
            aggfunc='sum',
            fill_value=0
        )

    df_edu_escola_tipo.reset_index(inplace=True)

    df_edu_escola_final = pd.merge(df_edu_escola_tipo, df_edu_escola_nivel, on=['Ano', 'Região'], how='left')
    df_edu_escola_final.reset_index(inplace=True)

    df_edu_escola_final.drop(columns=['index','Total_x'], inplace=True)
    df_edu_escola_final.rename(columns={'Total_y': 'Total Estabelecimentos'}, inplace=True)

    return df_edu_escola_final


def trata_ensino_superior(df_edu_ensino_superior):
    
    df_edu_ensino_superior = df_edu_ensino_superior.dropna(axis=1, how='all')
    df_edu_ensino_superior = df_edu_ensino_superior[df_edu_ensino_superior['02. Nome Região (Portugal)'] != 'Portugal']

    df_edu_ensino_superior = df_edu_ensino_superior.drop(columns=['08. Símbolo'])

    last_year = df_edu_ensino_superior['01. Ano'].max()
    df_edu_ensino_superior = df_edu_ensino_superior[df_edu_ensino_superior['01. Ano'] == last_year]

    df_edu_ensino_superior.rename(columns={
            '01. Ano': 'Ano',
            '02. Nome Região (Portugal)': 'Região',
            '03. Âmbito Geográfico': 'Âmbito Geográfico',
            '04. Filtro 1': 'Tipo de Escola',
            '09. Valor': 'Valor'
        }, inplace=True)

    df_edu_ensino_superior = df_edu_ensino_superior.astype({
            'Ano': 'int',
            'Região': 'str',
            'Âmbito Geográfico': 'str',
            'Tipo de Escola': 'str',
            'Valor': 'float'
        })

    df_edu_ensino_superior = df_edu_ensino_superior.pivot_table(
            index=['Ano', 'Região'],
            columns='Tipo de Escola',
            values='Valor',
            aggfunc='sum',
            fill_value=0
        )

    df_edu_ensino_superior.reset_index(inplace=True)

    return df_edu_ensino_superior


def trata_econ_depositos(df_econ_depositos):
    df_econ_depositos = df_econ_depositos.dropna(axis=1, how='all')

    df_econ_depositos = df_econ_depositos[df_econ_depositos['02. Nome Região (Portugal)'] != 'Portugal']

    df_econ_depositos = df_econ_depositos.drop(columns=['08. Símbolo'])

    last_year = df_econ_depositos['01. Ano'].max()
    df_econ_depositos = df_econ_depositos[df_econ_depositos['01. Ano'] == last_year]

    df_econ_depositos.rename(columns={
                '01. Ano': 'Ano',
                '02. Nome Região (Portugal)': 'Região',
                '03. Âmbito Geográfico': 'Âmbito Geográfico',
                '04. Filtro 1': 'Deposito',
                '09. Valor': 'Valor'
            }, inplace=True)

    df_econ_depositos = df_econ_depositos.astype({
                'Ano': 'int',
                'Região': 'str',
                'Âmbito Geográfico': 'str',
                'Deposito': 'str',
                'Valor': 'float'
            })

    df_econ_depositos = df_econ_depositos.pivot_table(
                index=['Ano', 'Região'],
                columns='Deposito',
                values='Valor',
                aggfunc='sum',
                fill_value=0
            )

    df_econ_depositos.reset_index(inplace=True)

    return df_econ_depositos


def trata_econ_bancos(df_econ_estabelecimentos_bancos):
    
    df_econ_estabelecimentos_bancos = df_econ_estabelecimentos_bancos.dropna(axis=1, how='all')

    df_econ_estabelecimentos_bancos = df_econ_estabelecimentos_bancos[df_econ_estabelecimentos_bancos['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_econ_estabelecimentos_bancos['01. Ano'].max()
    df_econ_estabelecimentos_bancos = df_econ_estabelecimentos_bancos[df_econ_estabelecimentos_bancos['01. Ano'] == last_year]

    df_econ_estabelecimentos_bancos.rename(columns={
                    '01. Ano': 'Ano',
                    '02. Nome Região (Portugal)': 'Região',
                    '03. Âmbito Geográfico': 'Âmbito Geográfico',
                    '09. Valor': 'Valor'
                }, inplace=True)

    df_econ_estabelecimentos_bancos = df_econ_estabelecimentos_bancos.astype({
                    'Ano': 'int',
                    'Região': 'str',
                    'Âmbito Geográfico': 'str',
                    'Valor': 'float'
                })

    return df_econ_estabelecimentos_bancos


def trata_df_desemprego(df_desemprego):
    df_desemprego = df_desemprego.dropna(axis=1, how='all')
    df_desemprego = df_desemprego[df_desemprego['02. Nome Região (Portugal)'] != 'Portugal']
    df_desemprego = df_desemprego.drop(columns=['08. Símbolo'])

    last_year = df_desemprego['01. Ano'].max()
    df_desemprego = df_desemprego[df_desemprego['01. Ano'] == last_year]

    df_desemprego.rename(columns={
                '01. Ano': 'Ano',
                '02. Nome Região (Portugal)': 'Região',
                '03. Âmbito Geográfico': 'Âmbito Geográfico',
                '04. Filtro 1': 'Faixa Etária',
                '09. Valor': 'Valor'
            }, inplace=True)

    df_desemprego = df_desemprego.astype({
                'Ano': 'int',
                'Região': 'str',
                'Âmbito Geográfico': 'str',
                'Faixa Etária': 'str',
                'Valor': 'float'
            })
    df_desemprego = df_desemprego.reset_index(drop=True)

    df_desemprego = df_desemprego.pivot_table(
                    index=['Ano', 'Região'],
                    columns='Faixa Etária',
                    values='Valor',
                    aggfunc='sum',
                    fill_value=0
                )

    df_desemprego.reset_index(inplace=True)

    return df_desemprego

def trata_populacao_empregada_escolaridade(df_polacao_empregada):
    df_polacao_empregada = df_polacao_empregada.dropna(axis=1, how='all')
    df_polacao_empregada = df_polacao_empregada[df_polacao_empregada['02. Nome Região (Portugal)'] != 'Portugal']
    df_polacao_empregada = df_polacao_empregada.drop(columns=['08. Símbolo'])

    last_year = df_polacao_empregada['01. Ano'].max()
    df_polacao_empregada = df_polacao_empregada[df_polacao_empregada['01. Ano'] == last_year]

    df_polacao_empregada.rename(columns={
                    '01. Ano': 'Ano',
                    '02. Nome Região (Portugal)': 'Região',
                    '03. Âmbito Geográfico': 'Âmbito Geográfico',
                    '04. Filtro 1': 'Escolaridade',
                    '09. Valor': 'Valor'
                }, inplace=True)

    df_polacao_empregada = df_polacao_empregada.astype({
                    'Ano': 'int',
                    'Região': 'str',
                    'Âmbito Geográfico': 'str',
                    'Escolaridade': 'str',
                    'Valor': 'float'
                })

    df_polacao_empregada = df_polacao_empregada.pivot_table(
                        index=['Ano', 'Região'],
                        columns='Escolaridade',
                        values='Valor',
                        aggfunc='sum',
                        fill_value=0
                    )

    df_polacao_empregada.reset_index(inplace=True)

    return df_polacao_empregada

def trata_econ_bancos(df_econ_estabelecimentos_bancos):
    df_econ_estabelecimentos_bancos = df_econ_estabelecimentos_bancos.dropna(axis=1, how='all')

    df_econ_estabelecimentos_bancos = df_econ_estabelecimentos_bancos[df_econ_estabelecimentos_bancos['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_econ_estabelecimentos_bancos['01. Ano'].max()
    df_econ_estabelecimentos_bancos = df_econ_estabelecimentos_bancos[df_econ_estabelecimentos_bancos['01. Ano'] == last_year]

    df_econ_estabelecimentos_bancos.rename(columns={
                    '01. Ano': 'Ano',
                    '02. Nome Região (Portugal)': 'Região',
                    '03. Âmbito Geográfico': 'Âmbito Geográfico',
                    '09. Valor': 'Valor'
                }, inplace=True)

    df_econ_estabelecimentos_bancos = df_econ_estabelecimentos_bancos.astype({
                    'Ano': 'int',
                    'Região': 'str',
                    'Âmbito Geográfico': 'str',
                    'Valor': 'float'
                })

    return df_econ_estabelecimentos_bancos

def trata_populacao_empregada_ramo(df_polacao_empregada_ramo):
    df_polacao_empregada_ramo = df_polacao_empregada_ramo.dropna(axis=1, how='all')
    df_polacao_empregada_ramo = df_polacao_empregada_ramo[df_polacao_empregada_ramo['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_polacao_empregada_ramo['01. Ano'].max()
    df_polacao_empregada_ramo = df_polacao_empregada_ramo[df_polacao_empregada_ramo['01. Ano'] == last_year]

    df_polacao_empregada_ramo = df_polacao_empregada_ramo.drop(columns=['08. Símbolo'])

    df_polacao_empregada_ramo.rename(columns={
                        '01. Ano': 'Ano',
                        '02. Nome Região (Portugal)': 'Região',
                        '03. Âmbito Geográfico': 'Âmbito Geográfico',
                        '04. Filtro 1': 'Ramo de Atividade',
                        '09. Valor': 'Valor'
                    }, inplace=True)

    df_polacao_empregada_ramo = df_polacao_empregada_ramo.astype({
                        'Ano': 'int',
                        'Região': 'str',
                        'Âmbito Geográfico': 'str',
                        'Ramo de Atividade': 'str',
                        'Valor': 'float'
                    })

    df_polacao_empregada_ramo = df_polacao_empregada_ramo.pivot_table(
                            index=['Ano', 'Região'],
                            columns='Ramo de Atividade',
                            values='Valor',
                            aggfunc='sum',
                            fill_value=0
                        )
    df_polacao_empregada_ramo.reset_index(inplace=True)

    return df_polacao_empregada_ramo

def trata_populacao_estrangeira(df_populacao_estrangeira):
    df_populacao_estrangeira = df_populacao_estrangeira.dropna(axis=1, how='all')
    df_populacao_estrangeira = df_populacao_estrangeira[df_populacao_estrangeira['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_populacao_estrangeira['01. Ano'].max()
    df_populacao_estrangeira = df_populacao_estrangeira[df_populacao_estrangeira['01. Ano'] == last_year]

    df_populacao_estrangeira = df_populacao_estrangeira.drop(columns=['08. Símbolo'])

    df_populacao_estrangeira.rename(columns={
                            '01. Ano': 'Ano',
                            '02. Nome Região (Portugal)': 'Região',
                            '03. Âmbito Geográfico': 'Âmbito Geográfico',
                            '04. Filtro 1': 'Nacionalidade',
                            '09. Valor': 'Valor'
                        }, inplace=True)

    df_populacao_estrangeira = df_populacao_estrangeira.astype({
                            'Ano': 'int',
                            'Região': 'str',
                            'Âmbito Geográfico': 'str',
                            'Nacionalidade': 'str',
                            'Valor': 'float'
                        })

    df_populacao_estrangeira = df_populacao_estrangeira.pivot_table(
                                index=['Ano', 'Região'],
                                columns='Nacionalidade',
                                values='Valor',
                                aggfunc='sum',
                                fill_value=0
                            )
    df_populacao_estrangeira.reset_index(inplace=True)

    return df_populacao_estrangeira

def trata_moradia_edificios(df_moradia_edificios):
    df_moradia_edificios = df_moradia_edificios.dropna(axis=1, how='all')
    df_moradia_edificios = df_moradia_edificios[df_moradia_edificios['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_moradia_edificios['01. Ano'].max()
    df_moradia_edificios = df_moradia_edificios[df_moradia_edificios['01. Ano'] == last_year]

    df_moradia_edificios.rename(columns={
                                '01. Ano': 'Ano',
                                '02. Nome Região (Portugal)': 'Região',
                                '03. Âmbito Geográfico': 'Âmbito Geográfico',
                                '04. Filtro 1': 'Tipo de Obra',
                                '05. Filtro 2': 'Fim que se destina',
                                '09. Valor': 'Valor'
                            }, inplace=True)

    df_moradia_edificios = df_moradia_edificios.astype({
                                'Ano': 'int',
                                'Região': 'str',
                                'Âmbito Geográfico': 'str',
                                'Tipo de Obra': 'str',
                                'Fim que se destina': 'str',
                                'Valor': 'float'
                            })

    df_moradia_edificios_tipo = df_moradia_edificios.pivot_table(
                                    index=['Ano', 'Região'],
                                    columns='Tipo de Obra',
                                    values='Valor',
                                    aggfunc='sum',
                                    fill_value=0
                                )
    df_moradia_edificios_tipo.reset_index(inplace=True)

    df_moradia_edificios_destino = df_moradia_edificios.pivot_table(
                                    index=['Ano', 'Região'],
                                    columns='Fim que se destina',
                                    values='Valor',
                                    aggfunc='sum',
                                    fill_value=0
                                )
    df_moradia_edificios_destino.reset_index(inplace=True)

    df_moradia_edificios_final = pd.merge(df_moradia_edificios_destino, df_moradia_edificios_tipo, on=['Ano', 'Região'], how='left')
    df_moradia_edificios_final.reset_index(inplace=True)

    df_moradia_edificios_final.drop(columns=['index','Total_x'], inplace=True)

    return df_moradia_edificios_final


def trata_construcoes_novas(df_construcoes_novas):
    df_construcoes_novas = df_construcoes_novas.dropna(axis=1, how='all')
    df_construcoes_novas = df_construcoes_novas[df_construcoes_novas['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_construcoes_novas['01. Ano'].max()
    df_construcoes_novas = df_construcoes_novas[df_construcoes_novas['01. Ano'] == last_year]

    df_construcoes_novas.rename(columns={
                                    '01. Ano': 'Ano',
                                    '02. Nome Região (Portugal)': 'Região',
                                    '03. Âmbito Geográfico': 'Âmbito Geográfico',
                                    '04. Filtro 1': 'Qtd. Quartos',
                                    '09. Valor': 'Valor'
                                }, inplace=True)

    df_construcoes_novas = df_construcoes_novas.astype({
                                    'Ano': 'int',
                                    'Região': 'str',
                                    'Âmbito Geográfico': 'str',
                                    'Qtd. Quartos': 'str',
                                    'Valor': 'float'
                                })

    df_construcoes_novas = df_construcoes_novas.pivot_table(
                                index=['Ano', 'Região'],
                                columns='Qtd. Quartos',
                                values='Valor',
                                aggfunc='sum',
                                fill_value=0
                            )
    df_construcoes_novas.reset_index(inplace=True)

    return df_construcoes_novas

def trata_sal_ganho_medio_mensal(df_sal_ganho_medio_mensal):
    df_sal_ganho_medio_mensal = df_sal_ganho_medio_mensal.dropna(axis=1, how='all')
    df_sal_ganho_medio_mensal = df_sal_ganho_medio_mensal[df_sal_ganho_medio_mensal['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_sal_ganho_medio_mensal['01. Ano'].max()
    df_sal_ganho_medio_mensal = df_sal_ganho_medio_mensal[df_sal_ganho_medio_mensal['01. Ano'] == last_year]

    df_sal_ganho_medio_mensal.drop(columns=['08. Símbolo'], inplace=True)

    df_sal_ganho_medio_mensal.rename(columns={
        '01. Ano': 'Ano',
        '02. Nome Região (Portugal)': 'Região',
        '03. Âmbito Geográfico': 'Âmbito Geográfico',
        '09. Valor': 'Valor'
    }, inplace=True)

    df_sal_ganho_medio_mensal = df_sal_ganho_medio_mensal.astype({
        'Ano': 'int',
        'Região': 'str',
        'Âmbito Geográfico': 'str',
        'Valor': 'float'
    })

    return df_sal_ganho_medio_mensal

def trata_sal_ganho_medio_mensal_escol(df_sal_ganho_medio_mensal_escol):
    df_sal_ganho_medio_mensal_escol = df_sal_ganho_medio_mensal_escol.dropna(axis=1, how='all')
    df_sal_ganho_medio_mensal_escol = df_sal_ganho_medio_mensal_escol[df_sal_ganho_medio_mensal_escol['02. Nome Região (Portugal)'] != 'Portugal']

    last_year = df_sal_ganho_medio_mensal_escol['01. Ano'].max()
    df_sal_ganho_medio_mensal_escol = df_sal_ganho_medio_mensal_escol[df_sal_ganho_medio_mensal_escol['01. Ano'] == last_year]

    df_sal_ganho_medio_mensal_escol.drop(columns=['08. Símbolo'], inplace=True)

    df_sal_ganho_medio_mensal_escol.rename(columns={
        '01. Ano': 'Ano',
        '02. Nome Região (Portugal)': 'Região',
        '03. Âmbito Geográfico': 'Âmbito Geográfico',
        '04. Filtro 1': 'Nível de Escolaridade',
        '09. Valor': 'Valor'
    }, inplace=True)

    df_sal_ganho_medio_mensal_escol = df_sal_ganho_medio_mensal_escol.astype({
        'Ano': 'int',
        'Região': 'str',
        'Âmbito Geográfico': 'str',
        'Nível de Escolaridade': 'str',
        'Valor': 'float'
    })

    df_sal_ganho_medio_mensal_escol = df_sal_ganho_medio_mensal_escol.pivot_table(
                                    index=['Ano', 'Região'],
                                    columns='Nível de Escolaridade',
                                    values='Valor',
                                    aggfunc='sum',
                                    fill_value=0
                                )
    df_sal_ganho_medio_mensal_escol.reset_index(inplace=True)

    return df_sal_ganho_medio_mensal_escol

def trata_econ_poder_compra():

    file_path = '..\\..\\Bases\\PorData\\economia\\Municipios_Proporcao_de_poder_de_compra.xlsx'

    excel_data = pd.ExcelFile(file_path)

    # Carregar a planilha 'Quadro'
    df = pd.read_excel(excel_data, sheet_name='Quadro')

    # Limpar e extrair as colunas e dados relevantes
    df_econ_poder_compra = df.iloc[10:, [0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10, 11, 12]]
    df_econ_poder_compra.columns = ['Âmbito Geográfico', 'Anos', '1993', '2000', '2002', '2007', '2009', '2011', '2013', '2015', '2017', '2019', '2021']

    # Remover linhas completamente vazias
    df_econ_poder_compra = df_econ_poder_compra.dropna(how='all')

    # Resetar o índice
    df_econ_poder_compra.reset_index(drop=True, inplace=True)

    df_econ_poder_compra = df_econ_poder_compra.drop(0, axis=0).reset_index(drop=True)

    df_econ_poder_compra = df_econ_poder_compra[df_econ_poder_compra['Âmbito Geográfico'] == 'Município']

    df_econ_poder_compra = df_econ_poder_compra[['Âmbito Geográfico', 'Anos', df_econ_poder_compra.columns[-1]]]

    ultima_coluna = df_econ_poder_compra.columns[-1]
    df_econ_poder_compra.rename(columns={
        'Âmbito Geográfico': 'Âmbito Geográfico',
        'Anos': 'Região',
        ultima_coluna: 'Valor'
    }, inplace=True)

    df_econ_poder_compra = df_econ_poder_compra.astype({
        'Âmbito Geográfico': 'str',
        'Região': 'str',
        'Valor': 'float'
    })

    return df_econ_poder_compra

In [None]:
def trata_seg_taxa_crime():
    file_path = '..\\..\\Bases\\InePt\\seguranca\\INE_PT-Taxa-de-criminalidade.xls'

    excel_data = pd.ExcelFile(file_path)

    # Carregar a planilha 'Quadro'
    df_seg_tax_crime = pd.read_excel(excel_data, sheet_name='Quadro')

    df_seg_tax_crime= df_seg_tax_crime.iloc[10:, [0, 1, 2, 4, 6, 8, 10, 12, 14]]
    df_seg_tax_crime.columns = [
        'Regiao', 
        'Codigo', 
        'Total', 
        'Crimes contra a integridade física', 
        'Furto/roubo por esticão e na via pública', 
        'Furto de veículo e em veículo motorizado', 
        'Condução de veículo com taxa de álcool igual ou superior a 1,2g/l',
        'Condução sem habilitação legal', 
        'Crimes contra o património'
        ]

    # Remover linhas completamente vazias
    df_seg_tax_crime = df_seg_tax_crime.dropna(how='all')

    df_seg_tax_crime['Codigo'] = df_seg_tax_crime['Codigo'].astype(str)
    df_seg_tax_crime = df_seg_tax_crime[df_seg_tax_crime['Codigo'].str.len() == 7]

    df_seg_tax_crime = df_seg_tax_crime.astype({
        'Regiao':'str',
        'Codigo':'str',
        'Total': 'float',
        'Crimes contra a integridade física': 'float',
        'Furto/roubo por esticão e na via pública': 'float',
        'Furto de veículo e em veículo motorizado': 'float',
        'Condução de veículo com taxa de álcool igual ou superior a 1,2g/l': 'float',
        'Condução sem habilitação legal': 'float',
        'Crimes contra o património': 'float'
    })

    return df_seg_tax_crime

def trata_mora_valor_renda():
        file_path = '..\\..\\Bases\\InePt\\moradia\\INE_PT-Valor-mediano-das-rendas.xls'

        excel_data = pd.ExcelFile(file_path)

        # Carregar a planilha 'Quadro'
        df_mora_valor_rendas = pd.read_excel(excel_data, sheet_name='Quadro')

        df_mora_valor_rendas= df_mora_valor_rendas.iloc[9:, [0, 1, 2, 3]]
        df_mora_valor_rendas.columns = [
                'Regiao', 
                'Codigo', 
                'Valor mediano das rendas por m2',
                'lixo'
        ]

        # Remover linhas completamente vazias
        df_mora_valor_rendas = df_mora_valor_rendas.dropna(how='all')

        df_mora_valor_rendas.drop(columns=['lixo'], inplace=True)

        df_mora_valor_rendas['Codigo'] = df_mora_valor_rendas['Codigo'].astype(str)
        # df_1= df_mora_valor_rendas[df_mora_valor_rendas['Codigo'].str.match(r'^\d{2}$')]
        # df_3= df_mora_valor_rendas[df_mora_valor_rendas['Codigo'].str.match(r'^\d{3}$')]

        df_mora_valor_rendas = df_mora_valor_rendas[df_mora_valor_rendas['Codigo'].str.len() == 7]

        # Criar nova coluna com valor estimado para apartamento de 100m²
        df_mora_valor_rendas['Valor apartamento 100m²'] = df_mora_valor_rendas['Valor mediano das rendas por m2'] * 100

         # Criar nova coluna com valor estimado para apartamento de 80m²
        df_mora_valor_rendas['Valor apartamento 80m²'] = df_mora_valor_rendas['Valor mediano das rendas por m2'] * 80


        return df_mora_valor_rendas


In [None]:
file_path = 'pordataFiles.json'
arquivos = read_json_file(file_path)

In [None]:
dataframes = read_csv_files_from_folders(folderPathPorData)

In [None]:
df_cultura_cinemas = find_df_by_name(dataframes, '623-recintos-de-cinema')
df_cultura_cinemas = trata_df_cultura(df_cultura_cinemas)
adiciona_df_tratado("Cultura","recintos-de-cinema" , df_cultura_cinemas)
# lista_cidades_cinemas(df_cultura_cinemas)

In [None]:
df_cultura_espetaculos = find_df_by_name(dataframes, '631-sessoes-de-espetaculos-ao-vivo')
df_cultura_espetaculos = trata_df_cultura(df_cultura_espetaculos)
adiciona_df_tratado("Cultura","sessoes-de-espetaculos-ao-vivo" , df_cultura_espetaculos)
# lista_cidades_cinemas(df_cultura_espetaculos)

In [None]:
df_populaccao_residente = find_df_by_name(dataframes, '1-populacao-residente-por-sexo-e-grupo-etario')
df_populaccao_final = trata_df_populacao_residente(df_populaccao_residente)
adiciona_df_tratado("Populacao","populacao-residente-por-sexo-e-grupo-etario" , df_populaccao_final)
# cidades_por_grupo(df_populaccao_final, categoria='Todos', n = 10) # Todos Crianças Adolescentes Jovens Adultos Adultos Idosos Populosas

In [None]:
df_densidade_populacional = find_df_by_name(dataframes, '4-densidade-populacional')
df_densidade_populacional = trata_df_populacao_densidade(df_densidade_populacional)
adiciona_df_tratado("Populacao","densidade-populacional" , df_densidade_populacional)

In [None]:
df_populacao_estrangeira = find_df_by_name(dataframes, '354-populacao-estrangeira-com-estatuto-legal-de-residente')
df_populacao_estrangeira = trata_populacao_estrangeira(df_populacao_estrangeira)
adiciona_df_tratado("Populacao","populacao-estrangeira-com-estatuto-legal-de-residente" , df_populacao_estrangeira) 

In [None]:
df_seguranca_crime_catetoria = find_df_by_name(dataframes, '560-crimes-por-categoria')
df_seg_categoria = trata_crimes_catetoria(df_seguranca_crime_catetoria)
adiciona_df_tratado("Segurança","crimes-por-categoria" , df_seg_categoria)

In [None]:
df_seg_crimes_tipo = find_df_by_name(dataframes, '559-crimes-registados-pelas-policias-por-tipo-de-crime')
df_seg_crimes_tipo = trata_crimes_tipo(df_seg_crimes_tipo)
adiciona_df_tratado("Segurança","crimes-registados-pelas-policias-por-tipo-de-crime" , df_seg_crimes_tipo)

In [None]:
df_taxa_crimes = trata_seg_taxa_crime()
adiciona_df_tratado("Segurança","taxa_crimes", df_taxa_crimes)

In [None]:
df_saude_hospitais = find_df_by_name(dataframes, '470-hospitais-por-natureza-institucional')
df_saude_hospitais = trata_hospitais(df_saude_hospitais)
adiciona_df_tratado("Saude","hospitais-por-natureza-institucional" , df_saude_hospitais)

In [None]:
df_saude_farmacias = find_df_by_name(dataframes, '464-farmacias')
df_saude_farmacias = trata_farmacias(df_saude_farmacias)
adiciona_df_tratado("Saude","farmacias" , df_saude_farmacias)

In [None]:
df_edu_ensino_n_superior =  find_df_by_name(dataframes, '379-estabelecimentos-de-ensino-nao-superior-por-0')
df_edu_escola_final = trata_ensino_n_superior(df_edu_ensino_n_superior)
adiciona_df_tratado("Educacao","estabelecimentos-de-ensino-nao-superior-por-0" , df_edu_escola_final)

In [None]:
df_edu_ensino_superior =  find_df_by_name(dataframes, '375-estabelecimentos-de-ensino-superior-por-subsistema')
df_edu_ensino_superior = trata_ensino_superior(df_edu_ensino_superior)
adiciona_df_tratado("Educacao","estabelecimentos-de-ensino-superior-por-subsistema" , df_edu_ensino_superior) 

In [None]:
df_econ_depositos = find_df_by_name(dataframes, '294-depositos-de-clientes-nos-bancos-caixas-economicas-e')
df_econ_depositos = trata_econ_depositos(df_econ_depositos)
adiciona_df_tratado("Economia","depositos-de-clientes-nos-bancos-caixas-economicas-e" , df_econ_depositos) 

In [None]:
df_econ_estabelecimentos_bancos = find_df_by_name(dataframes, '295-estabelecimentos-de-bancos-caixas-economicas-e-caixas')
df_econ_estabelecimentos_bancos = trata_econ_bancos(df_econ_estabelecimentos_bancos)
adiciona_df_tratado("Economia","estabelecimentos-de-bancos-caixas-economicas-e-caixas" , df_econ_estabelecimentos_bancos) 

In [None]:
df_desemprego = find_df_by_name(dataframes, '439-desemprego-registado-nos-centros-de-emprego-por-grup')
df_desemprego = trata_df_desemprego(df_desemprego)
adiciona_df_tratado("Emprego","desemprego-registado-nos-centros-de-emprego-por-grup" , df_desemprego) 

In [None]:
df_polacao_empregada = find_df_by_name(dataframes, '445-populacao-empregada-por-conta-de-outrem-por-nivel-de')
df_polacao_empregada = trata_populacao_empregada_escolaridade(df_polacao_empregada)
adiciona_df_tratado("Emprego","populacao-empregada-por-conta-de-outrem-por-nivel-de" , df_polacao_empregada) 


In [None]:
df_polacao_empregada_ramo = find_df_by_name(dataframes, '845-Pessoal-ao-servico-nas-empresas-por-ramo-de-atividade')
df_polacao_empregada_ramo = trata_populacao_empregada_ramo(df_polacao_empregada_ramo)
adiciona_df_tratado("Emprego","Pessoal-ao-servico-nas-empresas-por-ramo-de-atividade" , df_polacao_empregada_ramo) 


In [None]:
df_moradia_edificios = find_df_by_name(dataframes, '978-edificios-concluidos-por-tipo-de-obra-e-fim-que-se')
df_moradia_edificios = trata_moradia_edificios(df_moradia_edificios)
adiciona_df_tratado("Moradia","edificios-concluidos-por-tipo-de-obra-e-fim-que-se" , df_moradia_edificios) 

In [None]:
df_construcoes_novas = find_df_by_name(dataframes, '980-fogos-concluidos-em-construcoes-novas-para-habitacao')
df_construcoes_novas = trata_construcoes_novas(df_construcoes_novas)
adiciona_df_tratado("Moradia","fogos-concluidos-em-construcoes-novas-para-habitacao" , df_construcoes_novas) 

In [None]:
df_mora_valor_rendas = trata_mora_valor_renda()
adiciona_df_tratado("Moradia","Valor Medio Arrendamento", df_mora_valor_rendas)

In [None]:
df_sal_ganho_medio_mensal= find_df_by_name(dataframes, '581-ganho-medio-mensal')
df_sal_ganho_medio_mensal = trata_sal_ganho_medio_mensal(df_sal_ganho_medio_mensal)
adiciona_df_tratado("Renda","ganho-medio-mensal" , df_sal_ganho_medio_mensal) 


In [None]:
df_sal_ganho_medio_mensal_escol= find_df_by_name(dataframes, '582-ganho-medio-mensal-por-nivel-de-escolaridade')
df_sal_ganho_medio_mensal_escol = trata_sal_ganho_medio_mensal_escol(df_sal_ganho_medio_mensal_escol)
adiciona_df_tratado("Renda","ganho-medio-mensal-por-nivel-de-escolaridade" , df_sal_ganho_medio_mensal_escol) 


In [None]:
df_econ_poder_compra = trata_econ_poder_compra()
adiciona_df_tratado("Renda","poder-de-compra" , df_econ_poder_compra) 


In [None]:
# cultura
df_cinemas = find_df_by_name(dfs,'recintos-de-cinema')
df_sessoes = find_df_by_name(dfs,'sessoes-de-espetaculos-ao-vivo')

df_cinemas = df_cinemas.rename(columns={'Valor': 'Qtd.Cinemas'})
df_sessoes = df_sessoes.rename(columns={'Valor': 'Qtd.Sessões'})

df_cultura = pd.merge(df_cinemas, df_sessoes, on=['Região'], how='left')
df_cultura.drop(columns=['Âmbito Geográfico_x','Âmbito Geográfico_y'], inplace=True)
df_cultura

In [None]:
# saude
df_saude_hospitais = find_df_by_name(dfs,'hospitais-por-natureza-institucional')
df_farmacias = find_df_by_name(dfs,'farmacias')

df_farmacias = df_farmacias.rename(columns={'Valor': 'Qtd.Farmacias'})
df_saude_hospitais = df_saude_hospitais.rename(columns={'Parceria público-privada': 'Qtd.Hospitais.Publico.Privado'})
df_saude_hospitais = df_saude_hospitais.rename(columns={'Privado': 'Qtd.Hospitais.Privado'})
df_saude_hospitais = df_saude_hospitais.rename(columns={'Público': 'Qtd.Hospitais.Publico'})
df_saude_hospitais = df_saude_hospitais.rename(columns={'Público': 'Qtd.Hospitais.Total'})

df_saude = pd.merge(df_saude_hospitais, df_farmacias, on=['Região'], how='left')

df_saude.drop(columns=['Âmbito Geográfico'], inplace=True)


In [None]:
# educacao
df_ensino_n_superior = find_df_by_name(dfs,'estabelecimentos-de-ensino-nao-superior-por-0')
df_ensino_superior = find_df_by_name(dfs,'estabelecimentos-de-ensino-superior-por-subsistema')
df_ensino_superior = df_ensino_superior.rename(columns={'Privado': 'Qtd.Ensino.Superior.Privado'})
df_ensino_superior = df_ensino_superior.rename(columns={'Público': 'Qtd.Ensino.Superior.Publico'})
df_ensino_superior = df_ensino_superior.rename(columns={'Total': 'Qtd.Ensino.Superior.Total'})

df_ensino_n_superior = df_ensino_n_superior.rename(columns={'Privado': 'Qtd.Ensino.NSuperior.Privado'})
df_ensino_n_superior = df_ensino_n_superior.rename(columns={'Público': 'Qtd.Ensino.NSuperior.Publico'})
df_ensino_n_superior = df_ensino_n_superior.rename(columns={'Escola artística': 'Qtd.Ensino.NSuperior.artistica'})
df_ensino_n_superior = df_ensino_n_superior.rename(columns={'Escola básica': 'Qtd.Ensino.NSuperior.basica'})
df_ensino_n_superior = df_ensino_n_superior.rename(columns={'Escola profissional': 'Qtd.Ensino.NSuperior.profissional'})
df_ensino_n_superior = df_ensino_n_superior.rename(columns={'Escola secundária': 'Qtd.Ensino.NSuperior.secundaria'})
df_ensino_n_superior = df_ensino_n_superior.rename(columns={'Jardim-de-infância': 'Qtd.Ensino.NSuperior.Jardim-de-infância'})
f_ensino_n_superior = df_ensino_n_superior.rename(columns={'Total Estabelecimentos': 'Qtd.Ensino.NSuperior.Total'})

df_educacao = pd.merge(df_ensino_n_superior, df_ensino_superior, on=['Região'], how='left')


In [None]:
# Populacao

df_populacao_residente = find_df_by_name(dfs,'populacao-residente-por-sexo-e-grupo-etario')
df_populacao_densidade = find_df_by_name(dfs,'densidade-populacional')
df_populacao_estrangeira = find_df_by_name(dfs,'populacao-estrangeira-com-estatuto-legal-de-residente')

df_populacao_residente = df_populacao_residente.rename(columns={
    'Homens': 'Qtd.Homens',
    'Mulheres': 'Qtd.Mulheres',
    '0 - 4 anos': 'Qtd.0_4_anos',
    '5 - 9 anos': 'Qtd.5_9_anos',
    '10 - 14 anos': 'Qtd.10_14_anos',
    '15 - 19 anos': 'Qtd.15_19_anos',
    '20 - 24 anos': 'Qtd.20_24_anos',
    '25 - 29 anos': 'Qtd.25_29_anos',
    '30 - 34 anos': 'Qtd.30_34_anos',
    '35 - 39 anos': 'Qtd.35_39_anos',
    '40 - 44 anos': 'Qtd.40_44_anos',
    '45 - 49 anos': 'Qtd.45_49_anos',
    '50 - 54 anos': 'Qtd.50_54_anos',
    '55 - 59 anos': 'Qtd.55_59_anos',
    '60 - 64 anos': 'Qtd.60_64_anos',
    '65 - 69 anos': 'Qtd.65_69_anos',
    '70 - 74 anos': 'Qtd.70_74_anos',
    '75 - 79 anos': 'Qtd.75_79_anos',
    '80 - 84 anos': 'Qtd.80_84_anos',
    '85 ou mais anos': 'Qtd.85_ou_mais_anos',
    'Total População': 'Qtd.Total.População',
    'Total Crianças': 'Qtd.Total.Crianças',
    'Total Adolescentes': 'Qtd.Total.Adolescentes',
    'Total Jovens Adultos': 'Qtd.Total.Jovens.Adultos',
    'Total Adultos': 'Qtd.Total.Adultos',
    'Total Idosos': 'Qtd.Total.Idosos',
    'Proporção Crianças': 'Proporção.Crianças',
    'Proporção Adolescentes': 'Proporção.Adolescentes',
    'Proporção Jovens Adultos': 'Proporção.Jovens.Adultos',
    'Proporção Adultos': 'Proporção.Adultos',
    'Proporção Idosos': 'Proporção.Idosos'
})

df_populacao_densidade = df_populacao_densidade.rename(columns={
    'Valor': 'Qtd.Densidade.Populacional'
})

df_populacao_densidade = df_populacao_densidade.drop(columns=['Âmbito Geográfico'])

df_populacao_estrangeira = df_populacao_estrangeira.rename(columns={
    '1. África': 'Qtd.Africa',
    '1.1. Angola': 'Qtd.Angola',
    '1.2.Cabo-Verde': 'Qtd.Cabo_Verde',
    '1.3. Guiné-Bissau': 'Qtd.Guine_Bissau',
    '1.4. Moçambique': 'Qtd.Mocambique',
    '1.5. São Tomé e Príncipe': 'Qtd.Sao_Tome_e_Principe',
    '2. América': 'Qtd.America',
    '2.1. Brasil': 'Qtd.Brasil',
    '3. Ásia': 'Qtd.Asia',
    '3.1. China': 'Qtd.China',
    '3.2. Índia': 'Qtd.India',
    '3.3. Nepal': 'Qtd.Nepal',
    '4. Europa': 'Qtd.Europa',
    '4.1. Espanha': 'Qtd.Espanha',
    '4.2. França': 'Qtd.Franca',
    '4.3. Itália': 'Qtd.Italia',
    '4.4. República da Moldova': 'Qtd.Republica_da_Moldova',
    '4.5. Reino Unido': 'Qtd.Reino_Unido',
    '4.6. Roménia': 'Qtd.Romenia',
    '4.7. Ucrânia': 'Qtd.Ucrania',
    'Total': 'Qtd.Total.Populacao.Estrangeira'
})

df_populacao_ = pd.merge(df_populacao_residente, df_populacao_densidade, on=['Região'], how='left')
df_populacao = pd.merge(df_populacao_, df_populacao_estrangeira, on=['Região'], how='left')

In [None]:
# Segurança

df_seg_crimes_cat = find_df_by_name(dfs,'crimes-por-categoria')
df_seg_crimes_tipo = find_df_by_name(dfs,'crimes-registados-pelas-policias-por-tipo-de-crime')
df_seg_crimes_taxa = find_df_by_name(dfs,'taxa_crimes')

df_seg_crimes_cat = df_seg_crimes_cat.rename(columns={
    '1. Contra as pessoas': 'Qtd.Crimes.Contra.Pessoas',
    '2. Contra o património': 'Qtd.Crimes.Contra.Patrimonio',
    '3. Contra a vida em sociedade': 'Qtd.Crimes.Contra.Vida.Em.Sociedade',
    '4. Contra o Estado': 'Qtd.Crimes.Contra.Estado',
    '5. Contra a identidade cultural, integridade pessoal': 'Qtd.Crimes.Contra.IdentidadeCultural.IntegridadePessoal',
    '6. Contra animais companhia': 'Qtd.Crimes.Contra.Animais.De.Companhia',
    '7. Legislação Avulsa e Outros': 'Qtd.Crimes.Outros.Leituras.Legislacao.Avulsa',
    'Total': 'Qtd.Crimes.Total'
})

df_seg_crimes_tipo = df_seg_crimes_tipo.rename(columns={
    'Furto em edifício comercial ou industrial': 'Qtd.Crime.Furto.ComercialOuIndustrial',
    'Furto em residência': 'Qtd.Crime.Furto.Residencia',
    'Furto em veículo motorizado': 'Qtd.Crime.Furto.VeiculoMotorizado',
    'Total': 'Qtd.Crime.Total',
    'Violência doméstica contra cônjuge ou análogos': 'Qtd.Crime.Violencia.Domestica.Contra.ConjugeOuAnalogos'
})

df_seg_crimes_taxa = df_seg_crimes_taxa.rename(columns={
    'Regiao': 'Região',
    'Total': 'Qtd.Taxa.Crime.Total',
    'Crimes contra a integridade física': 'Qtd.Taxa.Crime.Contra.Integridade.Fisica',
    'Furto/roubo por esticão e na via pública': 'Qtd.Taxa.Crime.FurtoOuRoubo.ViaPublica',
    'Furto de veículo e em veículo motorizado': 'Qtd.Taxa.Crime.Furto.Veiculo',
    'Condução de veículo com taxa de álcool igual ou superior a 1,2g/l': 'Qtd.Taxa.Crime.Conducao.Alcool.1_2g',
    'Condução sem habilitação legal': 'Qtd.Taxa.Crime.Conducao.Sem.Habilitacao',
    'Crimes contra o património': 'Qtd.Taxa.Crime.Contra.Patrimonio'
})

df_seguranca_ = pd.merge(df_seg_crimes_cat, df_seg_crimes_tipo, on=['Região'], how='left')
df_seguranca = pd.merge(df_seguranca_, df_seg_crimes_taxa, on=['Região'], how='left')
df_seguranca.drop(columns=['Ano_y'], inplace=True)
df_seguranca = df_seguranca.rename(columns={
    'Ano_x': 'Ano'
})

In [82]:
# Ecomonia

df_econ_depositos = find_df_by_name(dfs,'depositos-de-clientes-nos-bancos-caixas-economicas-e')
df_econ_bancos = find_df_by_name(dfs,'estabelecimentos-de-bancos-caixas-economicas-e-caixas')

df_econ_bancos = df_econ_bancos.rename(columns={'Valor': 'Qtd.Estabelecimentos.Bancarios'})
df_econ_bancos.drop(columns=['Âmbito Geográfico','07. Escala'],inplace=True)

df_econ_depositos = df_econ_depositos.rename(
    columns={
        'De emigrantes': 'Qtd.Depositos.De.Imigrantes',
        'De outros clientes':'Qtd.Depositos.De.Outros.Clientes',
        'Total': 'Qtd.Total.Depositos'
    }
)

df_economia = pd.merge(df_econ_bancos, df_econ_depositos, on=['Região'], how='left')
df_economia.drop(columns=['Ano_y'],inplace=True)
df_economia.rename(columns={'Ano_x':'Ano'},inplace=True)

In [83]:
df_economia

Unnamed: 0,Ano,Região,Qtd.Estabelecimentos.Bancarios,Qtd.Depositos.De.Imigrantes,Qtd.Depositos.De.Outros.Clientes,Qtd.Total.Depositos
0,2023,Abrantes,7.0,10206.0,512889.0,523095.0
1,2023,Águeda,10.0,26500.0,972942.0,999442.0
2,2023,Aguiar da Beira,2.0,19138.0,162557.0,181695.0
3,2023,Alandroal,1.0,0.0,0.0,0.0
4,2023,Albergaria-a-Velha,8.0,8636.0,319967.0,328603.0
...,...,...,...,...,...,...
303,2023,Vimioso,2.0,15236.0,74191.0,89427.0
304,2023,Vinhais,1.0,13064.0,110887.0,123951.0
305,2023,Viseu,33.0,106480.0,2843802.0,2950282.0
306,2023,Vizela,7.0,4700.0,356085.0,360785.0


In [61]:
df_lista = pd.DataFrame([
    {'Categoria': item['Categoria'], 'Nome': item['df_name']}
    for item in dfs
])

print(df_lista)

    Categoria                                               Nome
0     Cultura                                 recintos-de-cinema
1     Cultura                     sessoes-de-espetaculos-ao-vivo
2   Populacao        populacao-residente-por-sexo-e-grupo-etario
3   Populacao                             densidade-populacional
4   Populacao  populacao-estrangeira-com-estatuto-legal-de-re...
5   Segurança                               crimes-por-categoria
6   Segurança  crimes-registados-pelas-policias-por-tipo-de-c...
7   Segurança                                        taxa_crimes
8       Saude               hospitais-por-natureza-institucional
9       Saude                                          farmacias
10   Educacao      estabelecimentos-de-ensino-nao-superior-por-0
11   Educacao  estabelecimentos-de-ensino-superior-por-subsis...
12   Economia  depositos-de-clientes-nos-bancos-caixas-econom...
13   Economia  estabelecimentos-de-bancos-caixas-economicas-e...
14    Emprego  desemprego