In [2]:
# Importação das bibliotecas necessárias
import pandas as pd
from sklearn.preprocessing import StandardScaler

def convert_to_float(val):
    """
    Converte valores numéricos do formato brasileiro para o padrão internacional.
    
    Parameters:
    val (str): Valor a ser convertido.
    
    Returns:
    float: Valor convertido.
    """
    if isinstance(val, str):
        try:
            return float(val.replace('.', '').replace(',', '.'))
        except ValueError:
            return val
    return val

def load_data(filepath, sheet_name):
    """
    Carrega os dados de um arquivo Excel.
    
    Parameters:
    filepath (str): Caminho para o arquivo Excel.
    sheet_name (str): Nome da planilha a ser carregada.
    
    Returns:
    DataFrame: Dados carregados em um DataFrame.
    """
    return pd.read_excel(filepath, sheet_name=sheet_name)

def convert_numeric_columns(df, numeric_columns):
    """
    Converte as colunas numéricas para o formato correto.
    
    Parameters:
    df (DataFrame): DataFrame com os dados.
    numeric_columns (list): Lista de colunas numéricas a serem convertidas.
    
    Returns:
    DataFrame: DataFrame com colunas numéricas convertidas.
    """
    df[numeric_columns] = df[numeric_columns].applymap(convert_to_float)
    return df

def normalize_data(df, numeric_columns):
    """
    Normaliza as colunas numéricas dos dados.
    
    Parameters:
    df (DataFrame): DataFrame com os dados.
    numeric_columns (list): Lista de colunas numéricas a serem normalizadas.
    
    Returns:
    DataFrame: DataFrame com colunas normalizadas.
    """
    scaler = StandardScaler()
    df[numeric_columns] = scaler.fit_transform(df[numeric_columns])
    return df

def save_data(df, filepath):
    """
    Salva os dados em um arquivo CSV.
    
    Parameters:
    df (DataFrame): DataFrame com os dados.
    filepath (str): Caminho para o arquivo CSV.
    """
    df.to_csv(filepath, index=False)

# Caminhos dos arquivos e nome da planilha
excel_path = 'Raw_Data_Input_Output_Variables.xlsx'  # Certifique-se que este arquivo está na área de arquivos do Jupyter Notebook
sheet_name = 'Variables'    # Nome da planilha a ser carregada
csv_output_path = 'Processed_Normalized_Data.csv'  # Nome do arquivo de saída

# Carregar os dados
df = load_data(excel_path, sheet_name)

# Identificar as colunas numéricas (todas as colunas, exceto a primeira)
numeric_columns = df.columns[1:]

# Converter colunas numéricas para o formato correto
df = convert_numeric_columns(df, numeric_columns)

# Normalizar os dados
df = normalize_data(df, numeric_columns)

# Salvar os dados normalizados em um arquivo CSV
save_data(df, csv_output_path)

# Exibir as primeiras linhas para verificação
print(df.head())



   Year  Legislative  Judiciary  Essential to Justice  Administration  \
0  2000    -2.049252  -1.463593             -1.664928       -1.486595   
1  2001    -1.817741  -1.438853             -1.577969       -1.377226   
2  2002    -1.578076  -1.285335             -1.489058       -1.222049   
3  2003    -1.183544  -1.267297             -1.338284       -1.361658   
4  2004    -0.881078  -1.040769             -0.966599       -1.107974   

   National Defense  Public Safety  Foreign Relations  Social Assistance  \
0         -1.071809      -1.380108          -1.534381          -0.789715   
1         -1.023620      -1.235456          -1.343466          -0.780579   
2         -0.995833      -1.375287          -0.910656          -0.767622   
3         -1.035937      -1.304760          -1.087122          -0.747325   
4         -0.959164      -1.178537          -0.928220          -0.689235   

   Security  ...  Services and Commerce  Communications    Energy  \
0 -1.295410  ...              -0.17