<h1><b><i>SCRIPT PRINCIPAL</b></i></h1>
<h2><b><i>Importa√ß√£o de Bibliot√©cas</b></i></h2>

In [None]:
import pandas as pd
import openpyxl
import numpy as np
import os


In [None]:
# ==============================================================================
# 1. SETUP INICIAL E CARREGAMENTO
#    (Melhor pr√°tica: definir constantes e carregar o arquivo de forma segura)
# ==============================================================================

# Defini√ß√£o do caminho do arquivo em uma vari√°vel para f√°cil manuten√ß√£o
# Baseado na sua estrutura de diret√≥rios
FILE_PATH = r'C:\Users\carlos.ramos\OneDrive - Presid√™ncia da Rep√∫blica\√Årea de Trabalho\Acompanhamento-Concessoes-Rodoviarias-main-\Acompanhamento-Concessoes-Rodoviarias-main\Pandas\Notebooks\RODOVI√ÅRIO\RISCOS\Planilha.xlsx'
OUTPUT_DIR = 'Dados Gerados' 

# Verifica se o arquivo existe antes de tentar carreg√°-lo
if not os.path.exists(FILE_PATH):
    print(f"ERRO: O arquivo '{FILE_PATH}' n√£o foi encontrado.")
    # Encerra o script ou lan√ßa uma exce√ß√£o se o arquivo principal n√£o existir
    exit()

# Cria a pasta de sa√≠da se ela n√£o existir
os.makedirs(OUTPUT_DIR, exist_ok=True)

print(f"Arquivo '{FILE_PATH}' encontrado. Iniciando processamento...")

## üìã Extra√ß√£o de Campos de Licen√ßa das Metas

Esta se√ß√£o cont√©m fun√ß√µes para extrair os seguintes campos que aparecem em todas as metas de todos os tipos de projeto (PAVIMENTA√á√ÉO, DUPLICA√á√ÉO, OAE, CONTORNO, FX ADICIONAL, TERCEIRA FAIXA):

- **N¬∫ PROCESSO**
- **DATA DO PROTOCOLO**
- **LICEN√áA**
- **SITUA√á√ÉO GERAL** (caso o processo j√° tenha sido protocolado)
- **Data do √∫ltimo documento encaminhado (D/M/A)**
- **Foi solicitado licen√ßa para o segmento?**
- **O pedido de licen√ßa desse segmento est√° dentro de um pedido de trecho maior?**
- **Se positivo, especificar o trecho completo requisitado - km(i) - km(f)**
- **Observa√ß√µes gerais** (Colocar aqui observa√ß√µes gerais; Quando escolher a op√ß√£o Outros, descrever a situa√ß√£o de forma suscinta)

### Como usar:

1. **Carregar a planilha "Planilha"** (se existir): A c√©lula abaixo tenta carregar automaticamente
2. **Extrair campos de uma meta espec√≠fica**: Use `extrair_campos_licenca_da_meta('META(2024)')`
3. **Adicionar campos a uma meta processada**: Use `adicionar_campos_licenca_a_meta(df_meta_24_copy, 'META(2024)')`


In [None]:
# Listar todas as planilhas dispon√≠veis no arquivo
xls = pd.ExcelFile(FILE_PATH)
sheet_names = xls.sheet_names
sheet_names

In [None]:
# Carregar a planilha "Planilha" se existir
try:
    df_planilha = pd.read_excel(FILE_PATH, sheet_name='Planilha')
    print("‚úÖ Planilha 'Planilha' carregada com sucesso!")
    print(f"Shape: {df_planilha.shape}")
    print(f"Colunas: {list(df_planilha.columns[:10])}")  # Primeiras 10 colunas
except Exception as e:
    print(f"‚ö†Ô∏è Aviso: N√£o foi poss√≠vel carregar a planilha 'Planilha': {e}")
    print("Tentando verificar se existe com nome diferente...")
    # Listar todas as planilhas para verificar
    xls = pd.ExcelFile(FILE_PATH)
    print(f"Planilhas dispon√≠veis: {xls.sheet_names}")
    df_planilha = None


In [None]:
# Fun√ß√£o para extrair campos comuns de todas as metas
def extrair_campos_licenca_meta(df_meta, tipo_projeto=''):
    """
    Extrai os campos relacionados a licen√ßas e processos que aparecem em todas as metas.
    
    Par√¢metros:
    - df_meta: DataFrame da meta
    - tipo_projeto: Tipo do projeto (PAVIMENTA√á√ÉO, DUPLICA√á√ÉO, OAE, etc.)
    
    Retorna:
    - DataFrame com os campos extra√≠dos
    """
    campos_licenca = {}
    
    # Lista de campos a serem extra√≠dos (com varia√ß√µes poss√≠veis de nomes)
    campos_procurados = {
        'N¬∫ PROCESSO': ['N¬∫ PROCESSO', 'N PROCESSO', 'NUMERO PROCESSO', 'PROCESSO', 'N¬∫ PROC'],
        'DATA DO PROTOCOLO': ['DATA DO PROTOCOLO', 'DATA PROTOCOLO', 'PROTOCOLO', 'DT PROTOCOLO'],
        'LICEN√áA': ['LICEN√áA', 'LICENCA', 'LICEN√áAS', 'LICENCAS'],
        'SITUA√á√ÉO GERAL': ['SITUA√á√ÉO GERAL', 'SITUACAO GERAL', 'SITUA√á√ÉO', 'SITUACAO'],
        'DATA √öLTIMO DOCUMENTO': ['Data do √∫ltimo documento encaminhado', 'DATA √öLTIMO DOC', 'ULTIMO DOCUMENTO', 
                                  'DATA DOCUMENTO', 'Data do √∫ltimo documento'],
        'LICEN√áA SOLICITADA': ['Foi solicitado licen√ßa para o segmento?', 'LICEN√áA SOLICITADA', 
                               'LICENCA SOLICITADA', 'SOLICITADO LICEN√áA'],
        'TRECHO MAIOR': ['O pedido de licen√ßa desse segmento est√° dentro de um pedido de trecho maior?',
                        'TRECHO MAIOR', 'PEDIDO TRECHO MAIOR'],
        'TRECHO COMPLETO': ['Se positivo, especificar o trecho completo requisitado', 
                           'TRECHO COMPLETO', 'KM INICIAL FINAL', 'km(i) - km(f)'],
        'OBSERVA√á√ïES': ['Colocar aqui observa√ß√µes gerais', 'OBSERVA√á√ïES', 'OBSERVACOES', 
                       'OBSERVA√á√ïES GERAIS', 'OBSERVACOES GERAIS']
    }
    
    # Procurar pelos campos nas colunas do DataFrame
    for campo_principal, variacoes in campos_procurados.items():
        encontrado = False
        for variacao in variacoes:
            # Procurar coluna que contenha a varia√ß√£o (case insensitive)
            colunas_encontradas = [col for col in df_meta.columns 
                                  if variacao.upper() in str(col).upper()]
            if colunas_encontradas:
                campos_licenca[campo_principal] = df_meta[colunas_encontradas[0]].copy()
                encontrado = True
                break
        
        if not encontrado:
            # Se n√£o encontrou, criar coluna vazia
            campos_licenca[campo_principal] = pd.Series([None] * len(df_meta), index=df_meta.index)
    
    # Criar DataFrame com os campos extra√≠dos
    df_campos = pd.DataFrame(campos_licenca, index=df_meta.index)
    
    # Adicionar prefixo do tipo de projeto se fornecido
    if tipo_projeto:
        df_campos.columns = [f'{tipo_projeto} - {col}' for col in df_campos.columns]
    
    return df_campos

print("‚úÖ Fun√ß√£o extrair_campos_licenca_meta criada com sucesso!")


In [None]:
# Processar campos de licen√ßa para todas as metas
# Esta fun√ß√£o ser√° usada para extrair os campos comuns de todas as metas

def processar_campos_licenca_todas_metas():
    """
    Processa os campos de licen√ßa para todas as metas carregadas.
    Retorna um dicion√°rio com os campos extra√≠dos por meta e tipo de projeto.
    """
    tipos_projeto = ['PAVIMENTA√á√ÉO', 'DUPLICA√á√ÉO', 'OAE', 'CONTORNO', 'FX ADICIONAL', 'TERCEIRA FAIXA']
    metas = {
        'META_2023': df_meta_23 if 'df_meta_23' in globals() else None,
        'META_2024': df_meta_24 if 'df_meta_24' in globals() else None,
        'META_2025': df_meta_25 if 'df_meta_25' in globals() else None,
        'META_2026': df_meta_26 if 'df_meta_26' in globals() else None,
        'META_2027': df_meta_27 if 'df_meta_27' in globals() else None,
    }
    
    campos_extraidos = {}
    
    for nome_meta, df_meta in metas.items():
        if df_meta is not None:
            print(f"\nüìã Processando {nome_meta}...")
            campos_extraidos[nome_meta] = {}
            
            # Ler a meta com header=2 para obter a estrutura correta
            try:
                df_meta_temp = pd.read_excel(FILE_PATH, sheet_name=df_meta.name if hasattr(df_meta, 'name') else nome_meta.replace('META_', 'META(').replace('_', ''), header=2)
                
                # Para cada tipo de projeto, tentar extrair os campos
                for tipo in tipos_projeto:
                    # Procurar se√ß√µes relacionadas ao tipo de projeto
                    # Os campos podem estar em colunas que cont√™m o nome do tipo de projeto
                    colunas_tipo = [col for col in df_meta_temp.columns if tipo.upper() in str(col).upper()]
                    
                    if colunas_tipo:
                        print(f"  ‚úÖ Encontradas {len(colunas_tipo)} colunas para {tipo}")
                        # Extrair campos usando a fun√ß√£o
                        campos = extrair_campos_licenca_meta(df_meta_temp, tipo_projeto=tipo)
                        campos_extraidos[nome_meta][tipo] = campos
                    else:
                        print(f"  ‚ö†Ô∏è Nenhuma coluna encontrada para {tipo}")
                        
            except Exception as e:
                print(f"  ‚ùå Erro ao processar {nome_meta}: {e}")
        else:
            print(f"‚ö†Ô∏è {nome_meta} n√£o est√° dispon√≠vel")
    
    return campos_extraidos

# Executar o processamento (comentado para n√£o executar automaticamente)
# campos_licenca_metas = processar_campos_licenca_todas_metas()
print("‚úÖ Fun√ß√£o processar_campos_licenca_todas_metas criada!")
print("üí° Use 'campos_licenca_metas = processar_campos_licenca_todas_metas()' para executar")


In [None]:
# Extrair campos de licen√ßa diretamente das planilhas de META
# Esta c√©lula l√™ as planilhas de META e extrai os campos solicitados

def extrair_campos_licenca_da_meta(sheet_name, tipos_projeto=['PAVIMENTA√á√ÉO', 'DUPLICA√á√ÉO', 'OAE', 'CONTORNO', 'FX ADICIONAL', 'TERCEIRA FAIXA']):
    """
    Extrai os campos de licen√ßa diretamente de uma planilha de META.
    
    Par√¢metros:
    - sheet_name: Nome da planilha (ex: 'META(2024)')
    - tipos_projeto: Lista dos tipos de projeto a processar
    
    Retorna:
    - DataFrame com todos os campos extra√≠dos
    """
    try:
        # Ler a planilha sem header para ver todas as linhas
        df_raw = pd.read_excel(FILE_PATH, sheet_name=sheet_name, header=None)
        
        # Procurar pelos campos nas primeiras linhas (cabe√ßalhos)
        campos_encontrados = {}
        
        # Lista de campos a procurar
        campos_procurados = [
            'N¬∫ PROCESSO',
            'DATA DO PROTOCOLO', 
            'LICEN√áA',
            'SITUA√á√ÉO GERAL',
            'Data do √∫ltimo documento encaminhado',
            'Foi solicitado licen√ßa para o segmento?',
            'O pedido de licen√ßa desse segmento est√° dentro de um pedido de trecho maior?',
            'Se positivo, especificar o trecho completo requisitado',
            'Colocar aqui observa√ß√µes gerais'
        ]
        
        # Procurar nas primeiras 5 linhas pelos cabe√ßalhos
        for linha_idx in range(min(5, len(df_raw))):
            linha = df_raw.iloc[linha_idx]
            for campo in campos_procurados:
                for col_idx, valor in enumerate(linha):
                    if pd.notna(valor) and campo.upper() in str(valor).upper():
                        if campo not in campos_encontrados:
                            campos_encontrados[campo] = col_idx
                            print(f"‚úÖ Encontrado '{campo}' na coluna {col_idx} (linha {linha_idx})")
        
        # Se encontrou campos, ler novamente com header apropriado
        if campos_encontrados:
            # Tentar ler com header=2 (padr√£o usado no notebook)
            df_meta = pd.read_excel(FILE_PATH, sheet_name=sheet_name, header=2)
            
            # Criar DataFrame com os campos encontrados
            df_campos = pd.DataFrame()
            for campo, col_idx in campos_encontrados.items():
                if col_idx < len(df_meta.columns):
                    col_name = df_meta.columns[col_idx]
                    df_campos[campo] = df_meta[col_name]
            
            return df_campos
        else:
            print(f"‚ö†Ô∏è Nenhum campo encontrado na planilha {sheet_name}")
            return pd.DataFrame()
            
    except Exception as e:
        print(f"‚ùå Erro ao processar {sheet_name}: {e}")
        return pd.DataFrame()

# Exemplo de uso (comentado):
# df_campos_meta_24 = extrair_campos_licenca_da_meta('META(2024)')
# print(f"\nCampos extra√≠dos: {list(df_campos_meta_24.columns)}")

print("‚úÖ Fun√ß√£o extrair_campos_licenca_da_meta criada!")
print("üí° Use 'df_campos = extrair_campos_licenca_da_meta(\"META(2024)\")' para extrair campos de uma meta espec√≠fica")


In [None]:
# ==============================================================================
# EXEMPLO PR√ÅTICO: Extrair e adicionar campos de licen√ßa √†s metas
# ==============================================================================

# Descomente as linhas abaixo para testar a extra√ß√£o de campos

# Exemplo 1: Extrair campos da META 2024
# df_campos_meta_24 = extrair_campos_licenca_da_meta('META(2024)')
# print("\n" + "="*60)
# print("Campos extra√≠dos da META 2024:")
# print("="*60)
# if not df_campos_meta_24.empty:
#     print(f"Colunas: {list(df_campos_meta_24.columns)}")
#     print(f"Shape: {df_campos_meta_24.shape}")
#     print("\nPrimeiras linhas:")
#     print(df_campos_meta_24.head())
# else:
#     print("Nenhum campo encontrado")

# Exemplo 2: Extrair campos de todas as metas
# metas_para_processar = ['META(1) 2023', 'META(2024)', 'META(2025)', 'META(2026)', 'META(2027)']
# campos_todas_metas = {}
# for meta in metas_para_processar:
#     print(f"\n{'='*60}")
#     print(f"Processando {meta}...")
#     print('='*60)
#     campos_todas_metas[meta] = extrair_campos_licenca_da_meta(meta)
#     if not campos_todas_metas[meta].empty:
#         print(f"‚úÖ {len(campos_todas_metas[meta].columns)} campos extra√≠dos")
#     else:
#         print("‚ö†Ô∏è Nenhum campo encontrado")

# Exemplo 3: Adicionar campos a uma meta j√° processada (ap√≥s o processamento normal)
# Ap√≥s processar df_meta_24_copy normalmente, voc√™ pode fazer:
# df_meta_24_copy_com_campos = adicionar_campos_licenca_a_meta(df_meta_24_copy, 'META(2024)')

print("üí° Descomente as linhas acima para testar a extra√ß√£o de campos")


In [None]:
# Fun√ß√£o para adicionar campos de licen√ßa √†s metas processadas
def adicionar_campos_licenca_a_meta(df_meta_processado, sheet_name_original):
    """
    Adiciona os campos de licen√ßa extra√≠dos √† meta j√° processada.
    
    Par√¢metros:
    - df_meta_processado: DataFrame da meta j√° processada
    - sheet_name_original: Nome da planilha original (ex: 'META(2024)')
    
    Retorna:
    - DataFrame com os campos de licen√ßa adicionados
    """
    # Extrair os campos da planilha original
    df_campos = extrair_campos_licenca_da_meta(sheet_name_original)
    
    if df_campos.empty:
        print(f"‚ö†Ô∏è Nenhum campo de licen√ßa encontrado para {sheet_name_original}")
        return df_meta_processado
    
    # Garantir que os √≠ndices sejam compat√≠veis
    if len(df_campos) != len(df_meta_processado):
        print(f"‚ö†Ô∏è Tamanhos diferentes: campos={len(df_campos)}, meta={len(df_meta_processado)}")
        # Tentar alinhar pelos √≠ndices
        df_campos = df_campos.reindex(df_meta_processado.index, fill_value=None)
    
    # Adicionar os campos ao DataFrame processado
    df_resultado = pd.concat([df_meta_processado, df_campos], axis=1)
    
    print(f"‚úÖ {len(df_campos.columns)} campos de licen√ßa adicionados √† meta {sheet_name_original}")
    print(f"   Campos adicionados: {list(df_campos.columns)}")
    
    return df_resultado

# Exemplo de uso para META 2024 (comentado):
# df_meta_24_com_campos = adicionar_campos_licenca_a_meta(df_meta_24_copy, 'META(2024)')

print("‚úÖ Fun√ß√£o adicionar_campos_licenca_a_meta criada!")
print("üí° Use esta fun√ß√£o ap√≥s processar cada meta para adicionar os campos de licen√ßa")


In [None]:
file_path = 'Planilha.xlsx'

In [None]:
# Carregar as planilhas
df_informacoes = pd.read_excel(FILE_PATH, sheet_name='INFORMA√á√ïES (1)')
df_per = pd.read_excel(FILE_PATH, sheet_name='PER (1)')
df_plan_exec_ano_ant = pd.read_excel(FILE_PATH, sheet_name='PLAN_EXEC AT√â ANO ANTERIOR (22)')
df_meta_23 = pd.read_excel(FILE_PATH, sheet_name='META(1) 2023')
df_meta_24 = pd.read_excel(FILE_PATH, sheet_name='META(2024)')
df_meta_25 = pd.read_excel(FILE_PATH, sheet_name='META(2025)')
df_meta_26 = pd.read_excel(FILE_PATH, sheet_name='META(2026)')
df_meta_27 = pd.read_excel(FILE_PATH, sheet_name='META(2027)')
df_inexec = pd.read_excel(FILE_PATH, sheet_name='iNEXECUTADO (pend√™ncias at√© 24)')
df_a_executar = pd.read_excel(FILE_PATH, sheet_name='√Ä EXECUTAR (2026 DIANTE)')

<h1><b><i>INFORMA√á√ïES (1)</b></i></h1>

In [None]:
#CHECKPOINT
df_informacoes_copy = df_informacoes.copy()

In [None]:
df_informacoes_copy = pd.read_excel(FILE_PATH, sheet_name='INFORMA√á√ïES (1)', header=2)
df_informacoes_copy.columns

In [None]:
df_informacoes_copy

In [None]:
df_informacoes_copy = df_informacoes_copy.drop([0, 1, 2], axis = 0)

In [None]:
df_informacoes_copy = df_informacoes_copy.dropna(subset=['BR'])

In [None]:
df_informacoes_copy['Etapa'] = None
df_informacoes_copy['Descri√ß√£o do Trecho'] = None
etapa_atual = None

for index, row in df_informacoes_copy.iterrows():
    if 'ETAPA' in str(row['TRECHO']):
        etapa_atual = row['TRECHO']
    df_informacoes_copy.at[index, 'Etapa'] = etapa_atual
    if pd.notna(row['TRECHO']) and 'ETAPA' not in str(row['TRECHO']):
        df_informacoes_copy.at[index, 'Descri√ß√£o do Trecho'] = row['TRECHO']

In [None]:
df_informacoes_copy.drop('TRECHO', axis=1, inplace=True)

In [None]:
# Updating the 'Regi√£o' column based on the 'UF' mapping
region_mapping = {
    'AC': 'Norte', 'AP': 'Norte', 'AM': 'Norte', 'PA': 'Norte', 'RO': 'Norte', 'RR': 'Norte', 'TO': 'Norte',
    'AL': 'Nordeste', 'BA': 'Nordeste', 'CE': 'Nordeste', 'MA': 'Nordeste', 'PB': 'Nordeste', 'PE': 'Nordeste',
    'PI': 'Nordeste', 'RN': 'Nordeste', 'SE': 'Nordeste',
    'DF': 'Centro-Oeste', 'GO': 'Centro-Oeste', 'MS': 'Centro-Oeste', 'MT': 'Centro-Oeste',
    'ES': 'Sudeste', 'MG': 'Sudeste', 'RJ': 'Sudeste', 'SP': 'Sudeste',
    'PR': 'Sul', 'SC': 'Sul', 'RS': 'Sul'
}
df_informacoes_copy['Regi√£o'] = df_informacoes_copy['UF'].map(region_mapping)

In [None]:
columns_to_fill = ['ESTADO/LOTE', 'EMPREENDIMENTO', 'PROPONENTE', 'EXECUTOR             (Grupo Controlador)',
       'ESTRUTURADOR DO PROJETO', 'ANO LEIL√ÉO', 'DATA DE IN√çCIO']
df_informacoes_copy[columns_to_fill] = df_informacoes_copy.groupby((df_informacoes_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_informacoes_copy['CAPEX (BI)'].unique()

In [None]:
df_informacoes_copy

In [None]:
df_informacoes_copy['Situa√ß√£o'] = df_informacoes_copy['KM Inicial'].apply(lambda x: x if str(x) in ['ATIVO', 'CADUCIDADE', 'JUDICIAL', 'RELICITA√á√ÉO', 'RENEGOCIA√á√ÉO'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_informacoes_copy['Situa√ß√£o'] = df_informacoes_copy['Situa√ß√£o'].fillna(method='ffill')

# Agora, separemos os valores num√©ricos para uma nova coluna 'KM Inicial Num'
df_informacoes_copy['km (i)'] = df_informacoes_copy['KM Inicial'].apply(lambda x: x if isinstance(x, float) else pd.NA)

In [None]:
df_informacoes_copy.drop('KM Inicial', axis=1, inplace=True)

In [None]:
# Renomear Coluna ['EXECUTOR...']
# DROP de Colunas e Realoca√ß√£o.

df_informacoes_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)
df_informacoes_copy.rename(columns={'EXTENS√ÉO\n (km)': 'EXTENS√ÉO (km)'}, inplace=True)
df_informacoes_copy.rename(columns={'KM Final': 'km (f)'}, inplace=True)

df_informacoes_copy = df_informacoes_copy[['Regi√£o', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO', 'PROPONENTE',
       'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO',
       'ANO LEIL√ÉO', 'DATA DE IN√çCIO', 'ANO DA CONCESS√ÉO',
       'PRAZO (anos)', 'CAPEX (BI)', 'OPEX (BI)', 'INVESTIMENTO TOTAL (BI)', 
       'Etapa', 'Descri√ß√£o do Trecho',
       'Situa√ß√£o', 'km (i)', 'km (f)', 'EXTENS√ÉO (km)']]

In [None]:
df_informacoes_copy['ESTRUTURADOR DO PROJETO'].unique()

In [None]:
df_informacoes_copy['PROPONENTE'].unique()

In [None]:
df_informacoes_copy.columns

In [None]:
# Converter colunas para 'category'
df_informacoes_copy['SETOR'] = df_informacoes_copy['SETOR'].astype('category')
df_informacoes_copy['UF'] = df_informacoes_copy['UF'].astype('category')
df_informacoes_copy['ESTADO/LOTE'] = df_informacoes_copy['ESTADO/LOTE'].astype('category')
df_informacoes_copy['PROPONENTE'] = df_informacoes_copy['PROPONENTE'].astype('category')
df_informacoes_copy['EXECUTOR (Grupo Controlador)'] = df_informacoes_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_informacoes_copy['ESTRUTURADOR DO PROJETO'] = df_informacoes_copy['ESTRUTURADOR DO PROJETO'].astype('category')

# Converter colunas para 'int'
df_informacoes_copy['ANO DA CONCESS√ÉO'] = pd.to_numeric(df_informacoes_copy['ANO DA CONCESS√ÉO'], errors='coerce').fillna(0).astype(int)
df_informacoes_copy['PRAZO (anos)'] = pd.to_numeric(df_informacoes_copy['PRAZO (anos)'], errors='coerce').fillna(0).astype(int)

# Converter colunas para 'float'
df_informacoes_copy['CAPEX (BI)'] = pd.to_numeric(df_informacoes_copy['CAPEX (BI)'], errors='coerce')
df_informacoes_copy['OPEX (BI)'] = pd.to_numeric(df_informacoes_copy['OPEX (BI)'], errors='coerce')
df_informacoes_copy['INVESTIMENTO TOTAL (BI)'] = df_informacoes_copy['INVESTIMENTO TOTAL (BI)'].replace('[\$]', '', regex=True).replace(',', '.', regex=True)
df_informacoes_copy['INVESTIMENTO TOTAL (BI)'] = pd.to_numeric(df_informacoes_copy['INVESTIMENTO TOTAL (BI)'], errors='coerce')

df_informacoes_copy['km (i)'] = pd.to_numeric(df_informacoes_copy['km (i)'], errors='coerce')
df_informacoes_copy['km (f)'] = pd.to_numeric(df_informacoes_copy['km (f)'], errors='coerce')
df_informacoes_copy['EXTENS√ÉO (km)'] = pd.to_numeric(df_informacoes_copy['EXTENS√ÉO (km)'], errors='coerce')

# Converter colunas para 'string'
df_informacoes_copy['EMPREENDIMENTO'] = df_informacoes_copy['EMPREENDIMENTO'].astype('string') 


In [None]:
# Fun√ß√£o para limpar e converter as datas para o formato datetime
def limpar_e_converter_data(data):
    # Tratar dados como string para evitar problemas com diferentes tipos
    data = str(data)
    # Substituir '//'' por '/'
    data = data.replace('//', '/')
    # Substituir '/' por '-'
    data = data.replace('/', '-')
    # Tentar converter para datetime
    return pd.to_datetime(data, errors='coerce', dayfirst=True)

# Aplicar a fun√ß√£o no DataFrame
# Substitua 'df_informacoes_copy' pelo nome do seu DataFrame e 'DATA DE IN√çCIO' pelo nome da coluna que cont√©m as datas
df_informacoes_copy['DATA DE IN√çCIO'] = df_informacoes_copy['DATA DE IN√çCIO'].apply(limpar_e_converter_data)

In [None]:
columns_to_fill = ['Regi√£o', 'ESTADO/LOTE', 'EMPREENDIMENTO', 'EXECUTOR (Grupo Controlador)']
df_informacoes_copy[columns_to_fill] = df_informacoes_copy.groupby((df_informacoes_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_informacoes_copy.index = range(1, len(df_informacoes_copy) + 1)

In [None]:
df_informacoes_copy.index.name = 'ID-√öNICO'

In [None]:
df_informacoes_copy

In [None]:
df_informacoes_copy['UF'].unique()

---

In [None]:
df_informacoes_copy = df_informacoes_copy[df_informacoes_copy['BR'] == 1]

In [None]:
columns_to_drop = ['SETOR', 'Regi√£o', 'Descri√ß√£o do Trecho', 'km (i)', 'km (f)']

# Removendo as colunas extras do DataFrame df_informacoes_copy
df_informacoes_copy = df_informacoes_copy.drop(columns=columns_to_drop)

In [None]:
# Dicion√°rio de renomea√ß√£o
rename_dict = {
    'UF': 'Regi√£o',
    'Etapa': 'ETAPA',
    'Situa√ß√£o': 'SITUA√á√ÉO'
}

# Renomear as colunas usando o dicion√°rio
df_informacoes_copy = df_informacoes_copy.rename(columns=rename_dict)

In [None]:
df_informacoes_copy = df_informacoes_copy[['Regi√£o', 'BR', 'EMPREENDIMENTO', 'PROPONENTE',
       'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO',
       'ANO LEIL√ÉO', 'DATA DE IN√çCIO', 'ANO DA CONCESS√ÉO',
       'PRAZO (anos)', 'CAPEX (BI)', 'OPEX (BI)', 'INVESTIMENTO TOTAL (BI)',
       'ETAPA', 'SITUA√á√ÉO', 'EXTENS√ÉO (km)', 'ESTADO/LOTE']]

In [None]:
# Realiza a substitui√ß√£o na coluna 'EMPREENDIMENTO'
df_informacoes_copy['EMPREENDIMENTO'] = df_informacoes_copy['EMPREENDIMENTO'].replace('CONCESS√ÉO VIA SUL', 'VIA SUL')

In [None]:
df_informacoes_copy.to_excel('Dados Gerados/INFORMA√á√ïES (1).xlsx', index=False, sheet_name='INFORMA√á√ïES (1)')

<h1><b><i>PER (1)</b></i></h1>

In [None]:
#CHECKPOINT
df_per_copy = df_per.copy()

In [None]:
df_per_copy = pd.read_excel(FILE_PATH, sheet_name='PER (1)', header=2)

In [None]:
df_per_copy

In [None]:
df_per_copy = df_per_copy.drop([0, 1, 2], axis = 0)

In [None]:
df_per_copy = df_per_copy.loc[df_per_copy['BR'] != 1]
df_per_copy = df_per_copy.dropna(subset=['BR'])

In [None]:
df_per_copy = df_per_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
df_per_copy['ESTADO/LOTE'] = df_per_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS',
       'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO',
       'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA',
       'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_per_copy['ESTADO/LOTE'] = df_per_copy['ESTADO/LOTE'].fillna(method='ffill')

In [None]:
df_per_copy

In [None]:
df_per_copy = df_per_copy[~df_per_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
# Renomear Coluna ['EXECUTOR...']

df_per_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)
df_per_copy.rename(columns={'PAVIMENTA√á√ÉO': 'PAVIMENTA√á√ÉO - < 2022 - Descri√ß√£o'}, inplace=True)
df_per_copy.rename(columns={'DUPLICA√á√ÉO': 'DUPLICA√á√ÉO - < 2022 - Descri√ß√£o'}, inplace=True)
df_per_copy.rename(columns={'OAE': 'OAE - < 2022 - Descri√ß√£o'}, inplace=True)
df_per_copy.rename(columns={'CONTORNO': 'CONTORNO - < 2022 - Descri√ß√£o'}, inplace=True)
df_per_copy.rename(columns={'FX ADICIONAL': 'FX ADICIONAL - < 2022 - Descri√ß√£o'}, inplace=True)
df_per_copy.rename(columns={'TERCEIRA FAIXA': 'TERCEIRA FAIXA - < 2022 - Descri√ß√£o'}, inplace=True)

In [None]:
df_per_copy

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - < 2022 - km (i)', 
                    'PAVIMENTA√á√ÉO - < 2022 - km (f)', 
                    'PAVIMENTA√á√ÉO - < 2022 - Ext. (km)', 
                    'PAVIMENTA√á√ÉO - < 2022 - PERCENTUAL (%)', 
                    'PAVIMENTA√á√ÉO - < 2022 - (km)%', 
                    'PAVIMENTA√á√ÉO - < 2022 - FINANCEIRO (R$)', 'PAVIMENTA√á√ÉO - 2023 - Descri√ß√£o', 
                    'PAVIMENTA√á√ÉO - 2023 - km (i)', 'PAVIMENTA√á√ÉO - 2023 - km (f)', 'PAVIMENTA√á√ÉO - 2023 - Ext. (km)', 
                    'PAVIMENTA√á√ÉO - 2023 - PERCENTUAL (%)', 'PAVIMENTA√á√ÉO - 2023 - (km)%', 'PAVIMENTA√á√ÉO - 2023 - FINANCEIRO (R$)', 
                    'PAVIMENTA√á√ÉO - 2024 - Descri√ß√£o', 'PAVIMENTA√á√ÉO - 2024 - km (i)', 'PAVIMENTA√á√ÉO - 2024 - km (f)', 
                    'PAVIMENTA√á√ÉO - 2024 - Ext. (km)', 'PAVIMENTA√á√ÉO - 2024 - PERCENTUAL (%)', 'PAVIMENTA√á√ÉO - 2024 - (km)%', 
                    'PAVIMENTA√á√ÉO - 2024 - FINANCEIRO (R$)', 'PAVIMENTA√á√ÉO - 2025 - Descri√ß√£o', 'PAVIMENTA√á√ÉO - 2025 - km (i)', 
                    'PAVIMENTA√á√ÉO - 2025 - km (f)', 'PAVIMENTA√á√ÉO - 2025 - Ext. (km)', 'PAVIMENTA√á√ÉO - 2025 - PERCENTUAL (%)', 
                    'PAVIMENTA√á√ÉO - 2025 - (km)%', 'PAVIMENTA√á√ÉO - 2025 - FINANCEIRO (R$)', 'PAVIMENTA√á√ÉO - 2026 - Descri√ß√£o', 
                    'PAVIMENTA√á√ÉO - 2026 - km (i)', 'PAVIMENTA√á√ÉO - 2026 - km (f)', 'PAVIMENTA√á√ÉO - 2026 - Ext. (km)', 
                    'PAVIMENTA√á√ÉO - 2026 - PERCENTUAL (%)', 'PAVIMENTA√á√ÉO - 2026 - (km)%', 'PAVIMENTA√á√ÉO - 2026 - FINANCEIRO (R$)', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - Descri√ß√£o', 'PAVIMENTA√á√ÉO - P√≥s 2026 - km (i)', 'PAVIMENTA√á√ÉO - P√≥s 2026 - km (f)', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - Ext. (km)', 'PAVIMENTA√á√ÉO - P√≥s 2026 - PERCENTUAL (%)', 'PAVIMENTA√á√ÉO - P√≥s 2026 - (km)%', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - FINANCEIRO (R$)', 'PAVIMENTA√á√ÉO - P√≥s 2026 - REL. F√çSICO (km)', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - REL.FINANCEIRO (R$)', 'DUPLICA√á√ÉO - < 2022 - Descri√ß√£o', 'DUPLICA√á√ÉO - < 2022 - km (i)', 
                    'DUPLICA√á√ÉO - < 2022 - km (f)', 'DUPLICA√á√ÉO - < 2022 - Ext. (km)', 'DUPLICA√á√ÉO - < 2022 - PERCENTUAL (%)', 
                    'DUPLICA√á√ÉO - < 2022 - (km)%', 'DUPLICA√á√ÉO - < 2022 - FINANCEIRO (R$)', 'DUPLICA√á√ÉO - 2023 - Descri√ß√£o', 
                    'DUPLICA√á√ÉO - 2023 - km (i)', 'DUPLICA√á√ÉO - 2023 - km (f)', 'DUPLICA√á√ÉO - 2023 - Ext. (km)', 
                    'DUPLICA√á√ÉO - 2023 - PERCENTUAL (%)', 'DUPLICA√á√ÉO - 2023 - (km)%', 'DUPLICA√á√ÉO - 2023 - FINANCEIRO (R$)', 
                    'DUPLICA√á√ÉO - 2024 - Descri√ß√£o', 'DUPLICA√á√ÉO - 2024 - km (i)', 'DUPLICA√á√ÉO - 2024 - km (f)', 
                    'DUPLICA√á√ÉO - 2024 - Ext. (km)', 'DUPLICA√á√ÉO - 2024 - PERCENTUAL (%)', 'DUPLICA√á√ÉO - 2024 - (km)%', 
                    'DUPLICA√á√ÉO - 2024 - FINANCEIRO (R$)', 'DUPLICA√á√ÉO - 2025 - Descri√ß√£o', 'DUPLICA√á√ÉO - 2025 - km (i)', 
                    'DUPLICA√á√ÉO - 2025 - km (f)', 'DUPLICA√á√ÉO - 2025 - Ext. (km)', 'DUPLICA√á√ÉO - 2025 - PERCENTUAL (%)', 
                    'DUPLICA√á√ÉO - 2025 - (km)%', 'DUPLICA√á√ÉO - 2025 - FINANCEIRO (R$)', 'DUPLICA√á√ÉO - 2026 - Descri√ß√£o', 
                    'DUPLICA√á√ÉO - 2026 - km (i)', 'DUPLICA√á√ÉO - 2026 - km (f)', 'DUPLICA√á√ÉO - 2026 - Ext. (km)', 
                    'DUPLICA√á√ÉO - 2026 - PERCENTUAL (%)', 'DUPLICA√á√ÉO - 2026 - (km)%', 'DUPLICA√á√ÉO - 2026 - FINANCEIRO (R$)', 
                    'DUPLICA√á√ÉO - P√≥s 2026 - Descri√ß√£o', 'DUPLICA√á√ÉO - P√≥s 2026 - km (i)', 'DUPLICA√á√ÉO - P√≥s 2026 - km (f)', 
                    'DUPLICA√á√ÉO - P√≥s 2026 - Ext. (km)', 'DUPLICA√á√ÉO - P√≥s 2026 - PERCENTUAL (%)', 'DUPLICA√á√ÉO - P√≥s 2026 - (km)%', 
                    'DUPLICA√á√ÉO - P√≥s 2026 - FINANCEIRO (R$)', 'DUPLICA√á√ÉO - P√≥s 2026 - REL. F√çSICO (km)', 'DUPLICA√á√ÉO - P√≥s 2026 - REL.FINANCEIRO (R$)', 
                    'OAE - < 2022 - Descri√ß√£o', 'OAE - < 2022 - km (i)', 'OAE - < 2022 - km (f)', 'OAE - < 2022 - Ext. (km)', 
                    'OAE - < 2022 - PERCENTUAL (%)', 'OAE - < 2022 - (km)%', 'OAE - < 2022 - FINANCEIRO (R$)', 'OAE - 2023 - Descri√ß√£o', 
                    'OAE - 2023 - km (i)', 'OAE - 2023 - km (f)', 'OAE - 2023 - Ext. (km)', 'OAE - 2023 - PERCENTUAL (%)', 
                    'OAE - 2023 - (km)%', 'OAE - 2023 - FINANCEIRO (R$)', 'OAE - 2024 - Descri√ß√£o', 'OAE - 2024 - km (i)', 
                    'OAE - 2024 - km (f)', 'OAE - 2024 - Ext. (km)', 'OAE - 2024 - PERCENTUAL (%)', 'OAE - 2024 - (km)%', 
                    'OAE - 2024 - FINANCEIRO (R$)', 'OAE - 2025 - Descri√ß√£o', 'OAE - 2025 - km (i)', 'OAE - 2025 - km (f)', 
                    'OAE - 2025 - Ext. (km)', 'OAE - 2025 - PERCENTUAL (%)', 'OAE - 2025 - (km)%', 'OAE - 2025 - FINANCEIRO (R$)', 
                    'OAE - 2026 - Descri√ß√£o', 'OAE - 2026 - km (i)', 'OAE - 2026 - km (f)', 'OAE - 2026 - Ext. (km)', 
                    'OAE - 2026 - PERCENTUAL (%)', 'OAE - 2026 - (km)%', 'OAE - 2026 - FINANCEIRO (R$)', 'OAE - P√≥s 2026 - Descri√ß√£o', 
                    'OAE - P√≥s 2026 - km (i)', 'OAE - P√≥s 2026 - km (f)', 'OAE - P√≥s 2026 - Ext. (km)', 'OAE - P√≥s 2026 - PERCENTUAL (%)', 
                    'OAE - P√≥s 2026 - (km)%', 'OAE - P√≥s 2026 - FINANCEIRO (R$)', 'OAE - P√≥s 2026 - REL. F√çSICO (km)', 'OAE - P√≥s 2026 - REL.FINANCEIRO (R$)', 
                    'CONTORNO - < 2022 - Descri√ß√£o', 'CONTORNO - < 2022 - km (i)', 'CONTORNO - < 2022 - km (f)', 'CONTORNO - < 2022 - Ext. (km)', 
                    'CONTORNO - < 2022 - PERCENTUAL (%)', 'CONTORNO - < 2022 - (km)%', 'CONTORNO - < 2022 - FINANCEIRO (R$)', 'CONTORNO - 2023 - Descri√ß√£o', 
                    'CONTORNO - 2023 - km (i)', 'CONTORNO - 2023 - km (f)', 'CONTORNO - 2023 - Ext. (km)', 'CONTORNO - 2023 - PERCENTUAL (%)', 
                    'CONTORNO - 2023 - (km)%', 'CONTORNO - 2023 - FINANCEIRO (R$)', 'CONTORNO - 2024 - Descri√ß√£o', 'CONTORNO - 2024 - km (i)', 
                    'CONTORNO - 2024 - km (f)', 'CONTORNO - 2024 - Ext. (km)', 'CONTORNO - 2024 - PERCENTUAL (%)', 'CONTORNO - 2024 - (km)%', 
                    'CONTORNO - 2024 - FINANCEIRO (R$)', 'CONTORNO - 2025 - Descri√ß√£o', 'CONTORNO - 2025 - km (i)', 'CONTORNO - 2025 - km (f)', 
                    'CONTORNO - 2025 - Ext. (km)', 'CONTORNO - 2025 - PERCENTUAL (%)', 'CONTORNO - 2025 - (km)%', 'CONTORNO - 2025 - FINANCEIRO (R$)', 
                    'CONTORNO - 2026 - Descri√ß√£o', 'CONTORNO - 2026 - km (i)', 'CONTORNO - 2026 - km (f)', 'CONTORNO - 2026 - Ext. (km)', 
                    'CONTORNO - 2026 - PERCENTUAL (%)', 'CONTORNO - 2026 - (km)%', 'CONTORNO - 2026 - FINANCEIRO (R$)', 'CONTORNO - P√≥s 2026 - Descri√ß√£o', 
                    'CONTORNO - P√≥s 2026 - km (i)', 'CONTORNO - P√≥s 2026 - km (f)', 'CONTORNO - P√≥s 2026 - Ext. (km)', 'CONTORNO - P√≥s 2026 - PERCENTUAL (%)', 
                    'CONTORNO - P√≥s 2026 - (km)%', 'CONTORNO - P√≥s 2026 - FINANCEIRO (R$)', 'CONTORNO - P√≥s 2026 - REL. F√çSICO (km)', 'CONTORNO - P√≥s 2026 - REL.FINANCEIRO (R$)', 
                    'FX ADICIONAL - < 2022 - Descri√ß√£o', 'FX ADICIONAL - < 2022 - km (i)', 'FX ADICIONAL - < 2022 - km (f)', 'FX ADICIONAL - < 2022 - Ext. (km)', 
                    'FX ADICIONAL - < 2022 - PERCENTUAL (%)', 'FX ADICIONAL - < 2022 - (km)%', 'FX ADICIONAL - < 2022 - FINANCEIRO (R$)', 'FX ADICIONAL - 2023 - Descri√ß√£o', 
                    'FX ADICIONAL - 2023 - km (i)', 'FX ADICIONAL - 2023 - km (f)', 'FX ADICIONAL - 2023 - Ext. (km)', 'FX ADICIONAL - 2023 - PERCENTUAL (%)', 
                    'FX ADICIONAL - 2023 - (km)%', 'FX ADICIONAL - 2023 - FINANCEIRO (R$)', 'FX ADICIONAL - 2024 - Descri√ß√£o', 'FX ADICIONAL - 2024 - km (i)', 
                    'FX ADICIONAL - 2024 - km (f)', 'FX ADICIONAL - 2024 - Ext. (km)', 'FX ADICIONAL - 2024 - PERCENTUAL (%)', 'FX ADICIONAL - 2024 - (km)%', 
                    'FX ADICIONAL - 2024 - FINANCEIRO (R$)', 'FX ADICIONAL - 2025 - Descri√ß√£o', 'FX ADICIONAL - 2025 - km (i)', 'FX ADICIONAL - 2025 - km (f)', 
                    'FX ADICIONAL - 2025 - Ext. (km)', 'FX ADICIONAL - 2025 - PERCENTUAL (%)', 'FX ADICIONAL - 2025 - (km)%', 'FX ADICIONAL - 2025 - FINANCEIRO (R$)', 
                    'FX ADICIONAL - 2026 - Descri√ß√£o', 'FX ADICIONAL - 2026 - km (i)', 'FX ADICIONAL - 2026 - km (f)', 'FX ADICIONAL - 2026 - Ext. (km)', 
                    'FX ADICIONAL - 2026 - PERCENTUAL (%)', 'FX ADICIONAL - 2026 - (km)%', 'FX ADICIONAL - 2026 - FINANCEIRO (R$)', 
                    'FX ADICIONAL - P√≥s 2026 - Descri√ß√£o', 'FX ADICIONAL - P√≥s 2026 - km (i)', 'FX ADICIONAL - P√≥s 2026 - km (f)', 
                    'FX ADICIONAL - P√≥s 2026 - Ext. (km)', 'FX ADICIONAL - P√≥s 2026 - PERCENTUAL (%)', 'FX ADICIONAL - P√≥s 2026 - (km)%', 
                    'FX ADICIONAL - P√≥s 2026 - FINANCEIRO (R$)', 'FX ADICIONAL - P√≥s 2026 - REL. F√çSICO (km)', 'FX ADICIONAL - P√≥s 2026 - REL.FINANCEIRO (R$)', 
                    'TERCEIRA FAIXA - < 2022 - Descri√ß√£o', 'TERCEIRA FAIXA - < 2022 - km (i)', 'TERCEIRA FAIXA - < 2022 - km (f)', 'TERCEIRA FAIXA - < 2022 - Ext. (km)', 
                    'TERCEIRA FAIXA - < 2022 - PERCENTUAL (%)', 'TERCEIRA FAIXA - < 2022 - (km)%', 'TERCEIRA FAIXA - < 2022 - FINANCEIRO (R$)', 'TERCEIRA FAIXA - 2023 - Descri√ß√£o', 
                    'TERCEIRA FAIXA - 2023 - km (i)', 'TERCEIRA FAIXA - 2023 - km (f)', 'TERCEIRA FAIXA - 2023 - Ext. (km)', 'TERCEIRA FAIXA - 2023 - PERCENTUAL (%)', 
                    'TERCEIRA FAIXA - 2023 - (km)%', 'TERCEIRA FAIXA - 2023 - FINANCEIRO (R$)', 'TERCEIRA FAIXA - 2024 - Descri√ß√£o', 'TERCEIRA FAIXA - 2024 - km (i)', 
                    'TERCEIRA FAIXA - 2024 - km (f)', 'TERCEIRA FAIXA - 2024 - Ext. (km)', 'TERCEIRA FAIXA - 2024 - PERCENTUAL (%)', 'TERCEIRA FAIXA - 2024 - (km)%', 
                    'TERCEIRA FAIXA - 2024 - FINANCEIRO (R$)', 'TERCEIRA FAIXA - 2025 - Descri√ß√£o', 'TERCEIRA FAIXA - 2025 - km (i)', 'TERCEIRA FAIXA - 2025 - km (f)', 
                    'TERCEIRA FAIXA - 2025 - Ext. (km)', 'TERCEIRA FAIXA - 2025 - PERCENTUAL (%)', 'TERCEIRA FAIXA - 2025 - (km)%', 'TERCEIRA FAIXA - 2025 - FINANCEIRO (R$)', 
                    'TERCEIRA FAIXA - 2026 - Descri√ß√£o', 'TERCEIRA FAIXA - 2026 - km (i)', 'TERCEIRA FAIXA - 2026 - km (f)', 'TERCEIRA FAIXA - 2026 - Ext. (km)', 
                    'TERCEIRA FAIXA - 2026 - PERCENTUAL (%)', 'TERCEIRA FAIXA - 2026 - (km)%', 'TERCEIRA FAIXA - 2026 - FINANCEIRO (R$)', 
                    'TERCEIRA FAIXA - P√≥s 2026 - Descri√ß√£o', 'TERCEIRA FAIXA - P√≥s 2026 - km (i)', 'TERCEIRA FAIXA - P√≥s 2026 - km (f)', 
                    'TERCEIRA FAIXA - P√≥s 2026 - Ext. (km)', 'TERCEIRA FAIXA - P√≥s 2026 - PERCENTUAL (%)', 'TERCEIRA FAIXA - P√≥s 2026 - (km)%', 
                    'TERCEIRA FAIXA - P√≥s 2026 - FINANCEIRO (R$)', 'TERCEIRA FAIXA - P√≥s 2026 - REL. F√çSICO (km)', 'TERCEIRA FAIXA - P√≥s 2026 - REL.FINANCEIRO (R$)']

In [None]:
df_meta_27_copy = df_meta_27.copy()
# Criar um dicion√°rio que mapeia qualquer coluna a partir do √≠ndice 9 para os novos nomes
rename_dict = {df_meta_27_copy.columns[i]: name for i, name in enumerate(new_column_names, start=9)}

# Usa o m√©todo rename para renomear as colunas, substituindo os nomes existentes
df_meta_27_copy.rename(columns=rename_dict, inplace=True)

In [None]:
df_per_copy['ESTRUTURADOR DO PROJETO'].unique()

In [None]:
df_per_copy['PROPONENTE'].unique()

In [None]:
df_per_copy['ESTRUTURADOR DO PROJETO'] = 'EPL'

In [None]:
df_per_copy['PROPONENTE'] = 'ANTT'

In [None]:
df_per_copy.index = range(1, len(df_per_copy) + 1)
df_per_copy.index.name = 'ID-√öNICO'
df_per_copy = df_per_copy.reset_index()

In [None]:
df_per_copy

In [None]:
df_per_raw = df_per_copy

In [None]:
# df_per_copy.to_excel('Dados Gerados/RAW_PER (1).xlsx', index=False)

In [None]:
colunas_manter = [
    'ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO', 'PROPONENTE',
    'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
]

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_per_copy.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_per_copy = df_per_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_per_copy

In [None]:
df_per_copy = df_per_copy.loc[df_per_copy['Valor'] != 0]
df_per_copy = df_per_copy.dropna(subset=['Valor'])

In [None]:
df_per_copy[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_per_copy['Atributo'].str.split(' - ', expand=True)


In [None]:
df_per_copy = df_per_copy[['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO', 'PROPONENTE',
    'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO', 'Atributo.1', 'Atributo.2', 'Atributo.3', 'Valor']]

In [None]:
'''# Converter colunas para 'category'
df_per_copy['SETOR'] =  df_per_copy['SETOR'].astype('category')
df_per_copy['UF'] =  df_per_copy['UF'].astype('category')
df_per_copy['PROPONENTE'] =  df_per_copy['PROPONENTE'].astype('category')
df_per_copy['EXECUTOR (Grupo Controlador)'] =  df_per_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_per_copy['ESTRUTURADOR DO PROJETO'] =  df_per_copy['ESTRUTURADOR DO PROJETO'].astype('category')
df_per_copy['Atributo.1'] =  df_per_copy['Atributo.1'].astype('category')
df_per_copy['Atributo.2'] =  df_per_copy['Atributo.2'].astype('category')

# Converter colunas para 'string'
df_per_copy['EMPREENDIMENTO'] =  df_per_copy['EMPREENDIMENTO'].astype('string') 
'''

In [None]:
df_per_copy

In [None]:
df_per_copy.to_excel('Dados Gerados/PER (1).xlsx', index=False)

---

In [None]:
df_per_raw

In [None]:
# Drop na coluna 'Regi√£o' que n√£o √© usada.
df_per_raw.drop(columns=['ID-√öNICO'], inplace=True)

In [None]:
df_per_raw.index = range(1, len(df_per_raw) + 1)
df_per_raw.index.name = 'ID-√öNICO'
df_per_raw = df_per_raw.reset_index()

In [None]:
df_per_raw = df_per_raw.sort_values(by='ID-√öNICO', ascending=True)

In [None]:
# Lista de strings que devem estar no nome das colunas para serem mantidas
keywords_to_keep = [
    'ID-√öNICO', 'SETOR', 'EMPREENDIMENTO', 
    'Descri√ß√£o', 'Ext. (km)', 'FINANCEIRO (R$)', 
    '(km)%'
]

# Identifica colunas que possuem qualquer uma das strings na lista de keywords
columns_to_keep = [col for col in df_per_raw.columns if any(keyword in col for keyword in keywords_to_keep)]

In [None]:
# Mant√©m apenas as colunas identificadas
df_per_raw = df_per_raw[columns_to_keep]

In [None]:
df_per_raw.columns

In [None]:
# Seleciona colunas da posi√ß√£o em diante
cols_a_verificar = df_per_raw.iloc[:, 3:]

# Remove linhas onde todas essas colunas est√£o vazias
df_per_raw = df_per_raw.dropna(subset=cols_a_verificar.columns, how='all')

In [None]:
# Primeiro, crie df_meta_25_raw se ele n√£o existir
if 'df_meta_25' in locals() or 'df_meta_25' in globals():
    df_meta_25_raw = df_meta_25.copy()
    print("df_meta_25_raw criado a partir de df_meta_25")
else:
    # Ou carregue do arquivo
    df_meta_25_raw = pd.read_excel(FILE_PATH, sheet_name='META(2025)')
    print("df_meta_25_raw carregado do arquivo")
df_a_executar_copy = df_a_executar.copy()
# Agora execute o c√≥digo de renomea√ß√£o
rename_dict = {df_meta_25_raw.columns[i]: name for i, name in enumerate(new_column_names, start=9)}
df_meta_25_raw.rename(columns=rename_dict, inplace=True)
# Criar um dicion√°rio que mapeia qualquer coluna a partir do √≠ndice 9 para os novos nomes
rename_dict = {df_meta_25_raw.columns[i]: name for i, name in enumerate(new_column_names, start=9)}

# Usa o m√©todo rename para renomear as colunas, substituindo os nomes existentes
df_a_executar_copy.rename(columns=rename_dict, inplace=True)

In [None]:
# Identifica colunas que possuem a string 'OBSERVA√á√ïES' em seu nome (preserva colunas de RISCOS)
columns_to_drop = [col for col in df_a_executar_copy.columns if 'OBSERVA√á√ïES' in col]
if columns_to_drop:
    df_a_executar_copy = df_a_executar_copy.drop(columns=columns_to_drop)

In [None]:
df_a_executar_copy

In [None]:
# 1. Recarregar a planilha com os par√¢metros corretos
df_a_executar = pd.read_excel(FILE_PATH, sheet_name='√Ä EXECUTAR (2026 DIANTE)', header=2)

# 2. Fazer uma c√≥pia para processamento
df_a_executar_copy = df_a_executar.copy()

# 3. Verificar se carregou corretamente
print("‚úÖ DataFrame carregado corretamente")
print(f"Shape: {df_a_executar_copy.shape}")
print(f"\nPrimeiras colunas:")
for i, col in enumerate(df_a_executar_copy.columns[:10], 1):
    print(f"{i:2}. '{col}'")

# 4. Verificar se a coluna 'ESTADO/LOTE' existe
if 'ESTADO/LOTE' in df_a_executar_copy.columns:
    print(f"\n‚úÖ Coluna 'ESTADO/LOTE' encontrada!")
    print(f"Valores √∫nicos: {df_a_executar_copy['ESTADO/LOTE'].unique()[:10]}")  # Primeiros 10 valores √∫nicos
else:
    print("\n‚ùå Coluna 'ESTADO/LOTE' N√ÉO encontrada!")

In [None]:
columns_to_fill = ['EMPREENDIMENTO']
df_a_executar_copy[columns_to_fill] = df_a_executar_copy.groupby((df_a_executar_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_per_raw1 = df_per_raw[['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO']]

In [None]:
df_a_executar_copy = df_a_executar_copy[~df_a_executar_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO']

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_per_raw.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_per_raw = df_per_raw.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_per_raw['SETOR'] = 'Rodovi√°rio'

In [None]:
df_per_raw

In [None]:
df_per_raw[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_per_raw['Atributo'].str.split(' - ', expand=True)

In [None]:
df_per_raw = df_per_raw[['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO', 'Atributo.1', 'Atributo.2', 'Valor']]

In [None]:
df_per_raw.columns

In [None]:
df_per_raw

In [None]:
df_per_raw.dropna(subset=['Valor'])

In [None]:
# Pivotar o DataFrame
df_per_raw = df_per_raw.pivot_table(index=['ID-√öNICO', 'Atributo.1'], 
                                            columns='Atributo.2', values='Valor', aggfunc='first').reset_index()

In [None]:
df_per_raw.columns

In [None]:
df_per_raw

In [None]:
# Remove a coluna de √≠ndice indesejada, se existir
if 'Atributo.2' in df_per_raw.columns:
    df_per_raw = df_per_raw.drop(columns='Atributo.2')

In [None]:
df_per_raw1

In [None]:
# Faz o merge com base na coluna 'ID-√öNICO'
df_per_raw = pd.merge(df_per_raw1, df_per_raw, on='ID-√öNICO', how='inner')

In [None]:
df_per_raw

In [None]:
df_per_raw = df_per_raw.dropna(subset=['Atributo.1'])

In [None]:
df_per_raw

In [None]:
df_per_raw.columns

In [None]:
df_per_raw = df_per_raw[['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO', 'Atributo.1', 'Descri√ß√£o',
            'Ext. (km)', '(km)%', 'FINANCEIRO (R$)']]

In [None]:
# Renomear Colunas
df_per_raw.rename(columns={'ID-√öNICO': 'ID-√öNICO1'}, inplace=True)
df_per_raw.rename(columns={'SETOR': 'SETOR2'}, inplace=True)
df_per_raw.rename(columns={'EMPREENDIMENTO': 'EMPREENDIMENTO2'}, inplace=True)
df_per_raw.rename(columns={'Descri√ß√£o': 'Descri√ß√£o2'}, inplace=True)
df_per_raw.rename(columns={'Ext. (km)': 'Ext.(km)2'}, inplace=True)
df_per_raw.rename(columns={'FINANCEIRO (R$)': 'FINANCEIRO(R$)2'}, inplace=True)
df_per_raw.rename(columns={'(km)%': '(km)%2'}, inplace=True)

In [None]:
df_per_raw

In [None]:
df_per_raw.to_excel('PER(2).xlsx', sheet_name= 'PER(2)', index= False)

<h1><b><i>PLAN_EXEC AT√â ANO ANTERIOR (22) -> (24)** </b></i></h1>

In [None]:
#CHECKPOINT
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant.copy()

In [None]:
df_plan_exec_ano_ant_copy = pd.read_excel(file_path, sheet_name='PLAN_EXEC AT√â ANO ANTERIOR (22)', header=2)

In [None]:
df_plan_exec_ano_ant_copy

In [None]:
df_plan_exec_ano_ant_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
columns_to_fill = ['SETOR', 'UF', 'BR', 'EMPREENDIMENTO', 'PROPONENTE',
       'EXECUTOR             (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO']
df_plan_exec_ano_ant_copy[columns_to_fill] = df_plan_exec_ano_ant_copy.groupby((df_plan_exec_ano_ant_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_plan_exec_ano_ant_copy['ESTADO/LOTE'] = df_plan_exec_ano_ant_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS',
       'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO',
       'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA',
       'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_plan_exec_ano_ant_copy['ESTADO/LOTE'] = df_plan_exec_ano_ant_copy['ESTADO/LOTE'].fillna(method='ffill')

In [None]:
# Renomear Coluna ['EXECUTOR...']

df_plan_exec_ano_ant_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)
df_plan_exec_ano_ant_copy.rename(columns={'PAVIMENTA√á√ÉO                                                                                                                                                                                                                                                                                                                           (Acumulada at√© 2022)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_plan_exec_ano_ant_copy.rename(columns={'DUPLICA√á√ÉO                                                                                                                                                                                                                                                                                                  (Acumulada at√© 2022)': 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_plan_exec_ano_ant_copy.rename(columns={'OAE                                                                                                                                                                                                                                                                                                               (Acumulada at√© 2022)': 'OAE - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_plan_exec_ano_ant_copy.rename(columns={'CONTORNO                                                                                                                                                                                                                                                                                                          (Acumulada at√© 2022)': 'CONTORNO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_plan_exec_ano_ant_copy.rename(columns={'FX ADICIONAL                                                                                                                                                                                                                                                                (Acumulada at√© 2022)': 'FX ADICIONAL - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_plan_exec_ano_ant_copy.rename(columns={'TERCEIRA FAIXA                                                                                                                                                                                                                                                                       (Acumulada at√© 2022)': 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - km (i)', 
                    'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - km (f)', 
                    'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Ext. (km)', 
                    'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
                    'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - (km)% PLAN', 
                    'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)',
                    'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC',
                    'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - (km)% EXEC',
                    'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o',
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - km (i)', 
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - km (f)', 
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Ext. (km)', 
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - (km)% PLAN', 
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)',
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC',
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - (km)% EXEC',
                    'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
                    'OAE - (Acumulada at√© ano anterior) - Descri√ß√£o',
                    'OAE - (Acumulada at√© ano anterior) - km (i)', 
                    'OAE - (Acumulada at√© ano anterior) - km (f)', 
                    'OAE - (Acumulada at√© ano anterior) - Ext. (km)', 
                    'OAE - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
                    'OAE - (Acumulada at√© ano anterior) - (km)% PLAN', 
                    'OAE - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)',
                    'OAE - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC',
                    'OAE - (Acumulada at√© ano anterior) - (km)% EXEC',
                    'OAE - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
                    'CONTORNO - (Acumulada at√© ano anterior) - Descri√ß√£o',
                    'CONTORNO - (Acumulada at√© ano anterior) - km (i)', 
                    'CONTORNO - (Acumulada at√© ano anterior) - km (f)', 
                    'CONTORNO - (Acumulada at√© ano anterior) - Ext. (km)', 
                    'CONTORNO - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
                    'CONTORNO - (Acumulada at√© ano anterior) - (km)% PLAN', 
                    'CONTORNO - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)',
                    'CONTORNO - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC',
                    'CONTORNO - (Acumulada at√© ano anterior) - (km)% EXEC',
                    'CONTORNO - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - Descri√ß√£o',
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - km (i)', 
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - km (f)', 
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - Ext. (km)', 
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - (km)% PLAN', 
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)',
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC',
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - (km)% EXEC',
                    'FX ADICIONAL - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - Descri√ß√£o',
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - km (i)', 
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - km (f)', 
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - Ext. (km)', 
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - (km)% PLAN', 
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)',
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC',
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - (km)% EXEC',
                    'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - FINANCEIRO (R$)']

In [None]:
# Criar um dicion√°rio que mapeia 'Unnamed: x' para os novos nomes
rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=9)}

# Usar o m√©todo rename para renomear as colunas
df_plan_exec_ano_ant_copy.rename(columns=rename_dict, inplace=True)

In [None]:
# Encontrar o √≠ndice da coluna 'Unnamed: 69'
idx = df_plan_exec_ano_ant_copy.columns.get_loc("Unnamed: 69")

# Remover todas as colunas a partir deste √≠ndice
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy.iloc[:, :idx]

In [None]:
# Identifica colunas que possuem as strings 'RISCOS' ou 'OBSERVA√á√ïES' em seu nome
columns_to_drop = [col for col in df_plan_exec_ano_ant_copy.columns if 'RISCOS' in col or 'OBSERVA√á√ïES' in col]

# Remove as colunas identificadas
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy.drop(columns=columns_to_drop)

In [None]:
df_plan_exec_ano_ant_copy.columns

In [None]:
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy.drop([0, 1, 2], axis = 0)

In [None]:
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy[~df_plan_exec_ano_ant_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
df_plan_exec_ano_ant_copy

In [None]:
df_plan_exec_ano_ant_copy.columns

In [None]:
df_plan_exec_ano_ant_copy.index = range(1, len(df_plan_exec_ano_ant_copy) + 1)
df_plan_exec_ano_ant_copy.index.name = 'ID-√öNICO'
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy.reset_index()

In [None]:
df_plan_exec_ano_ant_raw = df_plan_exec_ano_ant_copy

In [None]:
# df_plan_exec_ano_ant_copy.to_excel('Dados Gerados/RAW_PLAN_EXEC AT√â ANO ANTERIOR (22).xlsx', index=False)

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
]

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_plan_exec_ano_ant_copy.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy.loc[df_plan_exec_ano_ant_copy['Valor'] != 0]
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy.dropna(subset=['Valor'])

In [None]:
df_plan_exec_ano_ant_copy[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_plan_exec_ano_ant_copy['Atributo'].str.split(' - ', expand=True)

In [None]:
# DROP de ['Atributo'] e Realocar ['Valor'] para o final da Tabela.

df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy[['SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
       , 'Atributo.1', 'Atributo.2', 'Atributo.3', 'Valor']]

In [None]:
# Converter colunas para 'category'
df_plan_exec_ano_ant_copy['SETOR'] = df_plan_exec_ano_ant_copy['SETOR'].astype('category')
df_plan_exec_ano_ant_copy['UF'] = df_plan_exec_ano_ant_copy['UF'].astype('category')
df_plan_exec_ano_ant_copy['PROPONENTE'] = df_plan_exec_ano_ant_copy['PROPONENTE'].astype('category')
df_plan_exec_ano_ant_copy['EXECUTOR (Grupo Controlador)'] = df_plan_exec_ano_ant_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_plan_exec_ano_ant_copy['ESTRUTURADOR DO PROJETO'] = df_plan_exec_ano_ant_copy['ESTRUTURADOR DO PROJETO'].astype('category')
df_plan_exec_ano_ant_copy['Atributo.1'] = df_plan_exec_ano_ant_copy['Atributo.1'].astype('category')
df_plan_exec_ano_ant_copy['Atributo.2'] = df_plan_exec_ano_ant_copy['Atributo.2'].astype('category')

# Converter colunas para 'string'
df_plan_exec_ano_ant_copy['EMPREENDIMENTO'] = df_plan_exec_ano_ant_copy['EMPREENDIMENTO'].astype('string') 


---

<h1><b><i>'META(2023)'</b></i></h1>

In [None]:
#CHECKPOINT
df_meta_23_copy = df_meta_23.copy()

In [None]:
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)

In [None]:
df_meta_23_copy

In [None]:
df_meta_23_copy = df_meta_23_copy.drop([0, 1, 2], axis = 0)

In [None]:
df_meta_23_copy.columns

In [None]:
# Drop na coluna 'Regi√£o' que n√£o √© usada.
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)

In [None]:
# Removendo colunas
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)

In [None]:
# Renomear Colunas

df_meta_23_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO                                                                                                                                                                                                                                                                                     (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_23_copy.rename(columns={'DUPLICA√á√ÉO                                                                                                                                                                                                                                                                                               (Ano 2023)': 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_23_copy.rename(columns={'OAE                                                                                                                                                                                                                                                                                                                    (Ano 2023)': 'OAE - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_23_copy.rename(columns={'CONTORNO                                                                                                                                                                                                                                                                                                             (Ano 2023)': 'CONTORNO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_23_copy.rename(columns={'FX ADICIONAL                                                                                                                                                                                                                                                                                                     (Ano 2023)': 'FX ADICIONAL - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_23_copy.rename(columns={'TERCEIRA FAIXA                                                                                                                                                                                                                                                                                         (Ano 2023)': 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - km (i)', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - km (f)', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Ext. (km)', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - km (i)', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - km (f)', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Ext. (km)', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'OAE - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'OAE - (Acumulada at√© ano anterior) - km (i)', 
 'OAE - (Acumulada at√© ano anterior) - km (f)', 
 'OAE - (Acumulada at√© ano anterior) - Ext. (km)', 
 'OAE - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'OAE - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'OAE - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'OAE - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'OAE - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'OAE - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'CONTORNO - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'CONTORNO - (Acumulada at√© ano anterior) - km (i)', 
 'CONTORNO - (Acumulada at√© ano anterior) - km (f)', 
 'CONTORNO - (Acumulada at√© ano anterior) - Ext. (km)', 
 'CONTORNO - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'CONTORNO - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'CONTORNO - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'CONTORNO - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'CONTORNO - (Acumulada at√© ano anterior) - (km)% EXEC',
 'CONTORNO - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'FX ADICIONAL - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'FX ADICIONAL - (Acumulada at√© ano anterior) - km (i)',
 'FX ADICIONAL - (Acumulada at√© ano anterior) - km (f)', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - Ext. (km)', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - km (i)', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - km (f)', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - Ext. (km)', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - FINANCEIRO (R$)']


In [None]:
# Criar um dicion√°rio que mapeia 'Unnamed: x' para os novos nomes
rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=178)}

# Usar o m√©todo rename para renomear as colunas
df_meta_23_copy.rename(columns=rename_dict, inplace=True)

In [None]:
# Identifica colunas que possuem a string 'OBSERVA√á√ïES' em seu nome
columns_to_drop = [col for col in df_meta_23_copy.columns if 'OBSERVA√á√ïES' in col]

# Remove as colunas identificadas
df_meta_23_copy = df_meta_23_copy.drop(columns=columns_to_drop)

In [None]:
df_meta_23_copy.columns

In [None]:
df_meta_23_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
columns_to_fill = ['EMPREENDIMENTO']
df_meta_23_copy[columns_to_fill] = df_meta_23_copy.groupby((df_meta_23_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS',
       'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO',
       'MATO GROSSO', 'PAR√Å', 'RIO/SP', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA',
       'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')

In [None]:
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
df_meta_23_copy.columns

In [None]:
df_meta_23_copy.index = range(1, len(df_meta_23_copy) + 1)
df_meta_23_copy.index.name = 'ID-√öNICO'
df_meta_23_copy = df_meta_23_copy.reset_index()

In [None]:
df_meta_23_raw = df_meta_23_copy

In [None]:
# df_meta_23_copy.to_excel('Dados Gerados/RAW_META(2023).xlsx', index=False)

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO']

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_meta_23_copy.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_meta_23_copy['EMPREENDIMENTO'].unique()

In [None]:
df_meta_23_copy = df_meta_23_copy.loc[df_meta_23_copy['Valor'] != 0]
df_meta_23_copy = df_meta_23_copy.dropna(subset=['Valor'])

In [None]:
df_meta_23_copy[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_meta_23_copy['Atributo'].str.split(' - ', expand=True)

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

In [None]:
# DROP de ['Atributo'] e Realocar ['Valor'] para o final da Tabela.

df_meta_23_copy = df_meta_23_copy[['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
       , 'Atributo.1', 'Atributo.2', 'Atributo.3', 'Valor']]

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

In [None]:
# Converter colunas para 'category'
df_meta_23_copy['SETOR'] = df_meta_23_copy['SETOR'].astype('category')
df_meta_23_copy['UF'] = df_meta_23_copy['UF'].astype('category')
df_meta_23_copy['PROPONENTE'] = df_meta_23_copy['PROPONENTE'].astype('category')
df_meta_23_copy['EXECUTOR (Grupo Controlador)'] = df_meta_23_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_meta_23_copy['ESTRUTURADOR DO PROJETO'] = df_meta_23_copy['ESTRUTURADOR DO PROJETO'].astype('category')
df_meta_23_copy['Atributo.1'] = df_meta_23_copy['Atributo.1'].astype('category')
df_meta_23_copy['Atributo.2'] = df_meta_23_copy['Atributo.2'].astype('category')

# Converter colunas para 'string'
df_meta_23_copy['EMPREENDIMENTO'] = df_meta_23_copy['EMPREENDIMENTO'].astype('string') 


In [None]:
df_meta_23_copy.to_excel('Dados Gerados/META(2023).xlsx', index=False, sheet_name= 'META(23)')

---

<h1><b><i>'META(2024)'</b></i></h1>

In [None]:
#CHECKPOINT
df_meta_24_copy = df_meta_24.copy()

In [None]:
df_meta_24_copy = pd.read_excel(file_path, sheet_name='META(2024)', header=2)

In [None]:
df_meta_24_copy

In [None]:
df_meta_24_copy = df_meta_24_copy.drop([0, 1, 2], axis = 0)

In [None]:
df_meta_24_copy.columns

In [None]:
# Drop na coluna 'Regi√£o' que n√£o √© usada.
df_meta_24_copy.drop(columns=['Regi√£o'], inplace=True)

In [None]:
# Removendo colunas
df_meta_24_copy = df_meta_24_copy.drop(df_meta_24_copy.columns[8:176], axis=1)

In [None]:
# Renomear Colunas

df_meta_24_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)
df_meta_24_copy.rename(columns={'PAVIMENTA√á√ÉO                                                                                                                                                                                                                                                                                     (Ano 2024)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_24_copy.rename(columns={'DUPLICA√á√ÉO                                                                                                                                                                                                                                                                                               (Ano 2024)': 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_24_copy.rename(columns={'OAE                                                                                                                                                                                                                                                                                                               (Ano 2024)': 'OAE - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_24_copy.rename(columns={'CONTORNO                                                                                                                                                                                                                                                                                                                   (Ano 2024)': 'CONTORNO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_24_copy.rename(columns={'FX ADICIONAL                                                                                                                                                                                                                                                                                                     (Ano 2024)': 'FX ADICIONAL - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_meta_24_copy.rename(columns={'TERCEIRA FAIXA                                                                                                                                                                                                                                                                                         (Ano 2024)': 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)

df_meta_24_copy.rename(columns={'RISCOS (Pavimenta√ß√£o)       ': 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_meta_24_copy.rename(columns={'RISCOS (Duplica√ß√£o)       ': 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_meta_24_copy.rename(columns={'RISCOS (OAE)       ': 'RISCOS (OAE) - SITUA√á√ÉO'}, inplace=True)
df_meta_24_copy.rename(columns={'RISCOS (Contorno)       ': 'RISCOS (Contorno) - SITUA√á√ÉO'}, inplace=True)
df_meta_24_copy.rename(columns={'RISCOS (FX Adicional)       ': 'RISCOS (Faixa Adicional) - SITUA√á√ÉO'}, inplace=True)
df_meta_24_copy.rename(columns={'RISCOS (Terceira Faixa)       ': 'RISCOS (Terceira Faixa) - SITUA√á√ÉO'}, inplace=True)

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - km (i)', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - km (f)', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Ext. (km)', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Pavimenta√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Pavimenta√ß√£o) - PRINCIPAL',
 'RISCOS (Pavimenta√ß√£o) - N√çVEL DE ALERTA',
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - km (i)', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - km (f)', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Ext. (km)', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Duplica√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Duplica√ß√£o) - PRINCIPAL',
 'RISCOS (Duplica√ß√£o) - N√çVEL DE ALERTA',
 'OAE - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'OAE - (Acumulada at√© ano anterior) - km (i)', 
 'OAE - (Acumulada at√© ano anterior) - km (f)', 
 'OAE - (Acumulada at√© ano anterior) - Ext. (km)', 
 'OAE - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'OAE - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'OAE - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'OAE - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'OAE - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'OAE - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'RISCOS (OAE) - SITUA√á√ÉO',
 'RISCOS (OAE) - INTERFER√äNCIA',
 'RISCOS (OAE) - PRINCIPAL',
 'RISCOS (OAE) - N√çVEL DE ALERTA',
 'CONTORNO - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'CONTORNO - (Acumulada at√© ano anterior) - km (i)', 
 'CONTORNO - (Acumulada at√© ano anterior) - km (f)', 
 'CONTORNO - (Acumulada at√© ano anterior) - Ext. (km)', 
 'CONTORNO - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'CONTORNO - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'CONTORNO - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'CONTORNO - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'CONTORNO - (Acumulada at√© ano anterior) - (km)% EXEC',
 'CONTORNO - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'RISCOS (Contorno) - SITUA√á√ÉO',
 'RISCOS (Contorno) - INTERFER√äNCIA',
 'RISCOS (Contorno) - PRINCIPAL',
 'RISCOS (Contorno) - N√çVEL DE ALERTA',
 'FX ADICIONAL - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'FX ADICIONAL - (Acumulada at√© ano anterior) - km (i)',
 'FX ADICIONAL - (Acumulada at√© ano anterior) - km (f)', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - Ext. (km)', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'FX ADICIONAL - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'FX ADICIONAL - (Acumulada at√© ano anterior) - Descri√ß√£o',
 'RISCOS (Faixa Adicional) - SITUA√á√ÉO',
 'RISCOS (Faixa Adicional) - INTERFER√äNCIA',
 'RISCOS (Faixa Adicional) - PRINCIPAL',
 'RISCOS (Faixa Adicional) - N√çVEL DE ALERTA',
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - km (i)', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - km (f)', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - Ext. (km)', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - PERCENTUAL (%) PLAN', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - (km)% PLAN', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - FINANCEIRO PLAN (R$)', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - PERCENTUAL (%) EXEC', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - (km)% EXEC', 
 'TERCEIRA FAIXA - (Acumulada at√© ano anterior) - FINANCEIRO (R$)',
 'RISCOS (Terceira Faixa) - SITUA√á√ÉO',
 'RISCOS (Terceira Faixa) - INTERFER√äNCIA',
 'RISCOS (Terceira Faixa) - PRINCIPAL',
 'RISCOS (Terceira Faixa) - N√çVEL DE ALERTA']


In [None]:
# Criar um dicion√°rio que mapeia 'Unnamed: x' para os novos nomes
rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=178)}

# Usar o m√©todo rename para renomear as colunas
df_meta_24_copy.rename(columns=rename_dict, inplace=True)

In [None]:
# Identifica colunas que possuem as strings 'RISCOS' ou 'OBSERVA√á√ïES' em seu nome
columns_to_drop = [col for col in df_meta_24_copy.columns if 'RISCOS' in col or 'OBSERVA√á√ïES' in col]

# Remove as colunas identificadas
df_meta_24_copy = df_meta_24_copy.drop(columns=columns_to_drop)

In [None]:
df_meta_24_copy.columns

In [None]:
df_meta_24_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
columns_to_fill = ['EMPREENDIMENTO']
df_meta_24_copy[columns_to_fill] = df_meta_24_copy.groupby((df_meta_24_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_meta_24_copy['ESTADO/LOTE'] = df_meta_24_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS',
       'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO',
       'MATO GROSSO', 'PAR√Å', 'RIO/SP', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA',
       'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_meta_24_copy['ESTADO/LOTE'] = df_meta_24_copy['ESTADO/LOTE'].fillna(method='ffill')

In [None]:
df_meta_24_copy = df_meta_24_copy[~df_meta_24_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
df_meta_24_copy.columns

In [None]:
df_meta_24_copy.index = range(1, len(df_meta_24_copy) + 1)
df_meta_24_copy.index.name = 'ID-√öNICO'
df_meta_24_copy = df_meta_24_copy.reset_index()

In [None]:
df_meta_24_raw = df_meta_24_copy

In [None]:
# df_meta_24_copy.to_excel('Dados Gerados/RAW_META(2024).xlsx', index=False)

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO']

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_meta_24_copy.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_meta_24_copy = df_meta_24_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_meta_24_copy['EMPREENDIMENTO'].unique()

In [None]:
df_meta_24_copy = df_meta_24_copy.loc[df_meta_24_copy['Valor'] != 0]
df_meta_24_copy = df_meta_24_copy.dropna(subset=['Valor'])

In [None]:
df_meta_24_copy[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_meta_24_copy['Atributo'].str.split(' - ', expand=True)

In [None]:
# DROP de ['Atributo'] e Realocar ['Valor'] para o final da Tabela.

df_meta_24_copy = df_meta_24_copy[['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
       , 'Atributo.1', 'Atributo.2', 'Atributo.3', 'Valor']]

In [None]:
df_meta_24_copy

In [None]:
'''df_meta_24_copy['Atributo.1'] = df_meta_24_copy['Atributo.1'].apply(
    lambda x: x.replace('CONTORNO (Ano Vigente)', 'CONTORNO')
              .replace('DUPLICA√á√ÉO (Ano Vigente)', 'DUPLICA√á√ÉO')
              .replace('FX ADICIONAL (Ano Vigente)', 'FX ADICIONAL')
              .replace('OAE (Ano Vigente)', 'OAE')
              .replace('PAVIMENTA√á√ÉO (Ano Vigente)', 'PAVIMENTA√á√ÉO')
              .replace('TERCEIRA FAIXA (Ano Vigente)', 'TERCEIRA FAIXA')
)'''

In [None]:
# Converter colunas para 'category'
df_meta_24_copy['SETOR'] = df_meta_24_copy['SETOR'].astype('category')
df_meta_24_copy['UF'] = df_meta_24_copy['UF'].astype('category')
df_meta_24_copy['PROPONENTE'] = df_meta_24_copy['PROPONENTE'].astype('category')
df_meta_24_copy['EXECUTOR (Grupo Controlador)'] = df_meta_24_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_meta_24_copy['ESTRUTURADOR DO PROJETO'] = df_meta_24_copy['ESTRUTURADOR DO PROJETO'].astype('category')
df_meta_24_copy['Atributo.1'] = df_meta_24_copy['Atributo.1'].astype('category')
df_meta_24_copy['Atributo.2'] = df_meta_24_copy['Atributo.2'].astype('category')

# Converter colunas para 'string'
df_meta_24_copy['EMPREENDIMENTO'] = df_meta_24_copy['EMPREENDIMENTO'].astype('string') 


In [None]:
df_meta_24_copy = df_meta_24_copy.sort_values(by='ID-√öNICO', ascending=True)

In [None]:
df_meta_24_copy.to_excel('Dados Gerados/META(2024).xlsx', index=False, sheet_name= 'META')

---

# Exec(22) + Meta(23) + Meta(24)

In [None]:
# Suponha que df1 e df2 sejam seus DataFrames
df_22_23_24 = pd.concat([df_plan_exec_ano_ant_copy, df_meta_23_copy, df_meta_24_copy], axis=0)

# Resetando o √≠ndice do DataFrame resultante para evitar √≠ndices duplicados
df_22_23_24 = df_22_23_24.reset_index(drop=True)

In [None]:
df_22_23_24 = df_22_23_24.sort_values(by='ID-√öNICO', ascending=True)

In [None]:
df_22_23_24.to_excel('Dados Gerados/PLAN_EXEC AT√â ANO ANTERIOR (24).xlsx', index=False)

---

In [None]:
def process_and_concat_dfs(df_plan_exec_ano_ant_raw, df_meta_23_raw, df_meta_24_raw):
    def process_df(df):
        # Drop na coluna 'ID-√öNICO'
        if 'ID-√öNICO' in df.columns:
            df.drop(columns=['ID-√öNICO'], inplace=True)
        
        # Reset index e renomear √≠ndice
        df.index = range(1, len(df) + 1)
        df.index.name = 'ID-√öNICO'
        df = df.reset_index()
        df = df.sort_values(by='ID-√öNICO', ascending=True)

        # Definir os novos nomes das colunas a partir do √≠ndice 9
        new_column_names = ['PAVIMENTA√á√ÉO - Descri√ß√£o',
                            'PAVIMENTA√á√ÉO - km(i)', 
                            'PAVIMENTA√á√ÉO - km(f)', 
                            'PAVIMENTA√á√ÉO - Ext.(km)', 
                            'PAVIMENTA√á√ÉO - PERCENTUAL (%) PLAN', 
                            'PAVIMENTA√á√ÉO - (km)% PLAN', 
                            'PAVIMENTA√á√ÉO - FINANCEIRO PLAN (R$)', 
                            'PAVIMENTA√á√ÉO - PERCENTUAL (%) EXEC', 
                            'PAVIMENTA√á√ÉO - (km)% EXEC', 
                            'PAVIMENTA√á√ÉO - FINANCEIRO(R$)',
                            'DUPLICA√á√ÉO - Descri√ß√£o',
                            'DUPLICA√á√ÉO - km(i)', 
                            'DUPLICA√á√ÉO - km(f)', 
                            'DUPLICA√á√ÉO - Ext.(km)', 
                            'DUPLICA√á√ÉO - PERCENTUAL (%) PLAN', 
                            'DUPLICA√á√ÉO - (km)% PLAN', 
                            'DUPLICA√á√ÉO - FINANCEIRO PLAN (R$)', 
                            'DUPLICA√á√ÉO - PERCENTUAL (%) EXEC', 
                            'DUPLICA√á√ÉO - (km)% EXEC', 
                            'DUPLICA√á√ÉO - FINANCEIRO(R$)',
                            'OAE - Descri√ß√£o',
                            'OAE - km(i)', 
                            'OAE - km(f)', 
                            'OAE - Ext.(km)', 
                            'OAE - PERCENTUAL (%) PLAN', 
                            'OAE - (km)% PLAN', 
                            'OAE - FINANCEIRO PLAN (R$)', 
                            'OAE - PERCENTUAL (%) EXEC', 
                            'OAE - (km)% EXEC', 
                            'OAE - FINANCEIRO(R$)',
                            'CONTORNO - Descri√ß√£o',
                            'CONTORNO - km(i)', 
                            'CONTORNO - km(f)', 
                            'CONTORNO - Ext.(km)', 
                            'CONTORNO - PERCENTUAL (%) PLAN', 
                            'CONTORNO - (km)% PLAN', 
                            'CONTORNO - FINANCEIRO PLAN (R$)', 
                            'CONTORNO - PERCENTUAL (%) EXEC', 
                            'CONTORNO - (km)% EXEC',
                            'CONTORNO - FINANCEIRO(R$)',
                            'FX ADICIONAL - Descri√ß√£o',
                            'FX ADICIONAL - km(i)',
                            'FX ADICIONAL - km(f)', 
                            'FX ADICIONAL - Ext.(km)', 
                            'FX ADICIONAL - PERCENTUAL (%) PLAN', 
                            'FX ADICIONAL - (km)% PLAN', 
                            'FX ADICIONAL - FINANCEIRO PLAN (R$)', 
                            'FX ADICIONAL - PERCENTUAL (%) EXEC', 
                            'FX ADICIONAL - (km)% EXEC', 
                            'FX ADICIONAL - FINANCEIRO(R$)',
                            'TERCEIRA FAIXA - Descri√ß√£o',
                            'TERCEIRA FAIXA - km(i)', 
                            'TERCEIRA FAIXA - km(f)', 
                            'TERCEIRA FAIXA - Ext.(km)', 
                            'TERCEIRA FAIXA - PERCENTUAL (%) PLAN', 
                            'TERCEIRA FAIXA - (km)% PLAN', 
                            'TERCEIRA FAIXA - FINANCEIRO PLAN (R$)', 
                            'TERCEIRA FAIXA - PERCENTUAL (%) EXEC', 
                            'TERCEIRA FAIXA - (km)% EXEC', 
                            'TERCEIRA FAIXA - FINANCEIRO(R$)']

        # Renomear colunas a partir do √≠ndice 9
        rename_dict = {df.columns[i]: name for i, name in enumerate(new_column_names, start=9) if i < len(df.columns)}
        df.rename(columns=rename_dict, inplace=True)

        # Manter colunas que cont√™m estas keywords
        keywords_to_keep = [
            'ID-√öNICO', 'SETOR', 'EMPREENDIMENTO', 
            'Descri√ß√£o', 'Ext.(km)', 'FINANCEIRO PLAN (R$)', 'FINANCEIRO(R$)', 
            '(km)% PLAN', '(km)% EXEC'
        ]
        columns_to_keep = [col for col in df.columns if any(keyword in col for keyword in keywords_to_keep)]
        df = df[columns_to_keep]

        # Remover linhas onde todas as colunas a partir da posi√ß√£o 3 est√£o vazias
        cols_a_verificar = df.iloc[:, 3:]
        df = df.dropna(subset=cols_a_verificar.columns, how='all')

        # Preparar para unpivot
        df1 = df[['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO']]
        colunas_manter = ['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO']
        colunas_unpivot = df.columns.difference(colunas_manter)

        # Unpivot (melt)
        df = df.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                     var_name='Atributo', value_name='Valor')

        # Adicionar coluna 'SETOR' fixa (como no exemplo)
        df['SETOR'] = 'Rodovi√°rio'

        # Dividir a coluna 'Atributo' em duas
        df[['Atributo.1', 'Atributo.2']] = df['Atributo'].str.split(' - ', expand=True)

        # Selecionar colunas relevantes
        df = df[['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO', 'Atributo.1', 'Atributo.2', 'Valor']]

        # Remover valores nulos e zeros em 'Valor'
        df = df.dropna(subset=['Valor'])
        df = df.loc[df['Valor'] != 0]

        # Pivotar novamente
        df = df.pivot_table(index=['ID-√öNICO', 'Atributo.1'],
                            columns='Atributo.2', values='Valor', aggfunc='first').reset_index()

        # Remover coluna de √≠ndice indesejada, se existir
        if 'Atributo.2' in df.columns:
            df = df.drop(columns='Atributo.2')

        # Merge com df1 para recuperar colunas originais
        df = pd.merge(df1, df, on='ID-√öNICO', how='inner')

        # Remover linhas com valores nulos em 'Atributo.1'
        df = df.dropna(subset=['Atributo.1'])

        # Selecionar e ordenar colunas finais
        final_cols = ['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO', 'Atributo.1', 
                      'Descri√ß√£o', 'Ext.(km)', 'FINANCEIRO PLAN (R$)', 'FINANCEIRO(R$)', 
                      '(km)% PLAN', '(km)% EXEC']
        df = df[final_cols]

        # Renomear colunas para evitar conflitos futuros
        df.rename(columns={
            'ID-√öNICO': 'ID-√öNICO2',
            'SETOR': 'SETOR2',
            'EMPREENDIMENTO': 'EMPREENDIMENTO2',
            'Descri√ß√£o': 'Descri√ß√£o2',
            'Ext.(km)': 'Ext.(km)2',
            'FINANCEIRO PLAN (R$)': 'FINANCEIRO PLAN (R$)2',
            'FINANCEIRO(R$)': 'FINANCEIRO(R$)2',
            '(km)% PLAN': '(km)% PLAN2',
            '(km)% EXEC': '(km)% EXEC2'
        }, inplace=True)

        return df

    # Processar cada df
    df1_processed = process_df(df_plan_exec_ano_ant_raw.copy())
    df2_processed = process_df(df_meta_23_raw.copy())
    df3_processed = process_df(df_meta_24_raw.copy())

    # Concatenar os DataFrames processados
    df_concat = pd.concat([df1_processed, df2_processed, df3_processed], axis=0)
    df_concat = df_concat.reset_index(drop=True)
    df_concat = df_concat.sort_values(by='ID-√öNICO2', ascending=True)

    # Salvar resultado
    df_concat.to_excel('PLAN_EXEC AT√â ANO ANTERIOR (24)(2).xlsx', index=False)

    return df_concat

In [None]:
df_meta_24_raw

In [None]:
print("Processando a planilha 'META(2025)' para gerar o arquivo '2025(2).xlsx'...")

# ==============================================================================
# 1. CARREGAMENTO E LIMPEZA INICIAL
# ==============================================================================

# Carrega os dados da planilha pulando as linhas de cabe√ßalho
df_meta_25_copy = pd.read_excel(file_path, sheet_name='META(2025)', header=2)
# Remove as primeiras linhas que s√£o sub-cabe√ßalhos ou vazias
df_meta_25_copy = df_meta_25_copy.drop([0, 1, 2], axis=0)
# Remove colunas 'Unnamed' que s√£o criadas para colunas sem nome no Excel
df_meta_25_raw = df_meta_25_copy.loc[:, ~df_meta_25_copy.columns.str.contains('^Unnamed')]
# Remove linhas de totais que podem atrapalhar a an√°lise
df_meta_25_raw = df_meta_25_raw[~df_meta_25_raw.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA', case=False, na=False)).any(axis=1)]
# Remove quaisquer linhas que estejam completamente vazias
df_meta_25_raw.dropna(how='all', inplace=True)


In [None]:
# Cria um ID √∫nico para cada linha para podermos rastre√°-las ap√≥s as transforma√ß√µes
df_meta_25_raw.index = range(1, len(df_meta_25_raw) + 1)
df_meta_25_raw.index.name = 'ID-√öNICO'
df_meta_25_raw = df_meta_25_raw.reset_index()

# Guarda as colunas de identifica√ß√£o que usaremos no final para o merge
info_cols_df = df_meta_25_raw[['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO']].copy()

# Identifica as colunas de ID de forma autom√°tica para a transforma√ß√£o
id_vars = [col for col in df_meta_25_raw.columns if not any(keyword in str(col) for keyword in ['PAVIMENTA√á√ÉO', 'DUPLICA√á√ÉO', 'OAE', 'CONTORNO', 'FX ADICIONAL', 'TERCEIRA FAIXA'])]

# Transforma a tabela "larga" em "longa". Este passo √© crucial para a robustez.
df_long = df_meta_25_raw.melt(id_vars=id_vars, var_name='AtributoOriginal', value_name='Valor')

In [None]:
# Se houver dados para processar, continua
if not df_long.empty:
    # Extrai de forma inteligente o "Tipo de Obra" e a "M√©trica" do nome da coluna original
    df_long[['Atributo.1', 'Atributo.2']] = df_long['AtributoOriginal'].str.extract(r'([A-Z\s\/]+[A-Z])\s*\((.+)\)')
    df_long['Atributo.1'] = df_long['Atributo.1'].str.strip()
    df_long['Atributo.2'] = df_long['Atributo.2'].str.strip()

    # Transforma a tabela de volta para um formato com as m√©tricas como colunas
    df_pivot = df_long.pivot_table(
        index=['ID-√öNICO', 'Atributo.1'],
        columns='Atributo.2',
        values='Valor',
        aggfunc='first'
    ).reset_index()

    # Junta as informa√ß√µes de identifica√ß√£o de volta no DataFrame final
    df_final = pd.merge(info_cols_df, df_pivot, on='ID-√öNICO', how='inner')

    # ==============================================================================
    # 4. SELE√á√ÉO FINAL, RENOMEA√á√ÉO E EXPORTA√á√ÉO
    # ==============================================================================

    # Seleciona de forma segura apenas as colunas que voc√™ quer no resultado final
    # Isso evita o erro 'KeyError' se uma coluna n√£o tiver dados e n√£o for criada
    colunas_desejadas = [
        'ID-√öNICO', 'SETOR', 'EMPREENDIMENTO', 'Atributo.1',
        'Descri√ß√£o', 'Ext.(km)', 'FINANCEIRO PLAN (R$)', 'FINANCEIRO(R$)',
        '(km)% PLAN', '(km)% EXEC'
    ]
    colunas_finais_existentes = [col for col in colunas_desejadas if col in df_final.columns]
    df_final = df_final[colunas_finais_existentes]

    # Renomeia as colunas com o sufixo "2", como no seu c√≥digo original
    rename_final = {col: col.replace('ID-√öNICO', 'ID-√öNICO2')
                         .replace('SETOR', 'SETOR2')
                         .replace('EMPREENDIMENTO', 'EMPREENDIMENTO2')
                         .replace('Descri√ß√£o', 'Descri√ß√£o2')
                         .replace('Ext.(km)', 'Ext.(km)2')
                         .replace('FINANCEIRO PLAN (R$)', 'FINANCEIRO PLAN (R$)2')
                         .replace('FINANCEIRO(R$)', 'FINANCEIRO(R$)2')
                         .replace('(km)% PLAN', '(km)% PLAN2')
                         .replace('(km)% EXEC', '(km)% EXEC2') 
                   for col in df_final.columns}
    df_final.rename(columns=rename_final, inplace=True)

    # Salva o arquivo final com o nome desejado
    output_filename = '2025(2).xlsx'
    df_final.to_excel(output_filename, sheet_name='2025(2)', index=False)
    print(f"\nProcesso conclu√≠do! Arquivo '{output_filename}' foi gerado com sucesso.")

else:
    print("\nAVISO: Nenhum dado v√°lido encontrado em 'META(2025)' para gerar o arquivo final.")


<h1><b><i>'META(2025)'</b></i></h1>

In [None]:
# Primeiro cria um alias
df_meta_25 = df_meta_2025

#CHECKPOINT
df_meta_25_copy = df_meta_25.copy()

In [None]:
df_meta_25_copy = pd.read_excel(file_path, sheet_name='META(2025)', header=2)

In [None]:
df_meta_25_copy

In [None]:
df_meta_25_copy = df_meta_25_copy.drop([0, 1, 2], axis = 0)

In [None]:
df_meta_25_copy.columns

In [None]:
# Drop na coluna 'Regi√£o' que n√£o √© usada.
df_meta_25_copy.drop(columns=['Regi√£o'], inplace=True)

In [None]:
# Removendo colunas
df_meta_25_copy = df_meta_25_copy.drop(df_meta_25_copy.columns[8:176], axis=1)

In [None]:
# Renomear Colunas

df_meta_25_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)
df_meta_25_copy.rename(columns={'PAVIMENTA√á√ÉO                                                                                                                                                                                                                                                                                     (Ano Vigente)': 'PAVIMENTA√á√ÉO - (Ano Vigente) - Descri√ß√£o'}, inplace=True)
df_meta_25_copy.rename(columns={'DUPLICA√á√ÉO                                                                                                                                                                                                                                                                                               (Ano Vigente)': 'DUPLICA√á√ÉO - (Ano Vigente) - Descri√ß√£o'}, inplace=True)
df_meta_25_copy.rename(columns={'OAE                                                                                                                                                                                                                                                                                                               (Ano Vigente)': 'OAE - (Ano Vigente) - Descri√ß√£o'}, inplace=True)
df_meta_25_copy.rename(columns={'CONTORNO                                                                                                                                                                                                                                                                                                                   (Ano Vigente)': 'CONTORNO - (Ano Vigente) - Descri√ß√£o'}, inplace=True)
df_meta_25_copy.rename(columns={'FX ADICIONAL                                                                                                                                                                                                                                                                                                     (Ano Vigente)': 'FX ADICIONAL - (Ano Vigente) - Descri√ß√£o'}, inplace=True)
df_meta_25_copy.rename(columns={'TERCEIRA FAIXA                                                                                                                                                                                                                                                                                         (Ano Vigente)': 'TERCEIRA FAIXA - (Ano Vigente) - Descri√ß√£o'}, inplace=True)

df_meta_25_copy.rename(columns={'RISCOS (Pavimenta√ß√£o)       ': 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_meta_25_copy.rename(columns={'RISCOS (Duplica√ß√£o)       ': 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_meta_25_copy.rename(columns={'RISCOS (OAE)       ': 'RISCOS (OAE) - SITUA√á√ÉO'}, inplace=True)
df_meta_25_copy.rename(columns={'RISCOS (Contorno)       ': 'RISCOS (Contorno) - SITUA√á√ÉO'}, inplace=True)
df_meta_25_copy.rename(columns={'RISCOS (FX Adicional)       ': 'RISCOS (Faixa Adicional) - SITUA√á√ÉO'}, inplace=True)
df_meta_25_copy.rename(columns={'RISCOS (Terceira Faixa)       ': 'RISCOS (Terceira Faixa) - SITUA√á√ÉO'}, inplace=True)

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - (Ano Vigente) - km (i)', 
 'PAVIMENTA√á√ÉO - (Ano Vigente) - km (f)', 
 'PAVIMENTA√á√ÉO - (Ano Vigente) - Ext. (km)', 
 'PAVIMENTA√á√ÉO - (Ano Vigente) - PERCENTUAL (%) PLAN', 
 'PAVIMENTA√á√ÉO - (Ano Vigente) - (km)% PLAN', 
 'PAVIMENTA√á√ÉO - (Ano Vigente) - FINANCEIRO PLAN (R$)', 
 'PAVIMENTA√á√ÉO - (Ano Vigente) - PERCENTUAL (%) EXEC', 
 'PAVIMENTA√á√ÉO - (Ano Vigente) - (km)% EXEC', 
 'PAVIMENTA√á√ÉO - (Ano Vigente) - FINANCEIRO (R$)',
 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Pavimenta√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Pavimenta√ß√£o) - PRINCIPAL',
 'RISCOS (Pavimenta√ß√£o) - N√çVEL DE ALERTA',
 'RISCOS (Pavimenta√ß√£o) - N¬∫ PROCESSO',
 'RISCOS (Pavimenta√ß√£o) - DATA DO PROTOCOLO',
 'RISCOS (Pavimenta√ß√£o) - LICEN√áA',
 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO GERAL',
 'DUPLICA√á√ÉO - (Ano Vigente) - Descri√ß√£o',
 'DUPLICA√á√ÉO - (Ano Vigente) - km (i)', 
 'DUPLICA√á√ÉO - (Ano Vigente) - km (f)', 
 'DUPLICA√á√ÉO - (Ano Vigente) - Ext. (km)', 
 'DUPLICA√á√ÉO - (Ano Vigente) - PERCENTUAL (%) PLAN', 
 'DUPLICA√á√ÉO - (Ano Vigente) - (km)% PLAN', 
 'DUPLICA√á√ÉO - (Ano Vigente) - FINANCEIRO PLAN (R$)', 
 'DUPLICA√á√ÉO - (Ano Vigente) - PERCENTUAL (%) EXEC', 
 'DUPLICA√á√ÉO - (Ano Vigente) - (km)% EXEC', 
 'DUPLICA√á√ÉO - (Ano Vigente) - FINANCEIRO (R$)',
 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Duplica√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Duplica√ß√£o) - PRINCIPAL',
 'RISCOS (Duplica√ß√£o) - N√çVEL DE ALERTA',
 'RISCOS (Duplica√ß√£o) - N¬∫ PROCESSO',
 'RISCOS (Duplica√ß√£o) - DATA DO PROTOCOLO',
 'RISCOS (Duplica√ß√£o) - LICEN√áA',
 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO GERAL',
 'OAE - (Ano Vigente) - Descri√ß√£o',
 'OAE - (Ano Vigente) - km (i)', 
 'OAE - (Ano Vigente) - km (f)', 
 'OAE - (Ano Vigente) - Ext. (km)', 
 'OAE - (Ano Vigente) - PERCENTUAL (%) PLAN', 
 'OAE - (Ano Vigente) - (km)% PLAN', 
 'OAE - (Ano Vigente) - FINANCEIRO PLAN (R$)', 
 'OAE - (Ano Vigente) - PERCENTUAL (%) EXEC', 
 'OAE - (Ano Vigente) - (km)% EXEC', 
 'OAE - (Ano Vigente) - FINANCEIRO (R$)',
 'RISCOS (OAE) - SITUA√á√ÉO',
 'RISCOS (OAE) - INTERFER√äNCIA',
 'RISCOS (OAE) - PRINCIPAL',
 'RISCOS (OAE) - N√çVEL DE ALERTA',
 'CONTORNO - (Ano Vigente) - Descri√ß√£o',
 'CONTORNO - (Ano Vigente) - km (i)', 
 'CONTORNO - (Ano Vigente) - km (f)', 
 'CONTORNO - (Ano Vigente) - Ext. (km)', 
 'CONTORNO - (Ano Vigente) - PERCENTUAL (%) PLAN', 
 'CONTORNO - (Ano Vigente) - (km)% PLAN', 
 'CONTORNO - (Ano Vigente) - FINANCEIRO PLAN (R$)', 
 'CONTORNO - (Ano Vigente) - PERCENTUAL (%) EXEC', 
 'CONTORNO - (Ano Vigente) - (km)% EXEC',
 'CONTORNO - (Ano Vigente) - FINANCEIRO (R$)',
 'RISCOS (Contorno) - SITUA√á√ÉO',
 'RISCOS (Contorno) - INTERFER√äNCIA',
 'RISCOS (Contorno) - PRINCIPAL',
 'RISCOS (Contorno) - N√çVEL DE ALERTA',
 'RISCOS (Contorno) - N¬∫ PROCESSO',
 'RISCOS (Contorno) - DATA DO PROTOCOLO',
 'RISCOS (Contorno) - LICEN√áA',
 'RISCOS (Contorno) - SITUA√á√ÉO GERAL',
 'FX ADICIONAL - (Ano Vigente) - Descri√ß√£o',
 'FX ADICIONAL - (Ano Vigente) - km (i)',
 'FX ADICIONAL - (Ano Vigente) - km (f)', 
 'FX ADICIONAL - (Ano Vigente) - Ext. (km)', 
 'FX ADICIONAL - (Ano Vigente) - PERCENTUAL (%) PLAN', 
 'FX ADICIONAL - (Ano Vigente) - (km)% PLAN', 
 'FX ADICIONAL - (Ano Vigente) - FINANCEIRO PLAN (R$)', 
 'FX ADICIONAL - (Ano Vigente) - PERCENTUAL (%) EXEC', 
 'FX ADICIONAL - (Ano Vigente) - (km)% EXEC', 
 'FX ADICIONAL - (Ano Vigente) - FINANCEIRO (R$)',
 'FX ADICIONAL - (Ano Vigente) - Descri√ß√£o',
 'RISCOS (Faixa Adicional) - SITUA√á√ÉO',
 'RISCOS (Faixa Adicional) - INTERFER√äNCIA',
 'RISCOS (Faixa Adicional) - PRINCIPAL',
 'RISCOS (Faixa Adicional) - N√çVEL DE ALERTA',
 'RISCOS (Faixa Adicional) - N¬∫ PROCESSO',
 'RISCOS (Faixa Adicional) - DATA DO PROTOCOLO',
 'RISCOS (Faixa Adicional) - LICEN√áA',
 'RISCOS (Faixa Adicional) - SITUA√á√ÉO GERAL',
 'TERCEIRA FAIXA - (Ano Vigente) - km (i)', 
 'TERCEIRA FAIXA - (Ano Vigente) - km (f)', 
 'TERCEIRA FAIXA - (Ano Vigente) - Ext. (km)', 
 'TERCEIRA FAIXA - (Ano Vigente) - PERCENTUAL (%) PLAN', 
 'TERCEIRA FAIXA - (Ano Vigente) - (km)% PLAN', 
 'TERCEIRA FAIXA - (Ano Vigente) - FINANCEIRO PLAN (R$)', 
 'TERCEIRA FAIXA - (Ano Vigente) - PERCENTUAL (%) EXEC', 
 'TERCEIRA FAIXA - (Ano Vigente) - (km)% EXEC', 
 'TERCEIRA FAIXA - (Ano Vigente) - FINANCEIRO (R$)',
 'RISCOS (Terceira Faixa) - SITUA√á√ÉO',
 'RISCOS (Terceira Faixa) - INTERFER√äNCIA',
 'RISCOS (Terceira Faixa) - PRINCIPAL',
 'RISCOS (Terceira Faixa) - N√çVEL DE ALERTA'
 'RISCOS (Terceira Faixa) - N¬∫ PROCESSO',
 'RISCOS (Terceira Faixa) - DATA DO PROTOCOLO',
 'RISCOS (Terceira Faixa) - LICEN√áA',
 'RISCOS (Terceira Faixa) - SITUA√á√ÉO GERAL'
 'OBSERVA√á√ïES - SITUA√á√ÉO GERAL']  


In [None]:
# Criar um dicion√°rio que mapeia 'Unnamed: x' para os novos nomes
rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=178)}

# Usar o m√©todo rename para renomear as colunas
df_meta_25_copy.rename(columns=rename_dict, inplace=True)

In [None]:
# Identifica colunas que possuem as strings 'RISCOS' ou 'OBSERVA√á√ïES' em seu nome
columns_to_drop = [col for col in df_meta_25_copy.columns if 'RISCOS' in col or 'OBSERVA√á√ïES' in col]

# Remove as colunas identificadas
df_meta_25_copy = df_meta_25_copy.drop(columns=columns_to_drop)

In [None]:
df_meta_25_copy.columns

In [None]:
df_meta_25_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
columns_to_fill = ['EMPREENDIMENTO']
df_meta_25_copy[columns_to_fill] = df_meta_25_copy.groupby((df_meta_25_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_meta_25_copy['ESTADO/LOTE'] = df_meta_25_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS',
       'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO',
       'MATO GROSSO', 'PAR√Å', 'RIO/SP', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA',
       'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_meta_25_copy['ESTADO/LOTE'] = df_meta_25_copy['ESTADO/LOTE'].fillna(method='ffill')

In [None]:
df_meta_25_copy = df_meta_25_copy[~df_meta_25_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
df_meta_25_copy.columns

In [None]:
df_meta_25_copy.index = range(1, len(df_meta_25_copy) + 1)
df_meta_25_copy.index.name = 'ID-√öNICO'
df_meta_25_copy = df_meta_25_copy.reset_index()

In [None]:
df_meta_25_raw = df_meta_25_copy

In [None]:
# df_meta_25_copy.to_excel('Dados Gerados/RAW_META(2025).xlsx', index=False)

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO']

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_meta_25_copy.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_meta_25_copy = df_meta_25_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_meta_25_copy['EMPREENDIMENTO'].unique()

In [None]:
df_meta_25_copy = df_meta_25_copy.loc[df_meta_25_copy['Valor'] != 0]
df_meta_25_copy = df_meta_25_copy.dropna(subset=['Valor'])

In [None]:
df_meta_25_copy[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_meta_25_copy['Atributo'].str.split(' - ', expand=True)

In [None]:
# DROP de ['Atributo'] e Realocar ['Valor'] para o final da Tabela.

df_meta_25_copy = df_meta_25_copy[['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
       , 'Atributo.1', 'Atributo.2', 'Atributo.3', 'Valor']]

In [None]:
# Converter colunas para 'category'
df_meta_25_copy['SETOR'] = df_meta_25_copy['SETOR'].astype('category')
df_meta_25_copy['UF'] = df_meta_25_copy['UF'].astype('category')
df_meta_25_copy['PROPONENTE'] = df_meta_25_copy['PROPONENTE'].astype('category')
df_meta_25_copy['EXECUTOR (Grupo Controlador)'] = df_meta_25_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_meta_25_copy['ESTRUTURADOR DO PROJETO'] = df_meta_25_copy['ESTRUTURADOR DO PROJETO'].astype('category')
df_meta_25_copy['Atributo.1'] = df_meta_25_copy['Atributo.1'].astype('category')
df_meta_25_copy['Atributo.2'] = df_meta_25_copy['Atributo.2'].astype('category')

# Converter colunas para 'string'
df_meta_25_copy['EMPREENDIMENTO'] = df_meta_25_copy['EMPREENDIMENTO'].astype('string') 


In [None]:
df_meta_25_copy = df_meta_25_copy.sort_values(by='ID-√öNICO', ascending=True)

In [None]:
df_meta_25_copy.to_excel('Dados Gerados/META(2025).xlsx', index=False, sheet_name= 'META')

---

In [None]:
df_meta_25_raw

In [None]:
# Drop na coluna 'Regi√£o' que n√£o √© usada.
df_meta_25_raw.drop(columns=['ID-√öNICO'], inplace=True)

In [None]:
df_meta_25_raw.index = range(1, len(df_meta_25_raw) + 1)
df_meta_25_raw.index.name = 'ID-√öNICO'
df_meta_25_raw = df_meta_25_raw.reset_index()

In [None]:
df_meta_25_raw = df_meta_25_raw.sort_values(by='ID-√öNICO', ascending=True)

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - Descri√ß√£o',
 'PAVIMENTA√á√ÉO - km(i)', 
 'PAVIMENTA√á√ÉO - km(f)', 
 'PAVIMENTA√á√ÉO - Ext.(km)', 
 'PAVIMENTA√á√ÉO - PERCENTUAL (%) PLAN', 
 'PAVIMENTA√á√ÉO - (km)% PLAN', 
 'PAVIMENTA√á√ÉO - FINANCEIRO PLAN (R$)', 
 'PAVIMENTA√á√ÉO - PERCENTUAL (%) EXEC', 
 'PAVIMENTA√á√ÉO - (km)% EXEC', 
 'PAVIMENTA√á√ÉO - FINANCEIRO(R$)',
 'DUPLICA√á√ÉO - Descri√ß√£o',
 'DUPLICA√á√ÉO - km(i)', 
 'DUPLICA√á√ÉO - km(f)', 
 'DUPLICA√á√ÉO - Ext.(km)', 
 'DUPLICA√á√ÉO - PERCENTUAL (%) PLAN', 
 'DUPLICA√á√ÉO - (km)% PLAN', 
 'DUPLICA√á√ÉO - FINANCEIRO PLAN (R$)', 
 'DUPLICA√á√ÉO - PERCENTUAL (%) EXEC', 
 'DUPLICA√á√ÉO - (km)% EXEC', 
 'DUPLICA√á√ÉO - FINANCEIRO(R$)',
 'OAE - Descri√ß√£o',
 'OAE - km(i)', 
 'OAE - km(f)', 
 'OAE - Ext.(km)', 
 'OAE - PERCENTUAL (%) PLAN', 
 'OAE - (km)% PLAN', 
 'OAE - FINANCEIRO PLAN (R$)', 
 'OAE - PERCENTUAL (%) EXEC', 
 'OAE - (km)% EXEC', 
 'OAE - FINANCEIRO(R$)',
 'CONTORNO - Descri√ß√£o',
 'CONTORNO - km(i)', 
 'CONTORNO - km(f)', 
 'CONTORNO - Ext.(km)', 
 'CONTORNO - PERCENTUAL (%) PLAN', 
 'CONTORNO - (km)% PLAN', 
 'CONTORNO - FINANCEIRO PLAN (R$)', 
 'CONTORNO - PERCENTUAL (%) EXEC', 
 'CONTORNO - (km)% EXEC',
 'CONTORNO - FINANCEIRO(R$)',
 'FX ADICIONAL - Descri√ß√£o',
 'FX ADICIONAL - km(i)',
 'FX ADICIONAL - km(f)', 
 'FX ADICIONAL - Ext.(km)', 
 'FX ADICIONAL - PERCENTUAL (%) PLAN', 
 'FX ADICIONAL - (km)% PLAN', 
 'FX ADICIONAL - FINANCEIRO PLAN (R$)', 
 'FX ADICIONAL - PERCENTUAL (%) EXEC', 
 'FX ADICIONAL - (km)% EXEC', 
 'FX ADICIONAL - FINANCEIRO(R$)',
 'TERCEIRA FAIXA - Descri√ß√£o',
 'TERCEIRA FAIXA - km(i)', 
 'TERCEIRA FAIXA - km(f)', 
 'TERCEIRA FAIXA - Ext.(km)', 
 'TERCEIRA FAIXA - PERCENTUAL (%) PLAN', 
 'TERCEIRA FAIXA - (km)% PLAN', 
 'TERCEIRA FAIXA - FINANCEIRO PLAN (R$)', 
 'TERCEIRA FAIXA - PERCENTUAL (%) EXEC', 
 'TERCEIRA FAIXA - (km)% EXEC', 
 'TERCEIRA FAIXA - FINANCEIRO(R$)']

In [None]:
# Cria um dicion√°rio que mapeia qualquer coluna a partir do √≠ndice 9 para os novos nomes
rename_dict = {df_meta_25_raw.columns[i]: name for i, name in enumerate(new_column_names, start=9)}

# Usa o m√©todo rename para renomear as colunas, substituindo os nomes existentes
df_meta_25_raw.rename(columns=rename_dict, inplace=True)

In [None]:
# Identifica colunas que possuem a string 'OBSERVA√á√ïES' em seu nome (preserva colunas de RISCOS)
columns_to_drop = [col for col in df_meta_27_copy.columns if 'OBSERVA√á√ïES' in col]
if columns_to_drop:
    df_meta_27_copy = df_meta_27_copy.drop(columns=columns_to_drop)

In [None]:

# Mant√©m apenas as colunas identificadas
df_meta_25_raw = df_meta_25_raw[columns_to_keep]

In [None]:
df_meta_25_raw.columns

In [None]:
df_meta_25_raw

In [None]:
# Seleciona colunas da posi√ß√£o em diante
cols_a_verificar = df_meta_25_raw.iloc[:, 3:]

# Remove linhas onde todas essas colunas est√£o vazias
df_meta_25_raw = df_meta_25_raw.dropna(subset=cols_a_verificar.columns, how='all')

In [None]:
df_meta_25_raw1 = df_meta_25_raw[['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO']]

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO']

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_meta_25_raw.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_meta_25_raw = df_meta_25_raw.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_meta_25_raw['SETOR'] = 'Rodovi√°rio'

In [None]:
df_meta_25_raw[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_meta_25_raw['Atributo'].str.split(' - ', expand=True)

In [None]:
df_meta_25_raw.columns

In [None]:
df_meta_25_raw = df_meta_25_raw[['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO',
       'Atributo.1', 'Atributo.2', 'Valor']]

In [None]:
df_meta_25_raw.dropna(subset=['Valor'])
df_meta_25_raw = df_meta_25_raw.loc[df_meta_25_raw['Valor'] != 0]

In [None]:
# Pivotar o DataFrame
df_meta_25_raw = df_meta_25_raw.pivot_table(index=['ID-√öNICO', 'Atributo.1'], 
                                            columns='Atributo.2', values='Valor', aggfunc='first').reset_index()

In [None]:
df_meta_25_raw.columns

In [None]:
df_meta_25_raw

In [None]:
# Remove a coluna de √≠ndice indesejada, se existir
if 'Atributo.2' in df_meta_25_raw.columns:
    df_meta_25_raw = df_meta_25_raw.drop(columns='Atributo.2')

In [None]:
df_meta_25_raw1

In [None]:
# Faz o merge com base na coluna 'ID-√öNICO'
df_meta_25_raw = pd.merge(df_meta_25_raw1, df_meta_25_raw, on='ID-√öNICO', how='inner')

In [None]:
df_meta_25_raw

In [None]:
df_meta_25_raw1

In [None]:
df_meta_25_raw = df_meta_25_raw.dropna(subset=['Atributo.1'])

In [None]:
df_meta_25_raw

In [None]:
df_meta_25_raw.columns

In [None]:
# Filtra apenas as colunas que existem
colunas_existentes = [col for col in ['ID-√öNICO', 'SETOR', 'EMPREENDIMENTO',
                                      'Atributo.1', 'Descri√ß√£o', 'Ext.(km)', 
                                      'FINANCEIRO PLAN (R$)', 'FINANCEIRO(R$)', 
                                      '(km)% PLAN', '(km)% EXEC'] 
                      if col in df_meta_25_raw.columns]

print(f"Colunas que existem: {colunas_existentes}")
df_meta_25_raw = df_meta_25_raw[colunas_existentes]

print(f"Shape final: {df_meta_25_raw.shape}")
print(df_meta_25_raw.head())

In [None]:
# Renomear Colunas
df_meta_25_raw.rename(columns={'ID-√öNICO': 'ID-√öNICO2'}, inplace=True)
df_meta_25_raw.rename(columns={'SETOR': 'SETOR2'}, inplace=True)
df_meta_25_raw.rename(columns={'EMPREENDIMENTO': 'EMPREENDIMENTO2'}, inplace=True)
df_meta_25_raw.rename(columns={'Descri√ß√£o': 'Descri√ß√£o2'}, inplace=True)
df_meta_25_raw.rename(columns={'Ext.(km)': 'Ext.(km)2'}, inplace=True)
df_meta_25_raw.rename(columns={'FINANCEIRO PLAN (R$)': 'FINANCEIRO PLAN (R$)2'}, inplace=True)
df_meta_25_raw.rename(columns={'FINANCEIRO(R$)': 'FINANCEIRO(R$)2'}, inplace=True)
df_meta_25_raw.rename(columns={'(km)% PLAN': '(km)% PLAN2'}, inplace=True)
df_meta_25_raw.rename(columns={'(km)% EXEC': '(km)% EXEC2'}, inplace=True)

In [None]:
df_meta_25_raw

In [None]:
df_meta_25_raw.to_excel('2025(2).xlsx', sheet_name= '2025(2)', index= False)

<h1><b><i>'META(2026)'</b></i></h1>

In [None]:
#CHECKPOINT
# Primeiro cria um alias
df_meta_26 = df_meta_2026

df_meta_26_copy = df_meta_26.copy()

In [None]:
df_meta_26_copy = pd.read_excel(file_path, sheet_name='META(2026)', header=2)

In [None]:
df_meta_26_copy

In [None]:
df_meta_26_copy = df_meta_26_copy.drop([0, 1, 2], axis = 0)

In [None]:
df_meta_26_copy.columns

In [None]:
# Drop na coluna 'Regi√£o' que n√£o √© usada.
df_meta_26_copy.drop(columns=['Regi√£o'], inplace=True)

In [None]:
# Removendo colunas
df_meta_26_copy = df_meta_26_copy.drop(df_meta_26_copy.columns[8:176], axis=1)

In [None]:
# Renomear Colunas

df_meta_26_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)
df_meta_26_copy.rename(columns={'PAVIMENTA√á√ÉO                                                                                                                                                                                                                                                                                     (Ano Vigente)': 'PAVIMENTA√á√ÉO - 2026 - Descri√ß√£o'}, inplace=True)
df_meta_26_copy.rename(columns={'DUPLICA√á√ÉO                                                                                                                                                                                                                                                                                               (Ano Vigente)': 'DUPLICA√á√ÉO - 2026 - Descri√ß√£o'}, inplace=True)
df_meta_26_copy.rename(columns={'OAE                                                                                                                                                                                                                                                                                                               (Ano Vigente)': 'OAE - 2026 - Descri√ß√£o'}, inplace=True)
df_meta_26_copy.rename(columns={'CONTORNO                                                                                                                                                                                                                                                                                                                   (Ano Vigente)': 'CONTORNO - 2026 - Descri√ß√£o'}, inplace=True)
df_meta_26_copy.rename(columns={'FX ADICIONAL                                                                                                                                                                                                                                                                                                     (Ano Vigente)': 'FX ADICIONAL - 2026 - Descri√ß√£o'}, inplace=True)
df_meta_26_copy.rename(columns={'TERCEIRA FAIXA                                                                                                                                                                                                                                                                                         (Ano Vigente)': 'TERCEIRA FAIXA - 2026 - Descri√ß√£o'}, inplace=True)

df_meta_26_copy.rename(columns={'RISCOS (Pavimenta√ß√£o)       ': 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_meta_26_copy.rename(columns={'RISCOS (Duplica√ß√£o)       ': 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_meta_26_copy.rename(columns={'RISCOS (OAE)       ': 'RISCOS (OAE) - SITUA√á√ÉO'}, inplace=True)
df_meta_26_copy.rename(columns={'RISCOS (Contorno)       ': 'RISCOS (Contorno) - SITUA√á√ÉO'}, inplace=True)
df_meta_26_copy.rename(columns={'RISCOS (FX Adicional)       ': 'RISCOS (Faixa Adicional) - SITUA√á√ÉO'}, inplace=True)
df_meta_26_copy.rename(columns={'RISCOS (Terceira Faixa)       ': 'RISCOS (Terceira Faixa) - SITUA√á√ÉO'}, inplace=True)

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - 2026 - km (i)', 
 'PAVIMENTA√á√ÉO - 2026 - km (f)', 
 'PAVIMENTA√á√ÉO - 2026 - Ext. (km)', 
 'PAVIMENTA√á√ÉO - 2026 - PERCENTUAL (%) PLAN', 
 'PAVIMENTA√á√ÉO - 2026 - (km)% PLAN', 
 'PAVIMENTA√á√ÉO - 2026 - FINANCEIRO PLAN (R$)', 
 'PAVIMENTA√á√ÉO - 2026 - PERCENTUAL (%) EXEC', 
 'PAVIMENTA√á√ÉO - 2026 - (km)% EXEC', 
 'PAVIMENTA√á√ÉO - 2026 - FINANCEIRO (R$)',
 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Pavimenta√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Pavimenta√ß√£o) - PRINCIPAL',
 'RISCOS (Pavimenta√ß√£o) - N√çVEL DE ALERTA',
 'RISCOS (Pavimenta√ß√£o) - N¬∫ PROCESSO',
 'RISCOS (Pavimenta√ß√£o) - DATA DO PROTOCOLO',
 'RISCOS (Pavimenta√ß√£o) - LICEN√áA',
 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO GERAL',
 'DUPLICA√á√ÉO - 2026 - Descri√ß√£o',
 'DUPLICA√á√ÉO - 2026 - km (i)', 
 'DUPLICA√á√ÉO - 2026 - km (f)', 
 'DUPLICA√á√ÉO - 2026 - Ext. (km)', 
 'DUPLICA√á√ÉO - 2026 - PERCENTUAL (%) PLAN', 
 'DUPLICA√á√ÉO - 2026 - (km)% PLAN', 
 'DUPLICA√á√ÉO - 2026 - FINANCEIRO PLAN (R$)', 
 'DUPLICA√á√ÉO - 2026 - PERCENTUAL (%) EXEC', 
 'DUPLICA√á√ÉO - 2026 - (km)% EXEC', 
 'DUPLICA√á√ÉO - 2026 - FINANCEIRO (R$)',
 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Duplica√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Duplica√ß√£o) - PRINCIPAL',
 'RISCOS (Duplica√ß√£o) - N√çVEL DE ALERTA',
 'RISCOS (Duplica√ß√£o) - N¬∫ PROCESSO',
 'RISCOS (Duplica√ß√£o) - DATA DO PROTOCOLO',
 'RISCOS (Duplica√ß√£o) - LICEN√áA',
 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO GERAL',
 'OAE - 2026 - Descri√ß√£o',
 'OAE - 2026 - km (i)', 
 'OAE - 2026 - km (f)', 
 'OAE - 2026 - Ext. (km)', 
 'OAE - 2026 - PERCENTUAL (%) PLAN', 
 'OAE - 2026 - (km)% PLAN', 
 'OAE - 2026 - FINANCEIRO PLAN (R$)', 
 'OAE - 2026 - PERCENTUAL (%) EXEC', 
 'OAE - 2026 - (km)% EXEC', 
 'OAE - 2026 - FINANCEIRO (R$)',
 'RISCOS (OAE) - SITUA√á√ÉO',
 'RISCOS (OAE) - INTERFER√äNCIA',
 'RISCOS (OAE) - PRINCIPAL',
 'RISCOS (OAE) - N√çVEL DE ALERTA',
 'RISCOS (OAE) - N¬∫ PROCESSO',
 'RISCOS (OAE) - DATA DO PROTOCOLO',
 'RISCOS (OAE) - LICEN√áA',
 'RISCOS (OAE) - SITUA√á√ÉO GERAL',
 'CONTORNO - 2026 - Descri√ß√£o',
 'CONTORNO - 2026 - km (i)', 
 'CONTORNO - 2026 - km (f)', 
 'CONTORNO - 2026 - Ext. (km)', 
 'CONTORNO - 2026 - PERCENTUAL (%) PLAN', 
 'CONTORNO - 2026 - (km)% PLAN', 
 'CONTORNO - 2026 - FINANCEIRO PLAN (R$)', 
 'CONTORNO - 2026 - PERCENTUAL (%) EXEC', 
 'CONTORNO - 2026 - (km)% EXEC',
 'CONTORNO - 2026 - FINANCEIRO (R$)',
 'RISCOS (Contorno) - SITUA√á√ÉO',
 'RISCOS (Contorno) - INTERFER√äNCIA',
 'RISCOS (Contorno) - PRINCIPAL',
 'RISCOS (Contorno) - N√çVEL DE ALERTA',
 'RISCOS (Contorno) - N¬∫ PROCESSO',
 'RISCOS (Contorno) - DATA DO PROTOCOLO',
 'RISCOS (Contorno) - LICEN√áA',
 'RISCOS (Contorno) - SITUA√á√ÉO GERAL',
 'FX ADICIONAL - 2026 - Descri√ß√£o',
 'FX ADICIONAL - 2026 - km (i)',
 'FX ADICIONAL - 2026 - km (f)', 
 'FX ADICIONAL - 2026 - Ext. (km)', 
 'FX ADICIONAL - 2026 - PERCENTUAL (%) PLAN', 
 'FX ADICIONAL - 2026 - (km)% PLAN', 
 'FX ADICIONAL - 2026 - FINANCEIRO PLAN (R$)', 
 'FX ADICIONAL - 2026 - PERCENTUAL (%) EXEC', 
 'FX ADICIONAL - 2026 - (km)% EXEC', 
 'FX ADICIONAL - 2026 - FINANCEIRO (R$)',
 'FX ADICIONAL - 2026 - Descri√ß√£o',
 'RISCOS (Faixa Adicional) - SITUA√á√ÉO',
 'RISCOS (Faixa Adicional) - INTERFER√äNCIA',
 'RISCOS (Faixa Adicional) - PRINCIPAL',
 'RISCOS (Faixa Adicional) - N√çVEL DE ALERTA',
 'RISCOS (Faixa Adicional) - N¬∫ PROCESSO',
 'RISCOS (Faixa Adicional) - DATA DO PROTOCOLO',
 'RISCOS (Faixa Adicional) - LICEN√áA',
 'RISCOS (Faixa Adicional) - SITUA√á√ÉO GERAL',
 'TERCEIRA FAIXA - 2026 - Descri√ß√£o',
 'TERCEIRA FAIXA - 2026 - km (i)', 
 'TERCEIRA FAIXA - 2026 - km (f)', 
 'TERCEIRA FAIXA - 2026 - Ext. (km)', 
 'TERCEIRA FAIXA - 2026 - PERCENTUAL (%) PLAN', 
 'TERCEIRA FAIXA - 2026 - (km)% PLAN', 
 'TERCEIRA FAIXA - 2026 - FINANCEIRO PLAN (R$)', 
 'TERCEIRA FAIXA - 2026 - PERCENTUAL (%) EXEC', 
 'TERCEIRA FAIXA - 2026 - (km)% EXEC', 
 'TERCEIRA FAIXA - 2026 - FINANCEIRO (R$)',
 'RISCOS (Terceira Faixa) - SITUA√á√ÉO',
 'RISCOS (Terceira Faixa) - INTERFER√äNCIA',
 'RISCOS (Terceira Faixa) - PRINCIPAL',
 'RISCOS (Terceira Faixa) - N√çVEL DE ALERTA'
 'RISCOS (Terceira Faixa) - N¬∫ PROCESSO',
 'RISCOS (Terceira Faixa) - DATA DO PROTOCOLO',
 'RISCOS (Terceira Faixa) - LICEN√áA',
 'RISCOS (Terceira Faixa) - SITUA√á√ÉO GERAL',
 'OBSERVA√á√ïES - SITUA√á√ÉO GERAL']


In [None]:
# Criar um dicion√°rio que mapeia 'Unnamed: x' para os novos nomes
rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=178)}

# Usar o m√©todo rename para renomear as colunas
df_meta_26_copy.rename(columns=rename_dict, inplace=True)

In [None]:
# Identifica colunas que possuem a string 'RISCOS' em seu nome
columns_to_drop = [col for col in df_meta_26_copy.columns if 'RISCOS' in col or 'OBSERVA√á√ïES' in col]

# Remove as colunas identificadas
df_meta_26_copy = df_meta_26_copy.drop(columns=columns_to_drop)

In [None]:
df_meta_26_copy.columns

In [None]:
df_meta_26_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
columns_to_fill = ['EMPREENDIMENTO']
df_meta_26_copy[columns_to_fill] = df_meta_26_copy.groupby((df_meta_26_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_meta_26_copy['ESTADO/LOTE'] = df_meta_26_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS',
       'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO',
       'MATO GROSSO', 'PAR√Å', 'RIO/SP', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA',
       'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_meta_26_copy['ESTADO/LOTE'] = df_meta_26_copy['ESTADO/LOTE'].fillna(method='ffill')

In [None]:
df_meta_26_copy = df_meta_26_copy[~df_meta_26_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
df_meta_26_copy.columns

In [None]:
df_meta_26_copy.index = range(1, len(df_meta_26_copy) + 1)
df_meta_26_copy.index.name = 'ID-√öNICO'
df_meta_26_copy = df_meta_26_copy.reset_index()

In [None]:
df_meta_26_raw = df_meta_26_copy

In [None]:
# df_meta_26_copy.to_excel('Dados Gerados/RAW_META(2026).xlsx', index=False)

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO']

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_meta_26_copy.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_meta_26_copy = df_meta_26_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_meta_26_copy['EMPREENDIMENTO'].unique()

In [None]:
df_meta_26_copy = df_meta_26_copy.loc[df_meta_26_copy['Valor'] != 0]
df_meta_26_copy = df_meta_26_copy.dropna(subset=['Valor'])

In [None]:
df_meta_26_copy[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_meta_26_copy['Atributo'].str.split(' - ', expand=True)

In [None]:
# DROP de ['Atributo'] e Realocar ['Valor'] para o final da Tabela.

df_meta_26_copy = df_meta_26_copy[['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
       , 'Atributo.1', 'Atributo.2', 'Atributo.3', 'Valor']]

In [None]:
# Converter colunas para 'category'
df_meta_26_copy['SETOR'] = df_meta_26_copy['SETOR'].astype('category')
df_meta_26_copy['UF'] = df_meta_26_copy['UF'].astype('category')
df_meta_26_copy['PROPONENTE'] = df_meta_26_copy['PROPONENTE'].astype('category')
df_meta_26_copy['EXECUTOR (Grupo Controlador)'] = df_meta_26_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_meta_26_copy['ESTRUTURADOR DO PROJETO'] = df_meta_26_copy['ESTRUTURADOR DO PROJETO'].astype('category')
df_meta_26_copy['Atributo.1'] = df_meta_26_copy['Atributo.1'].astype('category')
df_meta_26_copy['Atributo.2'] = df_meta_26_copy['Atributo.2'].astype('category')

# Converter colunas para 'string'
df_meta_26_copy['EMPREENDIMENTO'] = df_meta_26_copy['EMPREENDIMENTO'].astype('string') 


In [None]:
df_meta_26_copy = df_meta_26_copy.sort_values(by='ID-√öNICO', ascending=True)

In [None]:
df_meta_26_copy.to_excel('Dados Gerados/META(2026).xlsx', index=False, sheet_name= 'META')

<h1><b><i>'META(2027)'</b></i></h1>

In [None]:
#CHECKPOINT
# Primeiro cria um alias
df_meta_27 = df_meta_2027

df_meta_27_copy = df_meta_27.copy()


In [None]:
df_meta_27_copy = pd.read_excel(file_path, sheet_name='META(2027)', header=2)

In [None]:
df_meta_27_copy

In [None]:
df_meta_27_copy = df_meta_27_copy.drop([0, 1, 2], axis = 0)

In [None]:
df_meta_27_copy.columns

In [None]:
# Drop na coluna 'Regi√£o' que n√£o √© usada.
df_meta_27_copy.drop(columns=['Regi√£o'], inplace=True)

In [None]:
# Removendo colunas
df_meta_27_copy = df_meta_27_copy.drop(df_meta_27_copy.columns[8:176], axis=1)

In [None]:
# Renomear Colunas

df_meta_27_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)
df_meta_27_copy.rename(columns={'PAVIMENTA√á√ÉO                                                                                                                                                                                                                                                                                     (Ano Vigente)': 'PAVIMENTA√á√ÉO - 2027 - Descri√ß√£o'}, inplace=True)
df_meta_27_copy.rename(columns={'DUPLICA√á√ÉO                                                                                                                                                                                                                                                                                               (Ano Vigente)': 'DUPLICA√á√ÉO - 2027 - Descri√ß√£o'}, inplace=True)
df_meta_27_copy.rename(columns={'OAE                                                                                                                                                                                                                                                                                                               (Ano Vigente)': 'OAE - 2027 - Descri√ß√£o'}, inplace=True)
df_meta_27_copy.rename(columns={'CONTORNO                                                                                                                                                                                                                                                                                                                   (Ano Vigente)': 'CONTORNO - 2027 - Descri√ß√£o'}, inplace=True)
df_meta_27_copy.rename(columns={'FX ADICIONAL                                                                                                                                                                                                                                                                                                     (Ano Vigente)': 'FX ADICIONAL - 2027 - Descri√ß√£o'}, inplace=True)
df_meta_27_copy.rename(columns={'TERCEIRA FAIXA                                                                                                                                                                                                                                                                                         (Ano Vigente)': 'TERCEIRA FAIXA - 2027 - Descri√ß√£o'}, inplace=True)

df_meta_27_copy.rename(columns={'RISCOS (Pavimenta√ß√£o)       ': 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_meta_27_copy.rename(columns={'RISCOS (Duplica√ß√£o)       ': 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_meta_27_copy.rename(columns={'RISCOS (OAE)       ': 'RISCOS (OAE) - SITUA√á√ÉO'}, inplace=True)
df_meta_27_copy.rename(columns={'RISCOS (Contorno)       ': 'RISCOS (Contorno) - SITUA√á√ÉO'}, inplace=True)
df_meta_27_copy.rename(columns={'RISCOS (FX Adicional)       ': 'RISCOS (Faixa Adicional) - SITUA√á√ÉO'}, inplace=True)
df_meta_27_copy.rename(columns={'RISCOS (Terceira Faixa)       ': 'RISCOS (Terceira Faixa) - SITUA√á√ÉO'}, inplace=True)

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - 2027 - km (i)', 
 'PAVIMENTA√á√ÉO - 2027 - km (f)', 
 'PAVIMENTA√á√ÉO - 2027 - Ext. (km)', 
 'PAVIMENTA√á√ÉO - 2027 - PERCENTUAL (%) PLAN', 
 'PAVIMENTA√á√ÉO - 2027 - (km)% PLAN', 
 'PAVIMENTA√á√ÉO - 2027 - FINANCEIRO PLAN (R$)', 
 'PAVIMENTA√á√ÉO - 2027 - PERCENTUAL (%) EXEC', 
 'PAVIMENTA√á√ÉO - 2027 - (km)% EXEC', 
 'PAVIMENTA√á√ÉO - 2027 - FINANCEIRO (R$)',
 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Pavimenta√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Pavimenta√ß√£o) - PRINCIPAL',
 'RISCOS (Pavimenta√ß√£o) - N√çVEL DE ALERTA',
 'RISCOS (Pavimenta√ß√£o) - N¬∫ PROCESSO',
 'RISCOS (Pavimenta√ß√£o) - DATA DO PROTOCOLO',
 'RISCOS (Pavimenta√ß√£o) - LICEN√áA',
 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO GERAL',
 'DUPLICA√á√ÉO - 2027 - Descri√ß√£o',
 'DUPLICA√á√ÉO - 2027 - km (i)', 
 'DUPLICA√á√ÉO - 2027 - km (f)', 
 'DUPLICA√á√ÉO - 2027 - Ext. (km)', 
 'DUPLICA√á√ÉO - 2027 - PERCENTUAL (%) PLAN', 
 'DUPLICA√á√ÉO - 2027 - (km)% PLAN', 
 'DUPLICA√á√ÉO - 2027 - FINANCEIRO PLAN (R$)', 
 'DUPLICA√á√ÉO - 2027 - PERCENTUAL (%) EXEC', 
 'DUPLICA√á√ÉO - 2027 - (km)% EXEC', 
 'DUPLICA√á√ÉO - 2027 - FINANCEIRO (R$)',
 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Duplica√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Duplica√ß√£o) - PRINCIPAL',
 'RISCOS (Duplica√ß√£o) - N√çVEL DE ALERTA',
 'RISCOS (Duplica√ß√£o) - N¬∫ PROCESSO',
 'RISCOS (Duplica√ß√£o) - DATA DO PROTOCOLO',
 'RISCOS (Duplica√ß√£o) - LICEN√áA',
 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO GERAL',
 'OAE - 2027 - Descri√ß√£o',
 'OAE - 2027 - km (i)', 
 'OAE - 2027 - km (f)', 
 'OAE - 2027 - Ext. (km)', 
 'OAE - 2027 - PERCENTUAL (%) PLAN', 
 'OAE - 2027 - (km)% PLAN', 
 'OAE - 2027 - FINANCEIRO PLAN (R$)', 
 'OAE - 2027 - PERCENTUAL (%) EXEC', 
 'OAE - 2027 - (km)% EXEC', 
 'OAE - 2027 - FINANCEIRO (R$)',
 'RISCOS (OAE) - SITUA√á√ÉO',
 'RISCOS (OAE) - INTERFER√äNCIA',
 'RISCOS (OAE) - PRINCIPAL',
 'RISCOS (OAE) - N√çVEL DE ALERTA',
 'RISCOS (OAE) - N¬∫ PROCESSO',
 'RISCOS (OAE) - DATA DO PROTOCOLO',
 'RISCOS (OAE) - LICEN√áA',
 'RISCOS (OAE) - SITUA√á√ÉO GERAL',
 'CONTORNO - 2027 - Descri√ß√£o',
 'CONTORNO - 2027 - km (i)', 
 'CONTORNO - 2027 - km (f)', 
 'CONTORNO - 2027 - Ext. (km)', 
 'CONTORNO - 2027 - PERCENTUAL (%) PLAN', 
 'CONTORNO - 2027 - (km)% PLAN', 
 'CONTORNO - 2027 - FINANCEIRO PLAN (R$)', 
 'CONTORNO - 2027 - PERCENTUAL (%) EXEC', 
 'CONTORNO - 2027 - (km)% EXEC',
 'CONTORNO - 2027 - FINANCEIRO (R$)',
 'RISCOS (Contorno) - SITUA√á√ÉO',
 'RISCOS (Contorno) - INTERFER√äNCIA',
 'RISCOS (Contorno) - PRINCIPAL',
 'RISCOS (Contorno) - N√çVEL DE ALERTA',
 'RISCOS (Contorno) - N¬∫ PROCESSO',
 'RISCOS (Contorno) - DATA DO PROTOCOLO',
 'RISCOS (Contorno) - LICEN√áA',
 'RISCOS (Contorno) - SITUA√á√ÉO GERAL',
 'FX ADICIONAL - 2027 - Descri√ß√£o',
 'FX ADICIONAL - 2027 - km (i)',
 'FX ADICIONAL - 2027 - km (f)', 
 'FX ADICIONAL - 2027 - Ext. (km)', 
 'FX ADICIONAL - 2027 - PERCENTUAL (%) PLAN', 
 'FX ADICIONAL - 2027 - (km)% PLAN', 
 'FX ADICIONAL - 2027 - FINANCEIRO PLAN (R$)', 
 'FX ADICIONAL - 2027 - PERCENTUAL (%) EXEC', 
 'FX ADICIONAL - 2027 - (km)% EXEC', 
 'FX ADICIONAL - 2027 - FINANCEIRO (R$)',
 'FX ADICIONAL - 2027 - Descri√ß√£o',
 'RISCOS (Faixa Adicional) - SITUA√á√ÉO',
 'RISCOS (Faixa Adicional) - INTERFER√äNCIA',
 'RISCOS (Faixa Adicional) - PRINCIPAL',
 'RISCOS (Faixa Adicional) - N√çVEL DE ALERTA',
 'RISCOS (Faixa Adicional) - N¬∫ PROCESSO',
 'RISCOS (Faixa Adicional) - DATA DO PROTOCOLO',
 'RISCOS (Faixa Adicional) - LICEN√áA',
 'RISCOS (Faixa Adicional) - SITUA√á√ÉO GERAL',
 'TERCEIRA FAIXA - 2027 - km (i)', 
 'TERCEIRA FAIXA - 2027 - km (f)', 
 'TERCEIRA FAIXA - 2027 - Ext. (km)', 
 'TERCEIRA FAIXA - 2027 - PERCENTUAL (%) PLAN', 
 'TERCEIRA FAIXA - 2027 - (km)% PLAN', 
 'TERCEIRA FAIXA - 2027 - FINANCEIRO PLAN (R$)', 
 'TERCEIRA FAIXA - 2027 - PERCENTUAL (%) EXEC', 
 'TERCEIRA FAIXA - 2027 - (km)% EXEC', 
 'TERCEIRA FAIXA - 2027 - FINANCEIRO (R$)',
 'RISCOS (Terceira Faixa) - SITUA√á√ÉO',
 'RISCOS (Terceira Faixa) - INTERFER√äNCIA',
 'RISCOS (Terceira Faixa) - PRINCIPAL',
 'RISCOS (Terceira Faixa) - N√çVEL DE ALERTA'
 'RISCOS (Terceira Faixa) - N¬∫ PROCESSO',
 'RISCOS (Terceira Faixa) - DATA DO PROTOCOLO',
 'RISCOS (Terceira Faixa) - LICEN√áA',
 'RISCOS (Terceira Faixa) - SITUA√á√ÉO GERAL',
 'OBSERVA√á√ïES - SITUA√á√ÉO GERAL']


In [None]:
# Criar um dicion√°rio que mapeia 'Unnamed: x' para os novos nomes
rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=178)}

# Usar o m√©todo rename para renomear as colunas
df_meta_27_copy.rename(columns=rename_dict, inplace=True)

In [None]:
# Identifica colunas que possuem a string 'RISCOS' em seu nome
columns_to_drop = [col for col in df_meta_27_copy.columns if 'RISCOS' in col]

# Remove as colunas identificadas
df_meta_27_copy = df_meta_27_copy.drop(columns=columns_to_drop)

In [None]:
df_meta_27_copy

In [None]:
df_meta_27_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
columns_to_fill = ['EMPREENDIMENTO']
df_meta_27_copy[columns_to_fill] = df_meta_27_copy.groupby((df_meta_27_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_meta_27_copy['ESTADO/LOTE'] = df_meta_27_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS',
       'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO',
       'MATO GROSSO', 'PAR√Å', 'RIO/SP', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA',
       'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_meta_27_copy['ESTADO/LOTE'] = df_meta_27_copy['ESTADO/LOTE'].fillna(method='ffill')

In [None]:
df_meta_27_copy = df_meta_27_copy[~df_meta_27_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
df_meta_27_copy.columns

In [None]:
df_meta_27_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
df_meta_27_raw = df_meta_27_copy

In [None]:
# df_meta_27_copy.to_excel('Dados Gerados/RAW_META(2027).xlsx', index=False)

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO']

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_meta_27_copy.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_meta_27_copy = df_meta_27_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_meta_27_copy['EMPREENDIMENTO'].unique()

In [None]:
df_meta_27_copy = df_meta_27_copy.loc[df_meta_27_copy['Valor'] != 0]
df_meta_27_copy = df_meta_27_copy.dropna(subset=['Valor'])

In [None]:
df_meta_27_copy[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_meta_27_copy['Atributo'].str.split(' - ', expand=True)

In [None]:
# DROP de ['Atributo'] e Realocar ['Valor'] para o final da Tabela.

df_meta_27_copy = df_meta_27_copy[['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
       , 'Atributo.1', 'Atributo.2', 'Atributo.3', 'Valor']]

In [None]:
# Converter colunas para 'category'
df_meta_27_copy['SETOR'] = df_meta_27_copy['SETOR'].astype('category')
df_meta_27_copy['UF'] = df_meta_27_copy['UF'].astype('category')
df_meta_27_copy['PROPONENTE'] = df_meta_27_copy['PROPONENTE'].astype('category')
df_meta_27_copy['EXECUTOR (Grupo Controlador)'] = df_meta_27_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_meta_27_copy['ESTRUTURADOR DO PROJETO'] = df_meta_27_copy['ESTRUTURADOR DO PROJETO'].astype('category')
df_meta_27_copy['Atributo.1'] = df_meta_27_copy['Atributo.1'].astype('category')
df_meta_27_copy['Atributo.2'] = df_meta_27_copy['Atributo.2'].astype('category')

# Converter colunas para 'string'
df_meta_27_copy['EMPREENDIMENTO'] = df_meta_27_copy['EMPREENDIMENTO'].astype('string') 


In [None]:
df_meta_27_copy = df_meta_27_copy.sort_values(by='ID-√öNICO', ascending=True)

In [None]:
df_meta_27_copy.to_excel('Dados Gerados/META(2027).xlsx', index=False, sheet_name= 'META')

<h1><b><i>'iNEXECUTADO (pend√™ncias at√© 24)'</b></i></h1>

In [None]:
#CHECKPOINT
df_inexec_copy = df_inexec.copy()

In [None]:
df_inexec_copy =  pd.read_excel(file_path, sheet_name='iNEXECUTADO (pend√™ncias at√© 24)', header=2)
df_inexec_copy.columns

In [None]:
df_inexec_copy

In [None]:
df_inexec_copy = df_inexec_copy.drop([0, 1, 2], axis = 0)

In [None]:
# Renomear Coluna ['EXECUTOR...']

df_inexec_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)
df_inexec_copy.rename(columns={'PAVIMENTA√á√ÉO (at√© 2024)': 'PAVIMENTA√á√ÉO - (at√© 2024) - Descri√ß√£o'}, inplace=True)
df_inexec_copy.rename(columns={'RISCOS (Pavimenta√ß√£o)       ': 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_inexec_copy.rename(columns={'DUPLICA√á√ÉO (at√© 2024)': 'DUPLICA√á√ÉO - (at√© 2024) - Descri√ß√£o'}, inplace=True)
df_inexec_copy.rename(columns={'RISCOS (Duplica√ß√£o)       ': 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO'}, inplace=True)
df_inexec_copy.rename(columns={'OAE  (at√© 2024)': 'OAE - (at√© 2024) - Descri√ß√£o'}, inplace=True)
df_inexec_copy.rename(columns={'RISCOS (OAE)       ': 'RISCOS (OAE) - SITUA√á√ÉO'}, inplace=True)
df_inexec_copy.rename(columns={'CONTORNO  (at√© 2024)': 'CONTORNO - (at√© 2024) - Descri√ß√£o'}, inplace=True)
df_inexec_copy.rename(columns={'RISCOS (Contorno)       ': 'RISCOS (Contorno) - SITUA√á√ÉO'}, inplace=True)
df_inexec_copy.rename(columns={'FX ADICIONAL (at√© 2024)': 'FX ADICIONAL - (at√© 2024) - Descri√ß√£o'}, inplace=True)
df_inexec_copy.rename(columns={'RISCOS (FX Adicional)       ': 'RISCOS (Faixa Adicional) - SITUA√á√ÉO'}, inplace=True)
df_inexec_copy.rename(columns={'TERCEIRA FAIXA (at√© 2024)': 'TERCEIRA FAIXA - (at√© 2024) - Descri√ß√£o'}, inplace=True)
df_inexec_copy.rename(columns={'RISCOS (Terceira Faixa)       ': 'RISCOS (Terceira Faixa) - SITUA√á√ÉO'}, inplace=True)

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - (at√© 2024) - km (i)', 
 'PAVIMENTA√á√ÉO - (at√© 2024) - km (f)', 
 'PAVIMENTA√á√ÉO - (at√© 2024) - Ext. (km)', 
 'PAVIMENTA√á√ÉO - (at√© 2024) - PERCENTUAL (%) PLAN', 
 'PAVIMENTA√á√ÉO - (at√© 2024) - (km)% PLAN', 
 'PAVIMENTA√á√ÉO - (at√© 2024) - FINANCEIRO PLAN (R$)', 
 'PAVIMENTA√á√ÉO - (at√© 2024) - PERCENTUAL (%) EXEC', 
 'PAVIMENTA√á√ÉO - (at√© 2024) - (km)% EXEC', 
 'PAVIMENTA√á√ÉO - (at√© 2024) - FINANCEIRO (R$)',
 'RISCOS (Pavimenta√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Pavimenta√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Pavimenta√ß√£o) - PRINCIPAL',
 'RISCOS (Pavimenta√ß√£o) - N√çVEL DE ALERTA',
 'DUPLICA√á√ÉO - (at√© 2024) - Descri√ß√£o',
 'DUPLICA√á√ÉO - (at√© 2024) - km (i)', 
 'DUPLICA√á√ÉO - (at√© 2024) - km (f)', 
 'DUPLICA√á√ÉO - (at√© 2024) - Ext. (km)', 
 'DUPLICA√á√ÉO - (at√© 2024) - PERCENTUAL (%) PLAN', 
 'DUPLICA√á√ÉO - (at√© 2024) - (km)% PLAN', 
 'DUPLICA√á√ÉO - (at√© 2024) - FINANCEIRO PLAN (R$)', 
 'DUPLICA√á√ÉO - (at√© 2024) - PERCENTUAL (%) EXEC', 
 'DUPLICA√á√ÉO - (at√© 2024) - (km)% EXEC', 
 'DUPLICA√á√ÉO - (at√© 2024) - FINANCEIRO (R$)',
 'RISCOS (Duplica√ß√£o) - SITUA√á√ÉO',
 'RISCOS (Duplica√ß√£o) - INTERFER√äNCIA',
 'RISCOS (Duplica√ß√£o) - PRINCIPAL',
 'RISCOS (Duplica√ß√£o) - N√çVEL DE ALERTA',
 'OAE - (at√© 2024) - Descri√ß√£o',
 'OAE - (at√© 2024) - km (i)', 
 'OAE - (at√© 2024) - km (f)', 
 'OAE - (at√© 2024) - Ext. (km)', 
 'OAE - (at√© 2024) - PERCENTUAL (%) PLAN', 
 'OAE - (at√© 2024) - (km)% PLAN', 
 'OAE - (at√© 2024) - FINANCEIRO PLAN (R$)', 
 'OAE - (at√© 2024) - PERCENTUAL (%) EXEC', 
 'OAE - (at√© 2024) - (km)% EXEC', 
 'OAE - (at√© 2024) - FINANCEIRO (R$)',
 'RISCOS (OAE) - SITUA√á√ÉO',
 'RISCOS (OAE) - INTERFER√äNCIA',
 'RISCOS (OAE) - PRINCIPAL',
 'RISCOS (OAE) - N√çVEL DE ALERTA',
 'CONTORNO - (at√© 2024) - Descri√ß√£o',
 'CONTORNO - (at√© 2024) - km (i)', 
 'CONTORNO - (at√© 2024) - km (f)', 
 'CONTORNO - (at√© 2024) - Ext. (km)', 
 'CONTORNO - (at√© 2024) - PERCENTUAL (%) PLAN', 
 'CONTORNO - (at√© 2024) - (km)% PLAN', 
 'CONTORNO - (at√© 2024) - FINANCEIRO PLAN (R$)', 
 'CONTORNO - (at√© 2024) - PERCENTUAL (%) EXEC', 
 'CONTORNO - (at√© 2024) - (km)% EXEC',
 'CONTORNO - (at√© 2024) - FINANCEIRO (R$)',
 'FX ADICIONAL - (at√© 2024) - Descri√ß√£o',
 'FX ADICIONAL - (at√© 2024) - km (i)',
 'FX ADICIONAL - (at√© 2024) - km (f)', 
 'FX ADICIONAL - (at√© 2024) - Ext. (km)', 
 'FX ADICIONAL - (at√© 2024) - PERCENTUAL (%) PLAN', 
 'FX ADICIONAL - (at√© 2024) - (km)% PLAN', 
 'FX ADICIONAL - (at√© 2024) - FINANCEIRO PLAN (R$)', 
 'FX ADICIONAL - (at√© 2024) - PERCENTUAL (%) EXEC', 
 'FX ADICIONAL - (at√© 2024) - (km)% EXEC', 
 'FX ADICIONAL - (at√© 2024) - FINANCEIRO (R$)',
 'TERCEIRA FAIXA - (at√© 2024) - km (i)', 
 'TERCEIRA FAIXA - (at√© 2024) - km (f)', 
 'TERCEIRA FAIXA - (at√© 2024) - Ext. (km)', 
 'TERCEIRA FAIXA - (at√© 2024) - PERCENTUAL (%) PLAN', 
 'TERCEIRA FAIXA - (at√© 2024) - (km)% PLAN', 
 'TERCEIRA FAIXA - (at√© 2024) - FINANCEIRO PLAN (R$)', 
 'TERCEIRA FAIXA - (at√© 2024) - PERCENTUAL (%) EXEC', 
 'TERCEIRA FAIXA - (at√© 2024) - (km)% EXEC', 
 'TERCEIRA FAIXA - (at√© 2024) - FINANCEIRO (R$)']

In [None]:
# Criar um dicion√°rio que mapeia 'Unnamed: x' para os novos nomes
rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=9)}

# Usar o m√©todo rename para renomear as colunas
df_inexec_copy.rename(columns=rename_dict, inplace=True)

In [None]:

# Identifica colunas que possuem a string 'RISCOS' em seu nome
columns_to_drop = [col for col in df_inexec_copy.columns if 'RISCOS' in col or 'OBSERVA√á√ïES' in col]

# Remove as colunas identificadas
df_inexec_copy = df_inexec_copy.drop(columns=columns_to_drop)

In [None]:
df_inexec_copy

In [None]:
df_inexec_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
columns_to_fill = ['EMPREENDIMENTO']
df_inexec_copy[columns_to_fill] = df_inexec_copy.groupby((df_inexec_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_inexec_copy['ESTADO/LOTE'] = df_inexec_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS',
       'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO',
       'MATO GROSSO', 'PAR√Å', 'RIO/SP', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA',
       'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_inexec_copy['ESTADO/LOTE'] = df_inexec_copy['ESTADO/LOTE'].fillna(method='ffill')

In [None]:
df_inexec_copy = df_inexec_copy[~df_inexec_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
df_meta_27_copy.columns

In [None]:
df_meta_27_copy.index = range(1, len(df_meta_27_copy) + 1)
df_meta_27_copy.index.name = 'ID-√öNICO'
df_meta_27_copy = df_meta_27_copy.reset_index()

In [None]:
df_inexec_raw = df_inexec_copy

In [None]:
# df_inexec_copy.to_excel('Dados Gerados/RAW_iNEXECUTADO (pend√™ncias at√© 24).xlsx', index=False)

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO']

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_inexec_copy.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_inexec_copy = df_inexec_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_inexec_copy['EMPREENDIMENTO'].unique()

In [None]:
df_inexec_copy = df_inexec_copy.loc[df_inexec_copy['Valor'] != 0]
df_inexec_copy = df_inexec_copy.dropna(subset=['Valor'])

In [None]:
df_inexec_copy[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_inexec_copy['Atributo'].str.split(' - ', expand=True)

In [None]:
# DROP de ['Atributo'] e Realocar ['Valor'] para o final da Tabela.

df_inexec_copy = df_inexec_copy[['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
       , 'Atributo.1', 'Atributo.2', 'Atributo.3', 'Valor']]

In [None]:
'''df_inexec_copy['Atributo.1'] = df_inexec_copy['Atributo.1'].apply(
    lambda x: x.replace('CONTORNO (at√© 2023)', 'CONTORNO')
              .replace('DUPLICA√á√ÉO (at√© 2023)', 'DUPLICA√á√ÉO')
              .replace('FX ADICIONAL (at√© 2023)', 'FX ADICIONAL')
              .replace('OAE (at√© 2023)', 'OAE')
              .replace('PAVIMENTA√á√ÉO (at√© 2023)', 'PAVIMENTA√á√ÉO')
              .replace('TERCEIRA FAIXA (at√© 2023)', 'TERCEIRA FAIXA')
)'''

In [None]:
# Converter colunas para 'category'
df_inexec_copy['SETOR'] = df_inexec_copy['SETOR'].astype('category')
df_inexec_copy['UF'] = df_inexec_copy['UF'].astype('category')
df_inexec_copy['PROPONENTE'] = df_inexec_copy['PROPONENTE'].astype('category')
df_inexec_copy['EXECUTOR (Grupo Controlador)'] = df_inexec_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_inexec_copy['ESTRUTURADOR DO PROJETO'] = df_inexec_copy['ESTRUTURADOR DO PROJETO'].astype('category')
df_inexec_copy['Atributo.1'] = df_inexec_copy['Atributo.1'].astype('category')
df_inexec_copy['Atributo.2'] = df_inexec_copy['Atributo.2'].astype('category')

# Converter colunas para 'string'
df_inexec_copy['EMPREENDIMENTO'] = df_inexec_copy['EMPREENDIMENTO'].astype('string') 


In [None]:
df_inexec_copy = df_inexec_copy.sort_values(by='ID-√öNICO', ascending=True)

In [None]:
df_inexec_copy

In [None]:
df_inexec_copy.to_excel('Dados Gerados/iNEXECUTADO (pend√™ncias at√© 24).xlsx', index=False)

<h1><b><i>'√Ä EXECUTAR (2026 DIANTE)'</b></i></h1>

In [None]:
#CHECKPOINT
df_a_executar_copy = df_a_executar.copy()

In [None]:
df_a_executar_copy = pd.read_excel(file_path, sheet_name='√Ä EXECUTAR (2026 DIANTE)', header=2)

In [None]:
df_a_executar_copy

In [None]:
df_a_executar_copy = df_a_executar_copy.drop([0, 1, 2], axis = 0)

In [None]:
# Renomear Coluna ['EXECUTOR...']
df_a_executar_copy.rename(columns={'EXECUTOR             (Grupo Controlador)': 'EXECUTOR (Grupo Controlador)'}, inplace=True)

df_a_executar_copy.rename(columns={'PAVIMENTA√á√ÉO': 'PAVIMENTA√á√ÉO - 2026 - Descri√ß√£o'}, inplace=True)
df_a_executar_copy.rename(columns={'DUPLICA√á√ÉO': 'DUPLICA√á√ÉO - 2026 - Descri√ß√£o'}, inplace=True)
df_a_executar_copy.rename(columns={'OAE': 'OAE - 2026 - Descri√ß√£o'}, inplace=True)
df_a_executar_copy.rename(columns={'CONTORNO': 'CONTORNO - 2026 - Descri√ß√£o'}, inplace=True)
df_a_executar_copy.rename(columns={'FX ADICIONAL': 'FX ADICIONAL - 2026 - Descri√ß√£o'}, inplace=True)
df_a_executar_copy.rename(columns={'TERCEIRA FAIXA': 'TERCEIRA FAIXA - 2026 - Descri√ß√£o'}, inplace=True)

In [None]:
new_column_names = ['PAVIMENTA√á√ÉO - 2026 - km (i)', 
                    'PAVIMENTA√á√ÉO - 2026 - km (f)', 
                    'PAVIMENTA√á√ÉO - 2026 - Ext. (km)', 
                    'PAVIMENTA√á√ÉO - 2026 - PERCENTUAL (%)', 
                    'PAVIMENTA√á√ÉO - 2026 - (km)%', 
                    'PAVIMENTA√á√ÉO - 2026 - FINANCEIRO (R$)',
                    'PAVIMENTA√á√ÉO - 2026 - Descri√ß√£o', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - km (i)', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - km (f)', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - Ext. (km)', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - PERCENTUAL (%)', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - (km)%', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - FINANCEIRO (R$)', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - REL. F√çSICO (km)', 
                    'PAVIMENTA√á√ÉO - P√≥s 2026 - REL.FINANCEIRO (R$)',
                    'DUPLICA√á√ÉO - 2026 - Descri√ß√£o', 
                    'DUPLICA√á√ÉO - 2026 - km (i)', 'DUPLICA√á√ÉO - 2026 - km (f)', 'DUPLICA√á√ÉO - 2026 - Ext. (km)', 
                    'DUPLICA√á√ÉO - 2026 - PERCENTUAL (%)', 'DUPLICA√á√ÉO - 2026 - (km)%', 'DUPLICA√á√ÉO - 2026 - FINANCEIRO (R$)', 
                    'DUPLICA√á√ÉO - P√≥s 2026 - Descri√ß√£o', 'DUPLICA√á√ÉO - P√≥s 2026 - km (i)', 'DUPLICA√á√ÉO - P√≥s 2026 - km (f)', 
                    'DUPLICA√á√ÉO - P√≥s 2026 - Ext. (km)', 'DUPLICA√á√ÉO - P√≥s 2026 - PERCENTUAL (%)', 'DUPLICA√á√ÉO - P√≥s 2026 - (km)%', 
                    'DUPLICA√á√ÉO - P√≥s 2026 - FINANCEIRO (R$)', 'DUPLICA√á√ÉO - P√≥s 2026 - REL. F√çSICO (km)', 'DUPLICA√á√ÉO - P√≥s 2026 - REL.FINANCEIRO (R$)',
                    'OAE - 2026 - Descri√ß√£o', 
                    'OAE - 2026 - km (i)', 'OAE - 2026 - km (f)', 'OAE - 2026 - Ext. (km)', 
                    'OAE - 2026 - PERCENTUAL (%)', 'OAE - 2026 - (km)%', 'OAE - 2026 - FINANCEIRO (R$)', 
                    'OAE - P√≥s 2026 - Descri√ß√£o', 'OAE - P√≥s 2026 - km (i)', 'OAE - P√≥s 2026 - km (f)', 
                    'OAE - P√≥s 2026 - Ext. (km)', 'OAE - P√≥s 2026 - PERCENTUAL (%)', 'OAE - P√≥s 2026 - (km)%', 
                    'OAE - P√≥s 2026 - FINANCEIRO (R$)', 'OAE - P√≥s 2026 - REL. F√çSICO (km)', 'OAE - P√≥s 2026 - REL.FINANCEIRO (R$)',
                    'CONTORNO - 2026 - Descri√ß√£o', 
                    'CONTORNO - 2026 - km (i)', 'CONTORNO - 2026 - km (f)', 'CONTORNO - 2026 - Ext. (km)', 
                    'CONTORNO - 2026 - PERCENTUAL (%)', 'CONTORNO - 2026 - (km)%', 'CONTORNO - 2026 - FINANCEIRO (R$)', 
                    'CONTORNO - P√≥s 2026 - Descri√ß√£o', 'CONTORNO - P√≥s 2026 - km (i)', 'CONTORNO - P√≥s 2026 - km (f)', 
                    'CONTORNO - P√≥s 2026 - Ext. (km)', 'CONTORNO - P√≥s 2026 - PERCENTUAL (%)', 'CONTORNO - P√≥s 2026 - (km)%', 
                    'CONTORNO - P√≥s 2026 - FINANCEIRO (R$)', 'CONTORNO - P√≥s 2026 - REL. F√çSICO (km)', 'CONTORNO - P√≥s 2026 - REL.FINANCEIRO (R$)',
                    'FX ADICIONAL - 2026 - Descri√ß√£o', 
                    'FX ADICIONAL - 2026 - km (i)', 'FX ADICIONAL - 2026 - km (f)', 'FX ADICIONAL - 2026 - Ext. (km)', 
                    'FX ADICIONAL - 2026 - PERCENTUAL (%)', 'FX ADICIONAL - 2026 - (km)%', 'FX ADICIONAL - 2026 - FINANCEIRO (R$)', 
                    'FX ADICIONAL - P√≥s 2026 - Descri√ß√£o', 'FX ADICIONAL - P√≥s 2026 - km (i)', 'FX ADICIONAL - P√≥s 2026 - km (f)', 
                    'FX ADICIONAL - P√≥s 2026 - Ext. (km)', 'FX ADICIONAL - P√≥s 2026 - PERCENTUAL (%)', 'FX ADICIONAL - P√≥s 2026 - (km)%', 
                    'FX ADICIONAL - P√≥s 2026 - FINANCEIRO (R$)', 'FX ADICIONAL - P√≥s 2026 - REL. F√çSICO (km)', 'FX ADICIONAL - P√≥s 2026 - REL.FINANCEIRO (R$)',
                    'TERCEIRA FAIXA - 2026 - Descri√ß√£o', 
                    'TERCEIRA FAIXA - 2026 - km (i)', 'TERCEIRA FAIXA - 2026 - km (f)', 'TERCEIRA FAIXA - 2026 - Ext. (km)', 
                    'TERCEIRA FAIXA - 2026 - PERCENTUAL (%)', 'TERCEIRA FAIXA - 2026 - (km)%', 'TERCEIRA FAIXA - 2026 - FINANCEIRO (R$)', 
                    'TERCEIRA FAIXA - P√≥s 2026 - Descri√ß√£o', 'TERCEIRA FAIXA - P√≥s 2026 - km (i)', 'TERCEIRA FAIXA - P√≥s 2026 - km (f)', 
                    'TERCEIRA FAIXA - P√≥s 2026 - Ext. (km)', 'TERCEIRA FAIXA - P√≥s 2026 - PERCENTUAL (%)', 'TERCEIRA FAIXA - P√≥s 2026 - (km)%', 
                    'TERCEIRA FAIXA - P√≥s 2026 - FINANCEIRO (R$)', 'TERCEIRA FAIXA - P√≥s 2026 - REL. F√çSICO (km)', 'TERCEIRA FAIXA - P√≥s 2026 - REL.FINANCEIRO (R$)']

In [None]:
# Criar um dicion√°rio que mapeia 'Unnamed: x' para os novos nomes
rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=9)}

# Usar o m√©todo rename para renomear as colunas
df_a_executar_copy.rename(columns=rename_dict, inplace=True)

In [None]:
df_a_executar_copy

In [None]:
df_a_executar_copy.dropna(subset=['ESTADO/LOTE'])

In [None]:
columns_to_fill = ['EMPREENDIMENTO']
df_a_executar_copy[columns_to_fill] = df_a_executar_copy.groupby((df_a_executar_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())

In [None]:
df_a_executar_copy['ESTADO/LOTE'] = df_a_executar_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS',
       'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO',
       'MATO GROSSO', 'PAR√Å', 'RIO/SP', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA',
       'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)

# Agora preenchemos para baixo at√© encontrar o pr√≥ximo valor n√£o-NaN (isto √©, a pr√≥xima 'Situa√ß√£o')
df_a_executar_copy['ESTADO/LOTE'] = df_a_executar_copy['ESTADO/LOTE'].fillna(method='ffill')

In [None]:
df_a_executar_copy = df_a_executar_copy[~df_a_executar_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]

In [None]:
df_a_executar_copy.columns

In [None]:
df_a_executar_copy.index = range(1, len(df_a_executar_copy) + 1)
df_a_executar_copy.index.name = 'ID-√öNICO'
df_a_executar_copy = df_a_executar_copy.reset_index()

In [None]:
df_a_executar_raw = df_a_executar_copy

In [None]:
# df_a_executar_copy.to_excel('Dados Gerados/RAW_√Ä EXECUTAR (2026 DIANTE).xlsx', index=False)

In [None]:
colunas_manter = ['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO']

# Use 'difference' para obter as colunas a serem unpivotadas
colunas_unpivot = df_a_executar_copy.columns.difference(colunas_manter)

# Realizar o unpivot (melt) das outras colunas
df_a_executar_copy = df_a_executar_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot,
                    var_name='Atributo', value_name='Valor')

In [None]:
df_a_executar_copy['EMPREENDIMENTO'].unique()

In [None]:
df_a_executar_copy = df_a_executar_copy.loc[df_a_executar_copy['Valor'] != 0]
df_a_executar_copy = df_a_executar_copy.dropna(subset=['Valor'])

In [None]:
df_a_executar_copy[['Atributo.1', 'Atributo.3', 'Atributo.2']] = df_a_executar_copy['Atributo'].str.split(' - ', expand=True)

In [None]:
# DROP de ['Atributo'] e Realocar ['Valor'] para o final da Tabela.

df_a_executar_copy = df_a_executar_copy[['ID-√öNICO', 'SETOR', 'UF', 'ESTADO/LOTE', 'BR', 'EMPREENDIMENTO',
       'PROPONENTE', 'EXECUTOR (Grupo Controlador)', 'ESTRUTURADOR DO PROJETO'
       , 'Atributo.1', 'Atributo.2', 'Atributo.3', 'Valor']]

In [None]:
df_a_executar_copy['Atributo.1'].unique()

In [None]:
'''

df_a_executar_copy['Atributo.1'] = df_a_executar_copy['Atributo.1'].apply(
    lambda x: x.replace('CONTORNO ', 'CONTORNO')
              .replace('DUPLICA√á√ÉO ', 'DUPLICA√á√ÉO')
              .replace('FX ADICIONAL ', 'FX ADICIONAL')
              .replace('OAE ', 'OAE')
              .replace('PAVIMENTA√á√ÉO ', 'PAVIMENTA√á√ÉO')
              .replace('TERCEIRA FAIXA ', 'TERCEIRA FAIXA')
)
'''

In [None]:
df_a_executar_copy['Atributo.2'].unique()

In [None]:
# Converter colunas para 'category'
df_a_executar_copy['SETOR'] = df_a_executar_copy['SETOR'].astype('category')
df_a_executar_copy['UF'] = df_a_executar_copy['UF'].astype('category')
df_a_executar_copy['PROPONENTE'] = df_a_executar_copy['PROPONENTE'].astype('category')
df_a_executar_copy['EXECUTOR (Grupo Controlador)'] = df_a_executar_copy['EXECUTOR (Grupo Controlador)'].astype('category')
df_a_executar_copy['ESTRUTURADOR DO PROJETO'] = df_a_executar_copy['ESTRUTURADOR DO PROJETO'].astype('category')
df_a_executar_copy['Atributo.1'] = df_a_executar_copy['Atributo.1'].astype('category')
df_a_executar_copy['Atributo.2'] = df_a_executar_copy['Atributo.2'].astype('category')

# Converter colunas para 'string'
df_a_executar_copy['EMPREENDIMENTO'] = df_a_executar_copy['EMPREENDIMENTO'].astype('string') 


In [None]:
df_a_executar_copy = df_a_executar_copy.sort_values(by='ID-√öNICO', ascending=True)

In [None]:
df_a_executar_copy

In [None]:
df_a_executar_copy.to_excel('Dados Gerados/√Ä EXECUTAR (2026 DIANTE).xlsx', index=False)

<h1><b><i>RISCOS - BI</b></i></h1>


In [None]:
df_riscos = pd.read_excel('Planilha Monitoramento de Riscos_Modelo_RODOVI√ÅRIO_20_02_24.xlsx')

In [None]:
file_path = 'Planilha Monitoramento de Riscos_Modelo_RODOVI√ÅRIO_20_02_24.xlsx'

In [None]:
#CHECKPOINT
df_riscos_copy = df_riscos.copy()

In [None]:
df_riscos_copy = pd.read_excel(file_path, sheet_name='RISCOS AMBIENTAIS', header=2)


In [None]:
df_riscos_copy.columns

In [None]:
df_riscos_copy = df_riscos_copy.rename(columns={'Unnamed: 3': 'Bin', 'Unnamed: 11': 'km(i)', 'Unnamed: 12': 'km(f)', 
                                                'Unnamed: 13': 'Ext.(km)', 'Unnamed: 14': 'FINANCEIRO(R$)',
                                                'Unnamed: 17': 'LI', 'Unnamed: 18': 'LO', 'Unnamed: 21': 'SISGLAF', 
                                                'Unnamed: 22': 'SEI', 'Unnamed: 27': 'Data do Atendimento', 
                                                'Unnamed: 28': 'N√çVEL DE ALERTA',
                                                'EXECUTOR             (Grupo Controlador)': 'EXECUTOR\n(Grupo Controlador)',
                                                'LOCALIZA√á√ÉO': 'Descri√ß√£o', 
                                                'PER': 'PER\nANO(Execu√ß√£o)', 
                                                'LICEN√áAS': 'LP', 
                                                'OBRAS': 'DATA DE IN√çCIO', 'PROCESSO': 'SINAFLOR', 
                                                'INTERFER√äNCIAS.1': 'Risco Principal'})

In [None]:
# Agora, modifique as colunas 'km(i)' e 'km(f)' para incluir o '+'
for col in ['km(i)', 'km(f)']:
    df_riscos_copy[col] = df_riscos_copy[col].astype(str).str.replace('(\d{3})(\d+)', r'\1+\2', regex=True)

In [None]:
# Colunas que precisam ser preenchidas at√© encontrar '1' em 'BR'
colunas_para_preencher = ['EMPREENDIMENTO', 'EXECUTOR\n(Grupo Controlador)',
       'DATA DE IN√çCIO DA CONCESS√ÉO', 'ANO DA CONCESS√ÉO']

# Iterar sobre as linhas do DataFrame
for coluna in colunas_para_preencher:
    valor_atual = None
    for idx, row in df_riscos_copy.iterrows():
        # Checa se 'BR' √© '1' ou se a linha da coluna a ser preenchida n√£o est√° vazia
        if row['BR'] == '1' or pd.notna(row[coluna]):
            valor_atual = row[coluna]
        df_riscos_copy.at[idx, coluna] = valor_atual

In [None]:
df_riscos_copy = df_riscos_copy.drop([0, 1, 2], axis = 0)
df_riscos_copy = df_riscos_copy.reset_index(drop=True)

In [None]:
df_riscos_copy = df_riscos_copy.loc[df_riscos_copy['BR'] != 1]

In [None]:
df_riscos_copy['BR'].unique()

In [None]:
df_riscos_copy = df_riscos_copy.reset_index(drop=True)

In [None]:
# Fun√ß√£o para limpar e converter as datas para o formato datetime
def limpar_e_converter_data(data):
    # Tratar dados como string para evitar problemas com diferentes tipos
    data = str(data)
    # Substituir '//'' por '/'
    data = data.replace('//', '/')
    # Substituir '/' por '-'
    data = data.replace('/', '-')
    # Tentar converter para datetime
    return pd.to_datetime(data, errors='coerce', dayfirst=True)

# Aplicar a fun√ß√£o no DataFrame
# Substitua 'df_riscos_copy' pelo nome do seu DataFrame e 'DATA DE IN√çCIO DA CONCESS√ÉO' pelo nome da coluna que cont√©m as datas
df_riscos_copy['DATA DE IN√çCIO DA CONCESS√ÉO'] = df_riscos_copy['DATA DE IN√çCIO DA CONCESS√ÉO'].apply(limpar_e_converter_data)

In [None]:
# Converter colunas para 'category'
df_riscos_copy['SETOR'] = df_riscos_copy['SETOR'].astype('object')
df_riscos_copy['UF'] = df_riscos_copy['UF'].astype('category')
df_riscos_copy['INTERFER√äNCIAS'] = df_riscos_copy['INTERFER√äNCIAS'].astype('category')
df_riscos_copy['INTERVEN√á√ÉO AFETADA'] = df_riscos_copy['INTERVEN√á√ÉO AFETADA'].astype('category')
df_riscos_copy['EXECUTOR\n(Grupo Controlador)'] = df_riscos_copy['EXECUTOR\n(Grupo Controlador)'].astype('category')
#df_riscos_copy['PROCESSO'] = df_riscos_copy['PROCESSO'].astype('category')
df_riscos_copy['Risco Principal'] = df_riscos_copy['Risco Principal'].astype('category')
#df_riscos_copy['Licen√ßas'] = df_riscos_copy['Licen√ßas'].astype('category')
#df_riscos_copy['Valor_Licen√ßas'] = df_riscos_copy['Valor_Licen√ßas'].astype('category')
df_riscos_copy['CRITICIDADE'] = df_riscos_copy['CRITICIDADE'].astype('category')
df_riscos_copy['N√çVEL DE ALERTA'] = df_riscos_copy['N√çVEL DE ALERTA'].astype('category')

# Converter colunas para 'int'
df_riscos_copy['FINANCEIRO(R$)'] = df_riscos_copy['FINANCEIRO(R$)'].replace('[\$]', '', regex=True).replace(',', '.', regex=True)
df_riscos_copy['FINANCEIRO(R$)'] = pd.to_numeric(df_riscos_copy['FINANCEIRO(R$)'], errors='coerce')

df_riscos_copy['ANO DA CONCESS√ÉO'] = pd.to_numeric(df_riscos_copy['ANO DA CONCESS√ÉO'], errors='coerce').fillna(0).astype(int)

# Converter colunas para 'float'
df_riscos_copy['Ext.(km)'] = pd.to_numeric(df_riscos_copy['Ext.(km)'], errors='coerce')

# Converter colunas para 'string'
df_riscos_copy['EMPREENDIMENTO'] = df_riscos_copy['EMPREENDIMENTO'].astype('string')
#df_riscos_copy['N¬∫ PROCESSO'] = df_riscos_copy['N¬∫ PROCESSO'].astype('string')
df_riscos_copy['Descri√ß√£o'] = df_riscos_copy['Descri√ß√£o'].astype('string')
df_riscos_copy['SITUA√á√ÉO GERAL'] = df_riscos_copy['SITUA√á√ÉO GERAL'].astype('string')  
df_riscos_copy['COMENT√ÅRIOS GERAIS'] = df_riscos_copy['COMENT√ÅRIOS GERAIS'].astype('string')

In [None]:
df_riscos_copy.columns

In [None]:
df_riscos_copy = df_riscos_copy[['SETOR', 'UF', 'BR', 'Bin', 'EMPREENDIMENTO',
       'EXECUTOR\n(Grupo Controlador)', 'DATA DE IN√çCIO DA CONCESS√ÉO',
       'ANO DA CONCESS√ÉO', 'INTERFER√äNCIAS', 'INTERVEN√á√ÉO AFETADA',
       'Descri√ß√£o', 'km(i)', 'km(f)', 'Ext.(km)', 'FINANCEIRO(R$)',
       'PER\nANO(Execu√ß√£o)', 'LP', 'LI', 'LO', 'DATA DE IN√çCIO', 'SINAFLOR',
       'SISGLAF', 'SEI', 'Risco Principal', 'CRITICIDADE', 'SITUA√á√ÉO GERAL',
       'COMENT√ÅRIOS GERAIS', 'Data do Atendimento', 'N√çVEL DE ALERTA']]

In [None]:
#df_riscos_copy.to_excel('Planilha Monitoramento de Riscos_Final.xlsx', index=False)

---

<h1><b><i>ID - RISCO</b></i></h1>
Sheet


In [None]:
df_id_riscos = df_riscos_copy[df_riscos_copy['Bin'] == 1]

In [None]:
#df_id_riscos = pd.read_excel('Planilha Monitoramento de Riscos_Final.xlsx')

In [None]:
(df_id_riscos['Bin'] == 1).sum()

In [None]:
df_id_riscos = df_id_riscos.reset_index(drop=True)

In [None]:
df_id_riscos.index = range(1, len(df_id_riscos) + 1)

In [None]:
df_id_riscos.to_excel('RISCOS - LIMPO/ID - RISCOS.xlsx')

<h3><b><i>'Descri√ß√£o'</b></i></h3>
Planilha 'Descri√ß√£o'


In [None]:
df_desc = pd.read_excel('RISCOS - LIMPO/ID - RISCOS.xlsx', sheet_name='Sheet1',
    usecols=['COMENT√ÅRIOS GERAIS'])

In [None]:
df_desc_copy = df_desc.copy()

In [None]:
df_desc_copy['COMENT√ÅRIOS GERAIS'].unique()

In [None]:
# Inicializa as colunas para cada categoria, incluindo uma para "Outras Descri√ß√µes"
categorias = ['Emitida', 'Em an√°lise', 'Aguardando', 'Solicitada', 'Sem informa√ß√£o', 'Pend√™ncia', 'Outras Descri√ß√µes']
for categoria in categorias:
       df_desc_copy[categoria] = None

# Iterando sobre as linhas do DataFrame
for index, row in df_desc_copy.iterrows():
    texto = row['COMENT√ÅRIOS GERAIS']
    if pd.isna(texto):  # Se a descri√ß√£o for NaN, pula para a pr√≥xima itera√ß√£o
        continue

    texto_inicial = texto.split()[0].lower()  # Considera apenas a primeira palavra para a categoriza√ß√£o
    
    # Inicialmente classifica como "Outras Descri√ß√µes"
    categoria = 'Outras Descri√ß√µes'

    # Verifica o in√≠cio da descri√ß√£o para determinar a categoria
    if texto_inicial.startswith('emitida'):
        categoria = 'Emitida'
    elif texto_inicial.startswith('em') and 'an√°lise' in texto.lower():
        categoria = 'Em an√°lise'
    elif texto_inicial.startswith('aguardando'):
        categoria = 'Aguardando'
    elif texto_inicial.startswith('solicitada'):
        categoria = 'Solicitada'
    elif texto_inicial.startswith('sem') and 'informa√ß√£o' in texto.lower():
        categoria = 'Sem informa√ß√£o'
    elif texto_inicial.startswith('pend√™ncia'):
        categoria = 'Pend√™ncia'
    
    # Atribui a descri√ß√£o √† categoria identificada
    df_desc_copy.at[index, categoria] = texto

In [None]:
df_desc_copy

In [None]:
df_desc_copy = df_desc_copy.drop(columns=['COMENT√ÅRIOS GERAIS'])

In [None]:
df_desc_copy.to_excel('RISCOS - LIMPO/Descri√ß√µes - Risco.xlsx', index=False)

<h2><b><i>'ID-RISCO' + 'Descri√ß√£o'</b></i></h2>
Script


In [None]:
import pandas as pd

In [None]:
df_riscos_concat = pd.read_excel('RISCOS - LIMPO/ID - RISCOS.xlsx')
df_desc_concat = pd.read_excel('RISCOS - LIMPO/Descri√ß√µes - Risco.xlsx')

In [None]:
df_desc_concat.fillna(0, inplace=True)

In [None]:
df_final = pd.concat([df_riscos_concat, df_desc_concat], axis=1)

In [None]:
df_final

In [None]:
df_final.rename(columns={'Unnamed: 0': 'ID-√öNICO'}, inplace=True)

In [None]:
df_final

<h2><b><i>'Risco' + 'Lista Suspensa'</b></i></h2>
Add colunas de Interfer√™ncia / Risco Principal


In [None]:
valores_lista_suspensa = [
    "Aus√™ncia de licen√ßas/autoriza√ß√µes ambientais para o empreendimento",
    "Aus√™ncia de licen√ßas/autoriza√ß√µes ambientais para as √°reas de uso",
    "Descumprimento de condicionantes ambientais",
    "Programas ambientais sem execu√ß√£o",
    "Descumprimento de exig√™ncias dos √≥rg√£os ambientais e intervenientes",
    "Descumprimento de exig√™ncias de √≥rg√£os de controle",
    "Medidas de prote√ß√£o e recupera√ß√£o ambiental previstas no projeto de engenharia n√£o executadas",
    "RNC n√£o solucionados",
    "Aus√™ncia de ASV",
    "Interfer√™ncia com comunidades Quilombolas",
    "N√£o existe pend√™ncia ambiental",
    "OUTROS"
]

# Criando colunas para cada risco na lista suspensa
for risco in valores_lista_suspensa:
    nome_coluna = risco.replace(" ", "_").replace("/", "_").replace("√ß", "c").replace("√£", "a").replace("/", "_").replace("(", "").replace(")", "").replace("√≥", "o").replace("√°", "a").replace("√©", "e").replace(".", "")
    df_final[nome_coluna] = ""
    
    # Preenchendo a nova coluna com 'ID-√önico' onde o risco corresponde
    df_final.loc[df_final['Risco Principal'] == risco, nome_coluna] = df_final['ID-√öNICO']

In [None]:
df_final.to_excel('DADOS - PRONTOS/Riscos - BI.xlsx', index=False, sheet_name= 'RISCOS')

---

<h1><b><i>Coluna FIN e KM novas</b></i></h1>
Sem Duplicadas.


In [None]:
# Carregar o DataFrame
riscos_km_fin = pd.read_excel('DADOS - PRONTOS/Riscos - BI.xlsx')
riscos_km_fin_copy = riscos_km_fin.copy()

In [None]:
def remove_duplicated_values(df):
    # Define as colunas para identificar duplicatas
    cols_to_check = ['INTERFER√äNCIAS', 'INTERVEN√á√ÉO AFETADA', 'Descri√ß√£o', 'km(i)', 'km(f)']
    
    # Marcar duplicatas, mantendo a primeira ocorr√™ncia de cada grupo
    duplicates_mask = df.duplicated(subset=cols_to_check, keep='first')
    
    # Criando as novas colunas 'Ext.(km)!' e 'FINANCEIRO(R$)!' onde n√£o houver duplicatas
    df['Ext.(km)!'] = df['Ext.(km)'].where(~duplicates_mask, None)
    df['FINANCEIRO(R$)!'] = df['FINANCEIRO(R$)'].where(~duplicates_mask, None)
    
    return df

In [None]:
# Aplicar a fun√ß√£o ao DataFrame
riscos_km_fin = remove_duplicated_values(riscos_km_fin)

In [None]:
# Inserir as novas colunas imediatamente ap√≥s as colunas originais
idx_ext_km = riscos_km_fin.columns.get_loc('Ext.(km)') + 1
idx_fin = riscos_km_fin.columns.get_loc('FINANCEIRO(R$)') + 1

In [None]:
riscos_km_fin.insert(idx_ext_km, 'Ext.(km)!', riscos_km_fin.pop('Ext.(km)!'))
riscos_km_fin.insert(idx_fin, 'FINANCEIRO(R$)!', riscos_km_fin.pop('FINANCEIRO(R$)!'))

In [None]:
# Salvar o DataFrame atualizado de volta ao arquivo Excel original
riscos_km_fin.to_excel('RISCOS - LIMPO/Riscos - BI.xlsx', index=False, sheet_name= 'RISCOS')

---

<h1><b><i>Documenta√ß√£o do Processamento dos Dados</i></b></h1>

<p>Este documento descreve o processo de limpeza e transforma√ß√£o dos dados presentes no arquivo Excel <code>Planilha de Monitoramento_PPI_2025_25_03_25_PPI_R18.xlsx</code>, especificamente na planilha "INFORMA√á√ïES (1)". O c√≥digo realiza v√°rias etapas de manipula√ß√£o de dados utilizando a biblioteca <code>pandas</code> para organizar, limpar e transformar os dados em um formato mais apropriado para an√°lises subsequentes.</p>

<h1><b><i>INFORMA√á√ïES (1)</i></b></h1>

<h2><b><i>Etapas do Processo</i></b></h2>

<h3><b><i>1. Leitura do Arquivo Excel</i></b></h3>
<p>O c√≥digo come√ßa carregando o arquivo Excel e acessando a planilha "INFORMA√á√ïES (1)" utilizando o m√©todo <code>pd.read_excel()</code>. Uma c√≥pia dos dados √© feita para evitar altera√ß√µes no arquivo original.</p>
<pre><code>df_informacoes_copy = pd.read_excel(file_path, sheet_name='INFORMA√á√ïES (1)', header=2)</code></pre>

<h3><b><i>2. Remo√ß√£o de Linhas Desnecess√°rias</i></b></h3>
<p>Em seguida, o c√≥digo remove as tr√™s primeiras linhas da planilha que cont√™m informa√ß√µes irrelevantes, al√©m de eliminar as linhas com valores ausentes na coluna <code>BR</code>.</p>
<pre><code>df_informacoes_copy = df_informacoes_copy.drop([0, 1, 2], axis=0)</code></pre>
<pre><code>df_informacoes_copy = df_informacoes_copy.dropna(subset=['BR'])</code></pre>

<h3><b><i>3. Preenchimento de Colunas Nulas</i></b></h3>
<p>O c√≥digo preenche as colunas vazias baseadas em um grupo de dados definido pela coluna <code>BR</code>. Isso √© feito utilizando a fun√ß√£o <code>transform(lambda x: x.ffill())</code> para realizar o preenchimento de valores faltantes (forward fill).</p>
<pre><code>columns_to_fill = ['ESTADO/LOTE', 'EMPREENDIMENTO', 'PROPONENTE', 'EXECUTOR (Grupo Controlador)',
       'ESTRUTURADOR DO PROJETO', 'ANO LEIL√ÉO', 'DATA DE IN√çCIO']</code></pre>
<pre><code>df_informacoes_copy[columns_to_fill] = df_informacoes_copy.groupby((df_informacoes_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())</code></pre>

<h3><b><i>4. Cria√ß√£o e Preenchimento de Colunas Derivadas</i></b></h3>
<p>A coluna <code>Situa√ß√£o</code> √© criada com base na coluna <code>KM Inicial</code>, sendo preenchida apenas com valores espec√≠ficos como 'ATIVO', 'CADUCIDADE', 'JUDICIAL', entre outros. O restante dos valores s√£o marcados como <code>NaN</code> e posteriormente preenchidos com o m√©todo <code>ffill()</code>.</p>
<pre><code>df_informacoes_copy['Situa√ß√£o'] = df_informacoes_copy['KM Inicial'].apply(lambda x: x if str(x) in ['ATIVO', 'CADUCIDADE', 'JUDICIAL', 'RELICITA√á√ÉO', 'RENEGOCIA√á√ÉO'] else pd.NA)</code></pre>
<pre><code>df_informacoes_copy['Situa√ß√£o'] = df_informacoes_copy['Situa√ß√£o'].fillna(method='ffill')</code></pre>

<h3><b><i>5. Tratamento de Dados Num√©ricos e de Texto</i></b></h3>
<p>O c√≥digo converte as colunas para o tipo adequado:
<ul>
    <li>Colunas categ√≥ricas como <code>SETOR</code>, <code>UF</code>, <code>ESTADO/LOTE</code>, <code>PROPONENTE</code>, etc., s√£o convertidas para o tipo <code>category</code>.</li>
    <li>Colunas num√©ricas como <code>ANO DA CONCESS√ÉO</code>, <code>PRAZO (anos)</code> s√£o convertidas para o tipo <code>int</code>.</li>
    <li>Colunas de valores monet√°rios e dist√¢ncias como <code>CAPEX (BI)</code>, <code>OPEX (BI)</code>, <code>INVESTIMENTO TOTAL (BI)</code>, <code>km (i)</code>, <code>km (f)</code> e <code>EXTENS√ÉO (km)</code> s√£o convertidas para o tipo <code>float</code>.</li>
</ul></p>
<pre><code>df_informacoes_copy['ANO DA CONCESS√ÉO'] = pd.to_numeric(df_informacoes_copy['ANO DA CONCESS√ÉO'], errors='coerce').fillna(0).astype(int)</code></pre>
<pre><code>df_informacoes_copy['CAPEX (BI)'] = pd.to_numeric(df_informacoes_copy['CAPEX (BI)'], errors='coerce')</code></pre>

<h3><b><i>6. Limpeza de Datas</i></b></h3>
<p>As datas na coluna <code>DATA DE IN√çCIO</code> s√£o limpas e convertidas para o formato <code>datetime</code> utilizando a fun√ß√£o <code>limpar_e_converter_data()</code>, que substitui caracteres indesejados e converte as datas corretamente.</p>
<pre><code>df_informacoes_copy['DATA DE IN√çCIO'] = df_informacoes_copy['DATA DE IN√çCIO'].apply(limpar_e_converter_data)</code></pre>

<h3><b><i>7. Filtragem de Dados</i></b></h3>
<p>Ap√≥s a limpeza, o c√≥digo filtra os dados para considerar apenas os registros onde o valor da coluna <code>BR</code> seja igual a 1. Em seguida, algumas colunas desnecess√°rias, como <code>SETOR</code>, <code>Regi√£o</code>, <code>Descri√ß√£o do Trecho</code>, etc., s√£o removidas.</p>
<pre><code>df_informacoes_copy = df_informacoes_copy[df_informacoes_copy['BR'] == 1]</code></pre>
<pre><code>columns_to_drop = ['SETOR', 'Regi√£o', 'Descri√ß√£o do Trecho', 'km (i)', 'km (f)']</code></pre>
<pre><code>df_informacoes_copy = df_informacoes_copy.drop(columns=columns_to_drop)</code></pre>

<h3><b><i>8. Renomea√ß√£o de Colunas</i></b></h3>
<p>Algumas colunas s√£o renomeadas para facilitar a leitura e padronizar os nomes. O dicion√°rio <code>rename_dict</code> √© utilizado para esse prop√≥sito.</p>
<pre><code>rename_dict = {'UF': 'Regi√£o', 'Etapa': 'ETAPA', 'Situa√ß√£o': 'SITUA√á√ÉO'}</code></pre>
<pre><code>df_informacoes_copy = df_informacoes_copy.rename(columns=rename_dict)</code></pre>

<h3><b><i>9. Substitui√ß√£o de Valores</i></b></h3>
<p>Na coluna <code>EMPREENDIMENTO</code>, ocorre uma substitui√ß√£o do valor 'CONCESS√ÉO VIA SUL' para 'VIA SUL'.</p>
<pre><code>df_informacoes_copy['EMPREENDIMENTO'] = df_informacoes_copy['EMPREENDIMENTO'].replace('CONCESS√ÉO VIA SUL', 'VIA SUL')</code></pre>

<h3><b><i>10. Exporta√ß√£o do Resultado</i></b></h3>
<p>Ap√≥s todas as transforma√ß√µes e limpezas, o DataFrame resultante √© exportado para um novo arquivo Excel.</p>
<pre><code>df_informacoes_copy.to_excel('NEW-SCRIPT - LIMPO/INFORMA√á√ïES (1).xlsx', index=False, sheet_name='INFORMA√á√ïES (1)')</code></pre>

<h2><b><i>Resumo das Altera√ß√µes Realizadas</i></b></h2>
<ul>
    <li>Limpeza e formata√ß√£o de dados.</li>
    <li>Preenchimento de valores ausentes com base em crit√©rios definidos.</li>
    <li>Convers√£o de colunas para tipos de dados adequados.</li>
    <li>Remo√ß√£o de colunas desnecess√°rias.</li>
    <li>Renomea√ß√£o de colunas para padroniza√ß√£o.</li>
    <li>Substitui√ß√£o de valores espec√≠ficos na coluna <code>EMPREENDIMENTO</code>.</li>
    <li>Exporta√ß√£o dos dados limpos para um novo arquivo Excel.</li>
</ul>
<p>Essas etapas garantem que os dados estejam prontos para an√°lises futuras, com todas as informa√ß√µes organizadas e padronizadas.</p>


---

<h1><b><i>PER (1)</i></b></h1>

<h2><b><i>Processamento dos Dados</i></b></h2>

<p>O c√≥digo inicia com o carregamento da planilha <code>'PER (1)'</code> para o DataFrame e realiza os seguintes tratamentos:</p>

<h3><b><i>Passos Iniciais de Limpeza e Tratamento</i></b></h3>
<ul>
<li>Cria√ß√£o de uma c√≥pia do DataFrame original <code>df_per_copy</code> e leitura da planilha <code>'PER (1)'</code>.</li>
<li>Remo√ß√£o das tr√™s primeiras linhas (√≠ndices 0, 1, 2) que s√£o apenas dados de layout.</li>
<li>Filtragem para excluir linhas onde a coluna <code>'BR'</code> seja igual a 1.</li>
<li>Remo√ß√£o de linhas com valores nulos nas colunas <code>'BR'</code> e <code>'ESTADO/LOTE'</code>.</li>
<li>Ajuste na coluna <code>'ESTADO/LOTE'</code> para garantir que ela contenha apenas valores v√°lidos (estados espec√≠ficos), preenchendo os valores faltantes com o m√©todo de <code>forward fill</code>.</li>
</ul>
<pre><code>df_per_copy = df_per_copy.drop([0, 1, 2], axis=0)</code></pre>
<pre><code>df_per_copy = df_per_copy.loc[df_per_copy['BR'] != 1]</code></pre>
<pre><code>df_per_copy = df_per_copy.dropna(subset=['BR'])</code></pre>
<pre><code>df_per_copy = df_per_copy.dropna(subset=['ESTADO/LOTE'])</code></pre>

<h3><b><i>2. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas s√£o renomeadas para melhorar a leitura e organizar a estrutura das informa√ß√µes, incluindo a adi√ß√£o de ano na descri√ß√£o das colunas. Algumas colunas com descri√ß√µes antigas foram atualizadas para refletir as mudan√ßas nos anos de dados.</p>
<pre><code>df_per_copy.rename(columns={'PAVIMENTA√á√ÉO': 'PAVIMENTA√á√ÉO - < 2022 - Descri√ß√£o'}, inplace=True)</code></pre>
<pre><code>df_per_copy.rename(columns={'DUPLICA√á√ÉO': 'DUPLICA√á√ÉO - < 2022 - Descri√ß√£o'}, inplace=True)</code></pre>
<pre><code>df_per_copy.rename(columns={'OAE': 'OAE - < 2022 - Descri√ß√£o'}, inplace=True)</code></pre>
<pre><code>df_per_copy.rename(columns={'CONTORNO': 'CONTORNO - < 2022 - Descri√ß√£o'}, inplace=True)</code></pre>

<h3><b><i>3. Cria√ß√£o de Novas Colunas</i></b></h3>
<p>Foi criada uma lista com novos nomes para as colunas, de acordo com os anos de dados (2022 a 2026) e outros atributos espec√≠ficos. O dicion√°rio <code>rename_dict</code> foi criado para mapear as colunas existentes para os novos nomes e, em seguida, as renomea√ß√µes foram aplicadas ao DataFrame.</p>
<pre><code>new_column_names = ['PAVIMENTA√á√ÉO - < 2022 - km (i)', 'PAVIMENTA√á√ÉO - < 2022 - km (f)', 'PAVIMENTA√á√ÉO - < 2022 - Ext. (km)', ...]</code></pre>
<pre><code>rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=9)}</code></pre>
<pre><code>df_per_copy.rename(columns=rename_dict, inplace=True)</code></pre>

<h3><b><i>4. Remo√ß√£o de Colunas Desnecess√°rias</i></b></h3>
<p>O c√≥digo tamb√©m remove algumas colunas desnecess√°rias para otimizar o DataFrame e evitar que dados irrelevantes sejam considerados nas an√°lises subsequentes. No caso, a coluna <code>Unnamed: 69</code> √© identificada e removida:</p>
<pre>
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy.iloc[:, :idx]
</pre>

<h3><b><i>5. Filtragem de Linhas Desnecess√°rias</i></b></h3>
<p>O c√≥digo tamb√©m aplica um filtro para remover linhas que cont√™m as palavras "TOTAL" ou "SOMA", que n√£o s√£o relevantes para a an√°lise detalhada:</p>
<pre>
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy[~df_plan_exec_ano_ant_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>6. Salvar o Arquivo Final</i></b></h3>
<p>Por fim, o DataFrame final, j√° tratado e reorganizado, √© salvo em um novo arquivo Excel:</p>
<pre>
df_plan_exec_ano_ant_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_PLAN_EXEC AT√â ANO ANTERIOR (22).xlsx', index=False)
</pre>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processo descrito transforma e organiza os dados do arquivo "PLAN_EXEC AT√â ANO ANTERIOR (22)" para facilitar an√°lises futuras e a integra√ß√£o com outras bases de dados. A utiliza√ß√£o de t√©cnicas como <code>fillna</code>, renomea√ß√£o de colunas e remo√ß√£o de dados irrelevantes contribui para a qualidade e clareza dos dados manipulados.</p>

---

<h1><b><i>PLAN_EXEC AT√â ANO ANTERIOR (22) -> (24)**</i></b></h1>

<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "PLAN_EXEC AT√â ANO ANTERIOR (22)" e sua transforma√ß√£o para o ano de 2024. O processo inclui a leitura do arquivo, limpeza de dados, preenchimento de valores ausentes, renomea√ß√£o de colunas, e transforma√ß√£o de dados para facilitar a an√°lise e integra√ß√£o com outras bases.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>A primeira etapa do processamento envolve a leitura do arquivo Excel que cont√©m os dados de execu√ß√£o at√© o ano de 2022. A leitura √© feita utilizando a fun√ß√£o <code>pd.read_excel</code>, especificando o caminho do arquivo e a planilha de interesse:</p>
<pre>
df_plan_exec_ano_ant_copy = pd.read_excel(file_path, sheet_name='PLAN_EXEC AT√â ANO ANTERIOR (22)', header=2)
</pre>
<p>O par√¢metro <code>header=2</code> √© utilizado para pular as primeiras linhas do arquivo que n√£o cont√™m dados relevantes para an√°lise.</p>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>Ap√≥s a leitura, o c√≥digo realiza o processo de limpeza dos dados. A primeira a√ß√£o √© remover as linhas com valores nulos na coluna <code>ESTADO/LOTE</code>, utilizando <code>dropna</code>:</p>
<pre>
df_plan_exec_ano_ant_copy.dropna(subset=['ESTADO/LOTE'])
</pre>
<p>Em seguida, a fun√ß√£o <code>groupby</code> √© usada para preencher os valores nulos em v√°rias colunas essenciais (como <code>SETOR</code>, <code>UF</code>, <code>BR</code>, etc.) com o √∫ltimo valor v√°lido de cada grupo, utilizando <code>ffill</code>:</p>
<pre>
df_plan_exec_ano_ant_copy[columns_to_fill] = df_plan_exec_ano_ant_copy.groupby((df_plan_exec_ano_ant_copy['BR'] == 1).cumsum())[columns_to_fill].transform(lambda x: x.ffill())
</pre>
<p>Essa abordagem preenche os valores ausentes para garantir que as informa√ß√µes sobre o setor, UF, e outros atributos importantes sejam propagadas corretamente.</p>

<h3><b><i>2.3. Filtragem de Estados</i></b></h3>
<p>Para garantir que os dados estejam corretos, o c√≥digo aplica um filtro para manter apenas as linhas em que a coluna <code>ESTADO/LOTE</code> contenha valores espec√≠ficos de estados v√°lidos. A fun√ß√£o <code>apply</code> √© utilizada para verificar se o valor na coluna √© um dos estados v√°lidos e, caso contr√°rio, marca o valor como <code>NaN</code>:</p>
<pre>
df_plan_exec_ano_ant_copy['ESTADO/LOTE'] = df_plan_exec_ano_ant_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
</pre>
<p>Ap√≥s isso, os valores nulos em <code>ESTADO/LOTE</code> s√£o preenchidos para baixo utilizando <code>fillna(method='ffill')</code>, para garantir que o estado de cada linha seja corretamente atribu√≠do:</p>
<pre>
df_plan_exec_ano_ant_copy['ESTADO/LOTE'] = df_plan_exec_ano_ant_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.4. Renomea√ß√£o de Colunas</i></b></h3>
<p>O pr√≥ximo passo √© renomear v√°rias colunas para torn√°-las mais descritivas e consistentes. Por exemplo, as colunas de descri√ß√£o para diferentes tipos de pavimenta√ß√£o, duplica√ß√£o, e outros tipos de interven√ß√µes recebem nomes mais claros e padronizados:</p>
<pre>
df_plan_exec_ano_ant_copy.rename(columns={'PAVIMENTA√á√ÉO (Acumulada at√© 2022)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_plan_exec_ano_ant_copy.rename(columns={'DUPLICA√á√ÉO (Acumulada at√© 2022)': 'DUPLICA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_plan_exec_ano_ant_copy.rename(columns={'OAE (Acumulada at√© 2022)': 'OAE - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
df_plan_exec_ano_ant_copy.rename(columns={'CONTORNO (Acumulada at√© 2022)': 'CONTORNO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.5. Transforma√ß√£o de Dados</i></b></h3>
<p>Ap√≥s a renomea√ß√£o das colunas, os dados s√£o reorganizados para um formato mais f√°cil de an√°lise. Para isso, s√£o definidas novas colunas para cada tipo de dado relevante. O c√≥digo usa um dicion√°rio para mapear as colunas e renome√°-las conforme necess√°rio:</p>
<pre>
rename_dict = {'Unnamed: {}'.format(i): name for i, name in enumerate(new_column_names, start=9)}
df_plan_exec_ano_ant_copy.rename(columns=rename_dict, inplace=True)
</pre>

<h3><b><i>2.6. Remo√ß√£o de Colunas Desnecess√°rias</i></b></h3>
<p>O c√≥digo tamb√©m remove algumas colunas desnecess√°rias para otimizar o DataFrame e evitar que dados irrelevantes sejam considerados nas an√°lises subsequentes. No caso, a coluna <code>Unnamed: 69</code> √© identificada e removida:</p>
<pre>
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy.iloc[:, :idx]
</pre>

<h3><b><i>2.7. Filtragem de Linhas Desnecess√°rias</i></b></h3>
<p>O c√≥digo tamb√©m aplica um filtro para remover linhas que cont√™m as palavras "TOTAL" ou "SOMA", que n√£o s√£o relevantes para a an√°lise. A fun√ß√£o <code>apply</code> com uma express√£o regular √© utilizada para realizar essa remo√ß√£o:</p>
<pre>
df_plan_exec_ano_ant_copy = df_plan_exec_ano_ant_copy[~df_plan_exec_ano_ant_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.8. Salvar o Arquivo Final</i></b></h3>
<p>Por fim, o DataFrame final, j√° tratado e reorganizado, √© salvo em um novo arquivo Excel para que possa ser utilizado posteriormente em an√°lises:</p>
<pre>
df_plan_exec_ano_ant_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_PLAN_EXEC AT√â ANO ANTERIOR (22).xlsx', index=False)
</pre>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processo descrito transforma e organiza os dados do arquivo "PLAN_EXEC AT√â ANO ANTERIOR (22)" para facilitar an√°lises futuras e a integra√ß√£o com outras bases de dados. A utiliza√ß√£o de t√©cnicas como <code>fillna</code>, renomea√ß√£o de colunas e remo√ß√£o de dados irrelevantes contribui para a qualidade e clareza dos dados manipulados.</p>

---

<h1><b><i>'META(2023)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processamento dos dados relativos ao arquivo "META(2023)", que s√£o lidos, limpos e organizados para an√°lise. O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para melhor entendimento e transforma√ß√£o dos dados para o formato ideal para an√°lise.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido utilizando a fun√ß√£o <code>pd.read_excel</code>, e a planilha 'META(1) 2023' √© carregada. A leitura √© feita a partir da terceira linha (header=2), pois as duas primeiras linhas n√£o cont√™m dados v√°lidos:</p>
<pre>
df_meta_23_copy = pd.read_excel(file_path, sheet_name='META(1) 2023', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas e colunas desnecess√°rias para garantir que os dados sejam bem formatados para an√°lise. As linhas 0, 1 e 2 s√£o removidas e as colunas de 'Regi√£o' s√£o descartadas:</p>
<pre>
df_meta_23_copy.drop(columns=['Regi√£o'], inplace=True)
df_meta_23_copy = df_meta_23_copy.drop(df_meta_23_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas relacionadas a diferentes categorias, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, Contorno, FX Adicional e Terceira Faixa, s√£o renomeadas para refletir com mais clareza a descri√ß√£o dos dados:</p>
<pre>
df_meta_23_copy.rename(columns={'PAVIMENTA√á√ÉO (Ano 2023)': 'PAVIMENTA√á√ÉO - (Acumulada at√© ano anterior) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>A fun√ß√£o <code>ffill</code> √© utilizada para preencher valores ausentes nas colunas de interesse, como 'EMPREENDIMENTO' e 'ESTADO/LOTE'. Tamb√©m √© aplicado um filtro para garantir que apenas estados v√°lidos sejam mantidos:</p>
<pre>
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', 'GOI√ÅS', 'SANTA CATARINA', 'TOCANTINS', 'GOIAS', 'RIO DE JANEIRO', 'MATO GROSSO', 'PAR√Å', 'S√ÉO PAULO', 'PARAN√Å', 'BAHIA', 'ESPIRITO SANTO', 'MATO GROSSO DO SUL'] else pd.NA)
df_meta_23_copy['ESTADO/LOTE'] = df_meta_23_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas que cont√™m os valores "TOTAL" ou "SOMA" s√£o removidas, pois representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada:</p>
<pre>
df_meta_23_copy = df_meta_23_copy[~df_meta_23_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>A transforma√ß√£o dos dados em um formato longo √© realizada com a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas, o que facilita a an√°lise. Al√©m disso, √© realizado um filtro para remover valores nulos e zerados:</p>
<pre>
df_meta_23_copy = df_meta_23_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>Por fim, o DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_meta_23_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_META(2023).xlsx', index=False)
</pre>

<h1><b><i>'META(2024)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2024)" segue os mesmos passos descritos para o "META(2023)", com a principal diferen√ßa no nome da planilha lida e nas colunas renomeadas para refletir o ano de 2024.</p>

<h1><b><i>'META(2025)'</i></b></h1>
<p>A descri√ß√£o do processo para "META(2025)" √© semelhante √† de "META(2024)", com as devidas atualiza√ß√µes no ano e nas colunas.</p>

<h1><b><i>'META(2026)'</i></b></h1>
<p>O processo de "META(2026)" segue os mesmos passos descritos anteriormente, com a atualiza√ß√£o do ano e das colunas correspondentes para o ano de 2026.</p>

<h1><b><i>'META(2027)'</i></b></h1>
<p>A documenta√ß√£o do processo para "META(2027)" √© id√™ntica aos anos anteriores, com a atualiza√ß√£o para os dados do ano de 2027.</p>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>O processamento dos dados para os anos de 2023 a 2027 segue a mesma metodologia, com a leitura dos arquivos, a limpeza, transforma√ß√£o, renomea√ß√£o de colunas e finalmente a organiza√ß√£o dos dados no formato desejado para an√°lise. Esses processos garantem que os dados estejam prontos para serem utilizados em outros fluxos de trabalho e an√°lises futuras.</p>

---

<h1><b><i>'iNEXECUTADO (pend√™ncias at√© 24)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>Esta se√ß√£o descreve o processo de leitura, limpeza e organiza√ß√£o dos dados referentes ao arquivo "iNEXECUTADO (pend√™ncias at√© 24)". O processo inclui a remo√ß√£o de colunas irrelevantes, renomea√ß√£o das colunas para refletir corretamente os dados e o tratamento de valores ausentes.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido a partir da planilha "iNEXECUTADO (pend√™ncias at√© 24)", e a leitura √© feita a partir da terceira linha (header=2):</p>
<pre>
df_inexec_copy = pd.read_excel(file_path, sheet_name='iNEXECUTADO (pend√™ncias at√© 24)', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>O c√≥digo realiza a remo√ß√£o de linhas desnecess√°rias e a remo√ß√£o de colunas irrelevantes. As linhas 0, 1 e 2 s√£o removidas e as colunas de "Regi√£o" s√£o descartadas:</p>
<pre>
df_inexec_copy.drop(columns=['Regi√£o'], inplace=True)
df_inexec_copy = df_inexec_copy.drop(df_inexec_copy.columns[8:176], axis=1)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas que descrevem as diferentes √°reas de execu√ß√£o (Pavimenta√ß√£o, Duplica√ß√£o, OAE, etc.) s√£o renomeadas para garantir clareza e consist√™ncia nos dados:</p>
<pre>
df_inexec_copy.rename(columns={'PAVIMENTA√á√ÉO (at√© 2024)': 'PAVIMENTA√á√ÉO - (at√© 2024) - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>Valores ausentes nas colunas s√£o preenchidos utilizando o m√©todo de preenchimento para frente <code>fillna(method='ffill')</code>, garantindo que a informa√ß√£o esteja presente para todas as linhas relevantes:</p>
<pre>
df_inexec_copy['ESTADO/LOTE'] = df_inexec_copy['ESTADO/LOTE'].apply(lambda x: x if str(x) in ['RIO GRANDE DO SUL', 'MINAS GERAIS', ...] else pd.NA)
df_inexec_copy['ESTADO/LOTE'] = df_inexec_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Remo√ß√£o de Linhas com "TOTAL" ou "SOMA"</i></b></h3>
<p>As linhas contendo "TOTAL" ou "SOMA" s√£o removidas, pois estas representam agrega√ß√µes que n√£o s√£o √∫teis para a an√°lise detalhada dos dados:</p>
<pre>
df_inexec_copy = df_inexec_copy[~df_inexec_copy.apply(lambda row: row.astype(str).str.contains('TOTAL|SOMA').any(), axis=1)]
</pre>

<h3><b><i>2.6. Unpivot dos Dados</i></b></h3>
<p>O processo de unpivot √© realizado para reorganizar as colunas em um formato longo, facilitando a an√°lise. As vari√°veis s√£o movidas para uma estrutura de linhas:</p>
<pre>
df_inexec_copy = df_inexec_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.7. Salvamento Final</i></b></h3>
<p>O DataFrame final √© salvo em um novo arquivo Excel, pronto para ser utilizado para an√°lise:</p>
<pre>
df_inexec_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_iNEXECUTADO (pend√™ncias at√© 24).xlsx', index=False)
</pre>

---

<h1><b><i>'√Ä EXECUTAR (2026 DIANTE)'</i></b></h1>
<h2><b><i>1. Descri√ß√£o do Processo</i></b></h2>
<p>O processo de tratamento dos dados para "√Ä EXECUTAR (2026 DIANTE)" segue uma metodologia similar √† de "iNEXECUTADO (pend√™ncias at√© 24)", com o foco na limpeza, renomea√ß√£o e transforma√ß√£o dos dados de execu√ß√£o para o ano de 2026 em diante.</p>

<h2><b><i>2. Etapas do Processamento</i></b></h2>

<h3><b><i>2.1. Leitura do Arquivo</i></b></h3>
<p>O arquivo Excel √© lido a partir da planilha "√Ä EXECUTAR (2026 DIANTE)", e a leitura √© feita a partir da terceira linha (header=2):</p>
<pre>
df_a_executar_copy = pd.read_excel(file_path, sheet_name='√Ä EXECUTAR (2026 DIANTE)', header=2)
</pre>

<h3><b><i>2.2. Limpeza de Dados</i></b></h3>
<p>As linhas desnecess√°rias s√£o removidas e as colunas irrelevantes s√£o descartadas. A coluna 'Regi√£o' tamb√©m √© descartada:</p>
<pre>
df_a_executar_copy.drop(columns=['Regi√£o'], inplace=True)
</pre>

<h3><b><i>2.3. Renomea√ß√£o de Colunas</i></b></h3>
<p>As colunas que representam diferentes √°reas de execu√ß√£o, como Pavimenta√ß√£o, Duplica√ß√£o, OAE, etc., s√£o renomeadas para refletir a descri√ß√£o atualizada dos dados:</p>
<pre>
df_a_executar_copy.rename(columns={'PAVIMENTA√á√ÉO': 'PAVIMENTA√á√ÉO - 2026 - Descri√ß√£o'}, inplace=True)
</pre>

<h3><b><i>2.4. Preenchimento de Valores Ausentes</i></b></h3>
<p>Valores ausentes nas colunas s√£o preenchidos de maneira semelhante ao processo anterior para garantir que os dados estejam completos:</p>
<pre>
df_a_executar_copy['ESTADO/LOTE'] = df_a_executar_copy['ESTADO/LOTE'].fillna(method='ffill')
</pre>

<h3><b><i>2.5. Unpivot dos Dados</i></b></h3>
<p>Os dados s√£o transformados para o formato longo utilizando a fun√ß√£o <code>melt</code>, movendo as vari√°veis de colunas para linhas para facilitar a an√°lise:</p>
<pre>
df_a_executar_copy = df_a_executar_copy.melt(id_vars=colunas_manter, value_vars=colunas_unpivot, var_name='Atributo', value_name='Valor')
</pre>

<h3><b><i>2.6. Salvamento Final</i></b></h3>
<p>O DataFrame processado √© salvo em um novo arquivo Excel:</p>
<pre>
df_a_executar_copy.to_excel('NEW-SCRIPT - LIMPO/RAW_√Ä EXECUTAR (2026 DIANTE).xlsx', index=False)
</pre>

<h2><b><i>3. Conclus√£o</i></b></h2>
<p>Os processos descritos acima s√£o implementados para os arquivos "iNEXECUTADO (pend√™ncias at√© 24)" e "√Ä EXECUTAR (2026 DIANTE)", garantindo que os dados estejam organizados e prontos para an√°lises detalhadas em cada √°rea espec√≠fica.</p>

---

<h2><b><i>FINAL -> TT - NS</i></b></h2>
<p>Ap√≥s todo esse processo de transforma√ß√µes e limpeza, os arquivos est√£o prontos para ser fundidos em uma tabela e planilha m√£e para alimenta√ß√£o do Relat√≥rio, este processo acontece dentro de outro notebook dentro da pasta NEW-SCRIPT - LIMPO, aonde se econtram todos os arquivos gerados/limpos por este c√≥digo e se localiza o notebook que acabamos de falar nomeado de "TT - NS" (Todas as Tabelas do New Script).</p>