### Importar y Cargar datos

In [2]:
import numpy as np
import pandas as pd
import os

# ---------------------------
# CARGA DE ARCHIVO
# ---------------------------
addresses = [
    'C:/Users/RONALD Q/OneDrive - LUZ DEL SUR S.A.A/Documentos/Estudios de Ingreso/ProyectoRyD_V2/Basededatos/FPC1C2.xlsx',
    'C:/Users/roquispec/OneDrive - LUZ DEL SUR S.A.A/Documentos/Estudios de Ingreso/ProyectoRyD_V2/Basededatos/FPC1C2.xlsx',
    'C:/Users/mticllacu/OneDrive - LUZ DEL SUR S.A.A/Archivos de Ronald Quispe Ocaña - ProyectoRyD_V2/Basededatos/FPC1C2.xlsx'
]

df = None
for path in addresses:
    if os.path.exists(path):
        df = pd.read_excel(path, header=1)
        print(f"✅ Archivo cargado desde: {path}")
        break

if df is None:
    raise FileNotFoundError("❌ No se encontró el archivo en ninguna de las rutas especificadas.")
df["SERIE"] = df["SERIE"].astype(str)
df['SERIE'] = df['SERIE'].astype(str).str.replace(" ", "")
df.head()

✅ Archivo cargado desde: C:/Users/roquispec/OneDrive - LUZ DEL SUR S.A.A/Documentos/Estudios de Ingreso/ProyectoRyD_V2/Basededatos/FPC1C2.xlsx


Unnamed: 0.1,Unnamed: 0,SERIE,FECHA,C1 H1 %,C1 H2 %,C1 H3 %,C1 H0 %,C1 H1 pF,C1 H2 pF,C1 H3 pF,...,C2 H1 %,C2 H2 %,C2 H3 %,C2 H0 %,C2 H1 pF,C2 H2 pF,C2 H3 pF,C2 H0 pF,TempR,HumR
0,,59571,2016-10-23,0.34,,,0.37,280.25,,,...,0.21,,,6.33,1114.5,,,373.17,,
1,,59571,2006-01-29,0.36,,,0.4,281.2,,,...,0.19,,,0.25,1053.0,,,360.6,,
2,,59571,1996-04-16,,,,,,,,...,,,,,,,,,,
3,,59572,2016-09-18,,,,,,,,...,,,,,,,,,,
4,,59572,2006-01-29,0.37,,,0.34,288.1,,,...,0.21,,,0.26,1072.0,,,353.6,,


### Limpieza de Datos

In [3]:
# ---------------------------
# LIMPIEZA DE DATOS
# ---------------------------

df = df.drop(columns=df.columns[0])  # elimina la primera columna vacía
cols_base = ['SERIE', 'FECHA']
cols_fp = [col for col in df.columns if col.endswith('%')]

df_fp = df[cols_base + cols_fp]  # dataset base solo con %s
df_fp.head()    

Unnamed: 0,SERIE,FECHA,C1 H1 %,C1 H2 %,C1 H3 %,C1 H0 %,C2 H1 %,C2 H2 %,C2 H3 %,C2 H0 %
0,59571,2016-10-23,0.34,,,0.37,0.21,,,6.33
1,59571,2006-01-29,0.36,,,0.4,0.19,,,0.25
2,59571,1996-04-16,,,,,,,,
3,59572,2016-09-18,,,,,,,,
4,59572,2006-01-29,0.37,,,0.34,0.21,,,0.26


### Subtabla C2

In [4]:
# ---------------------------
# SUBTABLA C2
# ---------------------------
cols_fp_c2 = [col for col in df_fp.columns if col.startswith('C2')]
df_fp_c2 = df_fp[cols_base + cols_fp_c2].copy()

# máximo de FP C2
df_fp_c2['Max_FP_C2'] = df_fp_c2[cols_fp_c2].max(axis=1)


### Configuración de puntajes

In [5]:
# ---------------------------
# CONFIGURACIÓN DE PUNTAJE
# ---------------------------
pesos = [5, 1]  
limites = {"FP": [1.0, 0.5]}  # [límite superior, límite inferior]

def asignar_puntaje(df, columna_valor, columna_puntaje, limites, pesos):
    df[columna_puntaje] = np.select(
        [
            df[columna_valor] > limites[0],
            df[columna_valor] <= limites[0]
        ],
        pesos,
        default=np.nan
    )
    return df

# aplicar regla IEEE
df_fp_c2 = asignar_puntaje(df_fp_c2, 'Max_FP_C2', 'FPBC2', limites["FP"], pesos)
df_fp_c2.head()
# aplicar regla IEEE
df_fp_c2 = asignar_puntaje(df_fp_c2, 'Max_FP_C2', 'FPBC2', limites["FP"], pesos)

# ---------------------------
# TABLAS BASE
# ---------------------------
df_FP_C2 = df_fp_c2[['SERIE', 'FECHA', 'FPBC2']].copy()   # tabla base

# tabla detallada
df_full_C2 = df_fp_c2[['SERIE', 'FECHA', 'FPBC2'] + cols_fp_c2].copy()

### Extensión del calendario desde 2015 al dia de hoy

In [6]:
# ---------------------------
# EXTENSIÓN DEL CALENDARIO DESDE 2015
# ---------------------------
inicio = "2015-01-01"
fecha_inicio = pd.Timestamp(inicio)
fecha_fin = pd.Timestamp.today().normalize()
fechas = pd.date_range(fecha_inicio, fecha_fin, freq="D")

todas_series = df['SERIE'].dropna().unique()
calendario = pd.MultiIndex.from_product([todas_series, fechas], names=["SERIE", "FECHA"])
df_calendario = pd.DataFrame(index=calendario).reset_index()

# ---------- tabla extendida FPBC2 ----------
ultimos_2015 = df_FP_C2[df_FP_C2['FECHA'] < fecha_inicio].sort_values('FECHA').groupby('SERIE').tail(1)
ultimos_2015['FECHA'] = fecha_inicio
base_ext = pd.concat([df_FP_C2, ultimos_2015], ignore_index=True)

df_extendida_FP_C2 = pd.merge(df_calendario, base_ext, on=["SERIE","FECHA"], how="left")
df_extendida_FP_C2 = df_extendida_FP_C2.groupby("SERIE").apply(lambda g: g.ffill()).reset_index(drop=True)

# ---------- tabla detallada extendida ----------
ultimos_2015_det = df_full_C2[df_full_C2['FECHA'] < fecha_inicio].sort_values('FECHA').groupby('SERIE').tail(1)
ultimos_2015_det['FECHA'] = fecha_inicio
base_ext_det = pd.concat([df_full_C2, ultimos_2015_det], ignore_index=True)

df_detalles_ext_FP_C2 = pd.merge(df_calendario, base_ext_det, on=["SERIE","FECHA"], how="left")
df_detalles_ext_FP_C2 = df_detalles_ext_FP_C2.groupby("SERIE").apply(lambda g: g.ffill()).reset_index(drop=True)

  df_extendida_FP_C2 = df_extendida_FP_C2.groupby("SERIE").apply(lambda g: g.ffill()).reset_index(drop=True)
  df_detalles_ext_FP_C2 = df_detalles_ext_FP_C2.groupby("SERIE").apply(lambda g: g.ffill()).reset_index(drop=True)


### Funciones a llamar

In [7]:
# ---------------------------
# FUNCIONES PARA LLAMAR
# ---------------------------
def get_df_FP_C2():
    return df_FP_C2

def get_df_extendida_FP_C2():
    return df_extendida_FP_C2

def get_df_detalles_FP_C2():
    return df_full_C2

def get_df_detalles_ext_FP_C2():
    return df_detalles_ext_FP_C2

# ---------------------------
# DEMO DE RESULTADOS
# ---------------------------
print("\n ====== TABLA FPBC2 ORIGINAL ====== \n")
print(get_df_FP_C2().head(), "\n")

print("\n ====== TABLA FPBC2 EXTENDIDA ====== \n")
print(get_df_extendida_FP_C2().tail(), "\n")

print("\n ====== TABLA DETALLADA FPBC2 ====== \n")
print(get_df_detalles_FP_C2().head(), "\n")

print("\n ====== TABLA DETALLADA EXTENDIDA FPBC2 ====== \n")
print(get_df_detalles_ext_FP_C2().tail(), "\n")




   SERIE      FECHA  FPBC2
0  59571 2016-10-23    5.0
1  59571 2006-01-29    1.0
2  59571 1996-04-16    NaN
3  59572 2016-09-18    NaN
4  59572 2006-01-29    1.0 



          SERIE      FECHA  FPBC2
523319  V147103 2025-11-03    NaN
523320  V147103 2025-11-04    NaN
523321  V147103 2025-11-05    NaN
523322  V147103 2025-11-06    NaN
523323  V147103 2025-11-07    NaN 



   SERIE      FECHA  FPBC2  C2 H1 %  C2 H2 %  C2 H3 %  C2 H0 %
0  59571 2016-10-23    5.0     0.21      NaN      NaN     6.33
1  59571 2006-01-29    1.0     0.19      NaN      NaN     0.25
2  59571 1996-04-16    NaN      NaN      NaN      NaN      NaN
3  59572 2016-09-18    NaN      NaN      NaN      NaN      NaN
4  59572 2006-01-29    1.0     0.21      NaN      NaN     0.26 



          SERIE      FECHA  FPBC2  C2 H1 %  C2 H2 %  C2 H3 %  C2 H0 %
523319  V147103 2025-11-03    NaN      NaN      NaN      NaN      NaN
523320  V147103 2025-11-04    NaN      NaN      NaN      NaN      NaN
523321  V147103 2025-11-05    Na