## Ajuste de predicciones con factores multiplicativos

En esta sección aplicamos **factores de ajuste** a cada predicción generada para evaluar la sensibilidad en la competencia de Kaggle.  
Los factores considerados son:

- 0.98 (reducción del 2%)
- 0.99 (reducción del 1%)
- 1.01 (aumento del 1%)
- 1.02 (aumento del 2%)

Se generan nuevos archivos `.csv` con los sufijos correspondientes, por ejemplo:

- `pred_trivial_avg_201901_201912_x0.98.csv`
- `pred_trivial_last_201912_x1.02.csv`


### ✅ Código actualizado para guardar en subcarpeta predicciones/

In [4]:
import os
import pandas as pd

def aplicar_factores_y_guardar(path_pred_csv, factores=[0.98, 0.99, 1.01, 1.02], output_dir="predicciones"):
    """
    Toma un archivo CSV de predicción y genera versiones ajustadas multiplicando la columna 'tn'
    y las guarda en una carpeta de salida especificada.
    """
    # Crear subcarpeta si no existe
    os.makedirs(output_dir, exist_ok=True)

    # Nombre base sin extensión
    base = os.path.splitext(os.path.basename(path_pred_csv))[0]

    # Leer archivo
    df_pred = pd.read_csv(path_pred_csv)

    # Generar versiones escaladas
    for f in factores:
        df_ajustada = df_pred.copy()
        df_ajustada['tn'] = df_ajustada['tn'] * f
        nombre = f"{base}_x{f:.2f}.csv"
        path_salida = os.path.join(output_dir, nombre)
        df_ajustada.to_csv(path_salida, index=False)
        print(f"Archivo generado: {path_salida}")


### 🔁 Loop para aplicarlo a todos los archivos base



In [5]:
# Lista de archivos base
archivos = [
    "pred_trivial_avg_201807_201912.csv"
]

# Aplicar factores y guardar en subcarpeta
for archivo in archivos:
    aplicar_factores_y_guardar(archivo)


Archivo generado: predicciones\pred_trivial_avg_201807_201912_x0.98.csv
Archivo generado: predicciones\pred_trivial_avg_201807_201912_x0.99.csv
Archivo generado: predicciones\pred_trivial_avg_201807_201912_x1.01.csv
Archivo generado: predicciones\pred_trivial_avg_201807_201912_x1.02.csv


### ✅ Función: aplicar ruido normal aleatorio

In [16]:
import numpy as np


def aplicar_ruido_aleatorio(path_pred_csv, std_dev=0.01, output_dir="predicciones", seed=None):
    """
    Aplica ruido aleatorio multiplicativo con distribución normal N(1, std_dev) a la columna 'tn'.
    Guarda el resultado en la subcarpeta especificada.
    """
    # Semilla para reproducibilidad (opcional)
    if seed is not None:
        np.random.seed(seed)

    # Crear carpeta si no existe
    os.makedirs(output_dir, exist_ok=True)

    # Cargar archivo
    df_pred = pd.read_csv(path_pred_csv)
    n = len(df_pred)

    # Generar factores aleatorios desde N(1, std_dev)
    factores = np.random.normal(loc=0.99, scale=std_dev, size=n)

    # Aplicar factores
    df_pred['tn'] = df_pred['tn'] * factores

    # Guardar
    base = os.path.splitext(os.path.basename(path_pred_csv))[0]
    nombre_salida = f"{base}_ruidoN_{int(std_dev*100)}p.csv"
    path_salida = os.path.join(output_dir, nombre_salida)

    df_pred.to_csv(path_salida, index=False)
    print(f"Archivo generado con ruido: {path_salida}")


### 🧪 Aplicamos función con ruido aleatorio

In [17]:
aplicar_ruido_aleatorio("pred_trivial_avg_201901_201912.csv", std_dev=0.025, seed=17)

Archivo generado con ruido: predicciones\pred_trivial_avg_201901_201912_ruidoN_2p.csv
