# Proyecto2025_Riesgo_Operativo_Aerogeneradores_RioGrande_TDF

**Materia:** Aprendizaje Automático  
**Autor:** Sabrina Villegas  
**Fecha:** 04 de Junio de 2025  
**Notebook:** 03 - Características (Features)

---

## Objetivo

El objetivo de este notebook es:

- Crear un **índice de riesgo operativo** combinando variables climáticas.
- Definir una variable objetivo **`riesgo_operativo`** en tres categorías: **bajo**, **medio** y **alto**.
- Generar variables adicionales que puedan enriquecer el análisis predictivo, y de esa forma mejorar el desempeño del modelo de Machine Learning.

---

In [10]:
# Importar librerías
import pandas as pd
import numpy as np


In [12]:
# Cargar el dataset procesado
path_merged = '../data/processed/merged_dataset.csv'
df = pd.read_csv(path_merged)

In [14]:
# Crear un índice de riesgo compuesto - Fórmula: combinación ponderada de variables climáticas

# Definir riesgo_score
# 0.6 * Velocidad del viento + 0.2 * Ráfagas de viento - 0.1 * Temperatura mínima
# Ajuste: normalizamos wspd de km/h a m/s dividiendo por 3.6 si queremos que las unidades sean coherentes 

df['wspd_m_s'] = df['wspd'] / 3.6  # opcional si querés unificar unidades


In [16]:
# Crear el riesgo_score
df['riesgo_score'] = (
    0.6 * df['Wind Speed (m/s)'] +
    0.2 * df['wspd_m_s'] - 
    0.1 * df['tmin']
)

In [18]:
# Crear la variable objetivo basada en riesgo_score
# Definimos los umbrales

def categorizar_riesgo_compuesto(score):
    if score < 10:
        return 'Bajo'
    elif 10 <= score < 20:
        return 'Medio'
    else:
        return 'Alto'

df['riesgo_operativo'] = df['riesgo_score'].apply(categorizar_riesgo_compuesto)

In [20]:
# 5. Confirmar la distribución de clases

print("Distribución de clases en 'riesgo_operativo':")
print(df['riesgo_operativo'].value_counts())

Distribución de clases en 'riesgo_operativo':
riesgo_operativo
Bajo     297
Medio     13
Alto       9
Name: count, dtype: int64


In [26]:
# Crear variables adicionales - Binarizar si el viento es del oeste (270° +/- 45°)

def direccion_oeste(direccion):
    if (direccion >= 225) and (direccion <= 315):
        return 1
    else:
        return 0

df['viento_oeste'] = df['Wind Direction (°)'].apply(direccion_oeste)

In [28]:
# Guardar el dataset final preparado
df.to_csv('../data/processed/final_dataset.csv', index=False)
print("Dataset final guardado correctamente en ../data/processed/final_dataset.csv")

Dataset final guardado correctamente en ../data/processed/final_dataset.csv
