# Red Neuronal

Variables caracteristicas

Fuente_Industrial (Discreta: Baja/Alta)
Velocidad_Corriente (Discreta: Lenta/R√°pida)
Profundidad (Discreta: Superficie/Fondo)
Concentracion_Mercurio (Discreta: Baja/Media/Alta)
Impacto_Ecologico (Binaria: S√≠/No)

Variable objetivo: 
Riesgo_Humano (Binaria: Seguro/Peligroso)


* Configurar Red neuronal para predecir el riesgo humano, capa de entrada, una capa oculta y una capa de salida
* Es apropiado usar Softmax??
* Configure capa oculta sigmoide | RElU
* Comapre los modelos experimentados con base a metricas de precisi√≥n, exactitud, exhaustividad.


Utilizar datos_mercurio_seguros.csv para llenar la tabla de distribucion de probabilidades.

Consultas a responder con el modelo:

* Probabilidad de alto riesgo humano cuando la fuente industrial es alta
* Cu√°l es la probabilidad de que el riesgo humano sea peligroso cuando la concentraci√≥n de mercurio es alta y la fuente industrial est√° activa?"
* ¬øC√≥mo cambia el impacto ecol√≥gico si se reduce la velocidad de la corriente en zonas profundas?"
* "¬øA partir de qu√© nivel de concentraci√≥n la probabilidad de riesgo humano supera el 50%?"

In [1]:
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import OneHotEncoder
from RedNeuronal import RedNeuronal, Sigmoid, ReLU, Softmax

In [2]:
# =================================================================
# 1. CARGAR Y PREPROCESAR DATOS
# =================================================================
# Cargar datos
data = pd.read_csv('datos_mercurio_seguros.csv')

# Mapear valores num√©ricos a etiquetas textuales
mapping = {
    'Fuente_Industrial': {0: 'Baja', 1: 'Alta'},
    'Velocidad_Corriente': {0: 'Lenta', 1: 'R√°pida'},
    'Profundidad': {0: 'Superficie', 1: 'Fondo'},
    'Concentracion_Mercurio': {0: 'Baja', 1: 'Media', 2: 'Alta'},
    'Impacto_Ecologico': {0: 'No', 1: 'S√≠'},
    'Riesgo_Humano': {0: 'Seguro', 1: 'Peligroso'}
}

# Aplicar mapeo
for col, mapping_dict in mapping.items():
    if col in data.columns:
        data[col] = data[col].map(mapping_dict)

# Codificar caracter√≠sticas usando One-Hot Encoding
categorical_cols = [
    'Fuente_Industrial', 
    'Velocidad_Corriente', 
    'Profundidad', 
    'Concentracion_Mercurio', 
    'Impacto_Ecologico'
]

encoder = OneHotEncoder(sparse_output=False, drop='if_binary')
X_encoded = encoder.fit_transform(data[categorical_cols])

# Obtener nombres de caracter√≠sticas despu√©s de la codificaci√≥n
feature_names = []
for i, col in enumerate(categorical_cols):
    if len(encoder.categories_[i]) == 2:  # Caracter√≠sticas binarias
        feature_names.append(f"{col}_{encoder.categories_[i][1]}")
    else:
        for category in encoder.categories_[i]:
            feature_names.append(f"{col}_{category}")

# Variable objetivo
y = data['Riesgo_Humano'].map({'Seguro': 0, 'Peligroso': 1}).values

# Dividir datos en entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(
    X_encoded, y, test_size=0.3, random_state=42
)

In [3]:
# =================================================================
# 2. CONFIGURAR Y ENTRENAR MODELOS
# =================================================================
# Configuraci√≥n com√∫n
input_size = X_train.shape[1]
output_size = 2  # Seguro (0) y Peligroso (1)

# Modelo 1: Capa oculta con activaci√≥n Sigmoid
model_sigmoid = RedNeuronal(
    output_activation=Softmax(),
    hidden_activation=Sigmoid(),
    hidden_layers=1,
    lambda_=0.01
)
model_sigmoid.configurar_capas(
    input_size=input_size,
    hidden_size=10,  # 10 neuronas en capa oculta
    output_size=output_size
)
model_sigmoid.inicializar_parametros()
model_sigmoid.fit(X_train, y_train)
result_sigmoid = model_sigmoid.entrenar(max_iter=200)

# Modelo 2: Capa oculta con activaci√≥n ReLU
model_relu = RedNeuronal(
    output_activation=Softmax(),
    hidden_activation=ReLU(),
    hidden_layers=1,
    lambda_=0.01
)
model_relu.configurar_capas(
    input_size=input_size,
    hidden_size=10,  # 10 neuronas en capa oculta
    output_size=output_size
)
model_relu.inicializar_parametros()
model_relu.fit(X_train, y_train)
result_relu = model_relu.entrenar(max_iter=200)

In [4]:
# =================================================================
# 3. EVALUAR MODELOS
# =================================================================
def evaluar_modelo(modelo, X, y, nombre):
    metricas = modelo.metricas_completas(X, y)
    
    print(f"\nüîç M√©tricas para modelo {nombre}:")
    print(f"‚Ä¢ Accuracy: {metricas['accuracy']:.4f}")
    print(f"‚Ä¢ Precision (Clase 0 - Seguro): {metricas['precision'][0]:.4f}")
    print(f"‚Ä¢ Precision (Clase 1 - Peligroso): {metricas['precision'][1]:.4f}")
    print(f"‚Ä¢ Recall (Clase 0 - Seguro): {metricas['recall'][0]:.4f}")
    print(f"‚Ä¢ Recall (Clase 1 - Peligroso): {metricas['recall'][1]:.4f}")
    print(f"‚Ä¢ F1-Score (Clase 0 - Seguro): {metricas['f1'][0]:.4f}")
    print(f"‚Ä¢ F1-Score (Clase 1 - Peligroso): {metricas['f1'][1]:.4f}")
    
    return metricas

# Evaluar ambos modelos en datos de prueba
print("\n" + "="*50)
metricas_sigmoid = evaluar_modelo(model_sigmoid, X_test, y_test, "Sigmoid")
print("\n" + "="*50)
metricas_relu = evaluar_modelo(model_relu, X_test, y_test, "ReLU")
print("="*50)



üîç M√©tricas para modelo Sigmoid:
‚Ä¢ Accuracy: 0.7625
‚Ä¢ Precision (Clase 0 - Seguro): 0.7625
‚Ä¢ Precision (Clase 1 - Peligroso): 0.0000
‚Ä¢ Recall (Clase 0 - Seguro): 1.0000
‚Ä¢ Recall (Clase 1 - Peligroso): 0.0000
‚Ä¢ F1-Score (Clase 0 - Seguro): 0.8652
‚Ä¢ F1-Score (Clase 1 - Peligroso): 0.0000


üîç M√©tricas para modelo ReLU:
‚Ä¢ Accuracy: 0.4458
‚Ä¢ Precision (Clase 0 - Seguro): 0.7358
‚Ä¢ Precision (Clase 1 - Peligroso): 0.2164
‚Ä¢ Recall (Clase 0 - Seguro): 0.4262
‚Ä¢ Recall (Clase 1 - Peligroso): 0.5088
‚Ä¢ F1-Score (Clase 0 - Seguro): 0.5398
‚Ä¢ F1-Score (Clase 1 - Peligroso): 0.3037


In [5]:
# =================================================================
# 4. COMPARAR MODELOS
# =================================================================
print("\nüèÜ Comparaci√≥n de modelos:")
print(f"‚Ä¢ Accuracy - Sigmoid: {metricas_sigmoid['accuracy']:.4f} | ReLU: {metricas_relu['accuracy']:.4f}")
print(f"‚Ä¢ F1-Score (Peligroso) - Sigmoid: {metricas_sigmoid['f1'][1]:.4f} | ReLU: {metricas_relu['f1'][1]:.4f}")

# Determinar mejor modelo
if metricas_relu['accuracy'] > metricas_sigmoid['accuracy']:
    mejor_modelo = model_relu
    mejor_nombre = "ReLU"
else:
    mejor_modelo = model_sigmoid
    mejor_nombre = "Sigmoid"

print(f"\nEl mejor modelo es: {mejor_nombre}")



üèÜ Comparaci√≥n de modelos:
‚Ä¢ Accuracy - Sigmoid: 0.7625 | ReLU: 0.4458
‚Ä¢ F1-Score (Peligroso) - Sigmoid: 0.0000 | ReLU: 0.3037

El mejor modelo es: Sigmoid


In [6]:
# =================================================================
# 5. RESPUESTA A CONSULTAS CON EL MEJOR MODELO
# =================================================================
def predecir_riesgo(mejor_modelo, caracteristicas):
    """Predice la probabilidad de riesgo peligroso"""
    # Convertir caracter√≠sticas a formato one-hot
    entrada = pd.DataFrame([caracteristicas], columns=categorical_cols)
    entrada_encoded = encoder.transform(entrada)
    
    # Predecir probabilidades
    probabilidades = mejor_modelo.predecir_probabilidad(entrada_encoded)
    return probabilidades[0][1]  # Probabilidad de clase Peligroso

print("\nüîÆ Consultas con el mejor modelo:")
# Consulta 1: Probabilidad de riesgo peligroso cuando fuente industrial es alta
caracteristicas1 = {
    'Fuente_Industrial': 'Alta',
    'Velocidad_Corriente': 'Lenta',  # Valor por defecto
    'Profundidad': 'Fondo',         # Valor por defecto
    'Concentracion_Mercurio': 'Media',  # Valor por defecto
    'Impacto_Ecologico': 'S√≠'       # Valor por defecto
}
prob1 = predecir_riesgo(mejor_modelo, caracteristicas1)
print(f"1. Probabilidad de riesgo peligroso | Fuente Industrial = Alta: {prob1:.4f}")

# Consulta 2: Riesgo peligroso con concentraci√≥n alta y fuente activa
caracteristicas2 = {
    'Fuente_Industrial': 'Alta',
    'Velocidad_Corriente': 'Lenta',
    'Profundidad': 'Fondo',
    'Concentracion_Mercurio': 'Alta',
    'Impacto_Ecologico': 'S√≠'
}
prob2 = predecir_riesgo(mejor_modelo, caracteristicas2)
print(f"2. Probabilidad riesgo peligroso | [Concentraci√≥n=Alta y Fuente=Alta]: {prob2:.4f}")

# Consulta 3: Cambio al reducir velocidad en zonas profundas
# Estado base: Velocidad r√°pida en fondo
caracteristicas3_base = {
    'Fuente_Industrial': 'Alta',
    'Velocidad_Corriente': 'R√°pida',
    'Profundidad': 'Fondo',
    'Concentracion_Mercurio': 'Media',
    'Impacto_Ecologico': 'S√≠'
}

# Estado reducido: Velocidad lenta en fondo
caracteristicas3_reducido = {
    'Fuente_Industrial': 'Alta',
    'Velocidad_Corriente': 'Lenta',
    'Profundidad': 'Fondo',
    'Concentracion_Mercurio': 'Media',
    'Impacto_Ecologico': 'S√≠'
}

prob3_base = predecir_riesgo(mejor_modelo, caracteristicas3_base)
prob3_reducido = predecir_riesgo(mejor_modelo, caracteristicas3_reducido)
print(f"3. Cambio al reducir velocidad en zonas profundas:")
print(f"   ‚Ä¢ Velocidad r√°pida: P(Riesgo) = {prob3_base:.4f}")
print(f"   ‚Ä¢ Velocidad lenta: P(Riesgo) = {prob3_reducido:.4f}")
print(f"   ‚Ä¢ Diferencia: {prob3_reducido - prob3_base:.4f}")

# Consulta 4: Nivel de concentraci√≥n donde riesgo supera 50%
concentraciones = ['Baja', 'Media', 'Alta']
umbral = 0.5
umbral_superado = False

print("\n4. Probabilidad de riesgo peligroso por nivel de concentraci√≥n:")
for conc in concentraciones:
    caracteristicas4 = {
        'Fuente_Industrial': 'Alta',
        'Velocidad_Corriente': 'Lenta',
        'Profundidad': 'Fondo',
        'Concentracion_Mercurio': conc,
        'Impacto_Ecologico': 'S√≠'
    }
    prob = predecir_riesgo(mejor_modelo, caracteristicas4)
    print(f"   ‚Ä¢ Concentraci√≥n {conc}: {prob:.4f} {'(>50%)' if prob > umbral else ''}")
    
    if not umbral_superado and prob > umbral:
        nivel_umbral = conc
        umbral_superado = True

if umbral_superado:
    print(f"\nEl riesgo supera 50% cuando la concentraci√≥n es: {nivel_umbral}")
else:
    print("\nEl riesgo no supera el 50% en ning√∫n nivel de concentraci√≥n")


üîÆ Consultas con el mejor modelo:
1. Probabilidad de riesgo peligroso | Fuente Industrial = Alta: 0.2157
2. Probabilidad riesgo peligroso | [Concentraci√≥n=Alta y Fuente=Alta]: 0.2232
3. Cambio al reducir velocidad en zonas profundas:
   ‚Ä¢ Velocidad r√°pida: P(Riesgo) = 0.2158
   ‚Ä¢ Velocidad lenta: P(Riesgo) = 0.2157
   ‚Ä¢ Diferencia: -0.0001

4. Probabilidad de riesgo peligroso por nivel de concentraci√≥n:
   ‚Ä¢ Concentraci√≥n Baja: 0.2299 
   ‚Ä¢ Concentraci√≥n Media: 0.2157 
   ‚Ä¢ Concentraci√≥n Alta: 0.2232 

El riesgo no supera el 50% en ning√∫n nivel de concentraci√≥n
