In [1]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

ModuleNotFoundError: No module named 'tensorflow'

## ¿Qué son las Redes Neuronales?
Las redes neuronales son un tipo de algoritmo de aprendizaje automático inspiradas en el funcionamiento del cerebro humano. Están compuestas por unidades básicas llamadas neuronas artificiales o nodos, organizadas en capas.

**Componentes Básicos de una Red Neuronal** 
- Neuronas (Nodos): 
Las neuronas reciben uno o más valores de entrada, los procesan y producen una salida.
Cada entrada está asociada con un peso que modula la importancia de esa entrada.
La neurona aplica una función de activación a la suma ponderada de sus entradas para producir su salida.
- Capas:
Capa de Entrada: Recibe las características o datos de entrada.
Capas Ocultas: Procesan las entradas a través de múltiples niveles de abstracción. Pueden ser una o varias.
Capa de Salida: Produce el resultado final del modelo (predicción).
- Pesos y Sesgos:
Los pesos ajustan la influencia de cada entrada en una neurona.
Los sesgos son términos adicionales que permiten a la función de activación desplazarse hacia la izquierda o la derecha, ayudando al modelo a aprender patrones de datos.
- Funciones de Activación:
Aplican una transformación no lineal a la salida de una neurona.
Ejemplos: ReLU (Rectified Linear Unit), Sigmoide, Tanh.

**Cómo Funciona una Red Neuronal**
- Propagación hacia Adelante (Forward Propagation):
Los datos de entrada se envían a través de las capas de la red.
Cada capa procesa las entradas y pasa las salidas a la siguiente capa hasta llegar a la capa de salida.
La salida de la capa final es la predicción del modelo.
Función de Pérdida:
Mide qué tan bien se desempeña el modelo comparando la predicción con el valor real.
Ejemplos: Error cuadrático medio (MSE), Entropía cruzada.

- Propagación hacia Atrás (Backpropagation):

El algoritmo ajusta los pesos y sesgos para minimizar la función de pérdida.
Calcula el gradiente de la función de pérdida respecto a cada peso utilizando el algoritmo de retropropagación.
Utiliza optimizadores (como SGD, Adam) para actualizar los pesos en la dirección que reduce la pérdida.

**Tipos de Redes Neuronales**
- Perceptrón Multicapa (MLP):
La forma más básica de red neuronal.
Compuesto por una capa de entrada, una o más capas ocultas y una capa de salida.
- Redes Neuronales Convolucionales (CNN):
Especializadas en procesamiento de datos con estructura de cuadrícula, como imágenes.
Utilizan capas convolucionales para extraer características espaciales.

- Redes Neuronales Recurrentes (RNN):

Adecuadas para datos secuenciales como series temporales o texto.
Tienen conexiones que permiten el paso de información de una etapa temporal a la siguiente.
- Redes Generativas Adversariales (GAN):

Consisten en dos redes que se entrenan juntas: un generador y un discriminador.
Utilizadas para generar nuevos datos sintéticos que parecen reales.

**Ventajas:**

Capacidad de Aprender Patrones Complejos: Pueden capturar relaciones no lineales en los datos.
Flexibilidad: Pueden ser aplicadas a una amplia variedad de tareas (clasificación, regresión, generación de datos).
**Desventajas:**

-Requieren Grandes Cantidades de Datos: Funcionan mejor con grandes conjuntos de datos.
-Computacionalmente Intensivas: Necesitan mucho poder computacional para entrenar.
-Opacidad: Son a menudo vistas como cajas negras, lo que dificulta la interpretación de cómo toman decisiones.

**Aplicaciones**

*Visión por Computadora: Reconocimiento de imágenes y objetos.*
- Procesamiento de Lenguaje Natural: Traducción automática, análisis de sentimientos.
- Juegos y Simulación: Agentes autónomos y aprendizaje por refuerzo.
- Finanzas: Predicción de mercados y análisis de riesgos.
- Medicina: Diagnóstico basado en imágenes médicas, descubrimiento de fármacos.



In [2]:
#Regresion lineal simple pero con correccion por RH
df = data = pd.read_csv("D:/Josefina/Proyectos/ProyectoChile/dataset/proceed/merge_pm-maiac-meteo/1000/08-TOT_merge_PM25-MAIAC-Meteo.csv") 
df['AOD_550_HR'] = df['AOD_550'] * (1/(1- (df['humedad']/100)))
print(df.columns)
print(df["year"].unique())
print(df["estacion"].unique())
print(len(df["year"]))
df.head()

Index(['Unnamed: 0', 'date', 'AOD_470', 'AOD_550', 'PM25', 'temperatura',
       'humedad', 'dirViento', 'velViento', 'estacion', 'year', 'estacion_num',
       'AOD_550_HR'],
      dtype='object')
[2015 2016 2017 2018 2019 2020 2021 2022 2023]
['BSQ' 'OHG' 'PDH' 'CNA' 'PTA' 'FLD' 'CDE']
12835


Unnamed: 0.1,Unnamed: 0,date,AOD_470,AOD_550,PM25,temperatura,humedad,dirViento,velViento,estacion,year,estacion_num,AOD_550_HR
0,1,1/1/2015,0.1173,0.084,13.7083,20.785763,49.979158,2.040632,2.040632,BSQ,2015,1,0.16793
1,2,2/1/2015,0.0808,0.058,17.6667,22.714225,36.677087,1.859316,1.859316,BSQ,2015,1,0.091594
2,3,3/1/2015,0.0527,0.0376,24.5833,23.687146,35.003467,1.903799,1.903799,BSQ,2015,1,0.057849
3,4,4/1/2015,0.2181,0.1572,24.75,24.307629,45.854158,1.818842,1.818842,BSQ,2015,1,0.290327
4,5,5/1/2015,0.1237,0.0887,20.375,22.223954,51.895812,2.129595,2.129595,BSQ,2015,1,0.184391


In [4]:
# print(df_subset.columns)
# # Variables independientes (múltiples) y dependientes
#X = df[['AOD_550', 'temperatura', 'humedad','dirViento', 'velViento']] 
# X = df[['AOD_550_HR', 'temperatura', 'humedad','dirViento', 'velViento']] 
X = df[['AOD_550_HR', 'temperatura', 'humedad']] 
y = df['PM25']

In [None]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import mean_squared_error, mean_absolute_error, r2_score
import tensorflow as tf
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Supongamos que df es tu DataFrame
# Variables predictoras
X = df[['AOD_550', 'temperatura', 'humedad', 'dirViento', 'velViento']]

# Variable objetivo
y = df[['PM25']]

# Dividir los datos en conjuntos de entrenamiento y prueba
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Estandarizar los datos
#Estandarizamos las características para que tengan media 0 y desviación estándar 1. 
#Esto ayuda a la red neuronal a converger más rápido y de manera más estable.
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# Crear el modelo
# Creamos una red neuronal secuencial con capas densas (fully connected).
model = Sequential()
# Dense(64, activation='relu'): Añade una capa oculta con 64 neuronas y la función de activación ReLU (Rectified Linear Unit).
# input_dim=X_train.shape[1]: Especifica la dimensión de entrada (el número de características predictoras).
# Dense(1, activation='linear'): Añade una capa de salida con una sola neurona y una función de activación lineal, 
# adecuada para problemas de regresión.

model = Sequential()
model.add(Dense(64, input_dim=X_train.shape[1], activation='relu'))  # Primera capa oculta con 64 neuronas y función de activación ReLU
model.add(Dense(32, activation='relu'))  # Segunda capa oculta con 32 neuronas y función de activación ReLU
model.add(Dense(16, activation='relu'))  # Tercera capa oculta con 16 neuronas y función de activación ReLU
model.add(Dense(1, activation='linear'))  # Capa de salida con una neurona y función de activación lineal

# Compilar el modelo
#Compilamos el modelo especificando el optimizador y la función de pérdida.
# optimizer='adam': Adam es un optimizador eficiente que combina las ventajas de otros métodos de optimización.
# loss='mean_squared_error': La función de pérdida es el error cuadrático medio, adecuada para problemas de regresión.
model.compile(optimizer='adam', loss='mean_squared_error')

# Entrenar el Modelo
#Entrenamos el modelo con los datos de entrenamiento, especificando el número de épocas, 
#el tamaño del lote y el conjunto de validación.
history = model.fit(X_train, y_train, epochs=100, batch_size=32, validation_split=0.2, verbose=1)

# epochs=100: Número de veces que el modelo verá todo el conjunto de entrenamiento.
# batch_size=32: Número de muestras que el modelo verá antes de actualizar los pesos.
# validation_split=0.2: Proporción de datos de entrenamiento que se usarán para validación.
# verbose=1: Muestra el progreso del entrenamiento.

# Hacer predicciones
y_pred = model.predict(X_test)

# Calcular las métricas
mse = mean_squared_error(y_test, y_pred)
mae = mean_absolute_error(y_test, y_pred)
r2 = r2_score(y_test, y_pred)

# Imprimir las métricas
print(f"Mean Squared Error (MSE): {mse}")
print(f"Mean Absolute Error (MAE): {mae}")
print(f"R^2 Score: {r2}")
