In [2]:
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import LabelEncoder
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Dense

# Load the dataset
data = {
    'Date': pd.date_range(start='2023-11-01', periods=30),
    'Temperature': [15, 16, 14, 12, 13, 17, 18, 16, 14, 13, 14, 15, 13, 12, 11, 14, 16, 15, 14, 13, 12, 13, 14, 16, 17, 15, 14, 14, 12, 11],
    'Precipitation': [0.2, 0.0, 2.5, 8.0, 0.0, 0.0, 0.0, 0.0, 0.5, 0.0, 0.0, 0.0, 1.0, 3.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.0, 0.3, 2.0, 0.0],
    'Conditions': ['Clear', 'Partly Cloudy', 'Rain', 'Showers', 'Clear', 'Sunny', 'Sunny', 'Partly Cloudy', 'Drizzle', 'Clear', 'Clear', 'Partly Cloudy', 'Showers', 'Rain', 'Clear', 'Sunny', 'Sunny', 'Partly Cloudy', 'Clear', 'Clear', 'Partly Cloudy', 'Sunny', 'Sunny', 'Partly Cloudy', 'Clear', 'Clear', 'Partly Cloudy', 'Drizzle', 'Rain', 'Clear']
}
df = pd.DataFrame(data)

Unnamed: 0,Date,Temperature (°C),Precipitation (mm),Conditions
0,2023-11-01,15,0.2,Clear
1,2023-11-02,16,0.0,Partly Cloudy
2,2023-11-03,14,2.5,Rain
3,2023-11-04,12,8.0,Showers
4,2023-11-05,13,0.0,Clear


In [None]:
le = LabelEncoder()
df['Conditions'] = le.fit_transform(df['Conditions'])

# Split the dataset
X_train, X_test, y_train, y_test = train_test_split(df['Precipitation'].values, df['Conditions'].values, test_size=0.2, random_state=42)

# Reshape data
X_train = X_train.reshape(-1, 1)
X_test = X_test.reshape(-1, 1)

In [None]:
# Create the model
model = Sequential()
model.add(Dense(10, input_dim=1, activation='relu'))
model.add(Dense(10, activation='relu'))
model.add(Dense(len(le.classes_), activation='softmax'))

En el código proporcionado, utilizamos la capa Dense de Keras para crear las capas de entrada y oculta de la red neuronal. La capa Dense es una capa completamente conectada, lo que significa que todas las neuronas de una capa están conectadas con las de la siguiente capa. En el caso de la capa de entrada, el parámetro input_dim se utiliza para especificar el número de entradas.

En esta línea, "Dense(10, input_dim=1, activation='relu')" crea una capa densa con 10 neuronas y espera datos de entrada con 1 característica. La función de activación relu se utiliza para las neuronas de esta capa.

Para la capa de salida, también usamos una capa Dense, pero la cantidad de neuronas corresponde a la cantidad de clases de salida y la función de activación suele ser softmax para problemas de clasificación de clases múltiples.

En esta línea, "Dense(len(le.classes_), activación='softmax')" crea una capa de salida con una cantidad de neuronas igual a la cantidad de clases en la variable objetivo y usa la función de activación softmax para generar una distribución de probabilidad. sobre las clases.

## Estructura de la red neuronal

- Capa de entrada: 1 entrada (Precipitación), 10 neuronas, activación 'relu'
- Capa oculta 1: 10 neuronas, activación 'relu'
- Capa oculta 2: 10 neuronas, activación 'relu'
- Capa de salida: número de neuronas igual al número de clases, activación con 'softmax'

In [None]:
# Compile the model
model.compile(loss='sparse_categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

In [None]:
# Train the model
model.fit(X_train, y_train, epochs=50, batch_size=1, verbose=1)

In [None]:
# Evaluate the model
loss, accuracy = model.evaluate(X_test, y_test, verbose=0)
print(f'Test loss: {loss:.3}')
print(f'Test accuracy: {accuracy:.3}')

# Otros conceptos clave

- **Forward Propagation**: En forward propagation, los datos fluyen desde la capa de entrada a través de las capas ocultas hasta la capa de salida de la red neuronal. Cada neurona de una capa toma las salidas de la capa anterior (o los datos de entrada de la primera capa oculta), aplica pesos, agrega un bias y pasa el resultado a través de una función de activación. Luego, el resultado final se calcula en base a estos cálculos.

- **Backpropagation**: Backpropagation es el proceso mediante el cual la red neuronal aprende y actualiza sus weights y biases. Después de la Forward Propagation, la salida de la red se compara con la salida esperada y se calcula el error. Luego, este error se propaga a través de la red, desde la capa de salida a la capa de entrada. Los weights y biases se actualizan de manera que se minimice este error. La cantidad en la que se actualizan las weights y los sesgos está determinada por la tasa de aprendizaje y el gradiente del error con respecto a las weights y los biases.

- **Descenso de gradiente**: El descenso de gradiente es un algoritmo de optimización que se utiliza para minimizar la función de error moviéndose iterativamente en la dirección del descenso más pronunciado, que está determinado por el negativo del gradiente. En el contexto de las redes neuronales, el descenso de gradiente se utiliza durante la Backpropagation para actualizar los weights y bias para minimizar el error entre la salida de la red y la salida esperada. La tasa de aprendizaje determina el tamaño de los pasos dados en la dirección del descenso más pronunciado.

## Funciones de activación

- Primero, ¿qué es una función activadora? Es una función matemática aplicada a la salida de una neurona, y ¿cuáles son sus principales propósitos?

 1. **No linealidad**: la mayoría de los datos del mundo real no son lineales, lo que significa que no se pueden representar con precisión con una línea recta. Las funciones de activación introducen no linealidad en la salida de una neurona. Esto permite que la red neuronal aprenda de los errores y realice representaciones complejas, lo que le permite resolver problemas no lineales.

 2. **Normalización de salida**: Algunas funciones de activación como sigmoide o softmax garantizan que la salida de la neurona esté en un rango específico (entre 0 y 1 para sigmoide y sumando 1 para softmax). Esto puede resultar útil en determinados casos, como capas de salida para problemas de clasificación binaria o de clases múltiples.

 3. **Habilitación de la BackPropagation**: Las funciones de activación y sus derivados se utilizan durante el proceso de BackPropagation cuando se actualizan los pesos.

 Las funciones de activación comunes incluyen la función sigmoidea, la función tangente hiperbólica (tanh), la unidad lineal rectificada (ReLU) y la función softmax. Cada uno tiene sus propias ventajas y se utiliza en capas específicas según los requisitos del modelo de red neuronal.

### Existen varias funciones de activación comunes utilizadas en redes neuronales, cada una con sus propias características y casos de uso:

1. **Función sigmoidea**: La función sigmoide genera un valor entre 0 y 1, lo que puede resultar útil para problemas de clasificación binaria. A menudo se utiliza en la capa de salida de una red de clasificación binaria. 

```python
def sigmoid(x):
    return 1 / (1 + np.exp(-x))
```

2. **Función Tanh**: La función tangente hiperbólica, o tanh, genera un valor entre -1 y 1. Al igual que la función sigmoidea, es suave y diferenciable.

```python
def tanh(x):
    return np.tanh(x)
```

3. **Función ReLU (Unidad lineal rectificada)**: La función ReLU genera la entrada directamente si es positiva; de lo contrario, genera cero. A menudo se usa en las capas ocultas de una red neuronal porque ayuda a la red a aprender patrones complejos. Sin embargo, puede causar un problema en el que las neuronas a veces pueden quedar atrapadas en el estado negativo.

```python
def relu(x):
    return max(0, x)
```

4. **Función Softmax**: la función softmax se usa a menudo en la capa de salida de una red neuronal para problemas de clasificación de clases múltiples. Convierte la salida de la red en una distribución de probabilidad entre múltiples clases.

```python
def softmax(x):
    e_x = np.exp(x - np.max(x))
    return e_x / e_x.sum(axis=0)
```

Cada una de estas funciones de activación tiene sus propios casos de uso y se utiliza en diferentes tipos de capas o diferentes tipos de redes neuronales.