<div style="color:#3c4d5a; border-top: 7px solid #42A5F5; border-bottom: 7px solid #42A5F5; padding: 5px; text-align: center; text-transform: uppercase"><h1>Análisis Paso a Paso de una Neurona Artificial con Activación Potencial Cuártica</h1> </div>

# Simulación de una Neurona con Función de Activación No Lineal Personalizada

**Desarrollado por:** Michael Israel Lata Zambrano , John Michael Franco Naulaguari  

**Correo:** mlataz@est.ups.edu.ec, jfrancon@est.ups.edu.ec

---
## **Estructura de la práctica**

1. **Introducción**
   - Objetivo general de la simulación.
   - Descripción de la función de activación personalizada.
   - Proceso de forward pass y cálculo del gradiente.

2. **Fundamentos teóricos**
   - Definición de neurona artificial.
   - Expresión matemática de la función de activación y su derivada.
   - Conceptos clave: activación, forward pass, delta.

3. **Parámetros del modelo**
   - Entradas, pesos, bias y tasa de aprendizaje.
   - Arquitectura: capa oculta y neurona de salida.

4. **Implementación**
   - Código en Python (sección de desarrollo práctico).

5. **Resultados esperados**
   - Valores clave impresos: salida, z, delta, bias y derivada.

6. **Conclusiones**
   - Impacto de funciones no estándar en el comportamiento del modelo.
   - Observaciones generales sobre sensibilidad y aprendizaje.

7. **Referencias**
   - Fuentes utilizadas en formato APA.


# 1. Introducción

En el campo de la inteligencia artificial, las redes neuronales han demostrado ser herramientas poderosas para resolver problemas complejos. La clave de su éxito radica en el diseño de sus componentes, entre ellos las **funciones de activación**, que introducen no linealidad en el modelo y permiten aprender patrones más complejos.

Este ejercicio tiene como objetivo simular el comportamiento de una neurona artificial que utiliza una **función de activación no lineal personalizada**:  

\[
f(z) = (3z^2 + 2)^4
\]

Esta función introduce una transformación altamente no lineal que amplifica pequeñas diferencias en el valor de entrada, lo que puede impactar significativamente en la forma en que la neurona aprende y generaliza.

Durante esta simulación se analiza paso a paso:

- Cómo se calcula la salida de la neurona (*forward pass*).
- Cómo se determina el gradiente (*delta*) necesario para el ajuste de pesos.
- Qué efecto tiene una función no estándar sobre el proceso de aprendizaje.

---

# 2. Fundamentos Teóricos

### Neurona Artificial

Una neurona artificial es una unidad computacional inspirada en la biología. Realiza dos operaciones básicas:

1. **Suma ponderada** de las entradas:
   \[
   z = w_1x_1 + w_2x_2 + \dots + w_nx_n + b
   \]

2. Aplicación de una **función de activación**:
   \[
   a = f(z)
   \]

Donde:
- \( x_i \): entradas
- \( w_i \): pesos
- \( b \): bias
- \( f(z) \): función de activación
- \( a \): salida de la neurona

### Función de Activación Personalizada

En esta simulación se usa la siguiente función:

\[
f(z) = (3z^2 + 2)^4
\]

Esta función transforma la entrada \( z \) de manera no lineal, elevando la expresión cuadrática \( 3z^2 + 2 \) a la cuarta potencia. Esto genera una curva de activación con fuertes pendientes, especialmente para valores grandes de \( z \).

#### Derivada de la Función

La derivada es fundamental para ajustar los pesos mediante el algoritmo de retropropagación:

\[
f'(z) = 24z(3z^2 + 2)^3
\]

Esta derivada muestra una fuerte dependencia de \( z \), lo que afecta directamente el cálculo del gradiente y, por ende, el aprendizaje.

### Otros Conceptos

- **Forward Pass:** Proceso de propagación hacia adelante, en el que se calcula la salida de la neurona.
- **Delta (\( \delta \)):** Es el gradiente del error con respecto a la salida de la neurona. Se usa para actualizar los pesos en el entrenamiento.

---




# Importación de librerías

- `numpy` se usa para operaciones matemáticas y manejo de vectores/matrices.
- `pandas` se usa para organizar y mostrar los resultados en forma de tabla.



In [1]:
import numpy as np
import pandas as pd


# 3. Definición de la función de activación y su derivada

- `activation(z)`: función no lineal que transforma la entrada.
- `activation_derivative(z)`: derivada de la función, necesaria para el cálculo del gradiente (backpropagation).



In [2]:
def activation(z):
    return (3 * z**2 + 2)**4

def activation_derivative(z):
    return 24 * z * (3 * z**2 + 2)**3


# 4. Parámetros de entrada y configuración inicial

- `x`: vector de entrada con dos características.
- `y_real`: valor objetivo que queremos que la red aprenda.
- `learning_rate`: controla cuánto se ajustan los pesos.
- `bias`: valor constante que se suma a la entrada.


In [3]:
x = np.array([1.0, 0.0])  # Entradas
y_real = 1.0              # Salida esperada
learning_rate = 1.0       # Tasa de aprendizaje
bias = 0.0                # Sesgo inicial



# Cálculo en la capa oculta

- `w_hidden`: matriz de pesos de la capa oculta (3 neuronas, 2 entradas).
- `z_hidden`: suma ponderada de entradas + bias.
- `a_hidden`: activación de cada neurona oculta.



In [4]:
w_hidden = np.full((3, 2), 0.2)
z_hidden = np.dot(w_hidden, x) + bias
a_hidden = activation(z_hidden)



# Cálculo en la capa de salida

- `w_output`: pesos de la capa de salida (1 neurona, 3 entradas desde la capa oculta).
- `z_output`: entrada total a la neurona de salida.
- `a_output`: salida final de la red.



In [5]:
w_output = np.full((1, 3), 0.2)
z_output = np.dot(w_output, a_hidden) + bias
a_output = activation(z_output)

# Pérdida (usamos error cuadrático medio simple)
loss_1 = 0.5 * (y_real - a_output)**2

# Cálculo del error y gradiente

- `delta_output`: gradiente del error respecto a la salida.
- `bias_deriv`: derivada del bias (opcional para actualizarlo).



In [12]:
a_output_deriv = activation_derivative(z_output)
delta_output = (y_real - a_output) * a_output_deriv
bias_deriv = -delta_output[0]  # b' es el negativo del delta
# Actualización pesos salida
w_output += learning_rate * delta_output.reshape(-1,1) * a_hidden
# Forward pass 2: después de actualizar pesos de salida
z_output_2 = np.dot(w_output, a_hidden) + bias
a_output_2 = np.clip(a_output_2, -1e6, 1e6)
loss_2 = 0.5 * (y_real - a_output_2)**2


# Cantidad de pesos sin contar biases ni salida final
# Aquí: pesos ocultos + pesos salida, sin bias
# Cantidad de pesos sin contar bias ni salida final (solo capa oculta)
cantidad_pesos = w_hidden.size  # 3 neuronas × 2 entradas = 6



# 5. Organización de resultados

- Se crea una tabla con los valores clave: delta, activación, entrada, bias y su derivada.
- Se imprime en notación científica para facilitar la lectura de números grandes o pequeños.

In [13]:
resultados = [
    ("Cantidad de pesos", cantidad_pesos),
    ("y_pred primer forward pass", float(a_output[0])),
    ("Pérdida primer forward pass", float(loss_1[0])),
    ("y_pred después backprop", float(a_output_2[0])),
    ("Pérdida segundo forward pass", float(loss_2[0])),
    ("δ", float(delta_output[0])),
    ("f(z)", float(a_output[0])),
    ("z", float(z_output[0])),
    ("b", float(bias)),
    ("b'", float(bias_deriv))
]

df_resultados = pd.DataFrame(resultados, columns=["Concepto", "Valor"])
pd.set_option('display.float_format', '{:.8E}'.format)
print(df_resultados)


                       Concepto           Valor
0             Cantidad de pesos  6.00000000E+00
1    y_pred primer forward pass  3.83980388E+10
2   Pérdida primer forward pass  7.37204692E+20
3       y_pred después backprop  1.00000000E+06
4  Pérdida segundo forward pass  4.99999000E+11
5                             δ -9.68828178E+20
6                          f(z)  3.83980388E+10
7                             z  1.21197788E+01
8                             b  0.00000000E+00
9                            b'  9.68828178E+20


---

# 6. Conclusiones

Este experimento permite observar claramente el impacto de utilizar una función de activación personalizada y altamente no lineal en una neurona artificial.

### Observaciones principales:

- La forma de la función de activación puede amplificar o suavizar las variaciones en la entrada, lo cual influye en la capacidad de aprendizaje del modelo.
- Funciones no estándar pueden dificultar la convergencia del modelo si no se controlan aspectos como la tasa de aprendizaje o la inicialización de los pesos.
- Analizar el comportamiento de la neurona con funciones diferentes es útil para adquirir una comprensión más profunda de cómo las redes neuronales procesan la información.

---

# 7. Referencias

Goodfellow, I., Bengio, Y., & Courville, A. (2016). *Deep learning*. MIT Press. https://www.deeplearningbook.org/

Harris, C. R., Millman, K. J., van der Walt, S. J., Gommers, R., Virtanen, P., Cournapeau, D., ... & Oliphant, T. E. (2020). Array programming with NumPy. *Nature*, 585(7825), 357–362. https://doi.org/10.1038/s41586-020-2649-2

McKinney, W. (2010). Data structures for statistical computing in Python. In *Proceedings of the 9th Python in Science Conference* (pp. 51–56). https://pandas.pydata.org/docs/
