# Neuronas Artificiales: Un Vistazo a los Inicios del Aprendizaje Automático

## Introducción a las Neuronas Biológicas
Antes de hablar sobre las neuronas artificiales, es importante entender cómo funcionan las neuronas biológicas en el cerebro humano. Las neuronas son las unidades fundamentales del sistema nervioso y están encargadas de procesar y transmitir información a través de señales eléctricas y químicas. Cada neurona tiene tres partes principales: el cuerpo celular (o soma), las dendritas, y el axón.

- Dendritas: Son las ramificaciones que reciben señales de otras neuronas. Las dendritas actúan como antenas, captando información de las neuronas circundantes.
- Cuerpo celular: Contiene el núcleo y otros orgánulos que mantienen la célula viva. Es donde se integran las señales recibidas.
- - Cuerpo celular: Contiene el núcleo y otros orgánulos que mantienen la célula viva. Es donde se integran las señales recibidas.
 
![image.png](attachment:a6a4a5cb-6b75-4947-ad7b-54eb75968c3e.png)

La comunicación entre neuronas se realiza a través de las sinapsis, que son las conexiones entre el axón de una neurona y las dendritas de otra. Cuando una neurona recibe suficientes señales, transmite un potencial de acción a lo largo de su axón, liberando neurotransmisores que activan la siguiente neurona en la cadena.
![image.png](attachment:ef473272-150f-4cc0-9853-e9188a91bb65.png)
![image.png](attachment:ec2a1903-b01c-4092-846f-bd737fc5bde0.png)

Este proceso de transmisión de señales en el cerebro inspiró el desarrollo de las neuronas artificiales, utilizadas en el campo de la inteligencia artificial para emular cómo funciona el cerebro al procesar información.
![image.png](attachment:e14a8c82-3289-4b13-971d-c3a9cd1da387.png)
![image.png](attachment:8b500d16-847d-44e7-bd39-2870b1d228e1.png)
La imagen anterior muestra la similitud conceptual entre las neuronas biológicas y las artificiales. En ambas, se reciben señales, se procesan internamente y se emite una respuesta. Las sinapsis se modelan como pesos $w$ en las neuronas artificiales, que determinan la importancia de cada señal entrante.

McCulloch y Pitss describieron una celula nerviosa de este tipo como una simple puerta lógica con salidas binarias; a las dendritas llegan multiples señales, que se integran en el cuerpo celular y, si la señal acumulada supera un determinado umbral, se genera una señal de salida que sera transmitida por el axon.


## Introducción a las Neuronas Artificiales

Las neuronas artificiales son el concepto básico que impulsa gran parte de la inteligencia artificial moderna, especialmente en el área de redes neuronales. Inspiradas en la forma en que funcionan las neuronas biológicas del cerebro humano, estas unidades artificiales son los bloques de construcción fundamentales que permiten a las máquinas aprender y tomar decisiones. Una neurona artificial toma varias entradas (similar a las señales de entrada recibidas por una neurona biológica), las procesa y produce una salida que puede ser usada para predecir o clasificar datos.



## Historia de los Inicios del Aprendizaje Automático

Solo unos años mas tarde de la Neurona de McCulloch y Pitts, Frank Rosenblat publico el primer concepto de regla de aprendizaje ldel perceptron, basado en el modelo de neurona McCulloch y Pitts. (

El aprendizaje automático comenzó a desarrollarse en la década de 1950, con la idea de crear sistemas que pudieran aprender patrones a partir de datos sin ser programados explícitamente para cada tarea. Uno de los primeros hitos significativos en el campo fue el desarrollo del Perceptrón por Frank Rosenblatt en 1958.

La Idea del Perceptrón

El Perceptrón fue el primer modelo matemático inspirado en la biología capaz de aprender a clasificar patrones. Diseñado por Rosenblatt, consistía en una sola capa de neuronas conectadas a un conjunto de entradas. La idea fundamental del Perceptrón era muy simple pero poderosa: cada entrada tiene un peso asociado, que representa cuán importante es esa entrada para tomar la decisión final.


![Perceptron.png](attachment:cfbdea10-1512-49bf-8abc-4dc921fa243e.png)


La figura muestra el modelo básico del Perceptrón, donde:
- Cada entrada ($x_1, x_2, …, x_n$) representa una característica del dato de entrada.

- Los pesos ($w1, w**2, …, w_m$) determinan la contribución de cada característica.

Se calcula la suma ponderada de las entradas y se aplica una función de activación (generalmente una función escalón) para determinar la salida.

El Perceptrón intenta clasificar entradas calculando una salida simple: 1 si la suma ponderada de las entradas supera un determinado umbral, y 0 en caso contrario. Este concepto era revolucionario porque, por primera vez, una máquina podía aprender los valores de los pesos a partir de ejemplos. El proceso de aprendizaje consistía en ajustar los pesos cada vez que se cometía un error, acercando al modelo cada vez más a una solución óptima.



En otras palabras, el Perceptrón es un modelo de clasificación lineal. Es capaz de resolver problemas donde los datos se puedan dividir en dos clases utilizando una línea recta. Por ejemplo, dado un conjunto de puntos en un plano, si se puede trazar una línea que separe completamente dos clases de puntos, entonces el Perceptrón podrá encontrar dicha línea con suficiente entrenamiento.


# Definición formal de una Neurona Artificial
### Definición Formal de una Neurona Artificial

Una **neurona artificial** es el componente fundamental de una red neuronal artificial, inspirado en las neuronas biológicas. Su función principal es recibir varias entradas, combinarlas y producir una salida que depende de la suma ponderada de dichas entradas. Esta neurona imita el proceso biológico mediante el cual una neurona en el cerebro recibe estímulos y decide si debe transmitir un impulso nervioso.

En términos matemáticos, la neurona artificial se puede describir utilizando un **modelo de entrada y salida** donde cada entrada está asociada a un peso. Esta combinación ponderada se convierte en una **entrada neta**, que luego se pasa a una **función de activación** que decide si la neurona se activa (dispara) o no.

La ecuación de la entrada neta se define de la siguiente manera:

$$z = w_1x_1 + w_2x_2 + \dots + w_mx_m + b$$

donde:
- \( $z$ \) es la **entrada neta**,
- \( $w_i$ \) es el **peso** asociado a la entrada \( x_i \),
- \( $x_i$ \) son los **valores de entrada**, y
- \( $b$ \) es el **sesgo**.

La función de activación \(\sigma(z)\) toma la entrada neta y genera la salida de la neurona. En el caso de un **problema de clasificación binaria** con dos clases, 0 y 1, la función de activación puede ser una función escalón unitario:

$$
\sigma(z) = 
\begin{cases}
1 & \text{si } z \geq 0 \\
0 & \text{si } z < 0
\end{cases}
$$


La idea detrás de la **neurona artificial** es combinar las entradas, ponderadas por los pesos, para determinar la salida. Esto es similar a cómo una neurona biológica suma los potenciales que recibe a través de sus dendritas. Si la suma alcanza un cierto umbral, la neurona se activa y transmite un impulso eléctrico. Del mismo modo, en la neurona artificial, si la entrada neta es mayor o igual que un cierto umbral (en este caso, cero), la salida será 1; de lo contrario, será 0.

#### Expansión Matemática: El Sesgo y el Producto Escalar
Para simplificar la representación, el umbral \($\theta$\) se puede mover al lado izquierdo de la ecuación y redefinir como un **sesgo** (\($b$\)). Esto nos da una expresión simplificada:

$$z = \mathbf{w}^T \mathbf{x} + b$$

donde \(\mathbf{w}^T\) es el vector transpuesto de pesos y \(\mathbf{x}\) es el vector de entradas. Esta formulación con el producto escalar facilita la implementación de la neurona en términos computacionales, ya que se puede generalizar para incluir múltiples entradas.

La función de activación, además, no se limita a ser una función escalón. Algunas de las funciones más populares son:
- **Sigmoide**: \($\sigma(z) = \frac{1}{1 + e^{-z}}$\), que genera una salida en el rango de 0 a 1, útil para problemas de clasificación donde se desea una probabilidad.
- **ReLU (Rectified Linear Unit)**: \($\text{ReLU}(z) = \max(0, z)$\), que es muy popular en redes neuronales profundas debido a su capacidad de introducir no linealidades sin saturarse para valores grandes de entrada.

### Interpretación Biológica vs. Matemática
Desde una perspectiva biológica, la neurona artificial es una simplificación extrema de una neurona en el cerebro. Las **neuronas biológicas** están interconectadas a través de sinapsis y responden a los estímulos eléctricos y químicos, generando potenciales de acción que transmiten información. Las neuronas artificiales, en contraste, simplemente procesan entradas numéricas y producen una salida también numérica.

### Aplicaciones de la Neurona Artificial
Las neuronas artificiales se utilizan como bloques de construcción en redes más complejas conocidas como **redes neuronales artificiales**. Cuando se combinan múltiples neuronas en varias capas (redes neuronales multicapa), se pueden abordar problemas más complejos, como la clasificación de imágenes, el procesamiento del lenguaje natural, y muchas otras aplicaciones del aprendizaje profundo.

En resumen, la **neurona artificial** es un componente esencial que permite a las computadoras aprender de los datos, ajustando los pesos y el sesgo a través de algoritmos como el **descenso de gradiente** para reducir el error en las predicciones. Esta simple unidad, cuando se agrupa con otras en una arquitectura de red, se convierte en una poderosa herramienta capaz de aprender patrones complejos y realizar predicciones precisas.

In [11]:
import numpy as np

class Perceptron:
    def __init__(self, learning_rate=0.01, epochs=1000):
        self.learning_rate = learning_rate
        self.epochs = epochs
        self.weights = None
        self.bias = 0

    def step_function(self, x):
        return 1 if x >= 0 else 0

    def fit(self, X, y):
        # Inicializar pesos
        self.weights = np.zeros(X.shape[1])

        # Iterar sobre el número de épocas
        for epoch in range(self.epochs):
            for xi, target in zip(X, y):
                # Calcular la predicción
                linear_output = np.dot(xi, self.weights) + self.bias
                y_pred = self.step_function(linear_output)
                
                # Actualizar pesos y bias
                update = self.learning_rate * (target - y_pred)
                self.weights += update * xi
                self.bias += update

            # Imprimir pesos y bias después de cada época
            print(f"Época {epoch+1}: w = {self.weights}, bias = {self.bias}")

    def predict(self, X):
        # Aplicar el perceptrón a nuevas entradas
        linear_output = np.dot(X, self.weights) + self.bias
        return np.array([self.step_function(x) for x in linear_output])

# Datos de entrenamiento (Ejemplo con AND lógico)
X = np.array([[0, 0], [0, 1], [1, 0], [1, 1]])
y = np.array([0, 0, 0, 1])

# Entrenar el perceptrón
perceptron = Perceptron(learning_rate=0.1, epochs=10)
perceptron.fit(X, y)

# Prueba del modelo
print("Predicciones:", perceptron.predict(X))


Época 1: w = [0.1 0.1], bias = 0.0
Época 2: w = [0.2 0.1], bias = -0.1
Época 3: w = [0.2 0.1], bias = -0.20000000000000004
Época 4: w = [0.2 0.1], bias = -0.20000000000000004
Época 5: w = [0.2 0.1], bias = -0.20000000000000004
Época 6: w = [0.2 0.1], bias = -0.20000000000000004
Época 7: w = [0.2 0.1], bias = -0.20000000000000004
Época 8: w = [0.2 0.1], bias = -0.20000000000000004
Época 9: w = [0.2 0.1], bias = -0.20000000000000004
Época 10: w = [0.2 0.1], bias = -0.20000000000000004
Predicciones: [0 0 0 1]
