
# <font color="red"> Cuaderno 2. Compilaci√≥n y entrenamiento de modelos en  Tensorflow  y Keras. </font>

## <font color="blue"> Por Alfredo Alfredo Diaz </font>

![image](https://github.com/adiacla/bigdata/blob/master/Keras-vs-TensorFlow-vs-PyTorch.jpg?raw=true)

**Keras**

Keras es una librer√≠a escrita en Python, dise√±ada espec√≠ficamente para hacer experimentos con redes neuronales. Permite crear prototipos r√°pidamente y de manera f√°cil, pues est√° pensada para que sea f√°cil de usar.

Tener la posibilidad de pasar de una idea a un resultado con el m√≠nimo retraso posible es clave cuando haces investigaci√≥n.

**Pytorch**

Pytorch es un framework de Python que permite el crecimiento r√°pido del Deep Learning, con una fuerte aceleraci√≥n de la GPU. La caracter√≠stica principal de Pytorch es que utiliza grafos computacionales din√°micos. Todos los frameworks de Deep Learning utilizan un lenguaje, como Python en este caso, y un grafo computacional. Esto funciona as√≠ por cuestiones de eficiencia y optimizaci√≥n, pues un grafo computacional corre en paralelo en la GPU.


**TensorFlow**

Cuando una red neuronal se vuelve m√°s compleja, llena de capas y par√°metros, el proceso se vuelve mucho m√°s complejo. Es aqu√≠ donde entra TensorFlow, una librer√≠a de computaci√≥n num√©rica que computa gradientes autom√°ticamente, esto quiere decir que est√° a un nivel m√°s bajo y profundo que Keras o Pytorch.

TensorFlow fue desarrollada por Google y la utilizan empresas como Airbnb, Dropbox, Uber y Snapchat. Aunque es muy popular es m√°s recomendable para proyectos grandes y quiz√°s m√°s complejos, pues te da mucho control cuando est√°s construyendo redes neuronales.

Si quieres aprender a dise√±ar redes neuronales y crear prototipos de manera r√°pida para entender c√≥mo funcionan, una librer√≠a como Keras es ideal, pues incluso √©sta utiliza TensorFlow por debajo para computar gradientes, pero sin que tengas que involucrarte con eso. Pytorch combina las dos cosas, pues te ayuda a construir las redes y computa los gradientes autom√°ticamente.

**Scikit-learn**

Otra librer√≠a ideal para dise√±ar y entrenar redes neuronales es Scikit-learn, que tambi√©n est√° escrita en Python y que utilizan empresas como Spotify, Booking y Evernote. Emplea algoritmos de clasificaci√≥n (determina a qu√© categor√≠a pertenece un objeto), regresi√≥n (asocia atributos de valor continuo a objetos) y agrupamiento (agrupa objetos similares en conjuntos); y opera de manera simult√°nea con librer√≠as como NumPy y SciPy.

**Librer√≠as de Python relacionadas con Redes Neuronales**

![imagen](https://aitalks.es/wp-content/uploads/2020/06/Portada-librerias-python.jpg)

#Tensorflow

**Instalaci√≥n y Configuraci√≥n**
Antes de comenzar, aseg√∫rate de tener Python instalado en tu m√°quina. Para instalar TensorFlow, ejecuta el siguiente comando:

      pip install tensorflow


Si est√° usando google colab ya tienes instalado tensorflow y keras, si estas usando tu ambiente propio, recomendamos instalar TensorFlow en un entorno virtual para evitar conflictos con otras librer√≠as. Para crear y activar un entorno virtual, usa:

    # Crear entorno virtual
    python -m venv tf_env

    # Activar el entorno (Windows)
    tf_env\Scripts\activate

    # Activar el entorno (Mac/Linux)
    source tf_env/bin/activate

TensorFlow opera principalmente con arreglos multidimensionales llamados tensores, que son la base de cualquier modelo de aprendizaje autom√°tico. Estos tensores son similares a matrices y arrays de bibliotecas como NumPy, pero ofrecen capacidades adicionales, como la ejecuci√≥n en hardware especializado como GPU.

Un tensor tiene dos atributos principales que debemos comprender:

* shape: Describe la dimensi√≥n del tensor a lo largo de cada uno de sus ejes.
* dtype: Especifica el tipo de datos que contiene, como float32, int32, etc.

Vamos a ir trabajando con tensorflow para crear y trabajar con tensores

In [1]:
!python -V

Python 3.12.12


In [2]:
import tensorflow as tf
print(tf.__version__)
#Es importante usar la misma versi√≥n del tensorflow cuando se entrena y se despliegua.

2.19.0


In [3]:
#listar las librerias instaladas que son tensorflow
!pip list | grep tensorflow

tensorflow                               2.19.0
tensorflow-datasets                      4.9.9
tensorflow_decision_forests              1.12.0
tensorflow-hub                           0.16.1
tensorflow-metadata                      1.17.3
tensorflow-probability                   0.25.0
tensorflow-text                          2.19.0


In [4]:
#listar librerias keras
!pip list | grep keras

keras                                    3.10.0
keras-hub                                0.21.1
keras-nlp                                0.21.1
tf_keras                                 2.19.0


In [5]:
#listar librerias pytorch
!pip list | grep torch

torch                                    2.9.0+cu128
torchao                                  0.10.0
torchaudio                               2.9.0+cu128
torchcodec                               0.8.0+cu128
torchdata                                0.11.0
torchsummary                             1.5.1
torchtune                                0.6.1
torchvision                              0.24.0+cu128


In [13]:
!nvidia-smi

Thu Feb 19 00:54:38 2026       
+-----------------------------------------------------------------------------------------+
| NVIDIA-SMI 580.82.07              Driver Version: 580.82.07      CUDA Version: 13.0     |
+-----------------------------------------+------------------------+----------------------+
| GPU  Name                 Persistence-M | Bus-Id          Disp.A | Volatile Uncorr. ECC |
| Fan  Temp   Perf          Pwr:Usage/Cap |           Memory-Usage | GPU-Util  Compute M. |
|                                         |                        |               MIG M. |
|   0  Tesla T4                       Off |   00000000:00:04.0 Off |                    0 |
| N/A   58C    P0             28W /   70W |     107MiB /  15360MiB |      0%      Default |
|                                         |                        |                  N/A |
+-----------------------------------------+------------------------+----------------------+

+----------------------------------------------

##Operaciones B√°sicas con TensorFlow

Una de las principales caracter√≠sticas de TensorFlow es su capacidad para realizar c√°lculos con tensores, que son estructuras de datos similares a matrices o arrays. A continuaci√≥n, veremos c√≥mo crear tensores b√°sicos y realizar operaciones matem√°ticas:

In [7]:
import tensorflow as tf

# Crear un tensor bidimensional
x = tf.constant([[1., 2., 3.],
                 [4., 5., 6.]])

# Mostrar el tensor, su forma y tipo de datos
print("Tensor:\n", x)
print("Forma:", x.shape)
print("Tipo de datos:", x.dtype)
print("Tipo de tensor", type(x))

Tensor:
 tf.Tensor(
[[1. 2. 3.]
 [4. 5. 6.]], shape=(2, 3), dtype=float32)
Forma: (2, 3)
Tipo de datos: <dtype: 'float32'>
Tipo de tensor <class 'tensorflow.python.framework.ops.EagerTensor'>


In [8]:
x.numpy()

array([[1., 2., 3.],
       [4., 5., 6.]], dtype=float32)

In [9]:
import numpy as np
arreglo=np.array([[1,2,3],[4,5,6]])
type(arreglo)

numpy.ndarray

##Operaciones Matem√°ticas con Tensores

TensorFlow permite realizar operaciones est√°ndar sobre tensores, adem√°s de operaciones especializadas en aprendizaje autom√°tico. Veamos algunos ejemplos b√°sicos:

In [10]:
# Operaciones aritm√©ticas
print("Suma de tensores:\n", x + x)
print("-"*80,"\n")

Suma de tensores:
 tf.Tensor(
[[ 2.  4.  6.]
 [ 8. 10. 12.]], shape=(2, 3), dtype=float32)
-------------------------------------------------------------------------------- 



In [11]:
print("Resta de tensores:\n", x - x)
print("-"*80,"\n")

Resta de tensores:
 tf.Tensor(
[[0. 0. 0.]
 [0. 0. 0.]], shape=(2, 3), dtype=float32)
-------------------------------------------------------------------------------- 



In [12]:
print("Multiplicaci√≥n por escalar:\n", 5 * x,"\n")
print("-"*80,"\n")

Multiplicaci√≥n por escalar:
 tf.Tensor(
[[ 5. 10. 15.]
 [20. 25. 30.]], shape=(2, 3), dtype=float32) 

-------------------------------------------------------------------------------- 



In [14]:
# LA transpuesta
resultado = tf.transpose(x)
print("Producto matricial:\n", resultado,"\n")
print("-"*80,"\n")

Producto matricial:
 tf.Tensor(
[[1. 4.]
 [2. 5.]
 [3. 6.]], shape=(3, 2), dtype=float32) 

-------------------------------------------------------------------------------- 



In [15]:
# Producto matricial (operador '@')
resultado = x @ tf.transpose(x)
print("Producto matricial:\n", resultado,"\n")
print("-"*80,"\n")

Producto matricial:
 tf.Tensor(
[[14. 32.]
 [32. 77.]], shape=(2, 2), dtype=float32) 

-------------------------------------------------------------------------------- 



In [15]:
# Concatenaci√≥n de tensores
concatenado = tf.concat([x, x, x], axis=0)
print("Tensor concatenado:\n", concatenado,"\n")
print("-"*80,"\n")


In [16]:
#concatenar x, con x**2, X**3, por las columnas
concatenado = tf.concat([x, x**2, x**3], axis=1)
print("Tensor concatenado:\n", concatenado,"\n")
print("-"*80,"\n")

In [17]:
x

In [18]:
#media por sample
media = tf.reduce_mean(x, axis=1)
print("Media por sample:\n", media,"\n")
print("-"*80,"\n")

In [19]:
# Media por feature (columna)
mean_features = tf.reduce_mean(x, axis=0)
print("Media por feature:", mean_features.numpy())

In [20]:
#crear el tensor lalamdo "tensor" de [[1.,4.,0.5,2],[2.,3.,1.,0.],[2.,4.,1.,2.]]
tensor=tf.constant([[1.,4.,0.5,2],[2.,3.,1.,0.],[2.,4.,1.,2.]])
print("Tensor:\n", tensor)

In [21]:
tensorr=tensor**(0.5)
print("Tensor:\n", tensorr)

In [22]:
tensorsuma=tensor+tensorr
print("Tensor:\n", tensorsuma)

In [23]:
tensorcon=tf.concat([tensor,tensorr,tensorsuma],axis=0)
print("Tensor:\n", tensorcon)

In [24]:
respuesta=tf.concat([(tensorcon,tensorcon)],axis=1)
print("Tensor:\n", respuesta)

In [25]:
tensorcon

In [26]:
sumah=tf.reduce_sum(tensorcon,axis=1)
print("Tensor:\n", sumah)

In [27]:
mediah=tf.reduce_mean(tensorcon,axis=1)
print("Tensor:\n", mediah)

In [None]:
sumav=tf.reduce_sum(tensorcon,axis=0)
print("Tensor:\n", sumav)

In [29]:
mediav=tf.reduce_mean(tensorcon,axis=0)
print("Tensor:\n", mediav)

# Concepto de sigmoide y softmax

![](https://www.researchgate.net/publication/325856086/figure/fig1/AS:723221292789765@1549440801787/Softmax-function-image.png)


# Softmax explicado paso a paso

##  ¬øQu√© es Softmax?

Softmax es una funci√≥n que transforma un vector de n√∫meros reales en un vector de **probabilidades** que suman 1.  
Se usa mucho en **clasificaci√≥n multiclase**, porque permite interpretar las salidas de un modelo como probabilidades de cada clase.  

Si tienes un vector $(z = [z_1, z_2, ..., z_n])$, el Softmax se define as√≠:

$sigma(z_i) = \frac{e^{z_i}}{\sum_{j=1}^{n} e^{z_j}}$


Donde:

- $(e^{z_i})$ es la exponencial de cada elemento.
- El denominador $(\sum_{j=1}^{n} e^{z_j})$ normaliza para que la suma sea 1.

---

## 2 Ejemplo paso a paso

Supongamos que tenemos un vector:


$z = [2.0, 1.0, 0.1]$


**Paso 1: Calcular la exponencial de cada elemento**

$e^z = [e^2.0, e^1.0, e^{0.1}] \approx [7.389, 2.718, 1.105]$


**Paso 2: Sumar todas las exponenciales**
${suma} = 7.389 + 2.718 + 1.105 \approx 11.212$


**Paso 3: Dividir cada exponencial por la suma**

${Softmax}(z) = \left[\frac{7.389}{11.212}, \frac{2.718}{11.212}, \frac{1.105}{11.212}\right] \approx [0.659, 0.242, 0.099]$

 Ahora tenemos un vector de **probabilidades** que suman 1.

---


In [30]:
x

In [31]:
# Aplicaci√≥n de una funci√≥n matem√°tica: Softmax
softmax = tf.nn.softmax(x, axis=1)
print("Softmax aplicado al tensor:\n", softmax,"\n")
print("-"*80,"\n")

In [32]:

# Reducci√≥n: suma total de los elementos del tensor
suma_total = tf.reduce_sum(x)
print("Suma total del tensor:", suma_total.numpy())
suma_total

##Ejecuci√≥n en GPU
TensorFlow puede aprovechar GPUs para acelerar los c√°lculos.

Si est√° usando Google Colab, vaya a menu a ***Entorno de ejecuci√≥n ***y luego ingrese a ***Cambiar tipo de Entorno de Ejecuci√≥n*** y luego seleccione ***T4 GPU ***. Debe ejecutar todas las celdas anteriores.


Verifica si tu sistema est√° utilizando una GPU con este c√≥digo:


In [33]:
if tf.config.list_physical_devices('GPU'):
    print("TensorFlow est√° utilizando la GPU")
else:
    print("TensorFlow no est√° utilizando la GPU")

##Variables en TensorFlow
Mientras que los tensores normales son inmutables, las variables (tf.Variable) permiten almacenar valores que se pueden modificar, como los pesos de un modelo. Aqu√≠ tienes un ejemplo:

In [34]:
# Crear una variable
var = tf.Variable([0.0, 0.0, 0.0])

# Asignar nuevos valores
var.assign([1, 2, 3])
print("Variable actualizada:", var.numpy())

# Incrementar valores de la variable
var.assign_add([1, 1, 1])
print("Variable incrementada:", var.numpy())

# Diferenciaci√≥n Autom√°tica  (Repaso de conceptos)
La diferenciaci√≥n autom√°tica permite calcular derivadas de manera eficiente. Este mecanismo es esencial para entrenar modelos utilizando optimizadores como el descenso de gradiente.

## Calcular derivadas con TensorFlow: Explicaci√≥n

##  Variables

- En TensorFlow, se usan **variables** (`tf.Variable`) para valores que pueden cambiar y respecto a los cuales queremos derivar.
- Las variables son necesarias para que TensorFlow pueda **rastrear dependencias** y calcular gradientes autom√°ticamente.

---

##  Definir la funci√≥n

- La funci√≥n que queremos derivar puede ser cualquier expresi√≥n matem√°tica, como un polinomio o la funci√≥n de p√©rdida de un modelo.
- Por ejemplo, un polinomio:
$
f(x) = 3x^3 + 2x^2 - 4x - 2
$

- TensorFlow graba las operaciones sobre las variables para poder calcular c√≥mo cada salida depende de sus entradas.

---

##  `tf.GradientTape`

- `GradientTape` es un contexto que **graba todas las operaciones** realizadas sobre variables dentro de su bloque.
- Esto permite a TensorFlow **construir autom√°ticamente un grafo de derivaci√≥n** para calcular gradientes.

---

##  Calcular el gradiente

- Una vez que la funci√≥n ha sido evaluada dentro del `GradientTape`, podemos pedir a TensorFlow que calcule la **derivada de la salida respecto a la variable**.
- Matem√°ticamente, para nuestro polinomio:
$
f'(x) = \frac{d}{dx}(3x^3 + 2x^2 - 4x - 2) = 9x^2 + 4x - 4
$
- Evaluando en $(x = 2)$:

$
f'(2) = 9(2^2) + 4(2) - 4 = 40
$

---

##  Interpretaci√≥n

- El gradiente obtenido indica **la tasa de cambio de la funci√≥n respecto a la variable**.
- En aprendizaje autom√°tico, esto se usa para **actualizar los par√°metros de un modelo** durante el entrenamiento.

---

## Resumen conceptual

1. Se definen **variables** sobre las que queremos derivar.
2. `GradientTape` **graba operaciones** para calcular gradientes autom√°ticamente.
3. `tape.gradient` calcula la **derivada** de la salida respecto a las variables.
4. El resultado es un **tensor que indica la pendiente** de la funci√≥n en ese punto.
5. Esta t√©cnica se usa ampliamente en **optimizaci√≥n y entrenamiento de redes neuronales**.


In [35]:

def f(x):
    return 3*x**3 + 2*x**2-4*x - 2

In [36]:
#Grafico de dispersi√≥n entre a y y donde x
import matplotlib.pyplot as plt
a = tf.linspace(-10, 10, 100)
y = f(a)
plt.scatter(a, y)
plt.show()

# Derivadas de la funci√≥n

## Funci√≥n original

$$
f(x) = 3x^3 + 2x^2 - 4x - 2
$$

---

##  Paso 1: Primera derivada

Aplicamos reglas de derivaci√≥n:

$$
f'(x) = \frac{d}{dx}\left(3x^3 + 2x^2 - 4x - 2\right)
$$

- Derivada de $(3x^3 \;\rightarrow\; 9x^2)$  
- Derivada de $(2x^2 \;\rightarrow\; 4x)$  
- Derivada de $(-4x \;\rightarrow\; -4)$
- Derivada de $(-2 \;\rightarrow\; 0)$  

$$
f'(x) = 9x^2 + 4x - 4
$$

---

##  Paso 2: Segunda derivada

Ahora derivamos otra vez:

$$
f''(x) = \frac{d}{dx}\left(9x^2 + 4x - 4\right)
$$

- Derivada de $(9x^2 \;\rightarrow\; 18x)$  
- Derivada de $(4x \;\rightarrow\; 4)$  
- Derivada de $(-4 \;\rightarrow\; 0)$  

$$
f''(x) = 18x + 4
$$

---

##  Resumen

- **Funci√≥n original:**

$$
f(x) = 3x^3 + 2x^2 - 4x - 2
$$

- **Primera derivada (pendiente):**

$$
f'(x) = 9x^2 + 4x - 4
$$

- **Segunda derivada (curvatura):**

$$
f''(x) = 18x + 4
$$


##GrandientTape de TensorFlow
Es una cinta de grabaci√≥n ("tape") que observa todas las operaciones matem√°ticas realizadas sobre las variables marcadas como tf.Variable.

Luego, podemos pedirle que calcule las derivadas de una expresi√≥n con respecto a esas variables.

Se llama "tape" porque funciona como una grabadora:

Graba las operaciones (por ejemplo, multiplicaciones, potencias, sumas...).

Reproduce hacia atr√°s para aplicar la regla de la cadena y obtener derivadas.


In [37]:
import tensorflow as tf

x = tf.Variable(7.5)

with tf.GradientTape() as tape:
    y = f(x)   # f(x) = x¬≥+....

# Pedimos la derivada de y respecto a x
dy_dx = tape.gradient(y, x)

print("f(x) =", y.numpy())        #
print("f'(x) =", dy_dx.numpy())   #


# Diferencia entre usar GradientTape y luego llamar a tape.gradient

## with tf.GradientTape() as tape:

En el ejemplo anterior creamos la cinta (el ‚Äúgrabador‚Äù).

Durante ese bloque, TensorFlow observa todas las operaciones matem√°ticas que se hacen con variables (tf.Variable).

Es como si grabara paso a paso c√≥mo se calcul√≥ la funci√≥n.

## tape.gradient(y, x)

Una vez finaliza el bloque, usamos esa cinta para pedir la derivada de una salida y respecto a una variable x.

Aqu√≠ la cinta reproduce en reversa las operaciones grabadas (regla de la cadena).

Resultado: la derivada num√©rica en el punto actual de x.

# Primera y segunda derivada

In [38]:

# Definimos la funci√≥n f(x) = 3x¬≥ + 2x¬≤ - 4x - 2
def f(x):
    return 3*x**3 + 2*x**2 - 4*x - 2

# Definimos 'x' como una variable (TensorFlow necesita una Variable para calcular derivadas).
x = tf.Variable(0.481)

# Usamos dos "GradientTape":
# - El primero (tape2) calcular√° la PRIMERA derivada de f(x) con respecto a x.
# - El segundo (tape) observar√° lo que hace el primero, para luego calcular la SEGUNDA derivada.

with tf.GradientTape() as tape:
    with tf.GradientTape() as tape2:
        # Evaluamos la funci√≥n dentro de ambas cintas.
        y = f(x)

    # PRIMERA DERIVADA: f'(x)
    # La primera derivada mide la pendiente de la funci√≥n en un punto.
    # En t√©rminos pr√°cticos: indica la velocidad de cambio de f(x) con respecto a x.
    g_x = tape2.gradient(y, x)

# SEGUNDA DERIVADA: f''(x)
# La segunda derivada mide c√≥mo cambia la pendiente.
# En t√©rminos pr√°cticos:
#   - Si f''(x) > 0 ‚Üí la curva es c√≥ncava hacia arriba (m√≠nimos locales).
#   - Si f''(x) < 0 ‚Üí la curva es c√≥ncava hacia abajo (m√°ximos locales).
g_x2 = tape.gradient(g_x, x)

print("x =", x.numpy())
print("f(x) =", y.numpy())
print("f'(x) =", g_x.numpy())
print("f''(x) =", g_x2.numpy())


# Quiero Ver las funciones o las ecuaciones de la derivada

In [39]:
import sympy as sp

# Definir la variable simb√≥lica
x = sp.Symbol('x')

# Definir la funci√≥n
f = 3*x**3 + 2*x**2 - 4*x - 2

# Primera derivada
f_prime = sp.diff(f, x)

# Segunda derivada
f_second = sp.diff(f_prime, x)

print("Funci√≥n original f(x):", f)
print("Primera derivada f'(x):", f_prime)
print("Segunda derivada f''(x):", f_second)


In [40]:
import tensorflow as tf
import numpy as np
import matplotlib.pyplot as plt

# Definir la funci√≥n
def f(x):
    return 3*x**3 + 2*x**2 - 4*x - 2

# Definir el rango de valores para x
x_vals = np.linspace(-3, 3, 200)
f_vals = f(x_vals)

# Usamos TensorFlow para obtener derivadas autom√°ticas
x = tf.Variable(x_vals)

with tf.GradientTape() as tape:
    with tf.GradientTape() as tape2:
        y = f(x)
    f_prime = tape2.gradient(y, x)   # primera derivada
f_second = tape.gradient(f_prime, x) # segunda derivada

# Convertir resultados a numpy para graficar
f_prime_vals = f_prime.numpy()
f_second_vals = f_second.numpy()

# Graficar
plt.figure(figsize=(10,6))
plt.plot(x_vals, f_vals, label="f(x)", linewidth=2)
plt.plot(x_vals, f_prime_vals, label="f'(x)", linestyle="--", linewidth=2)
plt.plot(x_vals, f_second_vals, label="f''(x)", linestyle=":", linewidth=2)

plt.axhline(0, color="black", linewidth=0.7)
plt.axvline(0, color="black", linewidth=0.7)
plt.legend()
plt.title("Funci√≥n, Primera derivada y Segunda derivada")
plt.xlabel("x")
plt.ylabel("Valor")
plt.grid(True)
plt.show()


##Grafos y funciones

En el contexto de TensorFlow, graph se asocia m√°s com√∫nmente con gr√°fos porque describe una secuencia de operaciones que puede ser visualizada o ejecutada. Sin embargo, no se refiere espec√≠ficamente a una imagen o gr√°ficas de matplotlib o seaborn.

* @tf.function:

Este decorador convierte una funci√≥n de Python en un gr√°fo computacional de TensorFlow (un Graph).

Las funciones convertidas con @tf.function son m√°s eficientes porque optimizan las operaciones y permiten ejecutar c√°lculos en diferentes dispositivos como CPUs, GPUs o TPUs.

* print('Tracing.\n'):

Este mensaje se imprime solo cuando se crea o se "traza" el gr√°fo computacional por primera vez.
Una vez que el gr√°fo est√° trazado, las ejecuciones posteriores de la funci√≥n no vuelven a imprimir el mensaje porque ya se usa el gr√°fo optimizado.


* return tf.reduce_sum(x):

Calcula la suma de todos los elementos del tensor x.

tf.reduce_sum es una operaci√≥n que "reduce" un tensor a un solo valor al aplicar la suma en todas las dimensiones.

**Tracing**
Cuando se llama por primera vez a una funci√≥n decorada con @tf.function, TensorFlow analiza ("traza") el c√≥digo para crear un grafo computacional.

Este grafo permite realizar optimizaciones y ejecutar la funci√≥n de manera m√°s eficiente.

In [41]:
# Decorador de TensorFlow que convierte la funci√≥n en un "graph function"
# Esto significa que TensorFlow optimiza la ejecuci√≥n al compilarla en un grafo computacional.
@tf.function
def my_func(x):
    # Este print se ejecutar√° SOLO la primera vez que TensorFlow "tracea"
    # (construye el grafo de operaciones).
    print('Tracing.\n')

    # tf.reduce_sum suma todos los elementos de x (tensor o array)
    return tf.reduce_sum(x)

In [42]:
x = tf.constant([1, 2, 3])
my_func(x)

In [43]:
my_func(x).numpy()

En llamadas posteriores, TensorFlow solo ejecuta el gr√°fo optimizado, omitiendo cualquier paso que no sea de TensorFlow. A continuaci√≥n, observa que my_func no imprime el seguimiento, ya que print es una funci√≥n de Python, no una funci√≥n de TensorFlow.

In [44]:
x = tf.constant([10, 9, 8])
my_func(x)

In [45]:
my_func(x).numpy()

Un gr√°fo puede no ser reutilizable para entradas con una forma diferente (forma y tipo de datos), por lo que se genera un nuevo gr√°fo en su lugar.

In [46]:
x = tf.constant([10.0, 9.1, 8.2], dtype=tf.float32)
my_func(x)

In [47]:
my_func(x).numpy()

Estos gr√°fos capturados ofrecen dos beneficios:

1. En muchos casos, proporcionan una aceleraci√≥n significativa en la ejecuci√≥n (aunque no en este ejemplo trivial).

2. Puedes exportar estos gr√°fo, utilizando tf.saved_model, para ejecutarlos en otros sistemas, como un servidor o un dispositivo m√≥vil, sin necesidad de instalar Python.

##M√≥dulos, capas y modelos.

tf.Module es una clase para administrar sus objetos tf.Variable y los objetos tf.function que operan en ellos. La clase tf.Module es necesaria para admitir dos funciones importantes:


Puede guardar y restaurar los valores de sus variables usando tf.train.Checkpoint . Esto es √∫til durante el entrenamiento, ya que es r√°pido guardar y restaurar el estado de un modelo.
Puede importar y exportar los valores de tf.Variable y los gr√°fos de tf.function usando tf.saved_model . Esto le permite ejecutar su modelo independientemente del programa de Python que lo cre√≥.

Aqu√≠ hay un ejemplo completo exportando un objeto tf.Module simple

In [48]:
class MyModule(tf.Module):
    """
    Una clase que extiende `tf.Module` para demostrar c√≥mo gestionar variables y funciones en TensorFlow.

    Atributos:
        weight (tf.Variable): Una variable que almacena un valor inicializado durante la creaci√≥n del m√≥dulo.

    M√©todos:
        multiply(x):
            Realiza una multiplicaci√≥n entre la entrada `x` y la variable `weight`.
    """

    def __init__(self, value):
        """
        Constructor de la clase MyModule.

        Args:
            value (float o int): Valor inicial para la variable `weight`.
        """
        self.weight = tf.Variable(value)

    @tf.function
    def multiply(self, x):
        """
        Multiplica la entrada `x` por la variable `weight`.

        Args:
            x (tf.Tensor): Un tensor que representa los valores de entrada.

        Returns:
            tf.Tensor: El resultado de la multiplicaci√≥n de `x` y `weight`.
        """
        return x * self.weight


 El siguiente c√≥digo ejecuta una operaci√≥n de multiplicaci√≥n elemento por elemento entre el tensor de entrada y el valor almacenado en la variable weight del m√≥dulo. En este caso, el resultado es el tensor [3, 6, 9].

1. Creamos una instancia de la clase MyModule con el valor inicial de weight igual a 3. Esto significa que el atributo weight ser√° una variable de TensorFlow (tf.Variable) con un valor inicial de 3.

2. Llamamos al m√©todo multiply de la instancia mod pasando un tensor constante de valores [1, 2, 3].



In [49]:
mod = MyModule(3)
mod.multiply(tf.constant([1, 2, 3]))

In [50]:
mod.multiply(tf.constant([1, 2, 3])).numpy()

##Salvar el m√≥dulo

Para guardar un m√≥dulo en TensorFlow, se usa la funci√≥n tf.saved_model.save. Este m√©todo permite exportar un m√≥dulo o modelo de TensorFlow, junto con sus variables y gr√°ficos, para ser reutilizado en otros entornos sin necesidad de depender del programa original de Python.

![image](https://github.com/adiacla/bigdata/blob/master/modulosTF.JPG?raw=true)

In [51]:
save_path = './saved'
tf.saved_model.save(mod, save_path)

El modelo guardado resultante es independiente del c√≥digo que lo cre√≥. Puede cargar un modelo guardado desde Python, otros enlaces de idioma o TensorFlow Serving . Tambi√©n puede convertirlo para que se ejecute con TensorFlow Lite o TensorFlow JS .

In [52]:
reloaded = tf.saved_model.load(save_path)
reloaded.multiply(tf.constant([4, 5, 6])).numpy()

##Creaci√≥n de Modelos y Entrenamiento- Bucles de entrenamiento

Ahora vamos a poner todo unido para construir un modelo b√°sico y entr√©narlo desde cero.

1. Crear algunos datos de ejemplo. Esto genera una nube de puntos que sigue vagamente una curva cuadr√°tica:

2. Definir modelos personalizados usando tf.keras.Model y entrenarlos manualmente o con utilidades como Model.fit.

Vamos a realizar un ejemplo  de un modelo entrenado para ajustar datos sinteticos o simulados:



In [53]:
# Importa la biblioteca principal de Matplotlib
import matplotlib

# Importa el m√≥dulo pyplot de Matplotlib y lo asigna al alias 'plt'
from matplotlib import pyplot as plt

# Configura el tama√±o predeterminado de las figuras generadas por Matplotlib
# Esto asegura que todas las gr√°ficas creadas tengan dimensiones de 9 pulgadas de ancho por 6 pulgadas de alto
matplotlib.rcParams['figure.figsize'] = [9, 6]


#Generaci√≥n de datos aleatorios (sint√©ticos) a partir de una funci√≥n

Se genera un conjunto de datos x y se calcula y usando una funci√≥n cuadr√°tica, a la cual se a√±ade ruido para simular datos experimentales o del mundo real.

* Visualizaci√≥n:
Los puntos (Data) muestran los datos con ruido.

La l√≠nea (Ground truth) representa la relaci√≥n te√≥rica exacta entre x e y sin ruido.

* Leyenda: Facilita identificar qu√© serie corresponde a los datos simulados y cu√°l a la funci√≥n te√≥rica.

Explicaciones del c√≥digo

1. tf.linspace(-2, 2, 201): Genera 201 puntos equidistantes entre -2 y 2, lo que crea un vector de entradas x.
2. tf.cast(x, tf.float32): Asegura que los valores de x sean del tipo float32 para ser utilizados en operaciones de TensorFlow.
3. Funci√≥n f(x): Calcula el valor de la ecuaci√≥n cuadr√°tica $f(x) = x^2 + 2x - 5$ para cada valor en x.
4. tf.random.normal(shape=[201]): A√±ade ruido aleatorio a los valores de y para simular un conjunto de datos ruidosos.


##plt.plot:
Dibuja dos gr√°ficos, uno con puntos (.) para los datos generados con ruido.
Otro con una l√≠nea que representa la funci√≥n cuadr√°tica sin ruido (la "verdad fundamental").

Al final, el gr√°fico resultante muestra tanto los datos ruidosos como la funci√≥n que los genera.


# Creemo un modelo cuadr√°tico param√©trico hecho a mano con Gradiente del descenso (GradientTape)

In [54]:
tf.random.set_seed(42)

# Crear un tensor 'x' con valores en un rango de -2 a 2, dividido en 201 puntos
x = tf.linspace(-2, 2, 201)  # Genera valores de -2 a 2 con 201 puntos equidistantes
# Convertir 'x' a tipo de dato float32 para su procesamiento posterior
x = tf.cast(x, tf.float32)
x.numpy()

In [55]:
# Definir una funci√≥n f(x) que calcule el valor de la expresi√≥n cuadr√°tica: f(x) = x^2 + 2x - 5
def f(x):
    y = x**2 + 2*x - 5  # Evaluaci√≥n de la funci√≥n cuadr√°tica
    return y  # Devolver el valor calculado

# Generar el vector de 'y' usando la funci√≥n f(x) y agregar un ruido aleatorio de media 0 y varianza 1
y = f(x) + tf.random.normal(shape=[201])  # A√±adir ruido aleatorio a los valores de 'y'

# Graficar los datos generados (con ruido) usando puntos ('.') en el gr√°fico
plt.plot(x.numpy(), y.numpy(), '.', label='Data')  # Convertir los tensores a arrays de NumPy para graficar

# Graficar la "verdad fundamental" (la funci√≥n sin ruido) con una l√≠nea continua
plt.plot(x, f(x), label='Ground truth')  # Graficar la funci√≥n original sin ruido

# A√±adir la leyenda para explicar las l√≠neas en el gr√°fico
plt.legend()  # Mostrar leyenda para identificar los datos y la verdad fundamental


In [56]:
# Preparamos entradas: [x, x^2]
X = tf.stack([x, x**2], axis=1)   # shape = (201, 2)

print("Forma de X:", X.shape)
print("Forma de y:", y.shape)

In [57]:
import pandas as pd

# Create a dictionary with the data
data_dict = {
    'X1': x.numpy(),
    'X2': (x**2).numpy(),
    'y': y.numpy()
}

# Create the pandas DataFrame
df = pd.DataFrame(data_dict)

# Display the first few rows of the DataFrame
display(df.head())

![](https://github.com/adiacla/bigdata/blob/master/perceptron2.jpg?raw=true)

## Creamos un modelo con pesos y bias aleatorios

Veremo como se comparta la funci√≥n de error si mantenemos constante dos variables y variamos w1. Para explciarl el descenso del gradiente.

**El descenso del gradiente (Gradient Descent)** es un algoritmo de optimizaci√≥n que sirve para encontrar los valores de los par√°metros (pesos y sesgos en una red neuronal) que minimizan la funci√≥n de p√©rdida.

In [58]:
# Define the fixed values for bias (b) and weight (w1)
b = -5
w2 = 1

# Define a range of values for w2
w1_values = np.linspace(-6, 10, 100)

# Initialize a list to store the mean squared errors
mse_values = []

# Iterate through the w2 values
for w1 in w1_values:
    # Calculate the new column 'a1'
    df['a1'] = b + (w1 * df['X1']) + (w2 * df['X2'])
    # Calculate the mean squared error
    mse = tf.reduce_mean(tf.square(df['a1'] - df['y']))
    mse_values.append(mse.numpy())


# Plot the mean squared error against w2
plt.plot(w1_values, mse_values)
plt.xlabel("w1")
plt.ylabel("Mean Squared Error")
plt.title("Mean Squared Error vs. w2")
plt.show()

In [59]:
df

### Modelo

La salida del modelo para el ejemplo \(i\) es:

$\hat y_i = a1_i = b + w_1 x_{1i} + w_2 x_{2i},\quad \text{con } b=-5,\; w_2=1.$

### P√©rdida MSE

La funci√≥n de p√©rdida se define como:

$
\mathcal{L}(w_1) = \frac{1}{n}\sum_{i=1}^n \left(b + w_1 x_{1i} + w_2 x_{2i} - y_i\right)^2$

### Derivada de la p√©rdida respecto a $w_1$

$
\frac{\partial \mathcal{L}}{\partial w_1}
= \frac{2}{n}\sum_{i=1}^n \left(b + w_1 x_{1i} + w_2 x_{2i} - y_i\right)\,x_{1i}
$

### Forma vectorizada

$
\frac{\partial \mathcal{L}}{\partial w_1}
=\frac{2}{n}\, X_1^\top\left(b\,\mathbf{1}+w_1 X_1+w_2 X_2-y\right)
$


In [60]:
#crea dataframe de (w1_values, mse_values
df2 = pd.DataFrame({'w1': w1_values, 'mse': mse_values})
df2

#Un ejemplo dibujando la linea tagente a un punto de la funci√≥n de p√©rdida

In [61]:
# Define the fixed values for bias (b) and weight (w2)
b_fixed = tf.constant(-5.0, dtype=tf.float32)
w2_fixed = tf.constant(1.0, dtype=tf.float32)

# Convert DataFrame columns to TensorFlow tensors
X1_tensor = tf.constant(df['X1'].values, dtype=tf.float32)
X2_tensor = tf.constant(df['X2'].values, dtype=tf.float32)
y_tensor = tf.constant(df['y'].values, dtype=tf.float32)


def mse_for_w1(w1):
    """
    Calculates the mean squared error for a given w1, with fixed b and w2.
    """
    a1 = b_fixed + (w1 * X1_tensor) + (w2_fixed * X2_tensor)
    mse = tf.reduce_mean(tf.square(a1 - y_tensor))
    return mse

# Choose the point where w1 = 0
w1_point = tf.constant(0.0, dtype=tf.float32)
mse_point = mse_for_w1(w1_point) # This should be close to 2 based on the previous plot

# Use GradientTape to calculate the gradient of the MSE with respect to w1 at w1_point
with tf.GradientTape() as tape:
    tape.watch(w1_point)
    mse_at_point = mse_for_w1(w1_point)

gradient_at_point = tape.gradient(mse_at_point, w1_point)

print(f"Gradient of MSE at w1 = {w1_point.numpy()}: {gradient_at_point.numpy()}")

# Define the tangent line equation: y = m * (x - x1) + y1
# (x1, y1) = (w1_point.numpy(), mse_point.numpy())
# m = gradient_at_point.numpy()

def tangent_line(w, w1_point, mse_point, gradient):
    return gradient * (w - w1_point) + mse_point

# Generate a range of w1 values for plotting
w1_values_plot = np.linspace(-6, 10, 100)

# Calculate MSE values for plotting
mse_values_plot = [mse_for_w1(tf.constant(w, dtype=tf.float32)).numpy() for w in w1_values_plot]

# Calculate tangent line values for plotting
tangent_values_plot = tangent_line(w1_values_plot, w1_point.numpy(), mse_point.numpy(), gradient_at_point.numpy())

# Plot the MSE curve and the tangent line
plt.figure(figsize=(9, 6))
plt.plot(w1_values_plot, mse_values_plot, label="MSE vs. w1")
plt.plot(w1_values_plot, tangent_values_plot, label=f"Tangent at w1={w1_point.numpy()}", linestyle='--')
plt.scatter([w1_point.numpy()], [mse_point.numpy()], color='red', zorder=5) # Mark the tangent point
plt.xlabel("w1")
plt.ylabel("Mean Squared Error")
plt.title("Mean Squared Error vs. w1 with Tangent Line")
plt.legend()
plt.grid(True)
plt.show()

## Ahora explicado todo entonces vamos Entrenar el modelo usando Tensorflow (con la class Module)

Definici√≥n de la clase Model(tf.Module):

**tf.Module** es una clase base para crear modelos personalizados en TensorFlow. Permite realizar un seguimiento autom√°tico de las variables y asegura que los par√°metros del modelo se traten como variables de TensorFlow.

* M√©todo __init__(self):

*rand_init = tf.random.uniform(shape=[3], minval=0., maxval=5., seed=22)* genera un tensor con 3 valores aleatorios distribuidos uniformemente en el rango [0., 5.].
Estos valores se usar√°n para inicializar los pesos y el sesgo del modelo.

*self.w_q, self.w_l y self.b * son variables de TensorFlow que se inicializan con estos valores aleatorios.

**self.w_q:** el peso cuadr√°tico correspondiente al t√©rmino $ùë•2.self.w_l$: el peso lineal correspondiente al t√©rmino $ùë•.self.b$: el t√©rmino de sesgo.

**M√©todo __call__(self, x)**:

Este m√©todo hace que la clase sea "llamable", es decir, se puede utilizar una instancia de Model como si fuera una funci√≥n.

Toma un tensor de entrada x y calcula la salida del modelo cuadr√°tico utilizando la f√≥rmula:
$$y = w_q \cdot x^{2} + w_l \cdot x + b$$

donde $w_q$, $w_l$ y  $b$ son los par√°metros del modelo.

**Decorador @tf.function:**

El decorador @tf.function convierte el m√©todo en un gr√°fico de TensorFlow, lo que mejora la eficiencia en la ejecuci√≥n, especialmente cuando se utiliza en GPU o TPU.

Esto optimiza el c√°lculo, haci√©ndolo m√°s r√°pido en llamadas repetidas.

In [62]:
# ============================
# 2. Definimos el modelo con tf.Module
# ============================
class Neurona(tf.Module):
    """
    Una sola neurona: y_pred = w1*x + w2*x^2 + b
    """

    def __init__(self, seed=42):
        # Inicializamos pesos y bias con distribuci√≥n normal reproducible
        init = tf.random.normal(shape=(2,1), seed=seed)   # 2 entradas -> 1 salida
        self.W = tf.Variable(init)   # Matriz de pesos (2x1)
        self.b = tf.Variable(tf.zeros(1))  # Sesgo

    @tf.function
    def __call__(self, X):
        # Operaci√≥n de la neurona (sin activaci√≥n, lineal)
        return tf.matmul(X, self.W) + self.b

##Definir la funci√≥n de p√©rdida:

Dado que este modelo est√° dise√±ado para predecir valores continuos, el error cuadr√°tico medio (MSE, por sus siglas en ingl√©s) es una buena elecci√≥n para la funci√≥n de p√©rdida. Dado un vector de predicciones, $\hat{y}$ , y un vector de los valores verdaderos o "ground truth", ùë¶, el MSE se define como la media de las diferencias cuadradas entre los valores predichos y los valores reales.

$$
MSE = \frac{1}{m} \sum_{i=1}^{m} (\hat{y}_i - y_i)^2
$$

Donde:
- $ m$ es el n√∫mero total de muestras.
- $\hat{y}_i$ es la predicci√≥n del modelo para la \( i \)-√©sima muestra.
- $y_i$ es el valor real o "ground truth" para la \( i \)-√©sima muestra.
-$\sum $ denota la sumatoria a lo largo de todas las muestras.

### Detalle del c√°lculo:

La funci√≥n `mse_loss` realiza los siguientes pasos:

1. **Diferencia entre predicciones y valores reales:**
   
   $$
   (\hat{y}_i - y_i)
   $$

2. **Cuadrar las diferencias:**
   
   $$
   (\hat{y}_i - y_i)^2
   $$

3. **Promediar las diferencias cuadradas:**

   $$
   MSE = \frac{1}{m} \sum_{i=1}^{m} (\hat{y}_i - y_i)^2
   $$

Este es el c√°lculo del **MSE**, que mide cu√°n cerca est√°n las predicciones del modelo de los valores reales.

In [63]:
# ============================
# 3. Funci√≥n de p√©rdida y optimizaci√≥n
# ============================
def mse_loss(y_pred, y_true):
    return tf.reduce_mean(tf.square(y_pred - y_true))


##Ciclo de entrenamiento b√°sico para el modelo.

El ciclo har√° uso de la funci√≥n de p√©rdida MSE y sus gradientes con respecto a la entrada para actualizar iterativamente los par√°metros del modelo. El uso de mini-lotes para el entrenamiento proporciona tanto eficiencia de memoria como una convergencia m√°s r√°pida. La API tf.data.Dataset tiene funciones √∫tiles para dividir en lotes y mezclar los datos.

In [64]:
# ============================
# 4. Entrenamiento con GradientTape
# ============================
# Instanciamos el modelo
modelo = Neurona(seed=42)

# Hiperpar√°metros
epochs = 200
learning_rate = 0.05
losses = []

for epoch in range(epochs):
    with tf.GradientTape() as tape:
        y_pred = modelo(X)
        loss = mse_loss(y_pred, tf.expand_dims(y, axis=1))  # expandimos y a (201,1)

    # Calculamos gradientes
    grads = tape.gradient(loss, [modelo.W, modelo.b])

    # Actualizamos par√°metros (descenso del gradiente manual)
    modelo.W.assign_sub(learning_rate * grads[0])
    modelo.b.assign_sub(learning_rate * grads[1])

    losses.append(loss.numpy())
    if epoch %5 == 0:
        print(f"Epoch {epoch}: Loss = {loss.numpy():.4f}")


# 3. Predecir un valor

El c√≥digo llama a la funci√≥n plot_preds, que se utiliza para visualizar las predicciones del modelo y compararlas con los valores reales (y) y las predicciones de la funci√≥n f (la "verdad base" o el modelo original).

In [65]:
# ============================
# 5. Resultados
# ============================
print("\nPesos aprendidos:")
print("W =", modelo.W.numpy().flatten())
print("b =", modelo.b.numpy())

# Graficamos la evoluci√≥n de la p√©rdida
plt.plot(losses)
plt.xlabel("√âpoca")
plt.ylabel("MSE")
plt.title("Entrenamiento de una sola neurona")
plt.show()

# Graficamos la predicci√≥n vs datos
plt.scatter(x, y, label="Datos con ruido", s=10)
plt.plot(x, f(x), label="Funci√≥n real", linewidth=2)
plt.plot(x, modelo(X), label="Modelo entrenado", linewidth=2, linestyle="--")
plt.legend()
plt.show()

In [66]:
# ============================
# 5. Resultados
# ============================
print("\nPesos aprendidos:")
print("W =", modelo.W.numpy().flatten())
print("b =", modelo.b.numpy())

# Graficamos la evoluci√≥n de la p√©rdida
plt.plot(losses)
plt.xlabel("√âpoca")
plt.ylabel("MSE")
plt.title("Entrenamiento de una sola neurona")
plt.show()

# Graficamos la predicci√≥n vs datos
plt.scatter(x, y, label="Datos con ruido", s=10)
plt.plot(x, f(x), label="Funci√≥n real", linewidth=2)
plt.plot(x, modelo(X), label="Modelo entrenado", linewidth=2, linestyle="--")
plt.legend()
plt.show()

#Keras

El modelo qued√≥ entrenado y tiene buenos resultados, pero podemos hacer las implementaciones de utilidades de manera m√°s f√°cil y sencilla usnado utilidades comunes de entrenamiento est√°n disponibles en el m√≥dulo tf.keras.

Por lo tanto vamos a considera utilizar esas funciones en la siguiente secci√≥n antes de escribir las propias, como hicimos anteriormente.



**Keras** es una interfaz de alto nivel para TensorFlow, dise√±ada para facilitar y agilizar la implementaci√≥n de soluciones de aprendizaje autom√°tico (ML), con un enfoque principal en el aprendizaje profundo.

Esta biblioteca cubre todo el flujo de trabajo de ML, desde la preparaci√≥n de datos hasta la implementaci√≥n del modelo, pasando por el ajuste de hiperpar√°metros. Su principal objetivo es permitir una experimentaci√≥n r√°pida y eficiente.


Con Keras, se obtiene acceso completo a la escalabilidad y las capacidades multidispositivo de TensorFlow. Es posible ejecutar modelos en dispositivos potentes como TPUs o clusters de GPU, y tambi√©n exportar modelos entrenados para su uso en navegadores web o dispositivos m√≥viles. Adem√°s, Keras ofrece la posibilidad de desplegar modelos como APIs web.


El dise√±o de Keras est√° orientado a reducir la carga cognitiva, enfoc√°ndose en los siguientes aspectos:


1. Proporcionar interfaces simples y consistentes.
2. Minimizar la cantidad de pasos necesarios para realizar tareas comunes.
3. Ofrecer mensajes de error claros y f√°ciles de entender.
4. Seguir el principio de "divulgaci√≥n progresiva de complejidad", donde el usuario puede comenzar f√°cilmente y aprender gradualmente a medida que avanza en tareas m√°s complejas.
5. Fomentar la escritura de c√≥digo conciso y legible.


**Utilizar Keras**

Cualquier persona que utilice TensorFlow deber√≠a hacerlo a trav√©s de la API de Keras. Ya sea un ingeniero, un investigador o un profesional del aprendizaje autom√°tico, Keras es la opci√≥n recomendada para comenzar.


Existen casos espec√≠ficos, como la creaci√≥n de herramientas sobre TensorFlow o el desarrollo de plataformas de alto rendimiento personalizadas, donde puede ser necesario utilizar las APIs de bajo nivel de TensorFlow. Sin embargo, para la mayor√≠a de los usuarios, Keras ser√° la opci√≥n preferida.


**Componentes principales de Keras**

Keras est√° basado en dos estructuras de datos clave:
*capas y modelos*. Una **capa** es una funci√≥n que realiza una transformaci√≥n entre las entradas y las salidas, mientras que un **modelo** es un gr√°fico ac√≠clico dirigido (DAG) de capas.

##Capas

La clase *tf.keras.layers.Layer* es la piedra angular de Keras. Cada capa encapsula un conjunto de pesos y realiza ciertos c√°lculos a trav√©s del m√©todo call. Los pesos que se crean pueden ser entrenables o no, y las capas pueden estar compuestas de manera recursiva. Es decir, una capa puede contener otras capas como atributos, permitiendo que la capa externa gestione los pesos de las capas internas.

Adem√°s, las capas pueden utilizarse para tareas de preprocesamiento, como normalizaci√≥n de datos o vectorizaci√≥n de texto. Estas capas de preprocesamiento pueden integrarse directamente en el modelo, permitiendo su portabilidad tanto durante como despu√©s del entrenamiento.

##Modelos

Un modelo es un objeto que agrupa capas y que puede ser entrenado con datos. El tipo de modelo m√°s sencillo es el modelo secuencial, que organiza las capas en una pila lineal. Para arquitecturas m√°s complejas, Keras permite utilizar la API funcional, que facilita la creaci√≥n de gr√°ficos arbitrarios de capas, o incluso escribir modelos completamente personalizados utilizando subclases.


La clase *tf.keras.Model* proporciona m√©todos integrados para entrenar y evaluar modelos:

***fit***: Entrena el modelo durante un n√∫mero determinado de √©pocas.

***predict***: Genera predicciones a partir de las entradas.

***evaluate***: Devuelve la p√©rdida y las m√©tricas del modelo, configuradas a trav√©s del m√©todo compile.

Estos m√©todos ofrecen acceso a varias funcionalidades √∫tiles durante el entrenamiento:

***Callbacks:*** Permiten detener el entrenamiento anticipadamente, establecer puntos de control del modelo y monitorear el proceso mediante TensorBoard. Tambi√©n es posible implementar callbacks personalizados.


***Entrenamiento distribuido:*** Keras facilita la extensi√≥n del entrenamiento a m√∫ltiples GPUs, TPUs o dispositivos.

***Fusi√≥n escalonada:*** Al configurar steps_per_execution en compile, se pueden procesar varios lotes en una sola llamada de tf.function, mejorando la utilizaci√≥n del dispositivo, especialmente en TPUs.

Para m√°s detalles sobre c√≥mo utilizar el m√©todo fit, consulta la gu√≠a de entrenamiento y evaluaci√≥n. Si deseas personalizar el ciclo de entrenamiento y evaluaci√≥n, puedes consultar la secci√≥n sobre personalizaci√≥n de fi().

###Otras herramientas y APIs de Keras

Keras ofrece una variedad de APIs y herramientas adicionales para el aprendizaje profundo, entre las que se incluyen:

* Optimizadores
* M√©tricas
* Funciones de p√©rdida
* Utilidades para la carga de datos

Estas herramientas complementan la experiencia de entrenamiento y son fundamentales para optimizar y evaluar modelos de aprendizaje profundo.



Vamos a realizar el ejercicio que hicimos en Tensorflow donde modelamos nuestras propias funciones para usar Keras.


Empecemos creando un Modelo Secuencial en Keras utilizando tf.keras.Sequential. Una de las capas m√°s simples de Keras es la capa densa (Dense), que se puede instanciar con tf.keras.layers.Dense. La capa densa es capaz de aprender relaciones lineales multidimensionales de la forma  $ùëå=ùëäùëã+ùëè$. Para aprender una ecuaci√≥n no lineal de la forma $ùë§_1ùë•^2+ùë§_2ùë•+ùëè$‚Äã, la entrada de la capa densa debe ser una matriz de datos con $ùë•^2$  y $x$ como caracter√≠sticas.

La capa lambda *tf.keras.layers.Lambda* se puede usar para realizar esta transformaci√≥n de apilamiento.


1. La primera capa es una capa Lambda. Esta capa aplica una transformaci√≥n personalizada sobre los datos.
En este caso, estamos apilando dos caracter√≠sticas: $'x'$ y $'x^2$' a lo largo del eje 1 (columnas) utilizando tf.stack.
Esto permite que el modelo reciba como entrada tanto $x$ como $x^2$, lo cual es √∫til para aprender relaciones no lineales.

2. La siguiente capa es una capa densa (Dense). Esta capa realizar√° una combinaci√≥n lineal de las entradas que recibe.
'units=1' significa que la capa tendr√° una sola unidad de salida (un solo valor de predicci√≥n).
'kernel_initializer=tf.random.normal' inicializa los pesos de la capa de forma aleatoria usando una distribuci√≥n normal.



In [67]:
data = np.column_stack((x.numpy(), (x.numpy()**2),y.numpy()))
data

## Declaraci√≥n de la red

### Lambda layer:

Toma la entrada x y la transforma en un vector [x, x¬≤].

Es decir, pasa de tener 1 caracter√≠stica ‚Üí 2 caracter√≠sticas.

Dense(units=1):

Esto es una capa densa con 1 neurona.

Esa neurona recibe las 2 entradas (x y x¬≤) y calcula:

$ùë¶=ùë§1‚ãÖùë•+ùë§2‚ãÖùë•2+ùëè$

Es un modelo lineal en 2 variables (pero no hay funci√≥n de activaci√≥n, as√≠ que la salida es lineal).

In [68]:
modelo_keras = tf.keras.Sequential([
    tf.keras.layers.Lambda(lambda x: tf.stack([x, x**2], axis=1)),
    tf.keras.layers.Dense(
        units=1,
        kernel_initializer=tf.keras.initializers.RandomNormal(seed=42),  # kernel reproducible
    )
])


In [69]:
modelo_keras.summary()

In [70]:
# Compilamos el modelo con una funci√≥n de p√©rdida MSE (error cuadr√°tico medio) y un optimizador SGD con tasa de aprendizaje de 0.01.
modelo_keras.compile(
    loss=tf.keras.losses.MSE,
    optimizer=tf.keras.optimizers.SGD(learning_rate=0.01)
)

In [71]:
# Entrenamos el modelo durante 100 √©pocas con un tama√±o de lote de 32, utilizando los datos de entrada x y las etiquetas y.
history = modelo_keras.fit(x, y, epochs=100, batch_size=32, verbose=1)




In [72]:
# Guardamos el modelo entrenado en un archivo para su uso posterior.
modelo_keras.save('./modelo_keras.keras')

In [73]:
modelo_keras.summary()

Vamos a predecir un conjunto de valores

In [74]:
# Realizamos predicciones utilizando el modelo entrenado con los datos de entrada x.
predicciones = modelo_keras.predict(x)

# Las predicciones son una lista de valores de salida generados por el modelo.


In [75]:
predicciones

In [76]:
  # Graficar los datos reales (con ruido) usando puntos
  plt.plot(x, y, '.', label='Data')  # 'x' es la entrada y 'y' son los datos generados con ruido

  # Graficar la "verdad fundamental" (la funci√≥n sin ruido) con una l√≠nea
  plt.plot(x, f(x), label='Ground truth')  # 'f(x)' es la funci√≥n cuadr√°tica original sin ruido

  # Graficar las predicciones del modelo usando una l√≠nea
  plt.plot(x, predicciones, label='Predictions')  #son las predicciones del modelo entrenado

  # A√±adir un t√≠tulo al gr√°fico
  plt.title("Modelo entrenado con Keras")  # El t√≠tulo se pasa como argumento a la funci√≥n

  # Mostrar la leyenda para identificar las diferentes l√≠neas
  plt.legend()
