# ¿Qué es el aprendizaje automático?

Considera los siguientes conjuntos de números. ¿Puedes ver la relación entre ellos?

<table class="vertical-rules">
<tbody><tr><td colspan="1" rowspan="1"><p>X:</p>
</td><td colspan="1" rowspan="1"><p>-1</p>
</td><td colspan="1" rowspan="1"><p>0</p>
</td><td colspan="1" rowspan="1"><p>1</p>
</td><td colspan="1" rowspan="1"><p>2</p>
</td><td colspan="1" rowspan="1"><p>3</p>
</td><td colspan="1" rowspan="1"><p>4</p>
</td></tr>
<tr><td colspan="1" rowspan="1"><p>Y:</p>
</td><td colspan="1" rowspan="1"><p>-2</p>
</td><td colspan="1" rowspan="1"><p>1</p>
</td><td colspan="1" rowspan="1"><p>4</p>
</td><td colspan="1" rowspan="1"><p>7</p>
</td><td colspan="1" rowspan="1"><p>10</p>
</td><td colspan="1" rowspan="1"><p>13</p>
</td></tr>
</tbody></table>

Al mirarlos, podrías notar que el valor de X aumenta en 1 a medida que lees de izquierda a derecha y el valor correspondiente de Y aumenta en 3. Probablemente pienses que Y es igual a 3X más o menos algo. Entonces, probablemente mirarías el 0 de X y verías que Y es 1, y se te ocurriría la relación Y=3X+1.

Así es casi exactamente como usarías el código para entrenar un modelo para detectar los patrones en los datos.

In [1]:
import tensorflow as tf
from tensorflow import keras
from tensorflow.keras import layers
import numpy as np

In [3]:
print("Num GPUs Available: ", len(tf.config.list_physical_devices('GPU')))

Num GPUs Available:  1


A continuación, cree la red neuronal más sencilla posible. Tiene una capa, esa capa tiene una neurona, y la forma de entrada a ella es sólo un valor.

In [10]:
# Definir el modelo
model = keras.Sequential([keras.layers.Dense(units=1, input_shape=[1])])

A continuación, escribimos el código para compilar la red neuronal. Ahí tendremos que especificar dos funciones: una de pérdida y otra de optimización. En este ejemplo, sabes que la relación entre los números es Y=3X+1. Cuando el ordenador intenta aprender eso, hace una conjetura, tal vez Y=10X+10. La función de pérdida mide las respuestas adivinadas frente a las respuestas correctas conocidas y mide lo bien o mal que lo hizo.

A continuación, el modelo utiliza la función de optimización para hacer otra conjetura. Basándose en el resultado de la función de pérdida, intenta minimizar la pérdida. En este punto, puede llegar a algo como Y=5X+5. Aunque eso sigue siendo bastante malo, se acerca más al resultado correcto (la pérdida es menor). El modelo repite eso para el número de épocas, que verás en breve.

En primer lugar, aquí es cómo decirle a usar mean_squared_error para la pérdida y el descenso de gradiente estocástico (sgd) para el optimizador. Todavía no es necesario que entiendas las matemáticas de estos, pero puedes ver que funcionan. Con el tiempo, aprenderá las diferentes y apropiadas funciones de pérdida y optimizador para diferentes escenarios.

In [11]:
model.compile(optimizer='sgd', loss='mean_squared_error')

A continuación, proporcione algunos datos. En este caso, toma las seis variables X e Y de antes. Puedes ver que la relación entre ellas es que Y=3X+1, así que donde X es -1, Y es -2.

In [12]:
xs = np.array([-1.0, 0.0, 1.0, 2.0, 3.0, 4.0], dtype=float)
ys = np.array([-2.0, 1.0, 4.0, 7.0, 10.0, 13.0], dtype=float)

Ahora tienes todo el código que necesitas para definir la red neuronal. El siguiente paso es entrenarla para ver si puede inferir los patrones entre esos números y utilizarlos para crear un modelo. El proceso de entrenamiento de la red neuronal, donde aprende la relación entre las X y las Y, está en la llamada model.fit. Ahí es donde pasará por el bucle antes de hacer una conjetura, midiendo cuán buena o mala es (la pérdida), o usando el optimizador para hacer otra conjetura. Lo hará durante el número de épocas que usted especifique. Cuando ejecutes ese código, verás que la pérdida se imprimirá para cada época.

In [13]:
model.fit(xs, ys, epochs=500)

Epoch 1/500
Epoch 2/500
Epoch 3/500
Epoch 4/500
Epoch 5/500
Epoch 6/500
Epoch 7/500
Epoch 8/500
Epoch 9/500
Epoch 10/500
Epoch 11/500
Epoch 12/500
Epoch 13/500
Epoch 14/500
Epoch 15/500
Epoch 16/500
Epoch 17/500
Epoch 18/500
Epoch 19/500
Epoch 20/500
Epoch 21/500
Epoch 22/500
Epoch 23/500
Epoch 24/500
Epoch 25/500
Epoch 26/500
Epoch 27/500
Epoch 28/500
Epoch 29/500
Epoch 30/500
Epoch 31/500
Epoch 32/500
Epoch 33/500
Epoch 34/500
Epoch 35/500
Epoch 36/500
Epoch 37/500
Epoch 38/500
Epoch 39/500
Epoch 40/500
Epoch 41/500
Epoch 42/500
Epoch 43/500
Epoch 44/500
Epoch 45/500
Epoch 46/500
Epoch 47/500
Epoch 48/500
Epoch 49/500
Epoch 50/500
Epoch 51/500
Epoch 52/500
Epoch 53/500
Epoch 54/500
Epoch 55/500
Epoch 56/500
Epoch 57/500
Epoch 58/500
Epoch 59/500
Epoch 60/500
Epoch 61/500
Epoch 62/500
Epoch 63/500
Epoch 64/500
Epoch 65/500
Epoch 66/500
Epoch 67/500
Epoch 68/500
Epoch 69/500
Epoch 70/500
Epoch 71/500
Epoch 72/500
Epoch 73/500
Epoch 74/500
Epoch 75/500
Epoch 76/500
Epoch 77/500
Epoch 78

<keras.callbacks.History at 0x7f64c0308580>

Tienes un modelo que ha sido entrenado para aprender la relación entre X e Y. Puedes utilizar el método model.predict para que calcule la Y para una X previamente desconocida. Adivina antes de ejecutar el siguiente código:

In [14]:
print(model.predict([10.0]))

[[30.99629]]


Puede que hayas pensado en 31, pero al final ha sido un poco más. ¿Por qué crees que es así?

Las redes neuronales se ocupan de las probabilidades, así que calculó que hay una probabilidad muy alta de que la relación entre X e Y sea Y=3X+1, pero no puede saberlo con seguridad con sólo seis puntos de datos. El resultado es muy cercano a 31, pero no necesariamente 31.

Cuando trabajes con redes neuronales, verás que este patrón se repite. Casi siempre tratará con probabilidades, no con certezas, y hará un poco de codificación para averiguar cuál es el resultado basado en las probabilidades, sobre todo cuando se trata de la clasificación.