# Cap√≠tulo 14: Clasificaci√≥n de Im√°genes con Redes Neuronales Convolucionales Profundas

# √çndice

- [Componentes b√°sicos de las CNN](#componentes-b√°sicos-de-las-cnn)
- [Comprensi√≥n de las CNN y las jerarqu√≠as de funciones](#comprensi√≥n-de-las-cnn-y-las-jerarqu√≠as-de-funciones)
- [Realizaci√≥n de Convoluciones Discretas](#realizaci√≥n-de-convoluciones-discretas)
- [Convoluciones Discretas en 1 Dimensi√≥n](#convoluciones-discretas-en-1-dimensi√≥n)
- [Relleno de entradas para controlar el tama√±o de los mapas de caracter√≠sticas de salida](#relleno-de-entradas-para-controlar-el-tama√±o-de-los-mapas-de-caracter√≠sticas-de-salida)
- [Determinaci√≥n del tama√±o de salida de la convoluci√≥n](#determinaci√≥n-del-tama√±o-de-salida-de-la-convoluci√≥n)
- [Convoluciones Discretas en 2 Dimensiones](#convoluciones-discretas-en-2-dimensiones)
- [Submuestreo o agrupaci√≥n de capas](#submuestreo-o-agrupaci√≥n-de-capas)
- [Trabajo con m√∫ltiples canales de entrada o de color](#trabajo-con-m√∫ltiples-canales-de-entrada-o-de-color)
- [Funciones de activaci√≥n](#funciones-de-activaci√≥n)
- [Funciones de p√©rdida para clasificaci√≥n](#funciones-de-p√©rdida-para-clasificaci√≥n)
- [Implementaci√≥n de una CNN profunda usando PyTorch](#implementaci√≥n-de-una-cnn-profunda-usando-pytorch)
- [Convertir Jupyter Notebook a Fichero Python](#convertir-jupyter-notebook-a-fichero-python)

## Componentes b√°sicos de las CNN

Las redes neuronales convolucionales (CNN) son una familia de modelos que fueron originalmente inspirados en c√≥mo funciona la corteza visual del cerebro humano cuando reconocemos objetos.

El desarrollo de las CNN se remonta a la d√©cada de 1990, cuando Yann LeCun y sus colegas propusieron una arquitectura NN novedosa para clasificar d√≠gitos escritos a mano a partir de im√°genes.

Debido al excelente desempe√±o de las CNN para tareas de clasificaci√≥n de im√°genes, este tipo particular de NN feedforward gan√≥ mucha atenci√≥n y condujo a enormes mejoras en el aprendizaje autom√°tico para visi√≥n computacional.

Varios a√±os despu√©s, en 2019, Yann LeCun recibi√≥ el premio Turing (el premio m√°s prestigioso en inform√°tica) por sus contribuciones al campo de inteligencia artificial (IA), junto con otros dos investigadores, Yoshua Bengio y Geoffrey Hinton.

## Comprensi√≥n de las CNN y las jerarqu√≠as de funciones

La extracci√≥n exitosa de caracter√≠sticas relevantes es clave para el rendimiento de cualquier algoritmo de aprendizaje autom√°tico y el aprendizaje autom√°tico tradicional. Los modelos se basan en caracter√≠sticas de entrada que pueden provenir de un experto en el dominio o se basan en la selecci√≥n o extracci√≥n de caracter√≠sticas computacionales t√©cnicas.

Ciertos tipos de NN, como las CNN, pueden aprender autom√°ticamente caracter√≠sticas de datos sin procesar que son m√°s √∫tiles para una tarea particular. Por esta raz√≥n, es com√∫n considerar las capas CNN como caracter√≠sticas para extraer:

‚Ä¢ Las primeras capas (las que est√°n inmediatamente despu√©s de la capa de entrada) extraen caracter√≠sticas de bajo nivel a partir de datos sin procesar, y las capas posteriores (a menudo capas completamente conectadas, como en un perceptr√≥n multicapa (MLP) utiliza estas caracter√≠sticas para predecir un objetivo continuo (etiqueta de valor o clase).

In [28]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_01.png" format="png">
</div>
"""))

Ciertos tipos de NN multicapa y, en particular, las CNN profundas, construyen la llamada jerarqu√≠a de caracter√≠sticas combinando las caracter√≠sticas de bajo nivel en forma de capas para formar caracter√≠sticas de alto nivel.

Por ejemplo, si estamos tratando con im√°genes, entonces el nivel bajo de caracter√≠sticas, como bordes y manchas, se extraen de capas anteriores, que se combinan para formar entidades de alto nivel.

Estas caracter√≠sticas de alto nivel pueden formar formas m√°s complejas, como los contornos generales de objetos como edificios, gatos o perros.

In [29]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_02.png" format="png">
</div>
"""))

Una CNN calcula mapas de caracter√≠sticas a partir de una imagen de entrada, donde cada elemento proviene de un parche local de p√≠xeles en la imagen de entrada.

In [30]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_03.png" format="png">
</div>
"""))

Las CNN funcionan muy bien en tareas relacionadas con im√°genes y eso se debe en gran medida a dos ideas importantes:

‚Ä¢ Conectividad escasa: Un √∫nico elemento en el mapa de caracter√≠sticas est√° conectado solo a una peque√±a porci√≥n de p√≠xeles (esto es muy diferente de conectarse a toda la imagen de entrada, como en el caso de los MLP).

‚Ä¢ Compartir par√°metros: Se utilizan los mismos pesos para diferentes parches de la imagen de entrada.

Como consecuencia directa de estas dos ideas, la sustituci√≥n de un sistema convencional, MLP completamente conectado con una capa de convoluci√≥n disminuye sustancialmente la cantidad de pesos (par√°metros) en la red, por lo que veremos una mejora en la capacidad de capturar caracter√≠sticas relevantes.

En el contexto de los datos de im√°genes, tiene sentido suponer que las personas cercanas a los p√≠xeles suelen ser m√°s relevantes entre s√≠ que los p√≠xeles que est√°n m√°s alejados.

Normalmente, las CNN se componen de varias capas de submuestreo convolucionales que van seguidas de una o m√°s capas conectadas al final. Las capas completamente conectadas son esencialmente un MLP.

Las capas de submuestreo, com√∫nmente conocidas como capas de agrupaci√≥n, no tienen par√°metros que se puedan aprender.
No hay pesos ni unidades de polarizaci√≥n en las capas de agrupaci√≥n. Sin embargo, tanto la capa convolucional como la completamente conectada tienen pesos y sesgos que se optimizan durante el entrenamiento.

## Realizaci√≥n de Convoluciones Discretas

Para entender c√≥mo funcionan las operaciones de convoluci√≥n, comencemos con un convoluci√≥n en una dimensi√≥n, que a veces se utiliza para trabajar con ciertos tipos de datos de secuencia, como texto.

Una convoluci√≥n discreta (o simplemente convoluci√≥n) es un elemento fundamental de operaci√≥n en una CNN.

## Convoluciones Discretas en 1 Dimensi√≥n

Una convoluci√≥n discreta para dos vectores, x y w, se denota por y = x * w, en el cual el vector x es nuestra entrada (a veces llamada se√±al) y w se llama filtro o n√∫cleo.

Una convoluci√≥n discreta se define matem√°ticamente de la siguiente manera:

In [31]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_04.png" format="png">
</div>
"""))

El hecho de que la suma pase por √≠ndices de ‚Äì‚àû a +‚àû parece extra√±o, principalmente porque en las aplicaciones de aprendizaje autom√°tico, siempre tratamos con vectores de caracter√≠sticas finitas.

Por ejemplo, si x tiene 10 caracter√≠sticas con √≠ndices 0, 1, 2, ..., 8, 9, entonces los √≠ndices ‚Äì‚àû:-1 y 10:+‚àû est√°n fuera de los l√≠mites para x.

Por lo tanto, para calcular correctamente la suma que se muestra en el punto anterior f√≥rmula, se supone que x y w est√°n llenos de ceros.

Esto dar√° como resultado un vector de salida, y, que tambi√©n tiene tama√±o infinito, con muchos ceros tambi√©n.

Dado que esto no es √∫til en situaciones pr√°cticas, x se rellena s√≥lo con un valor finito n√∫mero de ceros.

Este proceso se llama relleno con ceros o simplemente relleno. Aqu√≠, el n√∫mero de ceros rellenados en cada lado se indica con p.

In [32]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_05.png" format="png">
</div>
"""))

Supongamos que la entrada original, x, y el filtro, w, tienen n y m elementos, respectivamente, donde m ‚â§ n.

El vector acolchado, xp, tiene tama√±o n + 2p. La f√≥rmula pr√°ctica para calcular una convoluci√≥n discreta cambiar√° a lo siguiente:

In [33]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_06.png" format="png">
</div>
"""))

Ejemplo de que el tama√±o del relleno es cero (p=0):

In [34]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_07.png" format="png">
</div>
"""))

Observa que el filtro girado, wr, es desplazado en dos celdas cada vez que cambiamos.

Este cambio es otro hiperpar√°metro de una circunvoluci√≥n, la zancada, s.

En este ejemplo, la zancada es dos, s = 2.

Tenga en cuenta que la zancada debe ser n√∫mero positivo menor que el tama√±o del vector de entrada.

In [35]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_08.png" format="png">
</div>
"""))

## Relleno de entradas para controlar el tama√±o de los mapas de caracter√≠sticas de salida

Hay tres modos de relleno que se utilizan com√∫nmente en pr√°ctica: plena, igual y v√°lida.

‚Ä¢ En modo completo, el par√°metro de relleno, p, se establece en p = m ‚Äì 1. Relleno completo aumenta las dimensiones de la salida; por lo tanto, rara vez se usa en arquitecturas CNN.

‚Ä¢ Generalmente se utiliza el mismo modo de relleno para garantizar que el vector de salida tiene el mismo tama√±o que el vector de entrada, x. En este caso, el par√°metro de relleno, p, se calcula seg√∫n el tama√±o del filtro, junto con el requisito de que el tama√±o de entrada y el tama√±o de salida sean los mismos.

‚Ä¢ Finalmente, calcular una convoluci√≥n en modo v√°lido se refiere al caso donde p = 0 (sin relleno).

El modo de relleno m√°s utilizado en las CNN es el mismo relleno.

Una de sus ventajas sobre los otros modos de relleno es la misma. El relleno preserva el tama√±o del vector, lo que facilita el dise√±o y una arquitectura de red m√°s conveniente.

In [36]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_09.png" format="png">
</div>
"""))

## Determinaci√≥n del tama√±o de salida de la convoluci√≥n

Supongamos que el vector de entrada es de tama√±o n y el filtro es de talla m.

Entonces, el tama√±o de la salida resultante de y = x * w, con relleno p y zancada s, se determinar√≠an de la siguiente manera:

In [37]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_10.png" format="png">
</div>
"""))

In [38]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_11.png" format="png">
</div>
"""))

## Convoluciones Discretas en 2 Dimensiones

Cuando trabajamos con entradas 2D, como una matriz, ùëøùëõ1√óùëõ2, y la matriz de filtro, ùëæùëö1√óùëö2, donde ùëö1 ‚â§ ùëõ1 y ùëö2 ‚â§ ùëõ2, entonces la matriz ùíÄ=ùëø*ùëæ es el resultado de una convoluci√≥n 2D entre ùëø y ùëæ. Esto es definido matem√°ticamente de la siguiente manera:

In [39]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_12.png" format="png">
</div>
"""))

In [40]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_13.png" format="png">
</div>
"""))

In [41]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_14.png" format="png">
</div>
"""))

## Submuestreo o agrupaci√≥n de capas

El submuestreo se aplica normalmente en dos formas de agrupaci√≥n operaciones en CNN: Agrupaci√≥n m√°xima y agrupaci√≥n media (tambi√©n conocida como agrupaci√≥n promedio).

La capa de agrupaci√≥n generalmente se denota por ùëÉùëõ1√óùëõ2. Aqu√≠ el sub√≠ndice determina el tama√±o del vecindario (el n√∫mero de p√≠xeles vecinos en cada dimensi√≥n) donde la operaci√≥n m√°xima o media es realizada. A este tipo de vecindario nos referimos como tama√±o de la agrupaci√≥n.

In [42]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_15.png" format="png">
</div>
"""))

La agrupaci√≥n (max-pooling) introduce una invariancia local. Esto significa que peque√±os cambios en EL vecindario local no cambia el resultado de la agrupaci√≥n m√°xima.

Por lo tanto, ayuda a generar caracter√≠sticas que sean m√°s resistentes al ruido en la entrada de datos.

En el siguiente ejemplo se muestra que la agrupaci√≥n m√°xima de dos diferentes matrices de entrada, X1 y X2, dan como resultado la misma salida:

In [43]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_16.png" format="png">
</div>
"""))

La agrupaci√≥n disminuye el tama√±o de las caracter√≠sticas, lo que resulta en una mayor capacidad de eficiencia computacional. Adem√°s, reducir el n√∫mero de funciones puede reducir tambi√©n el grado de sobreajuste.

Tradicionalmente, se supone que la agrupaci√≥n no se superpone.

La agrupaci√≥n generalmente se realiza en vecindarios que no se superponen, lo que se puede hacer estableciendo el par√°metro de zancada igual al tama√±o de la agrupaci√≥n. Por ejemplo, una capa de agrupaci√≥n que no se superpone, ùëÉùëõ1√óùëõ2, requiere un paso par√°metro s = (n1, n2).

Si bien la agrupaci√≥n sigue siendo una parte esencial de muchas arquitecturas de CNN, tambi√©n se han desarrollado varias arquitecturas CNN sin utilizar capas de agrupaci√≥n.

En lugar de utilizar capas de agrupaci√≥n para reducir el tama√±o de la entidad, los investigadores usan capas convolucionales con un paso de 2.

## Trabajo con m√∫ltiples canales de entrada o de color

Una entrada a una capa convolucional puede contener una o m√°s matrices 2D o matrices con dimensiones N1√óN2 (por ejemplo, la altura de la imagen y ancho en p√≠xeles).

Estas matrices N1√óN2 se llaman canales.

Las implementaciones convencionales de capas convolucionales esperan una representaci√≥n tensorial de rango 3 como entrada, por ejemplo, una representaci√≥n tridimensional. matriz, ùëøùëÅ1√óùëÅ2√óùê∂ùëñn, donde Cin es el n√∫mero de canales de entrada.

Por ejemplo, consideremos im√°genes como entrada a la primera capa de una CNN. Si la imagen est√° coloreada y utiliza el modo de color RGB, entonces Cin = 3 (para los canales de color rojo, verde y azul en RGB).

Sin embargo, si la imagen est√° en escala de grises, entonces tenemos Cin=1, porque solo hay un canal con los valores de intensidad de p√≠xeles en escala de grises.

In [44]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_17.png" format="png">
</div>
"""))

## Funciones de activaci√≥n

Se tienen diferentes funciones de activaci√≥n, como ReLU, sigmoide y tanh.

Algunas de estas funciones de activaci√≥n, como ReLU, se utilizan principalmente en las capas intermedias (ocultas) de una NN para agregar no linealidades a nuestro modelo.

Otros, como sigmoide (para binario) y softmax (para multiclase), se agregan en la √∫ltima capa (salida), lo que da como resultado probabilidades de membres√≠a de clase como salida del modelo.

Si las activaciones sigmoidea o softmax no est√°n incluidas en el capa de salida, entonces el modelo calcular√° los logits en lugar de las probabilidades de pertenencia a una clase.

## Funciones de p√©rdida para clasificaci√≥n

Centrarse en los problemas de clasificaci√≥n, dependiendo del tipo de problema (binario versus multiclase) y el tipo de salida (logits versus probabilidades), debemos elegir la funci√≥n de p√©rdida apropiada para entrenar nuestro modelo.

‚Ä¢ La entrop√≠a cruzada binaria es la funci√≥n de p√©rdida para una clasificaci√≥n binaria (con una sola unidad de salida).

‚Ä¢ La entrop√≠a cruzada categ√≥rica es la funci√≥n de p√©rdida para clasificaci√≥n multiclase.

In [45]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_18.png" format="png">
</div>
"""))

In [None]:
import torch
import torch.nn as nn
import numpy as np

In [None]:
####### Binary Cross-entropy
logits = torch.tensor([0.8])
probas = torch.sigmoid(logits)
target = torch.tensor([1.0])
bce_loss_fn = nn.BCELoss()
bce_logits_loss_fn = nn.BCEWithLogitsLoss()
print(f'BCE (w Probas): {bce_loss_fn(probas, target):.4f}')
print(f'BCE (w Logits): {bce_logits_loss_fn(logits, target):.4f}')

In [None]:
####### Categorical Cross-entropy
logits = torch.tensor([[1.5, 0.8, 2.1]])
probas = torch.softmax(logits, dim=1)
target = torch.tensor([2])
cce_loss_fn = nn.NLLLoss()
cce_logits_loss_fn = nn.CrossEntropyLoss()
print(f'CCE (w Logits): {cce_logits_loss_fn(logits, target):.4f}')
print(f'CCE (w Probas): {cce_loss_fn(torch.log(probas), target):.4f}')

## Implementaci√≥n de una CNN profunda usando PyTorch

In [46]:
from IPython.display import Image, HTML
display(HTML("""
<div style="display: flex; justify-content: center;">
    <img src="./figures/14_19.png" format="png">
</div>
"""))

In [None]:
import torchvision
from torchvision import transforms
image_path = './'
transform = transforms.Compose([
    transforms.ToTensor()
])

mnist_dataset = torchvision.datasets.FashionMNIST(
    root=image_path, train=True,
    transform=transform, download=True
)
from torch.utils.data import Subset
mnist_valid_dataset = Subset(mnist_dataset, 
                             torch.arange(10000))
mnist_train_dataset = Subset(mnist_dataset, 
                             torch.arange(
                                 10000, len(mnist_dataset)
                            ))
mnist_test_dataset = torchvision.datasets.FashionMNIST(
    root=image_path, train=False,
    transform=transform, download=False
)

In [None]:
from torch.utils.data import DataLoader
batch_size = 64
torch.manual_seed(1)
train_dl = DataLoader(mnist_train_dataset,
                      batch_size,
                      shuffle=True)

valid_dl = DataLoader(mnist_valid_dataset,
                      batch_size,
                      shuffle=False)

In [None]:
model = nn.Sequential()
model.add_module(
    'conv1',
    nn.Conv2d(
        in_channels=1, out_channels=32,
        kernel_size=5, padding=2
    )
)
model.add_module('relu1', nn.ReLU())
model.add_module('pool1', nn.MaxPool2d(kernel_size=2))
model.add_module(
    'conv2',
    nn.Conv2d(
        in_channels=32, out_channels=64,
        kernel_size=5, padding=2
    )
)
model.add_module('relu2', nn.ReLU())
model.add_module('pool2', nn.MaxPool2d(kernel_size=2))

Al proporcionar la forma de entrada como una tupla (4, 1, 28, 28) (4 im√°genes dentro del lote, 1 canal y tama√±o de imagen 28√ó28), especificado en este ejemplo, calculamos la salida tenga una forma (4, 64, 7, 7), indicando mapas de caracter√≠sticas con 64 canales y un tama√±o espacial de 7√ó7.

In [None]:
x = torch.ones((4, 1, 28, 28))
model(x).shape

In [None]:
model.add_module('flatten', nn.Flatten())
x = torch.ones((4, 1, 28, 28))
model(x).shape

In [None]:
model.add_module('fc1', nn.Linear(3136, 1024))
model.add_module('relu3', nn.ReLU())
model.add_module('dropout', nn.Dropout(p=0.5))
model.add_module('fc2', nn.Linear(1024, 10))

In [None]:
loss_fn = nn.CrossEntropyLoss()
optimizer = torch.optim.Adam(model.parameters(), lr=0.001)

In [None]:
def train(model, num_epochs, train_dl, valid_dl):
    loss_hist_train = [0] * num_epochs
    accuracy_hist_train = [0] * num_epochs
    loss_hist_valid = [0] * num_epochs
    accuracy_hist_valid = [0] * num_epochs
    for epoch in range(num_epochs):
        model.train()
        for x_batch, y_batch in train_dl:
            x_batch = x_batch.cpu()
            y_batch = y_batch.cpu()
            pred = model(x_batch)
            loss = loss_fn(pred, y_batch)
            loss.backward()
            optimizer.step()
            optimizer.zero_grad()
            loss_hist_train[epoch] += loss.item()*y_batch.size(0)
            is_correct = (
                torch.argmax(pred, dim=1) == y_batch
            ).float()
            accuracy_hist_train[epoch] += is_correct.sum()
        loss_hist_train[epoch] /= len(train_dl.dataset)
        accuracy_hist_train[epoch] /= len(train_dl.dataset)

        model.eval()

        with torch.no_grad():
            for x_batch, y_batch in valid_dl:
                x_batch = x_batch.cpu()
                y_batch = y_batch.cpu()
                pred = model(x_batch)
                loss = loss_fn(pred, y_batch)
                loss_hist_valid[epoch] += \
                    loss.item()*y_batch.size(0)
                is_correct = (
                    torch.argmax(pred, dim=1) == y_batch
                ).float()
                accuracy_hist_valid[epoch] += is_correct.sum()
        loss_hist_valid[epoch] /= len(valid_dl.dataset)
        accuracy_hist_valid[epoch] /= len(valid_dl.dataset)
        
        print(f'Epoch {epoch+1} accuracy: '
              f'{accuracy_hist_train[epoch]:.4f} val_accuracy: '
              f'{accuracy_hist_valid[epoch]:.4f}')
        
    return loss_hist_train, loss_hist_valid, \
        accuracy_hist_train, accuracy_hist_valid

In [None]:
torch.manual_seed(1)
num_epochs = 20
hist = train(model, num_epochs, train_dl, valid_dl)

In [None]:
import matplotlib.pyplot as plt
x_arr = np.arange(len(hist[0])) + 1
fig = plt.figure(figsize=(12,4))
ax = fig.add_subplot(1, 2, 1)
ax.plot(x_arr, hist[0], '--o', label='Train loss')
ax.plot(x_arr, hist[1], '--c', label='Validation loss')
ax.legend(fontsize=15)
ax = fig.add_subplot(1, 2, 2)
ax.plot(x_arr, hist[2], '--o', label='Train acc.')
ax.plot(x_arr, hist[3], '--c', 
        label='Validation acc.')
ax.legend(fontsize=15)
ax.set_xlabel('Epoch', size=15)
ax.set_ylabel('Accuracy', size=15)
plt.show()

In [None]:
pred = model(mnist_test_dataset.data.unsqueeze(1) / 255.)
is_correct = (
    torch.argmax(pred, dim=1) == mnist_test_dataset.targets
).float()
print(f'Test accuracy: {is_correct.mean():4f}')

## Convertir Jupyter Notebook a Fichero Python

In [None]:
! python .convert_notebook_to_script.py --input ch14_notebook.ipynb --output ch14_notebook.py