## **Práctica 1: Introducción a TensorFlow / Keras**

<hr>

El objetivo de esta práctica es aprender a configurar un entorno de trabajo para el bloque 2 de la asignatura Visión Artificial, utilizando **Visual Studio Code**, **Jupyter Notebook**, **Conda** y **TensorFlow**.

**Visual Studio Code** (VS Code) es un editor de código fuente desarrollado por Microsoft. Es gratuito, de código abierto, multiplataforma y es conocido por su ligereza y rapidez. Además es altamente personalizable gracias a su amplia gama de extensiones. Nosotros lo personalizaremos para ejecutar **Python** y **Notebooks Jupyter**.

**Jupyter Notebook** es una herramienta interactiva que permite crear y compartir documentos que contienen código ejecutable, texto explicativo, ecuaciones, visualizaciones y más. Es ideal para el aprendizaje, la experimentación y el desarrollo de proyectos en inteligencia artificial y ciencia de datos. Sus principales ventajas incluyen:
- Integración de código y texto explicativo en un único documento.
- Visualización interactiva de datos.
- Fácil de compartir y reproducir.

**Conda** es un gestor de paquetes y entornos que facilita la instalación de dependencias y la creación de entornos virtuales aislados. Esto te permite:
- Evitar conflictos entre paquetes.
- Mantener tus proyectos organizados y con configuraciones específicas.

**TensorFlow** es un framework que facilita la creación, el entrenamiento y la exportación de modelos de aprendizaje automático de manera eficiente. Las versiones de TensorFlow 2.X incorporan **Keras** como su API principal para la construcción de modelos de aprendizaje profundo. Esto simplifica el desarrollo, ofreciendo:
- Una sintaxis más intuitiva y modular.
- Ejecución por defecto en modo *eager*, lo que facilita la depuración.
- Soporte optimizado para CPU, GPU y TPU.

<hr>

### **1. Configuración del entorno**

Para trabajar con Python y Jupyter Notebook en VSCode, es necesario instalar sus extensiones. Aquí tienes los pasos para hacerlo, asumiendo que tienes abierto este fichero en VSCode:

1. Haz clic en el icono de extensiones en la barra lateral izquierda.
2. En la barra de búsqueda, escribe "Python" y selecciona la extensión desarrollada por Microsoft.
3. Haz clic en el botón de "Instalar" para añadir la extensión a tu VS Code.
4. Repite los pasos 2 y 3 escribiendo "Jupyter".

A continuación, deberás crear un entorno virtual con Conda. En los ordenadores de prácticas de la Universidad ya está instalado **Anaconda** y **Python**, por lo que no es necesario instalar nada. Aquí tienes los pasos a seguir:
1. Abre el menú de inicio de Windows.
2. Busca y ejecuta la aplicación **Anaconda Prompt** (Consola de Anaconda). Desde esta consola, podrás activar el entorno, instalar dependencias y ejecutar Jupyter Notebook.
3. Crea un nuevo entorno con: `conda create --name VA2 python=3.10`. Esto configurará un entorno llamado `VA2` con Python 3.10.
4. Activa el entorno con: `conda activate VA2`.
5. Instala una librería: `pip install ipykernel`.
6. Puedes desactivar el entorno con: `conda deactivate`.

<div class="alert alert-block alert-warning">
    <strong>NOTA:</strong> En tu ordenador personal tendrás que instalar <i>Anaconda</i> si no lo tenías previamente. Más información: https://www.anaconda.com/download
</div>

<div class="alert alert-block alert-warning">
    <strong>NOTA:</strong> Si en tu ordenador personal utilizas Linux o MacOS, deberás abrir un Terminal para ejecutar los pasos 3 a 6.
</div>

Para ejecutar este Notebook en el entorno que acabas de crear desde VSCode tendrás que hacer clic en la esquina superior derecha donde dice _Select Kernel_ y elegir el entorno ``VA2``. Por último, ejecuta el siguiente bloque de código para verificar que el entorno creado funciona correctamente.



In [2]:
print("¡Funciona!")

¡Funciona!


<hr>

### **2. Instalación de TensorFlow y otras librerías**

Para instalar TensorFlow en el entorno de trabajo creado, puedes hacerlo ejecutando de nuevo la aplicación Anaconda Prompt, activando el entorno ``VA2`` e instalando la librería: `pip install tensorflow`.

Sin embargo, es posible instalar librerías directamente desde un Notebook. Para ello, basta utilizar el signo de exclamación (`!`) al inicio de un bloque de código, lo que indica que el comando debe ejecutarse en la terminal en lugar de interpretarse como código Python.


In [1]:
! pip install tensorflow



Además de TensorFlow, utilizaremos otras librerías que definiremos e instalaremos a continuación.

**Pandas** está considerada la librería más popular de análisis de datos en Python y maneja todas sus operaciones mediante un objeto "Dataframe". Para instalarla:

In [4]:
! pip install pandas



**Matplotlib** es una librería que permite realizar una gran variedad de gráficos. Para instalarla:

In [5]:
! pip install matplotlib



**OpenCV** es la principal librería de programación destinada a tareas de visión por computador. Para instalarla:

In [6]:
! pip install opencv-python



**SciPy** es una librería Python utilizada para computación científica, matemáticas, ciencias e ingeniería.

In [7]:
! pip install scipy



**Scikit-learn** es una librería Python para el desarrollo de modelos de aprendizaje automático.

In [8]:
! pip install scikit-learn



<hr>

## ANEXO

En este anexo se presenta un resumen con las principales funciones y métodos de TensorFlow que utilizaremos en la asignatura. Estas herramientas nos permitirán construir, entrenar y evaluar modelos de aprendizaje automático de manera eficiente.

Para más información y detalles, puedes consultar la documentación oficial de TensorFlow: https://www.tensorflow.org/api_docs/

<hr>

#### Capas

*  `tensorflow.keras.layers.Activation(activation)`: Applies an activation function to an output.
    *  `activation`: Activation function to use. If None, no activation is applied. Possible values: 'relu', 'sigmoid', 'softmax', etc.

*  `tensorflow.keras.layers.AveragePooling2D()`: Average pooling operation for 2D spatial data.

*  `tensorflow.keras.layers.BatchNormalization()`: Layer that normalizes its inputs.

*  `tensorflow.keras.layers.Concatenate()`: Concatenates a list of inputs.

```python
# EJEMPLO
from tensorflow.keras.layers import Concatenate
Concatenate()([x1, x2])

```

*  `tensorflow.keras.layers.Conv2D(filters, kernel_size, strides=(1, 1),padding='valid', activation=None, use_bias=True)`: 2D convolution layer.
    *  `filters`: Integer, the dimensionality of the output space (i.e. the number of output filters in the convolution).
    *  `kernel_size`: An integer or tuple/list of 2 integers, specifying the height and width of the 2D convolution window. Can be a single integer to specify the same value for all spatial dimensions.
    *  `strides`: An integer or tuple/list of 2 integers, specifying the strides of the convolution along the height and width. Can be a single integer to specify the same value for all spatial dimensions.
    *  `padding`: one of "valid" or "same" (case-insensitive). "valid" means no padding. "same" results in padding with zeros evenly to the left/right or up/down of the input. When padding="same" and strides=1, the output has the same size as the input.
    *  `activation`: Activation function to use. If None, no activation is applied. Possible values: 'relu', 'sigmoid', 'softmax', etc.
    *  `use_bias`: Boolean, whether the layer uses a bias vector.

```python
# EJEMPLO
from tensorflow.keras.layers import Conv2D
Conv2D(16, 5, activation='relu', input_shape=(64,64,1))

```

* `tensorflow.keras.layers.Conv2DTranspose(filters, kernel_size, strides=(1, 1), padding='valid', dilation_rate=(1, 1), activation=None, use_bias=True)`: 2D transposed convolution layer.
    *  `filters`: Integer, the dimension of the output space (the number of filters in the transposed convolution).
    *  `kernel_size`: Integer, specifying the size of the transposed convolution window.
    *  `strides`: Integer or tuple/list of 1 integer, specifying the stride length of the transposed convolution. `strides > 1` is incompatible with `dilation_rate > 1`.
    *  `padding`: one of "valid" or "same" (case-insensitive). "valid" means no padding. "same" results in padding evenly to the left/right or up/down of the input. When padding="same" and strides=1, the output has the same size as the input.
    *  `dilation`: Integer or tuple/list of 1 integers, specifying the dilation rate to use for dilated transposed convolution.
    *  `activation`: Activation function. If None, no activation is applied. Possible values: 'relu', 'sigmoid', 'softmax', etc.
    *  `use_bias`: Boolean, whether the layer uses a bias vector.


*  `tensorflow.keras.layers.Dense(units, activation=None, use_bias=True)`: Just your regular densely-connected NN layer.
    *  `units`: Positive integer, dimensionality of the output space.
    *  `activation`: Activation function to use. If you don't specify anything, no activation is applied. Possible values: 'relu', 'selu', 'sigmoid', 'softmax', 'softplus', 'tanh', etc.
    *  `use_bias`: Boolean, whether the layer uses a bias vector.

```python
# EJEMPLO
from tensorflow.keras.layers import Dense
Dense(256, activation='relu')

```

*  `tensorflow.keras.layers.Dropout(rate)`: Applies Dropout to the input.
    *  `rate`: Float between 0 and 1. Fraction of the input units to drop.

```python
# EJEMPLO
from tensorflow.keras.layers import Dropout
Dropout(0.5)

```

*  `tensorflow.keras.layers.Flatten()`: Flattens the input.

*  `tensorflow.keras.layers.GlobalAveragePooling2D()`: Global average pooling operation for spatial data.

*  `tensorflow.keras.layers.GlobalMaxPool2D()`: Global max pooling operation for spatial data.


*  `tensorflow.keras.layers.Input(shape=None)`: Input layer.
    *  `units`: Shape of the input data.

```python
# EJEMPLO
Input(shape=(256, 256, 1))

```

*  `tensorflow.keras.layers.MaxPool2D()`: Max pooling operation for 2D spatial data.

##### Métodos

*  `get_weights()`: Return the values of layer.weights as a list of NumPy arrays.

```python
# EJEMPLO
filters, biases = layer.get_weights()  # layer with bias
filters,  = layer.get_weights()        # layer without bias

```

##### Atributos

*  `trainable`: Whether the layer should be trained (boolean).



<hr>

#### Modelos

*  `tensorflow.keras.Model(inputs, outputs)`: A model grouping layers into an object with training/inference features.
    * `inputs`: Input tensor(s).
    * `outputs`: Output tensor(s).

```python
# EJEMPLO
Model(inputs=inputs, outputs=outputs)

```

*  `tensorflow.keras.Sequential()`: Sequential groups a linear stack of layers into model.

```python
# EJEMPLO
from tensorflow.keras.models import Sequential
model = Sequential()

```

##### Métodos

*  `add(layer)`: Adds a layer instance on top of the layer stack.
    *  `layer`: layer instance.

```python
# EJEMPLO
from tensorflow.keras.layers import Flattern
model.add(Flatten())

```

*  `compile(optimizer='rmsprop', loss=None, loss_weights=None, metrics=None, weighted_metrics=None)`: Configures the model for training.
    *  `optimizer`: String (name of optimizer) or optimizer instance. Ver sección "Optimizadores".
    *  `loss`: Loss function. Possible values: 'mean_squared_error', 'binary_crossentropy', 'categorical_crossentropy', etc. To specify different losses for different outputs of a multi-output model, you could also pass a dictionary.
    *  `loss_weights`: Optional list or dictionary specifying scalar coefficients (Python floats) to weight the loss contributions of different model outputs. The loss value that will be minimized by the model will then be the weighted sum of all individual losses, weighted by the `loss_weights` coefficients.
    *  `metrics`: List of metrics to be evaluated by the model during training and testing. Typically you will use `metrics=['accuracy']`. To specify different metrics for different outputs of a multi-output model, you could also pass a dictionary, such as `metrics={'a':'accuracy', 'b':['accuracy', 'mse']}`.
    *  `weighted_metrics`: List of metrics to be evaluated and weighted by `sample_weight` or `class_weight` during training and testing.

```python
# EJEMPLO
model.compile(optimizer=optimizer, loss='binary_crossentropy', metrics=['accuracy'])

```

*  `evaluate(x=None, y=None, batch_size=None, verbose='auto' steps=None)`: Returns the loss value & metrics values for the model in test mode.
    *  `x`: Input data.
    *  `y`: Target data.
    *  `batch_size`: Integer or None. Number of samples per batch of computation.
    *  `verbose`: 'auto', 0, 1, or 2. Verbosity mode. 0 = silent, 1 = progress bar, 2 = single line.
    *  `steps`: Integer or None. Total number of steps (batches of samples) before declaring the evaluation round finished.

```python
# EJEMPLO
loss, acc = model.evaluate(data_test, steps=10, verbose=2)

```

*  `fit(x=None, y=None, batch_size=None, epochs=1, verbose='auto', validation_split=0.0, validation_data=None steps_per_epoch=None, validation_steps=None, validation_batch_size=None)`: Trains the model for a fixed number of epochs (dataset iterations).
    *  `x`: Input data.
    *  `y`: Target data.
    *  `batch_size`: Integer or None. Number of samples per gradient update.
    *  `epochs`: Integer. Number of epochs to train the model.
    *  `verbose`: 'auto', 0, 1, or 2. Verbosity mode. 0 = silent, 1 = progress bar, 2 = one line per epoch.
    *  `validation_split`: Float between 0 and 1. Fraction of the training data to be used as validation data.
    *  `validation_data`: Data on which to evaluate the loss and any model metrics at the end of each epoch. The model will not be trained on this data.
    *  `steps_per_epoch`: Integer or None. Total number of steps (batches of samples) before declaring one epoch finished and starting the next epoch.
    *  `validation_steps`: Total number of steps (batches of samples) to draw before stopping when performing validation at the end of every epoch.
    *  `validation_batch_size`: Integer or None. Number of samples per validation batch.

```python
# EJEMPLO
model.fit(data_train,
          epochs=6,   
          verbose=2,  
          steps_per_epoch=20,
          validation_data=data_val,
          validation_steps=10)

```

*  `predict(x, batch_size=None, verbose='auto')`: Generates output predictions for the input samples.
    *  `x`: Input samples.
    *  `batch_size`: Integer or None. Number of samples per batch.
    *  `verbose`: 'auto', 0, 1, or 2. Verbosity mode. 0 = silent, 1 = progress bar, 2 = single line.

```python
# EJEMPLO
import numpy as np
predictions = model.predict(data_test, verbose=2)
print(np.argmax([predictions[0]]), np.max(predictions[0]))

```

*  `summary()`: Prints a string summary of the network.

##### Atributos

*  `layers`: Layers of the model.

<hr>

#### Modelos pre-entrenados en TensorFlow

*  `tensorflow.keras.applications.DenseNet121(include_top=True,weights='imagenet', input_shape=None)`: Instantiates the Densenet121 architecture.

*  `tensorflow.keras.applications.EfficientNetB0(include_top=True,weights='imagenet', input_shape=None)`: Instantiates the EfficientNetB0 architecture.

*  `tensorflow.keras.applications.EfficientNetB1(include_top=True,weights='imagenet', input_shape=None)`: Instantiates the EfficientNetB1 architecture.

*  `tensorflow.keras.applications.InceptionV3(include_top=True, weights='imagenet', input_shape=None,)`: Instantiates the InceptionV3 architecture.

*  `tensorflow.keras.applications.MobileNetV2(include_top=True, weights='imagenet', input_shape=None,)`: Instantiates the MobileNetV2 architecture.

*  `tensorflow.keras.applications.ResNet50(include_top=True, weights='imagenet', input_shape=None,)`: Instantiates the ResNet50 architecture.
    *  `include_top`: Boolean, whether to include the fully-connected layer at the top, as the last layer of the network.
    *  `weights`: One of None (random initialization), imagenet (pre-training on ImageNet), or the path to the weights file to be loaded.
    *  `input_shape`: Optional shape tuple, only to be specified if include_top is False.

```python
# EJEMPLO
from tensorflow.keras.applications import InceptionV3
from tensorflow.keras.models import Model
from tensorflow.keras.layers import GlobalAveragePooling2D, Dense

base_model = InceptionV3(weights='imagenet', include_top=False)
x = base_model.output
x = GlobalAveragePooling2D()(x)
predictions = Dense(3, activation='softmax')(x)
model = Model(inputs=[base_model.input], outputs=[predictions])

```


<hr>

#### Optimizadores

*  `tensorflow.keras.optimizers.Adam(learning_rate=0.001)`: Optimizer that implements the Adam algorithm.

*  `tensorflow.keras.optimizers.experimental.Adadelta(learning_rate=0.001)`: Optimizer that implements the Adadelta algorithm.

*  `tensorflow.keras.optimizers.experimental.RMSprop(learning_rate=0.001)`: Optimizer that implements the RMSprop algorithm.

*  `tensorflow.keras.optimizers.experimental.SGD(learning_rate=0.01)`: Gradient descent (with momentum) optimizer.
    *  `learning_rate`: The learning rate.


```python
# EJEMPLO
from tensorflow.keras.optimizers import Adam
opt = Adam(learning_rate=0.0001)

```

<hr>

#### Otras operaciones

* `tensorflow.keras.backend.flatten(x)`

* `tensorflow.keras.backend.mean(x)`

* `tensorflow.keras.callbacks.EarlyStopping(monitor='val_loss', patience=0, mode='auto')`:
    *  `monitor`: Quantity to be monitored.
    *  `patience`: Number of epochs with no improvement after which training will be stopped.
    *  `mode`: One of `{"auto", "min", "max"}`. In min mode, training will stop when the quantity monitored has stopped decreasing; in "max" mode it will stop when the quantity monitored has stopped increasing; in "auto" mode, the direction is automatically inferred from the name of the monitored quantity.

* `tensorflow.keras.utils.set_random_seed(seed)`: Sets all random seeds for the program (Python, NumPy, and TensorFlow).
    * `seed`: Integer, the random seed to use.

*  `tensorflow.keras.utils.to_categorical(y, num_classes)`: Converts a class vector (integers) to binary class matrix.
    *  `y`: Array-like with class values to be converted into a matrix (integers from 0 to num_classes - 1).
    *  `num_classes`: Total number of classes.

```python
# EJEMPLO
from tensorflow.keras.utils import to_categorical
y = to_categorical(y, 5)

```

*  `sklearn.model_selection.train_test_split(arrays, test_size=None, train_size=None)`: Split arrays or matrices into random train and test subsets.
    *  `arrays`: Allowed inputs are lists, numpy arrays, scipy-sparse matrices or pandas dataframes.
    *  `test_size`: If float, should be between 0.0 and 1.0 and represent the proportion of the dataset to include in the test split.
    *  `train_size`: If float, should be between 0.0 and 1.0 and represent the proportion of the dataset to include in the train split.

```python
# EJEMPLO
from sklearn.model_selection import train_test_split
train_data, val_data = train_test_split(data, train_size=0.8)

```