<a href="https://colab.research.google.com/github/cristiandarioortegayubro/BDS/blob/main/modulo.04/bds_optimizacion_001_01.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/Logo%20BDS%20Horizontal%208.png?raw=true">
</p>


<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/Logo%20Scikit-learn.png?raw=true">
</p>


 # **<font color="DeepPink">Validación cruzada</font>**

<p align="justify">
♥ En los Colabs anteriores, se ven algunos conceptos relacionados con los modelos predictivos. Si bien esta sección podría ser un poco redundante con lo que se ve anteriormente, la intención es la de profundizar el tema de validación cruzada.
<br><br>
Antes de comenzar, detengámonos en las razones para tener un conjunto de datos de entrenamiento y otro conjunto de prueba. Pero antes, vamos a ver la limitación de usar todo el conjunto de datos, sin dividirlo.
<br><br>
👀 Para comparar los diferentes conceptos, usamos el conjunto de datos de viviendas de California, pero previo a comenzar, vamos a definir el tema de este Colab, la validación cruzada.

 ## **<font color="DeepPink">Definición y conceptos de la validación cruzada</font>**

<p align="justify">
✅ La validación cruzada, también conocida como <b>cross-validation</b> en inglés, es una técnica utilizada en el aprendizaje automático para evaluar el rendimiento de un modelo o algoritmo predictivo.
<br><br>
En <code>scikit-learn</code>, la biblioteca seleccionada para desarrollar modelos de aprendizaje automático, la validación cruzada se implementa mediante la función <code>cross_validate</code> del módulo <code>model_selection</code>. Esta función permite realizar la validación cruzada de manera sencilla y eficiente.
<br><br>
El proceso de validación cruzada implica dividir el conjunto de datos disponible en varios subconjuntos o "pliegues" (folds en inglés). Luego, se entrena y evalúa el modelo en múltiples iteraciones, utilizando diferentes combinaciones de subconjuntos de entrenamiento y prueba. En cada iteración, se reserva uno de los pliegues como conjunto de prueba y se utiliza el resto de los pliegues para entrenar el modelo. Luego, se evalúa el modelo en el pliegue de prueba y se registra su rendimiento.
<br><br>
Por ese motivo, el proceso de validación cruzada permite evaluar cómo se generaliza el modelo a nuevos datos y ayuda a evitar problemas como el sobreajuste (<b>overfitting</b>). Además, proporciona una estimación más precisa del rendimiento del modelo.
<br><br>
La forma más común de validación cruzada es la validación cruzada <b>k-fold</b> (k-fold cross-validation en inglés). En este enfoque, se divide el conjunto de datos en $k$ pliegues de tamaño aproximadamente igual. Luego, se realiza el entrenamiento y la evaluación $k$ veces, utilizando cada uno de los pliegues como conjunto de prueba una vez, mientras que los restantes $k-1$ pliegues se utilizan como conjunto de entrenamiento en cada iteración.

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/k-fold-001.png?raw=true" width="600">
</p>

 ## **<font color="DeepPink">Carga de las librerías</font>**

In [None]:
import numpy as np
import pandas as pd

In [None]:
import plotly.express as px

 ## **<font color="DeepPink">Carga y análisis de conjunto de datos</font>**

<p align = "justify">
👀 Vamos a usar datos de <code>scikit-learn</code>

In [None]:
from sklearn.datasets import fetch_california_housing

In [None]:
housing = fetch_california_housing(as_frame=True) #as_frame: como Pandas DataFrame

<p align = "justify">
👀 Vemos que tipo de objeto es

In [None]:
type(housing)

sklearn.utils._bunch.Bunch

<p align = "justify">
👀 Ahora vemos la descripción del conjunto de datos.

In [None]:
print(housing.DESCR)

.. _california_housing_dataset:

California Housing dataset
--------------------------

**Data Set Characteristics:**

    :Number of Instances: 20640

    :Number of Attributes: 8 numeric, predictive attributes and the target

    :Attribute Information:
        - MedInc        median income in block group
        - HouseAge      median house age in block group
        - AveRooms      average number of rooms per household
        - AveBedrms     average number of bedrooms per household
        - Population    block group population
        - AveOccup      average number of household members
        - Latitude      block group latitude
        - Longitude     block group longitude

    :Missing Attribute Values: None

This dataset was obtained from the StatLib repository.
https://www.dcc.fc.up.pt/~ltorgo/Regression/cal_housing.html

The target variable is the median house value for California districts,
expressed in hundreds of thousands of dollars ($100,000).

This dataset was derived

<p align="justify">
👀 En este conjunto de datos, el objetivo es predecir el valor promedio de las casas en un área de California. Las características recopiladas se basan en información inmobiliaria y geográfica general de estas propiedades. Como el valor promedio a predecir es el precio medio (variable numérica continua), utilizaremos entonces un modelo predictivo específico de regresión.

<p align="justify">
🛑 Vimos que el objeto <code>housing</code> es un objeto de <code>scikit-learn</code> y tiene sus propios métodos y atributos, como por ejemplo <code>data</code> que lo muestra o transforma en un <code>DataFrame</code>

In [None]:
type(housing)

sklearn.utils._bunch.Bunch

In [None]:
housing.data.head()

Unnamed: 0,MedInc,HouseAge,AveRooms,AveBedrms,Population,AveOccup,Latitude,Longitude
0,8.3252,41.0,6.984127,1.02381,322.0,2.555556,37.88,-122.23
1,8.3014,21.0,6.238137,0.97188,2401.0,2.109842,37.86,-122.22
2,7.2574,52.0,8.288136,1.073446,496.0,2.80226,37.85,-122.24
3,5.6431,52.0,5.817352,1.073059,558.0,2.547945,37.85,-122.25
4,3.8462,52.0,6.281853,1.081081,565.0,2.181467,37.85,-122.25


<p align = "justify">
👀 Tambien podemos ver la variable objetivo con <code>target</code>

In [None]:
housing.target

0        4.526
1        3.585
2        3.521
3        3.413
4        3.422
         ...  
20635    0.781
20636    0.771
20637    0.923
20638    0.847
20639    0.894
Name: MedHouseVal, Length: 20640, dtype: float64

<p align="justify">
👀 Ahora si, dividimos todos los datos del conjunto de datos <code>housing</code>, en nuestra variable objetivo y las variables explicativas. En el caso de la variable objetivo hacemos una transformación de los datos para expresar los valores a cientos de miles de dólares.

In [None]:
y = housing.target * 100000 #transformamos el precio a cientos de miles de dólares.
X = housing.data

<p align="justify">
👀 Visualizamos variable objetivo.

In [None]:
y.head()

0    452600.0
1    358500.0
2    352100.0
3    341300.0
4    342200.0
Name: MedHouseVal, dtype: float64

<p align="justify">
👀 Visualizamos variables explicativas.

In [None]:
X.head()

Unnamed: 0,MedInc,HouseAge,AveRooms,AveBedrms,Population,AveOccup,Latitude,Longitude
0,8.3252,41.0,6.984127,1.02381,322.0,2.555556,37.88,-122.23
1,8.3014,21.0,6.238137,0.97188,2401.0,2.109842,37.86,-122.22
2,7.2574,52.0,8.288136,1.073446,496.0,2.80226,37.85,-122.24
3,5.6431,52.0,5.817352,1.073059,558.0,2.547945,37.85,-122.25
4,3.8462,52.0,6.281853,1.081081,565.0,2.181467,37.85,-122.25


 # **<font color="DeepPink">Error de entrenamiento versus Error de prueba</font>**


 ## **<font color="DeepPink">Creación y ajuste del modelo</font>**

Para resolver el problema de regresión, utilizaremos un [Árbol de Regresión](https://scikit-learn.org/stable/modules/generated/sklearn.tree.DecisionTreeRegressor.html)

<p align="justify">
Un árbol de decisión en <code>scikit-learn</code> es un algoritmo de aprendizaje automático supervisado utilizado para resolver problemas de clasificación y regresión. Se basa en la idea de construir un modelo en forma de árbol que toma decisiones secuenciales basadas en características o atributos de los datos de entrada, o variables explicativas.
<br><br>
En <code>scikit-learn</code>, los árboles de decisión se implementan a través de la clase <code>DecisionTreeClassifier</code> para problemas de clasificación y la clase <code>DecisionTreeRegressor</code> para problemas de regresión.

In [None]:
from sklearn.tree import DecisionTreeRegressor

<p align="justify">
👀 Entonces la creación del árbol se hace con la instancia de la clase  <code>DecisionTreeRegressor</code>, y se ajusta al conjunto de datos  utilizando el método <code>fit()</code>. Durante este proceso, el árbol se construye de forma recursiva dividiendo los datos en función de las variables explicativas para minimizar la impureza (Entropía o Gini) en los nodos (clasificación) o minimizar su varianza (regresión).

In [None]:
model = DecisionTreeRegressor(random_state=0)
model.fit(X, y)

 ## **<font color="DeepPink">Evaluación del modelo</font>**

<p align="justify">
👀 Después de entrenar el modelo, nos gustaría conocer el rendimiento potencial una vez implementado en producción. Para este propósito, usamos el error absoluto medio (MAE por sus siglas en inglés), que nos da un error en la unidad original, es decir en este caso, expresado en $.

In [None]:
from sklearn.metrics import mean_absolute_error

In [None]:
y_predicted = model.predict(X)
score = mean_absolute_error(y, y_predicted)
print("")
print(f"En promedio, nuestro modelo genera un error de $ {score:.2f}")


En promedio, nuestro modelo genera un error de $ 0.00


<p align="justify">
Vemos que obtenemos una predicción perfecta sin errores de los precios de las propiedades. Esto es demasiado optimista y cuando sucede, casi siempre revela un problema metodológico.
<br><br>
👀 Entrenamos y predijimos con el mismo conjunto de datos.
<br><br>
En nuestro árbol de decisión, cada muestra en el conjunto de datos se almacena en un nodo hoja. Por lo tanto, nuestro árbol de decisiones memorizó completamente el conjunto de datos proporcionado durante el ajuste del modelo <code>fit()</code> y por ese motivo, no cometió ningún error al predecir los valores de los precios de las propiedades.



## **<font color="DeepPink">División de datos de prueba y entrenamiento</font>**

<p align="justify">
🛑 El error calculado anteriormente se denomina <b>error empírico</b> o <b>error de entrenamiento</b>.
<br><br>
Entrenamos un modelo predictivo para minimizar el error de entrenamiento, pero nuestro objetivo es minimizar el error en los datos que no se han visto durante el entrenamiento del modelo.
<br><br>
Este error también se denomina <b>error de generalización</b> o <b>error de prueba "verdadero"</b>.
<br><br>
Así, la evaluación más básica implica:

* Dividir el conjunto de datos en un conjunto de entrenamiento y un conjunto de prueba;
* Ajustar el modelo en el conjunto de entrenamiento;
* Estimar el error de entrenamiento en el conjunto de entrenamiento;
* Estimar el error de prueba en el conjunto de prueba.

<br>
<p align="justify">
👀 Así que dividamos nuestro conjunto de datos, para ello <code>scikit-learn</code> proporciona una función llamada <code>train_test_split</code> del módulo <code>model_selection</code> que se utiliza para realizar esta división. La función <code>train_test_split</code> toma como entrada el conjunto de datos completo y lo divide en dos conjuntos: uno para entrenamiento y otro para evaluación.
<br><br>
La división del conjunto de datos se realiza de manera aleatoria, asegurando que los datos se mezclen para evitar cualquier sesgo o patrón específico en los conjuntos de entrenamiento y evaluación. Por lo general, la división se realiza asignando un porcentaje específico de los datos al conjunto de evaluación (también conocido como conjunto de prueba) y el restante al conjunto de entrenamiento.
<br><br>


In [None]:
from sklearn.model_selection import train_test_split

In [None]:
X_train, X_test, y_train, y_test = train_test_split(X, y, random_state=0)

In [None]:
model.fit(X_train, y_train)

<p align="justify">
<code>X_train</code> y <code>y_train</code> representan los conjuntos de entrenamiento, mientras que <code>X_test</code> y <code>y_test</code> representan los conjuntos de prueba. El argumento <code>random_state</code> se utiliza para fijar la semilla aleatoria y asegurar que la división sea reproducible, es decir, independientemente de quien ejecute el script, siempre se obtenga el mismo resultado.
<br><br>
La división del conjunto de datos en <code>scikit-learn</code> es esencial para evaluar el rendimiento de los modelos de aprendizaje automático de manera objetiva y para evitar el sobreajuste al utilizar los mismos datos tanto para entrenamiento como para evaluación (test).

 ## **<font color="DeepPink">Evaluación del modelo</font>**

👀 Error de entrenamiento:

In [None]:
y_predicted = model.predict(X_train)
score = mean_absolute_error(y_train, y_predicted)
print("")
print(f"El error de entrenamiento del modelo es $ {score:.2f}")


El error de entrenamiento del modelo es $ 0.00


👀 Error de prueba:

In [None]:
y_predicted = model.predict(X_test)
score = mean_absolute_error(y_test, y_predicted)
print("")
print(f"El error de prueba del modelo es $ {score:.2f}")


El error de prueba del modelo es $ 47378.08


<p align="justify">
✅ Este error de prueba es en realidad lo que esperaríamos de nuestro modelo si se usara en un entorno de producción.

# **<font color="DeepPink">Estabilidad de las estimaciones de Validación Cruzada</font>**

<p align="justify">
Al hacer una sola división de prueba y entrenamiento, no damos ninguna indicación con respecto a la robustez de la evaluación de nuestro modelo predictivo: en particular, si el conjunto de prueba es pequeño, esta estimación del error de prueba será inestable y no reflejaría la "tasa de error real" que habríamos observado con el mismo modelo en una cantidad mayor de datos de prueba.
<br><br>
Por ejemplo, podríamos haber tenido suerte cuando hicimos nuestra división aleatoria de nuestro conjunto de datos limitado y aislar algunos de los casos más fáciles de predecir en el conjunto de prueba por casualidad: la estimación del error de prueba sería demasiado optimista, en este caso.
<br><br>
Entonces la <b>validación cruzada</b> permite estimar la robustez de un modelo predictivo repitiendo (iterando) el procedimiento de división. Dará varios errores de entrenamientos y pruebas y, por tanto, una <b>estimación de la variabilidad del rendimiento del modelo</b>.

Hay [diferentes estrategias de validación cruzada](https://scikit-learn.org/stable/modules/cross_validation.html#cross-validation-iterators),

<p align="justify">
Por ahora nos vamos a centrar en uno llamado <code>shuffle-split</code>. En cada iteración de esta estrategia nosotros vamos a:


- Mezclar aleatoriamente el orden de las muestras del conjunto de datos completo;
- Dividir el conjunto de datos en un conjunto de entrenamiento y un conjunto de prueba;
- Entrenar un nuevo modelo con el conjunto de entrenamiento;
- Evaluar el error de prueba con el conjunto de prueba.

<p align="justify">
Repetimos este procedimiento <code>n_splits</code> veces. Hay que tener en cuenta que el costo computacional aumenta con <code>n_splits</code>.

<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/Validacion-001.png?raw=true" width="650">
</p>


<p align="justify">
Esta figura muestra el caso particular de la estrategia de validación cruzada <code>shuffle-split</code> usando <code>n_splits = 5</code>. Para cada división de validación cruzada, el procedimiento entrena un modelo en todas las muestras rojas y evalúa su rendimiento en las muestras azules.

<p align="justify">
En este caso estableceremos <code>n_splits=40</code>, lo que significa que entrenaremos $40$ modelos en total.


Para evaluar el desempeño de nuestro modelo, debemos usar:

- [`sklearn.model_selection.cross_validate`](https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.cross_validate.html)

- [`sklearn.model_selection.ShuffleSplit`](https://scikit-learn.org/stable/modules/generated/sklearn.model_selection.ShuffleSplit.html)

👀 Cargamos las funciones <code>cross_validate</code> y <code>ShuffleSplit</code>:

In [None]:
from sklearn.model_selection import cross_validate
from sklearn.model_selection import ShuffleSplit

<p align="justify">
<code>ShuffleSplit</code> es una función que se utiliza para generar divisores de conjuntos de datos aleatorios para validación cruzada. A diferencia de otros métodos de validación cruzada, <code>ShuffleSplit</code> no utiliza particiones predefinidas o pliegues fijos, sino que genera múltiples divisiones aleatorias del conjunto de datos en conjuntos de entrenamiento y prueba.
<br><br>
ShuffleSplit toma como argumentos el número de iteraciones (<code>n_splits</code>), el tamaño del conjunto de prueba (<code>test_size</code> o <code>train_size</code>), la semilla aleatoria (<code>random_state</code>) y otros parámetros opcionales.

In [None]:
cv = ShuffleSplit(n_splits=40, test_size=0.3, random_state=0)
cv_results = cross_validate(model, X, y, cv=cv, scoring="neg_mean_absolute_error")

`scoring` controla qué [métrica](https://scikit-learn.org/stable/modules/model_evaluation.html#scoring-parameter) aplicar a los datos de prueba.



In [None]:
cv_results

{'fit_time': array([0.25534487, 0.25294495, 0.2501955 , 0.24779558, 0.24156833,
        0.25258231, 0.25279951, 0.26588869, 0.28010178, 0.25898004,
        0.16646075, 0.16876078, 0.17307258, 0.16088533, 0.16873789,
        0.16951847, 0.16784859, 0.1678524 , 0.16576076, 0.16912174,
        0.17082143, 0.16321111, 0.17260623, 0.16948748, 0.16704893,
        0.16733575, 0.18390965, 0.16612959, 0.16797161, 0.1652925 ,
        0.16582131, 0.17231178, 0.18019247, 0.1649437 , 0.16775393,
        0.17826939, 0.16467428, 0.16937065, 0.16732597, 0.17396331]),
 'score_time': array([0.0072639 , 0.00555634, 0.00576329, 0.00546527, 0.00549817,
        0.00745988, 0.00557089, 0.00566888, 0.00553107, 0.00656533,
        0.00474501, 0.00435829, 0.00423074, 0.00428343, 0.00429821,
        0.00430369, 0.00475836, 0.00425506, 0.00419092, 0.00419736,
        0.00424099, 0.00420403, 0.00454211, 0.00457692, 0.0043211 ,
        0.00431252, 0.00445127, 0.00440598, 0.00431776, 0.00431752,
        0.00437713, 

<p align="justify">
👀 Los resultados <code>cv_results</code> se almacenan en un <code>diccionario</code>. Lo convertiremos a un <code>DataFrame</code> para facilitar la visualización y manipulación de los datos.

In [None]:
cv_results = pd.DataFrame(cv_results)
cv_results.head()

Unnamed: 0,fit_time,score_time,test_score
0,0.255345,0.007264,-47137.009528
1,0.252945,0.005556,-46839.433786
2,0.250196,0.005763,-47305.85449
3,0.247796,0.005465,-44851.398417
4,0.241568,0.005498,-47072.168928


<p align="justify">
✅ Una puntuación es una métrica, y los valores más altos significan mejores resultados.
<br><br>
✅ Por el contrario, un error es una métrica en la que valores más bajos significan mejores resultados.
<br><br>
👀 El parámetro <code>scoring</code> en <code>cross_validate</code> siempre espera una función que sea una puntuación. Para hacerlo más fácil, todas las métricas de error en <code>Scikit-learn</code>, como <code>mean_absolute_error</code>, se pueden transformar en una puntuación para usar en <code>cross_validate</code>. Para hacerlo, debe pasar una cadena de la métrica de error con una cadena neg_ adicional al principio de la puntuación del parámetro; por ejemplo, <code>scoring="neg_mean_absolute_error"</code>. En este caso se computará el negativo del error absoluto medio que equivaldría a una puntuación.

<p align="justify">
👀 Ahora creamos la columna <code>test_error</code> con los valores de la columna <code>test_score</code> sacando el valor negativo.

In [None]:
cv_results["test_error"] = -cv_results["test_score"]
cv_results.head()

Unnamed: 0,fit_time,score_time,test_score,test_error
0,0.255345,0.007264,-47137.009528,47137.009528
1,0.252945,0.005556,-46839.433786,46839.433786
2,0.250196,0.005763,-47305.85449,47305.85449
3,0.247796,0.005465,-44851.398417,44851.398417
4,0.241568,0.005498,-47072.168928,47072.168928


In [None]:
len(cv_results)

40

<p align="justify">
👀 Vemos que tenemos $40$ entradas en nuestro <code>DataFrame</code> porque realizamos $40$ divisiones. Por lo tanto, podemos mostrar la distribución del error de prueba y así tener una estimación de su variabilidad.

In [None]:
print("")
print(f"Media: {cv_results.test_error.mean()}")
print(f"Desvío estandar: {cv_results.test_error.std()}")


Media: 46408.783781492246
Desvío estandar: 1195.4177777280847


📊 Ahora vamos a hacer un histograma:

In [None]:
px.histogram(cv_results,
             x="test_error",
             template="gridon",
             nbins=30).update_layout(bargap=0.2)

<p align="justify">
👀 Podemos observar que el error de prueba está agrupado alrededor de los $47$ y en un rango que va desde $43$ a $50$.
<br><br>
Tenga en cuenta que la desviación estándar es mucho menor que la media, y podríamos resumir que nuestra estimación de validación cruzada del error de prueba es $46.36$ ± $1,17$ k\$.
<br><br>
Si tuviéramos que entrenar un solo modelo en el conjunto de datos, es decir sin validación cruzada, y luego tener acceso a una cantidad ilimitada de pruebas de los datos, esperaríamos que su verdadero error de prueba se acerque a esa región.
<br><br>


# **<font color="DeepPink">Más detalles sobre cross_validate</font>**

<p align="justify">
👀 Durante la validación cruzada, se entrenan y evalúan muchos modelos. De hecho, el número de elementos en cada matriz de la salida de <code>cross_validate</code> es un resultado de uno de estos procedimientos <code>fit</code> / <code>score</code>. Para hacerlo explícito, es posible recuperar estos modelos ajustados en cada una de las iteraciones pasando la opción <code>return_estimator=True</code> en <code>cross_validate</code>.

In [None]:
from sklearn.model_selection import cross_val_score

In [None]:
cv_results = cross_validate(model, X, y, return_estimator=True)
cv_results

{'fit_time': array([0.29705143, 0.28939605, 0.28960037, 0.28376889, 0.28633976]),
 'score_time': array([0.00408411, 0.00393295, 0.00407434, 0.0038588 , 0.00464177]),
 'estimator': [DecisionTreeRegressor(random_state=0),
  DecisionTreeRegressor(random_state=0),
  DecisionTreeRegressor(random_state=0),
  DecisionTreeRegressor(random_state=0),
  DecisionTreeRegressor(random_state=0)],
 'test_score': array([0.21214626, 0.41969181, 0.42331813, 0.19377131, 0.4145845 ])}

In [None]:
cv_results['estimator']

[DecisionTreeRegressor(random_state=0),
 DecisionTreeRegressor(random_state=0),
 DecisionTreeRegressor(random_state=0),
 DecisionTreeRegressor(random_state=0),
 DecisionTreeRegressor(random_state=0)]

<p align="justify">
👀 Los cinco regresores del árbol de decisión corresponden a los cinco árboles en los diferentes folds. Tener acceso a estos regresores es útil porque permite inspeccionar los parámetros ajustados internos de estos regresores.
<br><br>
En el caso de que solo nos interese el puntaje de la prueba, <code>Scikit-learn</code> proporciona la función <code>cross_val_score</code>. Es idéntico a llamar a la función <code>cross_validate</code> y para seleccionar <code>test_score</code> solamente.

In [None]:
scores = cross_val_score(model, X, y)
scores

array([0.21214626, 0.41969181, 0.42331813, 0.19377131, 0.4145845 ])

 # **<font color="DeepPink">Conclusiones</font>**

<p align="justify">
👀 En este colab nosotros:
<br><br>
✅ Cargamos los datos de un objeto de<code>Scikit-learn</code> y lo convertimos a un <code>DataFrame</code>.
<br>
✅ Vimos la necesidad de dividir los datos en un conjunto de entrenamiento y un conjunto de prueba.
<br>
✅ Constatamos el significado de los errores de entrenamiento y los errores de prueba.
<br>
✅ Definimos el marco general de la validación cruzada con la posibilidad de estudiar las variaciones del rendimiento de la generalización del modelo.


<br>
<br>
<p align="center"><b>
💗
<font color="DeepPink">
Hemos llegado al final de nuestro colab, a seguir codeando...
</font>
</p>
<br>
<p align="center">
<img src="https://github.com/cristiandarioortegayubro/BDS/blob/main/images/Logo%20BDS%20Horizontal%208.png?raw=true">
</p>

---
