### Laboratorio de Implementación de CI/CD con Jenkins

#### Objetivo
Implementar un pipeline de CI/CD utilizando Jenkins para automatizar el entrenamiento, validación y despliegue de

 un modelo de machine learning.

#### Pasos del Laboratorio

1. **Instalación de Jenkins**: Utiliza Docker para instalar y configurar Jenkins.
2. **Configuración del Pipeline**: Configura un nuevo pipeline en Jenkins y crea un archivo `Jenkinsfile`.
3. **Creación de Scripts**: Escribe los scripts de entrenamiento, validación y despliegue.
4. **Ejecución del Pipeline**: Ejecuta el pipeline y verifica que todas las etapas se completen correctamente.


### Guía Completa: Integración y Entrega Continua en ML con Jenkins y GitHub

#### Objetivos de la Guía:
1. **Configurar Git y GitHub** para la gestión del código.
2. **Inicializar y subir un proyecto a GitHub**.
3. **Instalar y configurar Jenkins** para CI/CD.
4. **Crear y ejecutar un pipeline en Jenkins** usando un entorno virtual de Python.

### Parte 1: Configuración de Git y GitHub

#### 1. Configurar Git en tu Máquina Local

Si no has configurado Git en tu máquina local, hazlo ahora:
```bash
git config --global user.name "Humberto Farias"
git config --global user.email "hfarias@userena.cl"
```

#### 2. Inicializar un Repositorio Git en tu Proyecto

Navega al directorio de tu proyecto y inicializa un repositorio Git:
```bash
cd path/to/your/project
git init
```

#### 3. Añadir Archivos al Repositorio

Añade todos los archivos de tu proyecto al repositorio:
```bash
git add .
```

#### 4. Realizar un Commit Inicial

Realiza un commit inicial con un mensaje descriptivo:
```bash
git commit -m "Initial commit"
```

#### 5. Crear un Nuevo Repositorio en GitHub

1. Ve a tu cuenta de GitHub: [https://github.com/hfarias](https://github.com/hfarias)
2. Haz clic en el botón `New` (nuevo) para crear un nuevo repositorio.
3. Dale un nombre a tu repositorio (por ejemplo, `ml_cicd_project`) y agrega una descripción si lo deseas.
4. Selecciona `Public` o `Private` según tu preferencia.
5. No marques ninguna opción para inicializar el repositorio con un README, .gitignore o licencia, ya que estos archivos se crearán localmente.
6. Haz clic en `Create repository` (crear repositorio).

#### 6. Conectar tu Repositorio Local con GitHub

Copia la URL de tu nuevo repositorio de GitHub (por ejemplo, `https://github.com/hfarias/ml_cicd_project.git`) y conéctala con tu repositorio local:
```bash
git remote add origin https://github.com/hfarias/ml_cicd_project.git
```

#### 7. Subir tu Proyecto a GitHub

Empuja (push) tu commit inicial al repositorio de GitHub:
```bash
git push -u origin main
```



### Parte 2: Configuración de Jenkins para CI/CD

#### 1. Instalación de Jenkins

##### Usando Docker

1. Abre una terminal y ejecuta el siguiente comando para iniciar Jenkins usando Docker:
   ```bash
   docker run -p 8080:8080 -p 50000:50000 jenkins/jenkins:lts
   ```

2. Abre tu navegador web y ve a `http://localhost:8080`.

3. Desbloquea Jenkins usando la contraseña inicial proporcionada en la terminal donde ejecutaste el comando Docker.

4. Instala los plugins recomendados siguiendo las instrucciones en pantalla.

#### 2. Configuración Inicial de Jenkins

1. **Crea un nuevo pipeline**:
   - Ve a `New Item`.
   - Escribe un nombre para tu pipeline (por ejemplo, `ML_CICD_Pipeline`).
   - Selecciona `Pipeline` y haz clic en `OK`.

2. **Configura el pipeline**:
   - En la página de configuración del pipeline, desplázate hacia abajo hasta la sección `Pipeline`.
   - Selecciona `Pipeline script from SCM`.
   - En `SCM`, selecciona `Git`.
   - Ingresa la URL de tu repositorio Git: `https://github.com/hfarias/ml_cicd_project.git`.
   - En `Script Path`, ingresa `Jenkinsfile`.

### Parte 3: Creación del Archivo Jenkinsfile y Gestión de Dependencias

#### Crear y Modificar el `Jenkinsfile`

Abre o crea un archivo llamado `Jenkinsfile` en el directorio de tu proyecto con el siguiente contenido para gestionar un entorno virtual de Python:

```groovy
pipeline {
    agent any
    stages {
        stage('Checkout') {
            steps {
                checkout scm
            }
        }
        stage('Train Model') {
            steps {
                sh 'python train_model.py'
            }
        }
        stage('Validate Model') {
            steps {
                sh 'python validate_model.py'
            }
        }
        stage('Deploy Model') {
            steps {
                sh 'python deploy_model.py'
            }
        }
    }
}

```

### Scripts de Entrenamiento, Validación y Despliegue

En tu repositorio, crea los siguientes scripts:

#### `train_model.py`

```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_breast_cancer
import joblib

# Cargar datos
data = load_breast_cancer()
X = data.data
y = data.target

# Dividir datos
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Entrenar modelo
model = RandomForestClassifier(n_estimators=100, random_state=42)
model.fit(X_train, y_train)

# Guardar modelo
joblib.dump(model, 'model.joblib')
```

#### `validate_model.py`

```python
import pandas as pd
from sklearn.model_selection import train_test_split
from sklearn.ensemble import RandomForestClassifier
from sklearn.datasets import load_breast_cancer
from sklearn.metrics import accuracy_score, recall_score, precision_score, f1_score, roc_auc_score
import joblib

# Cargar datos
data = load_breast_cancer()
X = data.data
y = data.target

# Dividir datos
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# Cargar modelo
model = joblib.load('model.joblib')

# Realizar predicciones
y_pred = model.predict(X_test)

# Calcular métricas
accuracy = accuracy_score(y_test, y_pred)
recall = recall_score(y_test, y_pred)
precision = precision_score(y_test, y_pred)
f1 = f1_score(y_test, y_pred)
roc_auc = roc_auc_score(y_test, y_pred)

print(f"Accuracy: {accuracy:.2f}")
print(f"Recall: {recall:.2f}")
print(f"Precision: {precision:.2f}")
print(f"F1 Score: {f1:.2f}")
print(f"ROC AUC Score: {roc_auc:.2f}")
```

#### `deploy_model.py`

```python
import joblib
import os

# Simulación de despliegue (por ejemplo, copiar a una carpeta de despliegue)
os.makedirs('deploy', exist_ok=True)
joblib.dump(joblib.load('model.joblib'), 'deploy/model.joblib')

print("Modelo desplegado exitosamente.")
```

### Guardar y Cometer los Cambios

1. **Guardar el Archivo `Jenkinsfile`**: Guarda el archivo `Jenkinsfile` con las modificaciones mencionadas.
2. **Agregar y Cometer los Cambios**: Abre una terminal, navega al directorio de tu proyecto y ejecuta los siguientes comandos:

   ```bash
   cd path/to/your/project
   git add Jenkinsfile
   git add requirements.txt # Solo si has creado este archivo
   git commit -m "Add virtual environment setup to Jenkinsfile"
   git push origin main # O `master` si esa es tu rama principal
   ```

### Ejecutar el Pipeline en Jenkins

1. **Ve a Jenkins**: Abre tu navegador web y ve a `http://localhost:8080`.
2. **Ejecuta el Pipeline**: Selecciona tu pipeline (`ML_CICD_Pipeline`) y haz clic en `Build Now`.



