# Comandos Git que utilizaremos

| Comando Git                             | Descripción                                                                 |
|----------------------------------------|-----------------------------------------------------------------------------|
| `git config --global core.editor "code --wait"` | Establece Visual Studio Code como el editor de texto predeterminado para Git. |
| `git config --global user.email "..."` | Define el correo electrónico del usuario para las confirmaciones (commits). |
| `git config --global user.name "..."`  | Define el nombre del usuario para las confirmaciones (commits).              |
| `git clone <url>`                      | Clona un repositorio remoto en el equipo local.                              |
| `git branch -m main`                   | Renombra la rama actual a `main`.                                            |
| `git checkout -b <nombre_rama>`        | Crea una nueva rama y cambia automáticamente a ella.                         |
| `git checkout <nombre_rama>`           | Cambia a una rama existente.                                                 |
| `git merge <nombre_rama>`              | Fusiona la rama especificada con la rama actual.                             |
| `git add .`                            | Agrega todos los cambios al área de staging para ser confirmados.            |
| `git commit -m "mensaje"`              | Crea un commit con los cambios añadidos, acompañado de un mensaje descriptivo. |
| `git push -u origin <nombre_rama>`     | Envía la rama al repositorio remoto y la configura para seguimiento (tracking). |
| `git push origin <nombre_rama>`        | Sube los cambios locales de una rama al repositorio remoto.                  |
| `git tag -a v1.0 -m "mensaje"`         | Crea una etiqueta (tag) anotada con un mensaje explicativo.                  |
| `git push origin main --tags`          | Envía la rama `main` junto con todas las etiquetas (tags) al repositorio remoto. |

Hoja de comandos de Git: https://education.github.com/git-cheat-sheet-education.pdf

Enlace a la metodología oficial 'GitFlow': https://nvie.com/posts/a-successful-git-branching-model/

---

# 🌸 Modelo de clasificación de Iris con GitFlow

Este notebook contiene un flujo completo de trabajo para entrenar un modelo de machine learning simple en el dataset **Iris**, y al mismo tiempo, aplicar una estrategia de control de versiones basada en **GitFlow**.

Aprenderás a:
- Leer datos con pandas
- Entrenar un modelo simple (RandomForest)
- Usar ramas `feature/*`, `develop`, `release/*`, `main`
- Controlar versiones en GitHub desde Colab

## Paso 1: Configuración inicial del repositorio Git

Estableceremos la base del proyecto con GitFlow siguiendo prácticas estandarizadas de control de versiones.



#### 1. Crearemos el repositorio en GitHub
- Vamos a [GitHub](https://github.com/new)
- Nombramos del repo: `iris-classification`
- Agregamos su descripción breve: "Clasificación de flores Iris usando GitFlow"
- **Importante**: Dejamos todas las casillas SIN marcar (sin README, .gitignore ni license)



#### 2. Configuramos Git localmente

1. Definimos el usuario: `git config --global user.name "Tu Nombre"`
2. Definimos el email: `git config --global user.email "tu@email.com"`

#### 3. Configuramos Visual Studio Code con una cuenta de GitHub
1.	En Visual Studio Code, nos dirigimos a la esquina inferior izquierda y hacémos clic sobre el ícono de usuario (arriba del engranaje de configuración).
2.	Seleccionámos la última opción que dice “Iniciar sesión en GitHub para usar GitLens…” o “Sign in to GitHub”, según el idioma de tu VS Code.
3.	Seguí los pasos que aparecen en el navegador para iniciar sesión con tu cuenta de GitHub y autorizar el acceso.

#### 4. Conexión con el repositorio:
- Clonamos el repositorio: `git clone https://github.com/tuusuario/iris-classification.git`

- Verificamos la conexión remota: `git remote -v` (Nos debe mostrar 'origin' apuntando a al repo)

#### 5. Organizamos los archivos desde la terminal
- Movemos el notebook al directorio clonado: `mv Clase42_git_github_ejemplo.ipynb iris-classification `
- Navegamos al directorio del proyecto: `cd iris-classification`

#### 6.Configuramos y versionamos la rama develop (base para GitFlow)

1. Agregamos el notebook a area de stage: `git add .`
2. Agregamos el notebook al historial de commits: `git commit -m 'Agregamos notebook a al repositorio'`
3. Establecemos la rama principal como 'main': `git branch -M main`

#### 7. Configuramos la rama develop (base para GitFlow)
Estableceremos la rama `develop` como tronco principal para integrar nuevas features, siguiendo el estándar GitFlow.

1. Creamos y cambiamos a la rama develop desde main: `git checkout -b develop`


#### 8. Gestiónamos las librerías necesarias

1. Instalamos las dependencias (para ello necesitaremos previamente [instalar pip](https://pip.pypa.io/en/stable/installation)):
- Sklearn: `pip install sklearn`
- Pandas:  `pip install pandas`
- NumPy: `pip install numpy`

2. Volcamos las versiones de las librerías utilizadas a un archivo:
- Si es un entorno nuevo o aislado: `pip freeze > requirements.txt`
- Si es un entorno con mas librerías instaladas: `pip freeze | grep -E '^(pandas|numpy|scikit-learn)' > requirements.txt`

#### 9. Versionamos la gestión de librerías en `develop`

1. Agregamos los cambios al área de staging: `git add .`
2. Guardamos los cambios en el historial:: `git commit -m "Agregamos notebook repositorio.`
3. Subimos la rama al repo remoto (en el segundo intento nos pedira autenticarnos): `git push -u origin develop`

## Paso 2: Descargamos el dataset


In [1]:
import pandas as pd

In [2]:
df = pd.read_csv('https://gist.githubusercontent.com/netj/8836201/raw/6f9306ad21398ea43cba4f7d537619d0e07d5ae3/iris.csv')

In [3]:
df

Unnamed: 0,sepal.length,sepal.width,petal.length,petal.width,variety
0,5.1,3.5,1.4,0.2,Setosa
1,4.9,3.0,1.4,0.2,Setosa
2,4.7,3.2,1.3,0.2,Setosa
3,4.6,3.1,1.5,0.2,Setosa
4,5.0,3.6,1.4,0.2,Setosa
...,...,...,...,...,...
145,6.7,3.0,5.2,2.3,Virginica
146,6.3,2.5,5.0,1.9,Virginica
147,6.5,3.0,5.2,2.0,Virginica
148,6.2,3.4,5.4,2.3,Virginica


## Paso 3: Desarrollo de Features con Ramas Especializadas

Implementaremos funcionalidades de forma aislada mediante ramas 'feature', manteniendo `develop` estable.

### <label><input type="checkbox" checked> Feature EDA</label>

Analizaremos brevemente algunas de las estadisticas del dataset Iris.



#### 1. Creamos una nueva rama para eda
Desde develop (nos aseguramos de tener los últimos cambios):

1. `git checkout develop`
2. `git pull origin develop`

Creamos la nueva rama para la feature de 'eda':

3. `git checkout -b feature/eda`

#### 2. Trabajamos sobre la funcionalidad

Describe

In [4]:
df.describe

<bound method NDFrame.describe of      sepal.length  sepal.width  petal.length  petal.width    variety
0             5.1          3.5           1.4          0.2     Setosa
1             4.9          3.0           1.4          0.2     Setosa
2             4.7          3.2           1.3          0.2     Setosa
3             4.6          3.1           1.5          0.2     Setosa
4             5.0          3.6           1.4          0.2     Setosa
..            ...          ...           ...          ...        ...
145           6.7          3.0           5.2          2.3  Virginica
146           6.3          2.5           5.0          1.9  Virginica
147           6.5          3.0           5.2          2.0  Virginica
148           6.2          3.4           5.4          2.3  Virginica
149           5.9          3.0           5.1          1.8  Virginica

[150 rows x 5 columns]>

Info

In [5]:
df.info()

<class 'pandas.core.frame.DataFrame'>
RangeIndex: 150 entries, 0 to 149
Data columns (total 5 columns):
 #   Column        Non-Null Count  Dtype  
---  ------        --------------  -----  
 0   sepal.length  150 non-null    float64
 1   sepal.width   150 non-null    float64
 2   petal.length  150 non-null    float64
 3   petal.width   150 non-null    float64
 4   variety       150 non-null    object 
dtypes: float64(4), object(1)
memory usage: 6.0+ KB


#### 3. Versionado del trabajo
1. Añadimos los cambios al area de stage: `git add`
2. Guardamos los cambios en el historial: `git commit -m "feat(eda): añade análisis descriptivo básico"`
3. Subimos la rama al repo remoto: `git push -u origin feature/eda`  

#### 4.Integración con develop

1. Nos movemos a la rama develop: `git checkout develop`
2. Verificamos si no hay cambios en el repo remoto: `git pull origin develop`
3. Mergeamos develop con la rama fearure/eda: `git merge feature/eda`


#### 5. Publicamos los cambios:
1. Actualizamos la rama develop del repo remoto, con la nueva feature: `git push origin develop`

### <label><input type="checkbox">Feature Preprocesamiento</label>

#### Creamos una nueva rama para preprocesamiento

Desde develop (nos aseguramos de tener los últimos cambios):

1. `git checkout develop`
2. `git pull origin develop`

Creamos la nueva rama para la feature de 'preprocesamiento':

3. `git checkout -b feature/preprocesamiento`

#### 2. Trabajamos sobre la funcionalidad

a. Separamos en X e y

b. Reducimos las 4 columnas en X que representan largo y ancho (para petalo y sepalo) a solo dos que representen el area

Index(['sepal.length', 'sepal.width', 'petal.length', 'petal.width'], dtype='object')

#### 3. Versionado del trabajo
1. Añadimos los cambios al area de stage: `git add`
2. Guardamos los cambios en el historial: `git commit -m "feat(preprocesamiento): añadimos preprocesamiento basico."`
3. Subimos la rama al repo remoto: `git push -u origin feature/preprocesamiento`  

#### 4. Integración con develop

1. Nos movemos a la rama develop: `git checkout develop`
2. Verificamos si no hay cambios en el repo remoto: `git pull origin develop`
3. Mergeamos develop con la rama fearure/eda: `git merge feature/preprocesamiento`

#### 5. Publicamos los cambios
1. Actualizamos la rama develop del repo remoto, con la nueva feature: `git push origin develop`

### <label><input type="checkbox">Feature modelado</label>

#### Creamos una nueva rama para modelado

Desde develop (nos aseguramos de tener los últimos cambios):

1. `git checkout develop`
2. `git pull origin develop`

Creamos la nueva rama para la feature de 'modelado':

3. `git checkout -b feature/modelado`

#### 2. Trabajamos sobre la funcionalidad:

a. Instanciamos el modelo

b. Lo entrenamos

c. Hacemos las predicciones sobre el conjunto completo:

d. Lo evaluamos:

              precision    recall  f1-score   support

      Setosa       1.00      1.00      1.00        50
  Versicolor       1.00      1.00      1.00        50
   Virginica       1.00      1.00      1.00        50

    accuracy                           1.00       150
   macro avg       1.00      1.00      1.00       150
weighted avg       1.00      1.00      1.00       150



####  Versionado del trabajo
1. Añadimos los cambios al area de stage: `git add`
2. Guardamos los cambios en el historial: `git commit -m "feat(modelado): añadimos modelado basico con RandomForestClassifier."`
3. Subimos la rama al repo remoto: `git push -u origin feature/modelado`  

#### Integración con develop

1. Nos movemos a la rama develop: `git checkout develop`
2. Verificamos si no hay cambios en el repo remoto: `git pull origin develop`
3. Mergeamos develop con la rama fearure/eda: `git merge feature/modelado`

#### 5. Publicamos los cambios
1. Actualizamos la rama develop del repo remoto, con la nueva feature: `git push origin develop`

## Paso 4: Preparación de Release (Versión Estable)

Crearemos una versión lista para producción con una breve documentación.

#### 1. Creamos una nueva rama para release v1.0

Desde develop (nos aseguramos de tener los últimos cambios):

1. `git checkout develop`
2. `git pull origin develop`

Creamos la nueva rama para 'release/v1.0':
1. `git checkout -b release/v1.0`

#### 2. Trabajamos sobre una breve documentación en archivo `README.md`

In [None]:
with open('README.md', 'w', encoding='utf-8') as f:
    f.write('''
    ''')

#### 3. Versionado del trabajo
1. Añadimos los cambios al area de stage: `git add .`
2. Guardamos los cambios en el historial: `git commit -m "Agregamos documentación en archivo readme.md"`
3. Subimos la rama al repo remoto: `git push origin -u release/v1.0`  

#### 4. Integración con develop

1. Nos movemos a la rama main: `git checkout main`
2. Verificamos si no hay cambios en el repo remoto: `git pull origin main`
3. Mergeamos main con la rama release/v1.0: `git merge release/v1.0`

#### 5. Tageamos la versión de release
1. Le indicamos un tag al ultimo commit, el cual represente la una versión del proyecto: `git tag -a v1.0 -m "Primera versión estable del modelo Iris"`

#### 6. Publicamos los cambios
1. Actualizamos la rama main del repo remoto, con la nueva versión estable:  `git push origin main --tags`

## Final

Hemos implementado un flujo de trabajo completo con GitFlow para un proyecto de machine learning simple. Ideal para proyectos colaborativos y controlados por versiones.