<a href="https://colab.research.google.com/github/joramirez-analista-datos/portafolio/blob/main/Tutorial_GitHub_Colab.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# üöÄ Tutorial: Usar **GitHub** con **Google Colab**
**Objetivo:** Conectar Colab con GitHub para abrir, versionar y colaborar con notebooks.

> Sube este archivo a tu repositorio. Est√° listo para ejecutarse en Colab ‚úÖ

## ‚úÖ Requisitos previos
1. Cuenta en **GitHub** ‚Üí https://github.com  
2. Cuenta de **Google** ‚Üí https://colab.research.google.com  
3. Un repositorio (p√∫blico o privado). Ej.: `analisis-datos-junior`

## 1) Abrir un notebook desde GitHub (m√©todo visual)
1. Abre Colab ‚ûú **Archivo ‚Üí Abrir cuaderno ‚Üí pesta√±a "GitHub"**  
2. Pega la URL de tu repo, p. ej.: `https://github.com/TU_USUARIO/analisis-datos-junior`  
3. Selecciona el `.ipynb` que quieras abrir.  
4. Si el repo es **privado**, inicia sesi√≥n en GitHub y autoriza a Colab.

## 2) Guardar cambios en GitHub (m√©todo visual)
Al terminar de editar en Colab:

- Ve a **Archivo ‚Üí Guardar una copia en GitHub**
- Escribe un **mensaje de commit** claro
- Elige **repositorio** y **rama** (por defecto, `main`)
- Presiona **Aceptar** ‚úÖ

## 3) Trabajar con Git por c√≥digo (modo pro)
Este m√©todo permite **clonar, editar, confirmar y empujar cambios** desde Colab usando comandos `git`.

In [None]:
#@title üîß Configurar tu identidad de Git (ejecuta una sola vez por sesi√≥n)
USUARIO_GIT = "Tu Nombre"  #@param {type:"string"}
EMAIL_GIT = "tu_email@ejemplo.com"  #@param {type:"string"}

!git config --global user.name "$USUARIO_GIT"
!git config --global user.email "$EMAIL_GIT"

!git config --global --get user.name
!git config --global --get user.email


In [None]:
#@title ‚¨áÔ∏è Clonar tu repositorio (rellena con tu URL)
URL_REPO = "https://github.com/TU_USUARIO/analisis-datos-junior.git"  #@param {type:"string"}

# Si tu repo es p√∫blico, esto funciona directo.
# Si es privado, usa la celda de "push" con token (m√°s abajo) o monta tu Drive.
!git clone "$URL_REPO"


In [None]:
#@title üìÅ Entrar a la carpeta del repo
%cd /content/analisis-datos-junior
!pwd
!ls -la | head -n 50


### 3.1 Ejemplo pr√°ctico con pandas
Crearemos un mini an√°lisis y lo guardaremos en el repo.

In [None]:
#@title üêº Mini an√°lisis con pandas
import pandas as pd

datos = {'Producto': ['A','B','C','D'], 'Ventas':[12, 8, 15, 5]}
df = pd.DataFrame(datos)
display(df)
df.describe()


In [None]:
#@title üíæ Guardar el resultado como CSV dentro del repo
OUTPUT = "data/ventas_resumen.csv"  #@param {type:"string"}
import os
os.makedirs(os.path.dirname(OUTPUT), exist_ok=True)
df.to_csv(OUTPUT, index=False)
print("Archivo guardado en:", OUTPUT)
!ls -la data | head -n 20


### 3.2 Confirmar y empujar cambios (repos p√∫blicos)
Si tu repositorio es **p√∫blico**, puedes `push` directo con HTTPS.  
Si es **privado**, usa la celda siguiente con **token personal**.

In [None]:
#@title ‚úÖ add + commit + push (HTTPS p√∫blico)
MENSAJE_COMMIT = "Agrega CSV de ventas desde Colab"  #@param {type:"string"}

!git status
!git add .
!git commit -m "$MENSAJE_COMMIT" || echo "Nada que commitear"
!git branch -M main
!git push origin main


### 3.3 Empujar cambios a un repo **privado** usando **token**
1. Crea un **Personal Access Token** en GitHub (Settings ‚Üí Developer settings ‚Üí Personal access tokens).  
2. Permisos: **repo** (contenido).  
3. Usa **esta celda** con variables y elimina la celda al terminar.

In [None]:
#@title üîê Push con token (repos privados) ‚Äî usa variables y borra la celda al terminar
from getpass import getpass

usuario = input("Usuario de GitHub: ").strip()
token = getpass("Token de acceso (no se muestra): ").strip()
repo = input("owner/repo (ej. TU_USUARIO/analisis-datos-junior): ").strip()
rama = "main"

# Reescribimos el remoto para usar token de forma temporal
!git remote set-url origin https://{usuario}:{token}@github.com/{repo}.git

# Empujamos
!git push origin {rama}

# Por seguridad, restauramos el remoto a la URL sin token (si el repo es p√∫blico)
!git remote set-url origin https://github.com/{repo}.git
print("Listo. Revoca tokens que ya no uses si fue temporal.")


## 4) Agregar un `.gitignore` recomendado para notebooks
Evita subir archivos temporales o pesados. Ejecuta esta celda una vez.

In [None]:
#@title üìù Crear .gitignore para proyectos con notebooks
gitignore = (
    "# Python\n"
    "__pycache__/\n"
    "*.py[cod]\n"
    "*.egg-info/\n\n"
    "# Jupyter/Colab\n"
    ".ipynb_checkpoints/\n"
    "*.ipynb_convert*\n"
    "*.nbconvert.ipynb\n\n"
    "# Datos grandes (ejemplos)\n"
    "data/*.zip\n"
    "data/*.parquet\n"
    "data/*.csv\n\n"
    "# Sistemas\n"
    ".DS_Store\n"
    "Thumbs.db\n"
)

with open(".gitignore", "w", encoding="utf-8") as f:
    f.write(gitignore)
!git add .gitignore
!git commit -m "Agrega .gitignore base para Colab + GitHub" || echo "Nada que commitear"


## 5) Guardar una copia en Google Drive (opcional)
√ötil para persistir archivos entre sesiones sin depender de `git`.

In [None]:
#@title ‚ñ∂Ô∏è Montar Drive y copiar carpeta del repo
from google.colab import drive
drive.mount("/content/drive")

DESTINO = "/content/drive/MyDrive/colab_backup_analisis_datos_junior"  #@param {type:"string"}
!mkdir -p "$DESTINO"
!cp -r /content/analisis-datos-junior/* "$DESTINO"/
!echo "Copia realizada en: $DESTINO"


## 6) Buenas pr√°cticas
- Mensajes de commit claros: `Limpia nulos en ventas.csv`  
- Estructura sugerida del repo:

```
analisis-datos-junior/
 ‚î£ data/
 ‚î£ notebooks/
 ‚î£ scripts/
 ‚îó README.md
```
- Evita subir archivos > 50 MB a GitHub.  
- Usa ramas para nuevas funcionalidades: `git checkout -b feature/limpieza-null`

## 7) Recursos
- Documentaci√≥n de Colab para abrir notebooks desde GitHub.  
- Git Cheat Sheet (atajos de comandos).  
- Ayuda de Git: `git help <comando>`