In [1]:
# === CONFIGURACIÓN INICIAL OBLIGATORIA ===
import sys
print("Versión de Python:", sys.version)

import tensorflow as tf
print("GPU disponible:", tf.config.list_physical_devices('GPU'))

!pip install seaborn plotly

import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report
import warnings
warnings.filterwarnings('ignore')

plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("Entorno configurado correctamente en Google Colab")

Versión de Python: 3.11.13 (main, Jun  4 2025, 08:57:29) [GCC 11.4.0]
GPU disponible: []
Entorno configurado correctamente en Google Colab


# 📊 Notebook 1: Fundamentos de NumPy y Pandas

## Objetivos:
- Manipular arrays con NumPy
- Cargar y procesar datos con Pandas
- Exploración básica de datos

## Dataset: Titanic
Analizaremos los datos del Titanic para entender supervivencia de pasajeros.

In [2]:
# === CARGA DE DATOS ===
# Cargar dataset Titanic
titanic = sns.load_dataset('titanic')

print("Información del dataset:")
print(f"Forma del dataset: {titanic.shape}")
print(f"Columnas: {list(titanic.columns)}")

# Mostrar primeras filas
print("\nPrimeras 5 filas:")
titanic.head()

Información del dataset:
Forma del dataset: (891, 15)
Columnas: ['survived', 'pclass', 'sex', 'age', 'sibsp', 'parch', 'fare', 'embarked', 'class', 'who', 'adult_male', 'deck', 'embark_town', 'alive', 'alone']

Primeras 5 filas:


Unnamed: 0,survived,pclass,sex,age,sibsp,parch,fare,embarked,class,who,adult_male,deck,embark_town,alive,alone
0,0,3,male,22.0,1,0,7.25,S,Third,man,True,,Southampton,no,False
1,1,1,female,38.0,1,0,71.2833,C,First,woman,False,C,Cherbourg,yes,False
2,1,3,female,26.0,0,0,7.925,S,Third,woman,False,,Southampton,yes,True
3,1,1,female,35.0,1,0,53.1,S,First,woman,False,C,Southampton,yes,False
4,0,3,male,35.0,0,0,8.05,S,Third,man,True,,Southampton,no,True


In [3]:
# === EJERCICIOS NUMPY ===

# Crear arrays de ejemplo
edades = np.array(titanic['age'].dropna())
tarifas = np.array(titanic['fare'].dropna())

print("Estadísticas con NumPy:")
print(f"Edad promedio: {np.mean(edades):.2f}")
print(f"Edad mediana: {np.median(edades):.2f}")
print(f"Desviación estándar edad: {np.std(edades):.2f}")

print(f"\nTarifa promedio: ${np.mean(tarifas):.2f}")
print(f"Tarifa máxima: ${np.max(tarifas):.2f}")
print(f"Tarifa mínima: ${np.min(tarifas):.2f}")

# Operaciones con arrays
edades_normalizadas = (edades - np.mean(edades)) / np.std(edades)
print(f"\nEdades normalizadas (primeras 10): {edades_normalizadas[:10]}")

Estadísticas con NumPy:
Edad promedio: 29.70
Edad mediana: 28.00
Desviación estándar edad: 14.52

Tarifa promedio: $32.20
Tarifa máxima: $512.33
Tarifa mínima: $0.00

Edades normalizadas (primeras 10): [-0.53037664  0.57183099 -0.25482473  0.36516706  0.36516706  1.67403863
 -1.90813618 -0.18593675 -1.08148046 -1.77036023]


In [4]:
# === EJERCICIOS PANDAS ===

print("Limpieza y transformación de datos:")

# Información del dataset
print("Información general:")
print(titanic.info())

print("\nValores nulos por columna:")
print(titanic.isnull().sum())

# Estadísticas descriptivas
print("\nEstadísticas descriptivas:")
print(titanic.describe())

# Análisis por categorías
print("\nSupervivencia por clase:")
supervivencia_clase = titanic.groupby('class')['survived'].agg(['count', 'sum', 'mean'])
supervivencia_clase.columns = ['Total', 'Supervivientes', 'Tasa_Supervivencia']
print(supervivencia_clase)

print("\nSupervivencia por género:")
supervivencia_genero = titanic.groupby('sex')['survived'].agg(['count', 'sum', 'mean'])
supervivencia_genero.columns = ['Total', 'Supervivientes', 'Tasa_Supervivencia']
print(supervivencia_genero)

Limpieza y transformación de datos:
Información general:
<class 'pandas.core.frame.DataFrame'>
RangeIndex: 891 entries, 0 to 890
Data columns (total 15 columns):
 #   Column       Non-Null Count  Dtype   
---  ------       --------------  -----   
 0   survived     891 non-null    int64   
 1   pclass       891 non-null    int64   
 2   sex          891 non-null    object  
 3   age          714 non-null    float64 
 4   sibsp        891 non-null    int64   
 5   parch        891 non-null    int64   
 6   fare         891 non-null    float64 
 7   embarked     889 non-null    object  
 8   class        891 non-null    category
 9   who          891 non-null    object  
 10  adult_male   891 non-null    bool    
 11  deck         203 non-null    category
 12  embark_town  889 non-null    object  
 13  alive        891 non-null    object  
 14  alone        891 non-null    bool    
dtypes: bool(2), category(2), float64(2), int64(4), object(5)
memory usage: 80.7+ KB
None

Valores nulos po

In [5]:
# =============================================================================
# CELDA FINAL: GUARDAR NOTEBOOK EN GITHUB (VERSIÓN MEJORADA Y SEGURA)
# =============================================================================

import os
import json
import subprocess
from google.colab import drive

# CONFIGURACIÓN - Ajusta estos valores para cada notebook
NOTEBOOK_NAME = "01_Fundamentos_NumPy_Pandas.ipynb"  # Cambia por el nombre actual
COMMIT_MESSAGE = "Actualizar notebook de fundamentos"  # Cambia el mensaje
GITHUB_USERNAME = "LorenaRomero-UEES"
REPO_NAME = "UEES-IA-Semana1-Romero-Mery"

# Token de GitHub - CONFIGURADO DIRECTAMENTE
GITHUB_TOKEN = "[TOKEN_REMOVIDO_POR_SEGURIDAD]11BUTIYKA0JKR8MaahmYPt_i7ZRAKBrMg1O9dS06jDzblFOv9pPywhXQ0YHuJGUKnc3MGQKCV6vOMW7kaR"

def get_github_token():
    """Retorna el token de GitHub configurado"""
    return GITHUB_TOKEN

def mount_drive():
    """Monta Google Drive si no está montado"""
    try:
        if not os.path.exists('/content/drive'):
            print("Montando Google Drive...")
            drive.mount('/content/drive')
        print("EXITO: Google Drive montado correctamente")
        return True
    except Exception as e:
        print(f"ERROR: Error montando Google Drive: {e}")
        return False

def configure_git():
    """Configura Git con credenciales"""
    try:
        # Primero intentar configurar de forma local en el directorio
        os.makedirs('/tmp/git_config', exist_ok=True)
        os.chdir('/tmp/git_config')

        # Inicializar git temporalmente
        subprocess.run(['git', 'init'], check=True, capture_output=True)

        # Configurar usuario
        result1 = subprocess.run(['git', 'config', 'user.email', 'mery.romero@uees.edu.ec'],
                                capture_output=True, text=True)
        result2 = subprocess.run(['git', 'config', 'user.name', 'Mery Romero'],
                                capture_output=True, text=True)

        # Verificar configuración
        email_check = subprocess.run(['git', 'config', 'user.email'],
                                   capture_output=True, text=True)
        name_check = subprocess.run(['git', 'config', 'user.name'],
                                  capture_output=True, text=True)

        if 'mery.romero@uees.edu.ec' in email_check.stdout and 'Mery Romero' in name_check.stdout:
            print("EXITO: Git configurado correctamente")
            return True
        else:
            # Intentar configuración global alternativa
            subprocess.run(['git', 'config', '--global', 'user.email', 'mery.romero@uees.edu.ec'],
                          check=False)
            subprocess.run(['git', 'config', '--global', 'user.name', 'Mery Romero'],
                          check=False)
            print("EXITO: Git configurado (modo alternativo)")
            return True

    except subprocess.CalledProcessError as e:
        print(f"ADVERTENCIA: Error configurando Git globalmente, continuando: {e}")
        # Continuamos de todas formas, Git puede funcionar sin configuración global
        return True
    except Exception as e:
        print(f"ERROR: Error configurando Git: {e}")
        return False

def clean_directory():
    """Limpia y prepara el directorio de trabajo"""
    try:
        if os.path.exists('/content/repo_final'):
            subprocess.run(['rm', '-rf', '/content/repo_final'], check=True)
        print("EXITO: Directorio limpiado")
        return True
    except Exception as e:
        print(f"ERROR: Error limpiando directorio: {e}")
        return False

def clone_repository():
    """Clona el repositorio de GitHub"""
    try:
        token = get_github_token()
        repo_url = f"https://{GITHUB_USERNAME}:{token}@github.com/{GITHUB_USERNAME}/{REPO_NAME}.git"

        # Configurar Git en el directorio del repositorio después de clonar
        result = subprocess.run(['git', 'clone', repo_url, '/content/repo_final'],
                               capture_output=True, text=True, check=True)

        # Cambiar al directorio del repositorio y configurar usuario
        os.chdir('/content/repo_final')
        subprocess.run(['git', 'config', 'user.email', 'mery.romero@uees.edu.ec'], check=False)
        subprocess.run(['git', 'config', 'user.name', 'Mery Romero'], check=False)

        print("EXITO: Repositorio clonado y configurado correctamente")
        return True
    except subprocess.CalledProcessError as e:
        print(f"ERROR: Error clonando repositorio: {e}")
        print(f"STDOUT: {e.stdout}")
        print(f"STDERR: {e.stderr}")
        return False

def clean_notebook_content(content):
    """Limpia el contenido del notebook removiendo tokens sensibles"""
    # Lista de patrones a remover (incluyendo el token actual)
    token = get_github_token()
    sensitive_patterns = [
        token,
        "[TOKEN_REMOVIDO_POR_SEGURIDAD]",
        "[TOKEN_REMOVIDO_POR_SEGURIDAD]",
        "[TOKEN_REMOVIDO_POR_SEGURIDAD]",
        "[TOKEN_REMOVIDO_POR_SEGURIDAD]",
        "[TOKEN_REMOVIDO_POR_SEGURIDAD]",
        "[TOKEN_REMOVIDO_POR_SEGURIDAD]"
    ]

    cleaned_content = content
    for pattern in sensitive_patterns:
        if pattern and pattern in cleaned_content:
            cleaned_content = cleaned_content.replace(pattern, "[TOKEN_REMOVIDO_POR_SEGURIDAD]")

    # Limpieza adicional: remover líneas que contengan tokens
    lines = cleaned_content.split('\n')
    clean_lines = []
    for line in lines:
        # Si la línea contiene algún patrón de token, la reemplazamos
        line_has_token = False
        for pattern in ["[TOKEN_REMOVIDO_POR_SEGURIDAD]", "[TOKEN_REMOVIDO_POR_SEGURIDAD]", "[TOKEN_REMOVIDO_POR_SEGURIDAD]", "[TOKEN_REMOVIDO_POR_SEGURIDAD]", "[TOKEN_REMOVIDO_POR_SEGURIDAD]", "[TOKEN_REMOVIDO_POR_SEGURIDAD]"]:
            if pattern in line:
                line_has_token = True
                break

        if line_has_token:
            # Reemplazar toda la línea si contiene un token
            if "GITHUB_TOKEN" in line:
                clean_lines.append('GITHUB_TOKEN = "[TOKEN_REMOVIDO_POR_SEGURIDAD]"')
            else:
                clean_lines.append("[LINEA_CON_TOKEN_REMOVIDA_POR_SEGURIDAD]")
        else:
            clean_lines.append(line)

    return '\n'.join(clean_lines)

def copy_and_clean_notebook():
    """Copia el notebook desde Drive y lo limpia"""
    try:
        # Rutas
        drive_path = f"/content/drive/MyDrive/Colab Notebooks/{NOTEBOOK_NAME}"
        target_dir = "/content/repo_final/02_Laboratorio/notebooks"
        target_path = f"{target_dir}/{NOTEBOOK_NAME}"

        # Verificar que el notebook existe en Drive
        if not os.path.exists(drive_path):
            print(f"ERROR: No se encontró el notebook en: {drive_path}")
            return False

        # Crear directorio destino
        os.makedirs(target_dir, exist_ok=True)

        # Leer el notebook
        with open(drive_path, 'r', encoding='utf-8') as f:
            content = f.read()

        # Limpiar contenido sensible
        cleaned_content = clean_notebook_content(content)

        # Verificar que el token fue removido completamente
        token = get_github_token()
        if token in cleaned_content:
            print("ADVERTENCIA: Token detectado en contenido después de limpieza")
            # Limpieza adicional más agresiva
            cleaned_content = cleaned_content.replace(token, "[TOKEN_REMOVIDO_POR_SEGURIDAD]")

        # Guardar el notebook limpio
        with open(target_path, 'w', encoding='utf-8') as f:
            f.write(cleaned_content)

        print(f"EXITO: Notebook '{NOTEBOOK_NAME}' copiado y limpiado")
        print("SEGURIDAD: Contenido verificado - tokens removidos")
        return True

    except Exception as e:
        print(f"ERROR: Error copiando notebook: {e}")
        return False

def commit_and_push():
    """Hace commit y push de los cambios"""
    try:
        # Cambiar al directorio del repositorio
        os.chdir('/content/repo_final')

        # Verificar estado
        result = subprocess.run(['git', 'status', '--porcelain'],
                               capture_output=True, text=True, check=True)

        if not result.stdout.strip():
            print("EXITO: No hay cambios para subir")
            return True

        # Verificación final de seguridad antes de subir
        token = get_github_token()
        for root, dirs, files in os.walk('.'):
            for file in files:
                if file.endswith(('.ipynb', '.py', '.md', '.txt')):
                    filepath = os.path.join(root, file)
                    try:
                        with open(filepath, 'r', encoding='utf-8') as f:
                            content = f.read()
                            if token in content:
                                print(f"PELIGRO: Token detectado en {filepath}")
                                print("DETENIENDO PROCESO POR SEGURIDAD")
                                return False
                    except:
                        pass  # Ignorar archivos que no se pueden leer

        print("SEGURIDAD: Verificación final completada - sin tokens detectados")

        # Agregar archivos
        subprocess.run(['git', 'add', '.'], check=True)

        # Commit
        subprocess.run(['git', 'commit', '-m', COMMIT_MESSAGE], check=True)

        # Push
        subprocess.run(['git', 'push', 'origin', 'main'], check=True)

        print("EXITO: Cambios subidos exitosamente a GitHub")
        return True

    except subprocess.CalledProcessError as e:
        print(f"ERROR: Error en commit/push: {e}")
        if e.stderr:
            print(f"STDERR: {e.stderr}")
        return False

def main():
    """Función principal que ejecuta todo el proceso"""
    print("=== INICIANDO PROCESO DE SUBIDA A GITHUB ===")
    print("NOTA: Token configurado directamente en el código")
    print("")

    steps = [
        ("Montando Google Drive", mount_drive),
        ("Configurando Git", configure_git),
        ("Limpiando directorio", clean_directory),
        ("Clonando repositorio", clone_repository),
        ("Copiando y limpiando notebook", copy_and_clean_notebook),
        ("Subiendo cambios", commit_and_push)
    ]

    for step_name, step_function in steps:
        print(f"\n{step_name}...")
        if not step_function():
            print(f"\nERROR: PROCESO FALLIDO en: {step_name}")
            return False

    print(f"\nEXITO: PROCESO COMPLETADO EXITOSAMENTE")
    print(f"Notebook disponible en:")
    print(f"https://github.com/{GITHUB_USERNAME}/{REPO_NAME}/tree/main/02_Laboratorio/notebooks")

    return True

# Ejecutar el proceso
if __name__ == "__main__":
    main()

=== INICIANDO PROCESO DE SUBIDA A GITHUB ===
NOTA: Token configurado directamente en el código


Montando Google Drive...
Montando Google Drive...
Mounted at /content/drive
EXITO: Google Drive montado correctamente

Configurando Git...
EXITO: Git configurado correctamente

Limpiando directorio...
EXITO: Directorio limpiado

Clonando repositorio...
EXITO: Repositorio clonado y configurado correctamente

Copiando y limpiando notebook...
ERROR: No se encontró el notebook en: /content/drive/MyDrive/Colab Notebooks/01_Fundamentos_NumPy_Pandas.ipynb

ERROR: PROCESO FALLIDO en: Copiando y limpiando notebook
