#Instalar Librerias

In [None]:
# Instalar librerías adicionales si es necesario
!pip install seaborn plotly

# Importaciones estándar
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización
plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("Entorno configurado correctamente en Google Colab")

Entorno configurado correctamente en Google Colab


#Verificar que estamos en Google Collab

In [None]:
# Verificar si estamos en Google Colab
try:
    import google.colab
    IN_COLAB = True
    print(" Ejecutándose en Google Colab")
except ImportError:
    IN_COLAB = False
    print(" No está en Google Colab")

# Verificar recursos disponibles en Colab
if IN_COLAB:
    # Verificar GPU disponible
    import tensorflow as tf
    print(" Verificando recursos de hardware:")
    print(f"   - GPUs disponibles: {len(tf.config.list_physical_devices('GPU'))}")

    if len(tf.config.list_physical_devices('GPU')) > 0:
        print("   - Tipo GPU:", tf.config.list_physical_devices('GPU')[0])
        print("    GPU activada - Ideal para Deep Learning")
    else:
        print("     Solo CPU disponible - Suficiente para esta práctica")

    # Verificar RAM disponible
    import psutil
    ram_gb = round(psutil.virtual_memory().total / (1024**3), 1)
    print(f"   - RAM disponible: {ram_gb} GB")
    print(f"   - Almacenamiento temporal: ~100GB")

# Instalar librerías adicionales específicas para Colab
if IN_COLAB:
    print("\n Instalando librerías adicionales en Colab...")
    !pip install -q plotly kaleido  # Para gráficos interactivos
    !pip install -q seaborn --upgrade  # Asegurar última versión
    print(" Instalación completada")

 Ejecutándose en Google Colab
 Verificando recursos de hardware:
   - GPUs disponibles: 0
     Solo CPU disponible - Suficiente para esta práctica
   - RAM disponible: 12.7 GB
   - Almacenamiento temporal: ~100GB

 Instalando librerías adicionales en Colab...
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m69.0/69.0 kB[0m [31m3.3 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m49.3/49.3 kB[0m [31m2.7 MB/s[0m eta [36m0:00:00[0m
[?25h Instalación completada


#Importaciones optimizadas

In [None]:
# Importaciones optimizadas para Colab
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Configuración específica para Colab
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización optimizada para Colab
plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (12, 8)  # Más grande para pantallas Colab
plt.rcParams['font.size'] = 12
plt.rcParams['figure.dpi'] = 100  # Mejor resolución en Colab

# Configurar plotly para Colab
import plotly.io as pio
pio.renderers.default = 'colab'  # Renderizado específico para Colab

print("\n Configuración específica para Google Colab completada")
print("=" * 60)


 Configuración específica para Google Colab completada


#Funciones Especificas para Collab

In [None]:
# FUNCIONES ESPECÍFICAS PARA COLAB
# ========================================================================

def conectar_google_drive():
    """Función para conectar con Google Drive en Colab"""
    if IN_COLAB:
        from google.colab import drive
        try:
            drive.mount('/content/drive')
            print(" Google Drive conectado exitosamente")
            return True
        except Exception as e:
            print(f" Error conectando Google Drive: {e}")
            return False
    else:
        print(" Esta función solo funciona en Google Colab")
        return False


def mostrar_grafico_interactivo(fig):
    """Mostrar gráficos Plotly optimizados para Colab"""
    if IN_COLAB:
        fig.show()
    else:
        fig.show(renderer='browser')


#Cargar Datos

In [None]:
#Crear datasets sintéticos más grandes (aprovechando RAM de Colab)
print("\nMétodo 3: Datasets sintéticos grandes")
np.random.seed(42)

# Dataset más grande para aprovechar recursos de Colab
n_samples = 10000  # Más grande que en entorno local
n_features = 20

# Dataset de empleados expandido
empleados_data = {
    'id': range(1, n_samples + 1),
    'edad': np.random.randint(22, 65, n_samples),
    'salario': np.random.lognormal(10.8, 0.5, n_samples),  # Distribución más realista
    'departamento': np.random.choice(['IT', 'Marketing', 'Ventas', 'RRHH', 'Finanzas',
                                     'Operaciones', 'Legal', 'Calidad'], n_samples),
    'años_experiencia': np.random.randint(0, 25, n_samples),
    'satisfaccion': np.random.beta(2, 5, n_samples) * 10,  # Distribución sesgada
    'educacion': np.random.choice(['Bachiller', 'Técnico', 'Universitario', 'Posgrado'],
                                 n_samples, p=[0.1, 0.2, 0.5, 0.2]),
    'ubicacion': np.random.choice(['Quito', 'Guayaquil', 'Cuenca', 'Ambato', 'Machala'],
                                 n_samples, p=[0.4, 0.35, 0.15, 0.05, 0.05]),
    'genero': np.random.choice(['M', 'F'], n_samples, p=[0.52, 0.48]),
    'tiene_certificaciones': np.random.choice([True, False], n_samples, p=[0.3, 0.7])
}

# Agregar algunas correlaciones realistas
for i in range(n_samples):
    # Correlación experiencia-salario
    exp_bonus = empleados_data['años_experiencia'][i] * 1500
    empleados_data['salario'][i] += exp_bonus

    # Correlación educación-salario
    edu_multiplier = {'Bachiller': 0.8, 'Técnico': 0.9, 'Universitario': 1.0, 'Posgrado': 1.3}
    empleados_data['salario'][i] *= edu_multiplier[empleados_data['educacion'][i]]

df_empleados_grande = pd.DataFrame(empleados_data)
print(f" Dataset de empleados expandido: {df_empleados_grande.shape}")



Método 3: Datasets sintéticos grandes
 Dataset de empleados expandido: (10000, 10)


#Visualizaciones con Plotly

In [None]:
print("\n VISUALIZACIONES INTERACTIVAS EN COLAB")
print("=" * 40)

# Aprovechar Plotly para gráficos interactivos
print("Creando visualizaciones interactivas con Plotly...")

# Gráfico interactivo 3D
fig_3d = px.scatter_3d(
    df_empleados_grande,
    x='edad',
    y='años_experiencia',
    z='salario',
    color='departamento',
    size='satisfaccion',
    title='Análisis 3D: Edad vs Experiencia vs Salario',
    hover_data=['educacion', 'ubicacion']
)

fig_3d.update_layout(height=600)
print(" Gráfico 3D interactivo creado")
mostrar_grafico_interactivo(fig_3d)

# Dashboard interactivo
fig_dashboard = make_subplots(
    rows=2, cols=2,
    subplot_titles=('Distribución Salarios', 'Salarios por Departamento',
                   'Correlación Edad-Experiencia', 'Satisfacción por Educación'),
    specs=[[{"type": "histogram"}, {"type": "box"}],
           [{"type": "scatter"}, {"type": "bar"}]]
)

# Histograma
fig_dashboard.add_trace(
    go.Histogram(x=df_empleados_grande['salario'], name='Salarios'),
    row=1, col=1
)

# Box plot
for dept in df_empleados_grande['departamento'].unique():
    dept_data = df_empleados_grande[df_empleados_grande['departamento'] == dept]
    fig_dashboard.add_trace(
        go.Box(y=dept_data['salario'], name=dept),
        row=1, col=2
    )

# Scatter plot
fig_dashboard.add_trace(
    go.Scatter(x=df_empleados_grande['edad'],
              y=df_empleados_grande['años_experiencia'],
              mode='markers',
              name='Edad vs Experiencia'),
    row=2, col=1
)

# Bar plot
satisfaccion_edu = df_empleados_grande.groupby('educacion')['satisfaccion'].mean()
fig_dashboard.add_trace(
    go.Bar(x=satisfaccion_edu.index, y=satisfaccion_edu.values,
           name='Satisfacción'),
    row=2, col=2
)

fig_dashboard.update_layout(height=800, title_text="Dashboard Interactivo de Análisis")
print(" Dashboard interactivo creado")
mostrar_grafico_interactivo(fig_dashboard)


 VISUALIZACIONES INTERACTIVAS EN COLAB
Creando visualizaciones interactivas con Plotly...
 Gráfico 3D interactivo creado


 Dashboard interactivo creado


#Guardar notebook en GitHub desde Collab:

In [None]:
from google.colab import files

# 1. Entrar al directorio
%cd UEES-IA-Semana1-DavidPineda

# 2. Subir uno o varios notebooks
print("📤 Sube tus archivos .ipynb (puedes seleccionar varios):")
uploaded = files.upload()

# 3. Mover todos los archivos al repositorio
for filename in uploaded.keys():
    !mv /content/{filename} ./02_Laboratorio/notebooks/{filename}
    print(f"✓ Movido: {filename}")

# 4. Actualizar GitHub
!git add .
!git commit -m "Añadir notebooks"
!git push https://steevenpineda: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@github.com/steevenpineda/UEES-IA-Semana1-DavidPineda.git main

print("\n✅ ¡Todos los notebooks subidos exitosamente!")