# **Instalar Librerias**


In [2]:

# Instalar librerías adicionales si es necesario
!pip install seaborn plotly

# Importaciones estándar
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score, classification_report
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización
plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (10, 6)
plt.rcParams['font.size'] = 12

print("Entorno configurado correctamente en Google Colab")




Entorno configurado correctamente en Google Colab


# Verificar que estamos en Google Collab


In [3]:
# Verificar si estamos en Google Colab
try:
    import google.colab
    IN_COLAB = True
    print(" Ejecutándose en Google Colab")
except ImportError:
    IN_COLAB = False
    print(" No está en Google Colab")

# Verificar recursos disponibles en Colab
if IN_COLAB:
    # Verificar GPU disponible
    import tensorflow as tf
    print(" Verificando recursos de hardware:")
    print(f"   - GPUs disponibles: {len(tf.config.list_physical_devices('GPU'))}")

    if len(tf.config.list_physical_devices('GPU')) > 0:
        print("   - Tipo GPU:", tf.config.list_physical_devices('GPU')[0])
        print("    GPU activada - Ideal para Deep Learning")
    else:
        print("     Solo CPU disponible - Suficiente para esta práctica")

    # Verificar RAM disponible
    import psutil
    ram_gb = round(psutil.virtual_memory().total / (1024**3), 1)
    print(f"   - RAM disponible: {ram_gb} GB")
    print(f"   - Almacenamiento temporal: ~100GB")

# Instalar librerías adicionales específicas para Colab
if IN_COLAB:
    print("\n Instalando librerías adicionales en Colab...")
    !pip install -q plotly kaleido  # Para gráficos interactivos
    !pip install -q seaborn --upgrade  # Asegurar última versión
    print(" Instalación completada")

 Ejecutándose en Google Colab
 Verificando recursos de hardware:
   - GPUs disponibles: 0
     Solo CPU disponible - Suficiente para esta práctica
   - RAM disponible: 12.7 GB
   - Almacenamiento temporal: ~100GB

 Instalando librerías adicionales en Colab...
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m69.0/69.0 kB[0m [31m3.5 MB/s[0m eta [36m0:00:00[0m
[2K   [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m49.3/49.3 kB[0m [31m3.8 MB/s[0m eta [36m0:00:00[0m
[?25h Instalación completada


# Importaciones optimizadas


In [4]:
# Importaciones optimizadas para Colab
import numpy as np
import pandas as pd
import matplotlib.pyplot as plt
import seaborn as sns
import plotly.express as px
import plotly.graph_objects as go
from plotly.subplots import make_subplots

# Configuración específica para Colab
import warnings
warnings.filterwarnings('ignore')

# Configuración de visualización optimizada para Colab
plt.style.use('default')
sns.set_palette("husl")
plt.rcParams['figure.figsize'] = (12, 8)  # Más grande para pantallas Colab
plt.rcParams['font.size'] = 12
plt.rcParams['figure.dpi'] = 100  # Mejor resolución en Colab

# Configurar plotly para Colab
import plotly.io as pio
pio.renderers.default = 'colab'  # Renderizado específico para Colab

print("\n Configuración específica para Google Colab completada")
print("=" * 60)



 Configuración específica para Google Colab completada


# Funciones Especificas para Collab

In [5]:
# FUNCIONES ESPECÍFICAS PARA COLAB
# ========================================================================

def conectar_google_drive():
    """Función para conectar con Google Drive en Colab"""
    if IN_COLAB:
        from google.colab import drive
        try:
            drive.mount('/content/drive')
            print(" Google Drive conectado exitosamente")
            return True
        except Exception as e:
            print(f" Error conectando Google Drive: {e}")
            return False
    else:
        print(" Esta función solo funciona en Google Colab")
        return False


def mostrar_grafico_interactivo(fig):
    """Mostrar gráficos Plotly optimizados para Colab"""
    if IN_COLAB:
        fig.show()
    else:
        fig.show(renderer='browser')


# Cargar Datos

In [6]:
# CARGAR DATOS ESPECÍFICO PARA COLAB
# ========================================================================

print("\n CARGANDO DATOS EN GOOGLE COLAB")
print("=" * 40)

# Opción 1: Datasets integrados en Colab (más rápido)
print("Método 1: Datasets integrados en Seaborn")
titanic = sns.load_dataset('titanic')


print(f" Titanic dataset: {titanic.shape}")



 CARGANDO DATOS EN GOOGLE COLAB
Método 1: Datasets integrados en Seaborn
 Titanic dataset: (891, 15)


In [7]:
titanic.columns

Index(['survived', 'pclass', 'sex', 'age', 'sibsp', 'parch', 'fare',
       'embarked', 'class', 'who', 'adult_male', 'deck', 'embark_town',
       'alive', 'alone'],
      dtype='object')

**Analisis Exploratorio de Datos (EDA)**
## Análisis de la relación entre 'survived' y otras variables categóricas

###
Visualizar la relación entre la columna 'survived' y las variables categóricas 'embarked', 'who', 'adult_male', 'alone' y 'class' utilizando gráficos de barras para mostrar las tasas de supervivencia por categoría.


In [8]:
categorical_cols = ['embarked', 'who', 'adult_male', 'alone', 'class']

for col in categorical_cols:
    # Agrupar por la variable categórica y 'survived', calcular la media de 'survived'
    survival_rate_by_category = titanic.groupby([col, 'survived'])['survived'].count().unstack(fill_value=0)
    survival_rate_by_category['total'] = survival_rate_by_category.sum(axis=1)
    survival_rate_by_category['survival_rate'] = survival_rate_by_category[1] / survival_rate_by_category['total']
    survival_rate_by_category = survival_rate_by_category.reset_index()

    # Crear el gráfico de barras interactivo con Plotly
    fig = px.bar(
        survival_rate_by_category,
        x=col,
        y='survival_rate',
        title=f'Tasa de Supervivencia por {col.replace("_", " ").title()}',
        labels={
            col: col.replace("_", " ").title(),
            'survival_rate': 'Tasa de Supervivencia'
        },
        color=col, # Colorear por categoría para mayor claridad
        text='survival_rate'
    )

    fig.update_traces(texttemplate='%{text:.2f}', textposition='outside')
    fig.update_layout(uniformtext_minsize=8, uniformtext_mode='hide')
    fig.show()


## Generación de conclusiones del EDA del Titanic

###
Una vez analizadas todas las variables clave, se genera un resumen consolidado con las principales conclusiones obtenidas del análisis exploratorio de datos


## Resumen:
*   La relación entre las tasas de supervivencia y las variables categóricas «embarcado», «quién», «hombre adulto», «solo» y «clase» se visualizó con éxito mediante gráficos de barras interactivos.
*    Para cada variable categórica, se calcularon las tasas de supervivencia para cada categoría, lo que permitió comparar directamente cómo los diferentes grupos dentro de estas variables influían en los resultados de supervivencia.


### Conclusiones
*  A partir de estas visualizaciones, se podrían realizar análisis estadísticos adicionales (por ejemplo, pruebas de chi cuadrado) para cuantificar la importancia de las relaciones observadas entre estas variables categóricas y la supervivencia.
*   Las variables categóricas identificadas que muestran claras diferencias en las tasas de supervivencia podrían ser características valiosas para desarrollar modelos predictivos de supervivencia en accidentes futuros.


#**Guardar notebooks en GitHub desde Collab:**

In [None]:
# En cada notebook, añadir celda final para guardar en GitHub
# 1. Conectar Colab con GitHub
from google.colab import auth
auth.authenticate_user()

# 2. Configurar Git
!git config --global user.email "steeven.pineda7@gmail.com"
!git config --global user.name "David Pineda"

# 3. Clonar tu repositorio
!git clone https://github.com/tu-usuario/UEES-IA-Semana1-DavidPineda.git
%cd UEES-IA-Semana1-DavidPineda

# 4. Copiar notebook al repositorio
!cp /content/01_Fundamentos_NumPy_Pandas.ipynb ./02_Laboratorio/notebooks/

# 5. Hacer commit y push
!git add .
!git commit -m "Notebook de fundamentos"
!git push origin main



In [None]:
# Función para guardar automáticamente en GitHub
def save_to_github(notebook_name, commit_message="Actualizar notebook"):
    """
    Guarda el notebook actual en GitHub
    """
    !cp /content/{notebook_name} ./02_Laboratorio/notebooks/
    !git add .
    !git commit -m "{commit_message}"
    !git push origin main
    print(f" {notebook_name} guardado en GitHub")

# Usar al final de cada sesión de trabajo
save_to_github("01_Fundamentos_NumPy_Pandas.ipynb")