In [None]:
import pandas as pd
from google.colab import drive
import numpy as np
import os

# Montar Google Drive
drive.mount('/content/drive')

# Verificar las rutas disponibles
folder_path = '/content/drive/My Drive/'
files = os.listdir(folder_path)
print("Archivos en My Drive:", files)

# Asegúrate de que el archivo esté en la carpeta correcta
archivo = 'Titanic-Dataset (1).csv'  # Aquí reemplazado con el nombre del archivo
ruta_archivo = f'/content/drive/My Drive/{archivo}'

# Intentar cargar el archivo
try:
    # Cargar el dataset
    df = pd.read_csv(ruta_archivo)
    print("\nPrimeras filas del dataset:")
    print(df.head())

    # Verificar las columnas del dataset
    print("\nColumnas del dataset:")
    print(df.columns)

    # ------------------------------------------------------
    # Ejercicio 1: Análisis de supervivencia por sexo y clase del pasajero
    if 'Sex' in df.columns:
        supervivencia = df.groupby(['Sex', 'Pclass'])['Survived'].mean()
    else:
        raise KeyError("Columna 'Sex' no encontrada en el DataFrame. Verifica los nombres de las columnas.")

    print("\nProporción de supervivencia por sexo y clase:\n", supervivencia)

    tasa_mas_alta = supervivencia.idxmax(), supervivencia.max()
    tasa_mas_baja = supervivencia.idxmin(), supervivencia.min()

    print("\nTasa más alta de supervivencia:\n", tasa_mas_alta)
    print("\nTasa más baja de supervivencia:\n", tasa_mas_baja)

    # ------------------------------------------------------
    # Ejercicio 2: Identificación de familias grandes
    df['FamilySize'] = df['SibSp'] + df['Parch']  # Calcular el tamaño de la familia
    familias_grandes = df[df['FamilySize'] > 3]  # Filtrar familias grandes

    num_familias_grandes = len(familias_grandes)  # Número de familias grandes
    proporcion_supervivencia_familias = familias_grandes['Survived'].mean()  # Proporción de supervivencia en familias grandes

    print("\nNúmero de pasajeros en familias grandes:", num_familias_grandes)
    print("\nProporción de supervivencia en familias grandes:", proporcion_supervivencia_familias)

    # ------------------------------------------------------
    # Ejercicio 3: Segmentación por grupos de edad
    df['Age'] = df['Age'].fillna(df['Age'].median())  # Rellenar valores nulos en 'Age' con la mediana

    df['AgeGroup'] = df['Age'].apply(lambda x: 'Menor de Edad' if x < 18 else 'Mayor de Edad')

    print("\nCantidad de pasajeros por grupo de edad:")
    print(df['AgeGroup'].value_counts())

    # ------------------------------------------------------
    # Ejercicio 4: Comparación de promedios calculados con NumPy y Pandas
    prom_edad_numpy = np.nanmean(df['Age'])
    prom_fare_numpy = np.nanmean(df['Fare'])

    prom_edad_pandas = df['Age'].mean()
    prom_fare_pandas = df['Fare'].mean()

    print("\nPromedio de Age con NumPy:", prom_edad_numpy)
    print("Promedio de Age con Pandas:", prom_edad_pandas)

    print("\nPromedio de Fare con NumPy:", prom_fare_numpy)
    print("Promedio de Fare con Pandas:", prom_fare_pandas)

    # ------------------------------------------------------
    # Ejercicio 5: Creación de intervalos de clase usando NumPy y Pandas
    df['FareBin'] = pd.cut(df['Fare'], bins=np.linspace(df['Fare'].min(), df['Fare'].max(), 6), include_lowest=True)

    print("\nNúmero de pasajeros por intervalo de tarifa:")
    print(df['FareBin'].value_counts())

    # Corregido con el argumento observed=False para evitar la advertencia
    print("\nProporción de supervivencia por intervalo de tarifa:")
    print(df.groupby('FareBin', observed=False)['Survived'].mean())

except FileNotFoundError:
    print(f"Error: No se encontró el archivo en la ruta: {ruta_archivo}")
except KeyError as e:
    print(f"Error de columna: {e}")
except Exception as e:
    print(f"Error inesperado: {e}")


Drive already mounted at /content/drive; to attempt to forcibly remount, call drive.mount("/content/drive", force_remount=True).
Archivos en My Drive: ['SIL 2.ARD', 'CR KW CAMP.gdoc', 'REC PERS EDGAR.docx', 'Copia de REC PERS EDGAR.docx', 'Copia de Copia de REC PERS EDGAR.docx', 'CONTRATO_JARDINES_[1].pdf', 'CONTRATO_JARDINES_[1].gdoc', 'CONTRATO_JARDINES_[1] (1)_copia.pdf', 'DOCTOS ORVE CCM', 'Untitled document (1).gdoc', 'estado_de_cuenta_.pdf', 'GABRIELAGÓMEZ IBARRA.jpg', 'Untitled document.gdoc', 'Colab Notebooks', 'Untitled0.ipynb', 'Titanic-Dataset (1).csv']

Primeras filas del dataset:
   PassengerId  Survived  Pclass  \
0            1         0       3   
1            2         1       1   
2            3         1       3   
3            4         1       1   
4            5         0       3   

                                                Name     Sex   Age  SibSp  \
0                            Braund, Mr. Owen Harris    male  22.0      1   
1  Cumings, Mrs. John Bradle