<a href="https://colab.research.google.com/github/financieras/big_data/blob/main/retos/reto_001.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# Reto 1. Gestión de archivos en Google Colab
- Objetivo: Familiarizarse con la interfaz de Colab y la gestión básica de archivos
- Descarga manualmente el dataset `Titanic` desde Kaggle
- Sube el archivo manualmente a Google Colab
- Carga el dataset usando Pandas
- Visualiza las primeras 5 filas con `.head()`
- Monta Google Drive y verifica persistencia

# Resolución del Reto 1

## Paso 1: Descargar el dataset Titanic desde Kaggle
1. Ve a: https://www.kaggle.com/c/titanic/data
2. Haz clic en **"Download"** (necesitarás cuenta de Kaggle)
3. En la carpeta descargada, busca el archivo **`train.csv`**

In [1]:
# 1. Subir archivo manualmente
from google.colab import files
import pandas as pd
import os

print("📤 Subiendo archivo train.csv...")
uploaded = files.upload()

📤 Subiendo archivo train.csv...


Saving train.csv to train.csv


## Paso 2: Subir manualmente a Google Colab
```python
# En una nueva celda de Colab:
from google.colab import files
import pandas as pd

# Esto abrirá el selector de archivos
uploaded = files.upload()
```
**Acciones:**
- Ejecuta la celda
- Selecciona el archivo `train.csv` desde tu computadora
- Espera a que termine la subida

In [2]:
# 2. Cargar y explorar dataset
df = pd.read_csv('train.csv')
print(f"✅ Dataset cargado: {df.shape}")

print("\n🔍 Primeras 5 filas:")
display(df.head())

✅ Dataset cargado: (891, 12)

🔍 Primeras 5 filas:


Unnamed: 0,PassengerId,Survived,Pclass,Name,Sex,Age,SibSp,Parch,Ticket,Fare,Cabin,Embarked
0,1,0,3,"Braund, Mr. Owen Harris",male,22.0,1,0,A/5 21171,7.25,,S
1,2,1,1,"Cumings, Mrs. John Bradley (Florence Briggs Th...",female,38.0,1,0,PC 17599,71.2833,C85,C
2,3,1,3,"Heikkinen, Miss. Laina",female,26.0,0,0,STON/O2. 3101282,7.925,,S
3,4,1,1,"Futrelle, Mrs. Jacques Heath (Lily May Peel)",female,35.0,1,0,113803,53.1,C123,S
4,5,0,3,"Allen, Mr. William Henry",male,35.0,0,0,373450,8.05,,S


## Paso 3: Cargar el dataset con Pandas
```python
# Cargar el dataset
df = pd.read_csv('train.csv')

# Verificar carga exitosa
print("Dataset cargado correctamente")
print(f"Dimensiones: {df.shape}")  # (filas, columnas)
```

In [4]:
# 3. Montar Google Drive para persistencia
print("\n🗂️ Montando Google Drive...")
from google.colab import drive
drive.mount('/content/drive')


🗂️ Montando Google Drive...
Mounted at /content/drive


## Paso 4: Visualizar primeras 5 filas
```python
# Mostrar primeras filas
df.head()
```

In [5]:
# 4. Guardar copia en Drive
drive_path = '/content/drive/MyDrive/curso_data/titanic.csv'
os.makedirs('/content/drive/MyDrive/curso_data', exist_ok=True)
df.to_csv(drive_path, index=False)
print("💾 Copia guardada en Google Drive")

💾 Copia guardada en Google Drive


## Paso 5: Entender la temporalidad de los archivos
```python
# Los archivos subidos manualmente se pierden al cerrar la sesión
print("⚠️  ESTOS ARCHIVOS SE PERDERÁN AL CERRAR COLAB")
```

## Paso 6: Montar Google Drive para persistencia
```python
# Montar Google Drive
from google.colab import drive
drive.mount('/content/drive')

# Crear carpeta para el curso (opcional)
import os
os.makedirs('/content/drive/MyDrive/curso_data', exist_ok=True)
```

## Paso 7: Guardar copia en Drive
```python
# Guardar el dataset en Drive
df.to_csv('/content/drive/MyDrive/curso_data/titanic.csv', index=False)
print("✅ Dataset guardado en Google Drive")
```

## Paso 8: Verificar persistencia
```python
# Cargar desde Drive para verificar
df_drive = pd.read_csv('/content/drive/MyDrive/curso_data/titanic.csv')

# Verificar que son iguales
print("¿Los datos son idénticos?", df.equals(df_drive))
print(f"Dimensiones desde Drive: {df_drive.shape}")
df_drive.head()
```

In [6]:
# 5. Verificar persistencia
df_drive = pd.read_csv(drive_path)
print(f"📊 Verificación - Dimensiones: {df_drive.shape}")
print("🎉 Reto 1 completado exitosamente!")

📊 Verificación - Dimensiones: (891, 12)
🎉 Reto 1 completado exitosamente!
