In [None]:
import pandas as pd
import numpy as np
from catboost import CatBoostClassifier

# 1. Cargar datos frescos (Sin tocar nada manual todav√≠a)
df_train = pd.read_csv('train.csv')
df_test = pd.read_csv('test.csv')

# 2. Limpieza "Lazy" (Perezosa pero efectiva)
# CatBoost maneja nulos, pero prefiere que le digas expl√≠citamente si falta texto
# Rellenamos nulos num√©ricos con -999 (el modelo aprende que -999 es "dato faltante")
df_train = df_train.fillna(-999)
df_test = df_test.fillna(-999)

# 3. Definimos X e y
features = ['Pclass', 'Sex', 'Age', 'SibSp', 'Parch', 'Fare', 'Embarked']
X = df_train[features]
y = df_train['Survived']
X_test_kaggle = df_test[features]

# 4. Decirle cu√°les son columnas de Texto (Categorical Features)
# Pclass lo tratamos como n√∫mero, pero Sex y Embarked son texto
cat_features_names = ['Sex', 'Embarked']

# 5. ENTRENAR (Modo Clasificaci√≥n)
print("Entrenando el Gato en el Titanic... üê±üö¢")
modelo = CatBoostClassifier(
    iterations=500,        # No necesitamos tantos como en las casas (son pocos datos)
    learning_rate=0.05,
    depth=6,
    eval_metric='Accuracy', # Queremos maximizar la precisi√≥n
    verbose=100
)

modelo.fit(X, y, cat_features=cat_features_names)

# 6. Predecir
predicciones = modelo.predict(X_test_kaggle)

# 7. Guardar
submission = pd.DataFrame({
    'PassengerId': df_test['PassengerId'],
    'Survived': predicciones
})

submission.to_csv('titanic_catboost.csv', index=False)
print("¬°Archivo 'titanic_catboost.csv' listo!")

Entrenando el Gato en el Titanic... üê±üö¢
0:	learn: 0.7867565	total: 20.5ms	remaining: 20.5s
100:	learn: 0.8675645	total: 2.38s	remaining: 21.2s
200:	learn: 0.9012346	total: 4.72s	remaining: 18.8s
300:	learn: 0.9236813	total: 7.21s	remaining: 16.7s
400:	learn: 0.9393939	total: 9.82s	remaining: 14.7s
500:	learn: 0.9472503	total: 12.5s	remaining: 12.4s
600:	learn: 0.9517396	total: 15s	remaining: 9.96s
700:	learn: 0.9618406	total: 17.4s	remaining: 7.41s
800:	learn: 0.9685746	total: 19.7s	remaining: 4.88s
900:	learn: 0.9741863	total: 22.1s	remaining: 2.43s
999:	learn: 0.9775533	total: 24.4s	remaining: 0us
¬°Archivo 'titanic_catboost.csv' listo!
