In [8]:
import pandas as pd
from sklearn.linear_model import Perceptron 
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.metrics import accuracy_score
from sklearn.ensemble import AdaBoostClassifier

In [3]:
koi = pd.read_csv(
    "./data/koi.csv",
    comment='#',
    engine='python'
)

In [4]:
features_of_interest = [
    # Probabilidad / etiqueta
    "koi_score",          # Probabilidad de que un candidato sea un exoplaneta real
    "koi_disposition",    # Estado del candidato: CONFIRMED / CANDIDATE / FALSE POSITIVE
    
    # Atributos orbitales
    "koi_period",         # Período orbital del candidato en días
    "koi_time0bk",        # Época de tránsito (tiempo central)
    "koi_time0",          # Otra referencia temporal del tránsito
    "koi_eccen",          # Excentricidad orbital
    "koi_period_err1",    # Incertidumbre superior del período orbital
    "koi_period_err2",    # Incertidumbre inferior del período orbital
    
    # Atributos del tránsito
    "koi_duration",       # Duración del tránsito en horas
    "koi_depth",          # Profundidad del tránsito (ppm)
    "koi_impact",         # Parámetro de impacto del tránsito
    "koi_prad",           # Radio estimado del planeta en radios terrestres
    "koi_insol",          # Insolación recibida por el planeta (flujo terrestre)
    "koi_teq",            # Temperatura de equilibrio estimada del planeta (K)
    "koi_model_snr",      # Relación señal/ruido del modelo de tránsito
    
    # Atributos del sistema estelar
    "koi_srad",           # Radio estelar (en radios solares)
    "koi_smass",          # Masa estelar (en masas solares)
    "koi_steff",          # Temperatura efectiva de la estrella (K)
    "koi_smet",           # Metalicidad de la estrella ([Fe/H])
    "koi_slogg"           # Gravedad superficial de la estrella (cgs)
]
koi = koi[features_of_interest]
koi = koi.fillna(koi.mean(numeric_only=True))
koi.columns

Index(['koi_score', 'koi_disposition', 'koi_period', 'koi_time0bk',
       'koi_time0', 'koi_eccen', 'koi_period_err1', 'koi_period_err2',
       'koi_duration', 'koi_depth', 'koi_impact', 'koi_prad', 'koi_insol',
       'koi_teq', 'koi_model_snr', 'koi_srad', 'koi_smass', 'koi_steff',
       'koi_smet', 'koi_slogg'],
      dtype='object')

In [6]:
x_train = koi.drop(columns=["koi_disposition"])
y_train = koi["koi_disposition"]
X_train, X_test, y_train, y_test = train_test_split(x_train, y_train, test_size=0.2, random_state=40)
scaler = StandardScaler()
X_train_scaled = scaler.fit_transform(X_train)
X_test_scaled = scaler.transform(X_test)

In [None]:
# 3. Entrenar Perceptron (Regresión Logística básica)
perceptron = Perceptron(max_iter=1000, random_state=40)
perceptron.fit(X_train_scaled, y_train)

y_pred_perc = perceptron.predict(X_test_scaled)
print("Accuracy Perceptron:", accuracy_score(y_test, y_pred_perc))

Accuracy Perceptron: 0.6152639832723471


In [13]:
adaboost = AdaBoostClassifier(n_estimators=1000, random_state=0)
adaboost.fit(X_train_scaled, y_train)

y_pred_ada = adaboost.predict(X_test_scaled)
accuracy_score(y_test, y_pred_ada)

0.8243596445373759