In [None]:
# 逻辑回归分类模板（自动处理无用特征）
import pandas as pd
from sklearn.linear_model import LogisticRegression
from sklearn.preprocessing import StandardScaler

# 1. 加载数据
train = pd.read_csv("train.csv")  # 训练集
test = pd.read_csv("test.csv")    # 测试集

# 2. 指定列（根据实际数据修改）
target_col = "target"       # 目标列名（必须是二分类0/1）
useless_cols = ["id"]       # 要删除的无用列名

# 3. 自动选择有效特征
used_features = [col for col in train.columns
                if col not in useless_cols + [target_col]]

# 4. 数据标准化（重要！）
scaler = StandardScaler()
X_train = scaler.fit_transform(train[used_features])
X_test = scaler.transform(test[used_features])
y_train = train[target_col]

# 5. 训练模型
model = LogisticRegression(max_iter=1000)  # 增加迭代次数确保收敛
model.fit(X_train, y_train)

# 6. 预测并保存结果
pd.DataFrame({
    "id": test["id"],  # 保留ID列
    "prediction": model.predict(X_test)
}).to_csv("predictions.csv", index=False)

print("预测完成！结果已保存至 predictions.csv")
print(f"使用的特征：{used_features}")
print(f"模型准确率（训练集）：{model.score(X_train, y_train):.2%}")
