In [4]:
import pandas as pd
import numpy as np
from sklearn.linear_model import LassoCV
import statsmodels.api as sm
import os

# Чтение данных
data = pd.read_csv('test_sample.csv')
X = data.drop(columns=['Y'])
y = data['Y']

# 1. Lasso регрессия
lasso_cv = LassoCV(cv=5, random_state=1)
lasso_cv.fit(X, y)

# Находим исключенные предикторы (коэффициенты = 0)
eliminated_by_Lasso = np.where(lasso_cv.coef_ == 0)[0].tolist()

# 2. Линейная регрессия
X_with_const = sm.add_constant(X)
model = sm.OLS(y, X_with_const).fit()

# Находим исключенные предикторы (p-value > 0.1)
p_values = model.pvalues[1:]  # Игнорируем константу
eliminated_by_lm = np.where(p_values > 0.1)[0].tolist()

# Подготовка ответа
lasso_zeros = ' '.join(map(str, eliminated_by_Lasso))
lm_zeros = ' '.join(map(str, eliminated_by_lm))

# Создание файла с ответами
result = pd.DataFrame([lasso_zeros, lm_zeros],
                     index=['eliminated_by_Lasso', 'eliminated_by_lm'])
result.to_csv('answer.csv')

# Вывод результатов
print("Исключенные Lasso:", lasso_zeros)
print("Исключенные линейной моделью:", lm_zeros)
print("\nРезультаты сохранены в answer.csv")

Исключенные Lasso: 14 21 40 54 69 73 115 122 141 143 147 174 184 209 258 262 263 266 287 306 308 333 355 359 376 428 479
Исключенные линейной моделью: 40 43 60 67 69 73 125 132 143 155 156 197 228 231 362 409 450

Результаты сохранены в answer.csv
