In [1]:
import numpy as np
import pandas as pd
from sklearn.metrics import roc_auc_score

In [2]:
# Шаг 1: Загрузка данных
data = pd.read_csv('data-logistic.csv', header=None)
X = data.iloc[:, 1:]
y = data.iloc[:, 0]

# Добавление фиктивного признака для удобства
X = np.hstack((np.ones((X.shape[0], 1)), X))

In [3]:
# Шаг 3: Реализация градиентного спуска
def sigmoid(z):
    clipped_z = np.clip(z, -500, 500)
    return 1 / (1 + np.exp(-clipped_z))

def gradient_descent(X, y, k, C, max_iter=10000, eps=1e-5):
    w = np.zeros(X.shape[1])
    for i in range(max_iter):
        z = np.dot(X, w)
        predictions = sigmoid(z)
        gradient = np.dot(X.T, (predictions - y)) / len(y) + C * w
        w -= k * gradient
        if np.linalg.norm(k * gradient) < eps:
            break
    return w

In [4]:
# Шаг 4: Запуск градиентного спуска
w_no_reg = gradient_descent(X, y, k=0.1, C=0)
w_with_reg = gradient_descent(X, y, k=0.1, C=10)

# Вычисление вероятностей с помощью обученных моделей
probabilities_no_reg = sigmoid(np.dot(X, w_no_reg))
probabilities_with_reg = sigmoid(np.dot(X, w_with_reg))

In [5]:
# Шаг 5: Вычисление AUC-ROC
auc_no_reg = roc_auc_score(y, probabilities_no_reg)
auc_with_reg = roc_auc_score(y, probabilities_with_reg)

print(f"AUC-ROC без регуляризации: {auc_no_reg}")
print(f"AUC-ROC с L2-регуляризацией: {auc_with_reg}")

AUC-ROC без регуляризации: 0.9358095238095238
AUC-ROC с L2-регуляризацией: 0.937142857142857
