В домашнем задании необходимо применить полученные знания в теории оптимизации и машинном обучении для реализации логистической регрессии.
Этапы работы:**

Загрузите данные. Используйте датасет с ирисами. Его можно загрузить непосредственно из библиотеки Sklearn. В данных оставьте только 2 класса: Iris Versicolor, Iris Virginica.
Самостоятельно реализуйте логистическую регрессию, без использования метода LogisticRegression из библиотеки. Можете использовать библиотеки pandas, numpy, math для реализации. Оформите в виде функции. *Оформите в виде класса с методами.
Реализуйте метод градиентного спуска. Обучите логистическую регрессию этим методом. Выберете и посчитайте метрику качества. Метрика должна быть одинакова для всех пунктов домашнего задания. Для упрощения сравнения выберете только одну метрику.
Повторите п. 3 для метода скользящего среднего (Root Mean Square Propagation, RMSProp).
Повторите п. 3 для ускоренного по Нестерову метода адаптивной оценки моментов (Nesterov–accelerated Adaptive Moment Estimation, Nadam).
Сравните значение метрик для реализованных методов оптимизации. Можно оформить в виде таблицы вида |метод|метрика|время работы| (время работы опционально). Напишите вывод.
Для лучшего понимания темы и упрощения реализации можете обратиться к статье.

Для получение зачета по этому домашнему заданию, минимально, должно быть реализовано обучение логистической регрессии и градиентный спуск.

Загрузка библиотек

In [None]:
from sklearn import datasets
import numpy as np
import pandas as pd
from sklearn.model_selection import train_test_split

Необходимые функции

In [None]:
class LogisticRegression:

    def __init__(self, learning_rate=0.01, num_iterations=1000):
        self.learning_rate = learning_rate
        self.num_iterations = num_iterations
        self.weights = None
        self.bias = None

    def sigmoid(self, z):
        return 1 / (1 + np.exp(-z))

    def fit(self, X, y):
        num_samples, num_features = X.shape
        self.weights = np.zeros(num_features)
        self.bias = 0

        # градиентный спуск
        for _ in range(self.num_iterations):
            linear_output = np.dot(X, self.weights) + self.bias
            predicted_probs = self.sigmoid(linear_output)

            # градиенты
            dw = (1/num_samples) * np.dot(X.T, (predicted_probs - y))
            db = (1/num_samples) * np.sum(predicted_probs - y)

            # обновление весов и смещения
            self.weights -= self.learning_rate * dw
            self.bias -= self.learning_rate * db

    def predict(self, X):
        linear_output = np.dot(X, self.weights) + self.bias
        predicted_probs = self.sigmoid(linear_output)
        predicted_labels = [1 if x > 0.5 else 0 for x in predicted_probs]
        return np.array(predicted_labels)


Загрузка и обработка данных

In [None]:
iris = datasets.load_iris()
df = pd.DataFrame(iris.data, columns=iris.feature_names)
df['target'] = iris.target
data = df[~(df['target']==2)]
data = data.astype(int)
x1 = ['sepal length (cm)', 'sepal width (cm)', 'petal length (cm)', 'petal width (cm)']
basex = data[x1]
y1 = 'target'
basey = data[y1]
train_x, test_x, train_y , test_y = train_test_split(basex, basey, test_size = 0.2, random_state = 0)

Обучаем и проверяем

In [None]:
model = LogisticRegression()
model.fit(train_x, train_y)
predictions = model.predict(test_x)
print('Предсказание модели: ', predictions)
print('Проверочный набор:   ', test_y.to_numpy())

Предсказание модели:  [0 1 0 1 1 1 0 1 1 1 1 1 1 0 0 0 0 0 0 0]
Проверочный набор:    [0 1 0 1 1 1 0 1 1 1 1 1 1 0 0 0 0 0 0 0]
