# Домашнее задание "Функции потерь и оптимизация"

In [105]:
# Подключение необходимых библиотек

import numpy as np
import pandas as pd

In [145]:
# Создадим необходимые функции

# Сигмоид - функция вероятности принадлежности к классу
def sigmoid(x, weight):
    z = np.dot(x, weight)
    op = 1/(1 + np.exp(-z)) 
    return op

# Фунция потерь логистической регрессии
def loss(h, y):
    return (-y * np.log(h) - (1 - y) * np.log(1 - h)).mean()

# Функция расчета градиента
def gradient_descent(X, h, y):
    return np.dot(X.T, (h - y)) / y.shape[0]

# Функция градиентного спуска
def fit(x, y, lr, iteration):
    weight = np.zeros(x.shape[1])
    for i in range(iterations):
        sigma = sigmoid(x, weight)            

        dW = gradient_descent(x , sigma, y)
        weight -= lr * dW
    
    print('Обучение закончилось')
    
    return weight

# Функция Nesterov Momentum
def fit_nest(x, y, lr, iteration):
    weight = np.zeros(x.shape[1])
    rho = 0.975
    vx = np.zeros(x.shape[1])
    for i in range(iterations):
        sigma = sigmoid(x, weight)            
        dW = gradient_descent(x , sigma, y)
        old_vx = vx
        vx = rho * vx - lr * dW
        
        weight = rho * old_vx + (1 - rho) * vx
    
    print('Обучение закончилось')
    
    return weight

# Функция rmsprop
def fit_rmsprop(x, y, lr, iteration):
    weight = np.zeros(x.shape[1])
    rho = 0.975
    ep_dW2 = np.zeros(x.shape[1])
    eps = 0.00001
    for i in range(iterations):
        sigma = sigmoid(x, weight)            
        dW = gradient_descent(x , sigma, y)
        old_ep_dW2 = ep_dW2
        
        ep_dW2 = rho * old_ep_dW2 + (1 - rho)*dW**2
        
        weight = weight - (lr * (1/np.sqrt(ep_dW2+eps)))*dW
    
    print('Обучение закончилось')
    
    return weight

# Функция предсказания класса
def predict(x, weight):
    op = sigmoid(x, weight)    
    result = op >= 0.5
    result = result.astype(int)
    
    return result


In [107]:
# Загрузим даннные и получим X и y
df = pd.read_csv('adult.csv', na_values='?') # Загрузил датасет и подставил вместо ? - отстутсвие значения
selectedCol = df[['age', 'workclass', 'education', 'educational-num', 'marital-status', 'occupation', 'relationship', 'race', 'gender', 'native-country', 'income']]
selectedCol = selectedCol.dropna()
X = pd.get_dummies( selectedCol, columns = [ 'workclass',  'education', 'marital-status', 'occupation', 'relationship', 'race', 'native-country'] )
from sklearn.preprocessing import LabelEncoder
le = LabelEncoder()

le.fit( X['gender'] ) 

X['gender'] = le.transform(X['gender']) # Через LabelEncoder преобразовываем пол в число

del X['income'] # Это целевое значение - удаляем из X

le.fit( selectedCol['income'] )

y = pd.Series( data = le.transform( selectedCol['income'] ) ) # Делаем y из income и преобразуем в числовые значения

In [108]:
# Разобьем на train и test
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.25, random_state=42) # Делим выборки

In [133]:
# Обучим методом градиентным спуском
lr = 0.1
iterations = 50

weight = fit(X_train, y_train, lr, iterations)

Обучение закончилось


In [134]:
# Получение предсказания для X_test
predict(X_test, weight)

array([0, 0, 0, ..., 0, 0, 0])

In [135]:
# Для интереса проверим точность полученной модели
from sklearn.metrics import accuracy_score # Загружаем метрику точности

accuracy_score(y_test, predict(X_test, weight)) 

0.7560587298779409

## Вывод:
Точность 75% весьма высокая

In [149]:
# Обучим методом Nesterov Momentum
weight = fit_nest(X_train, y_train, lr, iterations)

Обучение закончилось


In [150]:
# Получение предсказания для X_test
predict(X_test, weight)

array([0, 0, 0, ..., 0, 0, 0])

In [151]:
# Для интереса проверим точность полученной модели
accuracy_score(y_test, predict(X_test, weight))

0.7560587298779409

## Вывод:
Точность такая же получилось 75%

In [152]:
# Обучим методом rmsprop
weight = fit_rmsprop(X_train, y_train, lr, iterations)

Обучение закончилось


In [153]:
# Получение предсказания для X_test
predict(X_test, weight)

array([0, 0, 0, ..., 0, 0, 0])

In [154]:
# Для интереса проверим точность полученной модели
accuracy_score(y_test, predict(X_test, weight))

0.7799398549442774

## Вывод:
Точность чуть выше получилась почти 78%