# Logistic Regression: Keras

In [23]:
import pandas as pd
import numpy as np
from sklearn.metrics import accuracy_score
from tensorflow import keras

import warnings
warnings.simplefilter("ignore", category=RuntimeWarning)
pd.options.mode.chained_assignment = None 

In [3]:
# loading and splitting train data
df = pd.read_csv('/Users/yuliabezginova/PycharmProjects/computer_vision/train_data_n.csv')
df['target'] = (df['target'] > df['target'].median()).astype(int)
features_train = df.drop('target', axis=1)
target_train = df['target']

# loading and splitting test data
df_val = pd.read_csv('/Users/yuliabezginova/PycharmProjects/computer_vision/test_data_n.csv')
df_val['target'] = (df_val['target'] > df['target'].median()).astype(int)
features_valid = df_val.drop('target', axis=1)
target_valid = df_val['target']

## 1.1 Training the model

In [5]:
model = keras.models.Sequential()

import warnings
warnings.simplefilter("ignore", category=RuntimeWarning)
pd.options.mode.chained_assignment = None 

In [7]:
# 1) К полносвязному слою примените функцию активации:
keras.layers.Dense(units=1, input_dim=features_train.shape[1], 
                   activation='sigmoid');

In [9]:
# добавляем слой
model.add(keras.layers.Dense(units=1, input_dim=features_train.shape[1],
                            activation='sigmoid')) 

In [10]:
# 2) Поменяйте функцию потерь MSE на binary_crossentropy.
model.compile(loss='binary_crossentropy', optimizer='sgd')

In [11]:
model.fit(features_train, target_train,
          verbose=2,
         epochs=5,
         validation_data=(features_valid, target_valid));

Epoch 1/5
32/32 - 1s - loss: 0.8682 - val_loss: 0.8525 - 993ms/epoch - 31ms/step
Epoch 2/5
32/32 - 0s - loss: 0.8361 - val_loss: 0.8317 - 128ms/epoch - 4ms/step
Epoch 3/5
32/32 - 0s - loss: 0.8081 - val_loss: 0.8132 - 129ms/epoch - 4ms/step
Epoch 4/5
32/32 - 0s - loss: 0.7826 - val_loss: 0.7972 - 136ms/epoch - 4ms/step
Epoch 5/5
32/32 - 0s - loss: 0.7605 - val_loss: 0.7830 - 172ms/epoch - 5ms/step


### Conclusion: Кросс-энтропия уменьшается, это хорошо. Чтобы понять, улучшается ли модель или нет, необходимо вычислить accuracy.

## 1.2 Calculating the accuracy metric

Найдем accuracy модели на валидационной выборке. Предсказания модели вычисляются функцией predict(), как в sklearn. Сигмоида вернёт числа от 0 до 1, преобразуйте их в классы, сравнив с 0.5.

Напечатаем на экране значение accuracy. Чтобы выводу не мешал прогресс обучения, зададим verbose=0.

```
score = accuracy_score(y_true, y_pred)
```

https://scikit-learn.org/stable/modules/generated/sklearn.metrics.accuracy_score.html

In [15]:
predictions = model.predict(features_valid) > 0.5



In [25]:
score = accuracy_score(target_valid, predictions)
print('Test accuracy:', score)

Test accuracy: 0.537


In [None]:
# score = model.evaluate(features_valid, target_valid, verbose=0)
# print('Test accuracy:', score)

### Conclusion: Модель показывают довольно высокую точность. Однако надо увеличивать количество эпох.

### epochs=10, metrics=['acc']

Обучение нейронной сети обычно занимает много времени. Сделайте так, чтобы отследить качество модели можно было на каждой эпохе. Для этого добавьте параметр metrics=['acc'] (от англ. accuracy) в методе compile(). 
Чтобы улучшить значение accuracy, обучите модель на десяти эпохах.

In [33]:
model.compile(loss='binary_crossentropy', optimizer='sgd',
              metrics=['acc'])
model.fit(features_train, target_train, epochs=10, verbose=2,
          validation_data=(features_valid, target_valid));

Epoch 1/10
32/32 - 1s - loss: 0.6088 - acc: 0.6700 - val_loss: 0.7123 - val_acc: 0.5700 - 997ms/epoch - 31ms/step
Epoch 2/10
32/32 - 0s - loss: 0.6083 - acc: 0.6710 - val_loss: 0.7129 - val_acc: 0.5690 - 146ms/epoch - 5ms/step
Epoch 3/10
32/32 - 0s - loss: 0.6081 - acc: 0.6730 - val_loss: 0.7131 - val_acc: 0.5660 - 154ms/epoch - 5ms/step
Epoch 4/10
32/32 - 0s - loss: 0.6077 - acc: 0.6750 - val_loss: 0.7136 - val_acc: 0.5690 - 159ms/epoch - 5ms/step
Epoch 5/10
32/32 - 0s - loss: 0.6076 - acc: 0.6700 - val_loss: 0.7137 - val_acc: 0.5660 - 258ms/epoch - 8ms/step
Epoch 6/10
32/32 - 0s - loss: 0.6072 - acc: 0.6790 - val_loss: 0.7141 - val_acc: 0.5640 - 149ms/epoch - 5ms/step
Epoch 7/10
32/32 - 0s - loss: 0.6071 - acc: 0.6760 - val_loss: 0.7143 - val_acc: 0.5610 - 149ms/epoch - 5ms/step
Epoch 8/10
32/32 - 0s - loss: 0.6068 - acc: 0.6740 - val_loss: 0.7147 - val_acc: 0.5620 - 129ms/epoch - 4ms/step
Epoch 9/10
32/32 - 0s - loss: 0.6065 - acc: 0.6750 - val_loss: 0.7153 - val_acc: 0.5630 - 246ms

In [32]:
predictions = model.predict(features_valid) > 0.5



In [30]:
score = accuracy_score(target_valid, predictions)
print('Accuracy:', score)

Accuracy: 0.56


### Conclusion: Точность неизбежно растет при увеличении количества эпох. В реальной жизни их число можно и нужно увеличивать до 50-80-100.