In [1]:
import pandas as pd
import numpy as np
import tensorflow as tf 
import matplotlib.pyplot as plt 

from sklearn.linear_model import Perceptron
from tensorflow.keras.layers import Dense, Conv2D, MaxPooling2D
from tensorflow.keras.models import Sequential
from tensorflow.keras.activations import hard_sigmoid

In [2]:
df = pd.read_csv('1180__2019.csv', sep=';')  # считываем и помещаем в Dataframe объект

In [3]:
df.head()   # выводим основную информацию по датасету

Unnamed: 0,id,ts,hdr,steps,energy_in,energy_out,heart_rate,stress_level,anxiety_level
0,1180,2019-01-01 00:03:30.000000,11.0,0,1,5,76,20,5.0
1,1180,2019-01-01 00:04:30.000000,11.0,0,1,5,76,20,3.0
2,1180,2019-01-01 00:05:30.000000,11.0,0,1,5,76,20,3.0
3,1180,2019-01-01 00:06:30.000000,11.0,0,1,5,76,20,3.0
4,1180,2019-01-01 00:07:30.000000,11.0,0,1,5,76,20,3.0


In [4]:
df = df.drop('ts', 1) # удаляем столбец ts
df = df.drop('id', 1) # удаляем столбец id
df # выводим результирующий датафрейм

Unnamed: 0,hdr,steps,energy_in,energy_out,heart_rate,stress_level,anxiety_level
0,11.0,0,1,5,76,20,5.0
1,11.0,0,1,5,76,20,3.0
2,11.0,0,1,5,76,20,3.0
3,11.0,0,1,5,76,20,3.0
4,11.0,0,1,5,76,20,3.0
5,11.0,0,0,5,75,20,3.0
6,11.0,0,0,5,75,20,4.0
7,11.0,0,0,5,75,20,4.0
8,11.0,0,0,5,75,20,4.0
9,11.0,0,0,5,75,20,4.0


In [5]:
df['anxiety_level'] = df['anxiety_level'].fillna(0) # заполняем значения NaN в столбце anxiety_level нулями
df['anxiety_level'] = df['anxiety_level'].astype(int) # представляем значения в данном столбике целыми числами

In [6]:
df.loc[df['anxiety_level'] > 0, 'anxiety_level'] = 1  # заменим значения больше 0 на 1

In [7]:
df

Unnamed: 0,hdr,steps,energy_in,energy_out,heart_rate,stress_level,anxiety_level
0,11.0,0,1,5,76,20,1
1,11.0,0,1,5,76,20,1
2,11.0,0,1,5,76,20,1
3,11.0,0,1,5,76,20,1
4,11.0,0,1,5,76,20,1
5,11.0,0,0,5,75,20,1
6,11.0,0,0,5,75,20,1
7,11.0,0,0,5,75,20,1
8,11.0,0,0,5,75,20,1
9,11.0,0,0,5,75,20,1


In [8]:
df = df.fillna(0) # заполняем все значения NaN в датафрейме нулями
df = df.astype(int) # представляем значения в данном датафрейме целыми числами

In [9]:
values = df.values # перенесим значения в отдельную переменную
X = values[:, 0:6] # выделяем признаки
y = values[:, 6] # выделяем целевую переменную

# print(X.shape[0])
# print(y.shape)

In [None]:
model = Perceptron(random_state=1) # создаем модель Перцептрона от scikit-learn
model.fit(X, y) # тренируем модель

print("%0.3f" % model.score(X, y)) # выводим значение точности модели от scikit-learn

In [None]:
model = Sequential()  # создаем последовательную модель на Tensorflow
model.add(Dense(1, input_shape=(6,), activation=hard_sigmoid, kernel_initializer='glorot_uniform'))  # добавляем слой с одним входом размерностью [6,]
model.compile(loss='binary_crossentropy', optimizer='sgd', metrics=['accuracy']) # ставим оптимизатор sgd и метрику точности

print(model.summary()) # выводим архитектуру модели

model.fit(X, y, epochs=5, batch_size=25, verbose=1, validation_split=0.2) # тренируем модель в 5 эпох с разделением датасета 80% к 20%

_, accuracy = model.evaluate(X, y) # просчитываем точность
print("%0.3f" % accuracy) # выводим её

In [None]:
import numpy as np
import math

class Perceptron(object):
    """Perceptron классификатор.

    Параметры
    ------------
    eta : float
      Скорость обучения (от 0,0 до 1,0)
    n_iter : int
      Передает обучающий набор данных.
    random_state : int
      Начальное значение генератора случайных чисел для инициализации случайного веса.

    Атрибуты
    -----------
    w_ : 1d-array
      Вес после fit.
    errors_ : list
      Количество ошибочных классификаций (обновлений) в каждую эпоху.
    """
    def __init__(self, eta=0.01, n_iter=50, random_state=1):
        self.eta = eta
        self.n_iter = n_iter
        self.random_state = random_state
    
    def fit(self, X, y):
        """Fit тренировочных данных.

        Параметры
        ----------
        X : {array-like}, shape = [n_samples, n_features]
          Обучающие векторы, где n_samples - это количество выборок, а n_features - количество функций.
        y : array-like, shape = [n_samples]
          Целевые значения.

        Возвращает
        -------
        self : object

        """
        rgen = np.random.RandomState(self.random_state) # задаем случайное значение переменной
        self.w_ = rgen.normal(loc=0.0, scale=0.01, size=1 + X.shape[1]) # нормализируем данное значение на 1 единицу больше, чем кол-во признаков
        self.errors_ = [] # Список ошибок

        for _ in range(self.n_iter):  # проходимся заданное кол-во эпох
            errors = 0
            for xi, target in zip(X, y): # формируем ключ-значение из тренировочных данных и проходимся в них
                update = self.eta * (target - self.predict(xi)) # обновлям переменную пересчитывая сколько нам осталось данных дообработать
                self.w_[1:] += update * xi # домножаем на массив данных
                self.w_[0] += update # добавляем переменную обновления
                errors += int(update != 0.0) # складываем кол-во ошибок
            self.errors_.append(errors) # добавляем в список ошибок
        return self

    def net_input(self, X):
        """Рассчитываем вход"""
        z = np.dot(X, self.w_[1:]) + self.w_[0]
        return z

    def predict(self, X):
        """Вернуть метку класса после шагов"""
        return np.where(self.net_input(X) >= 0, 1, -1)

In [None]:
values = df.values # перенесим значения в отдельную переменную
X = values[:, 0:6] # выделяем признаки
y = values[:, 6] # выделяем целевую переменную

# импортирем необходимые модули
from sklearn.model_selection import train_test_split
from sklearn.metrics import accuracy_score

# разделяем данные для обучения и для теста
x_train, x_test, y_train, y_test = train_test_split(X, y, test_size=0.05)

# создаем екземпляр класса Перцептрона
ppn = Perceptron(eta=0.1, n_iter=10)

# тренируем модель
ppn.fit(x_train, y_train)

# выводим график обновлений по модели по время обучения
plt.plot(range(1, len(ppn.errors_) + 1), ppn.errors_, marker='o')
plt.xlabel('Эпохи')
plt.ylabel('Кол-во обновлений')

plt.show()

In [None]:
test_y = ppn.predict(x_test) # просчитываем значения по тестовым данным
accuracy_score(np.array(y_test), test_y) # выводим точность