In [1]:
import numpy as np
import pandas as pd
import csv
import random
import math

# Инициализация

In [2]:
# количество признаков входного слоя
feature_count = 4

# Считывание данных из файла и их подготовка

In [3]:
df = pd.read_csv('data/titanik.csv', sep=',')

# подготовленный датасет
train_data = []
# датасет для тестирования
test_data = []

classes = df['Survived'].unique()

data = pd.concat([train, test], sort=False)

data['Sex'] = data['Sex'].replace(['male','female'], [0, 1])
data['Embarked'] = data['Embarked'].fillna(('S'))
data['Embarked'] = data['Embarked'].map( {'S': 0, 'C': 1, 'Q': 2} ).astype(int)
data['Fare'] = data['Fare'].fillna(np.mean(data['Fare']))
data['Age'] = data['Age'].fillna(data['Age'].median())


df = df.sample(frac=1).reset_index(drop=True)

for i in range(len(df)) : 

    features = np.zeros((feature_count))
    features[0] = df.loc[i, "sepal.length"]
    features[1] = df.loc[i, "sepal.width"]
    features[2] = df.loc[i, "petal.length"]
    features[3] = df.loc[i, "petal.width"]
    
    # Нормализация входного вектора
    norm_features = np.zeros((feature_count))
    for j in range(len(features)):
        sum = 0 
        for k in range(len(features)):
            sum += features[k] ** 2
        norm_features[j] = features[j] / math.sqrt(sum)
    
    temp_data = dict(features = norm_features, result = np.where(classes == df.loc[i, "variety"])[0].item(0))
    if (len(train_data) / len(df)) < 0.9:
        train_data.append(temp_data)
    else:
        test_data.append(temp_data)

# Обучение

## Кохонен

In [4]:
def getKohonenWinnerIndex(x, neuron_counts, w, s):
    result = 0
    max_net = -1
    for i in range(neuron_counts):
        net = 0
        for j in range(len(x)):
            net += x[j] * w[j][i] * s[i]
        if (net > max_net):
            result = i
            max_net = net
    return result

In [8]:
# скорость обучения слоя Кохонена
theta = 0.7
# скорость обучения слоя Гроссберга
beta = 0.1
#количество нейронов выходного слоя (слоя Гроссберга) = количество проффессий 
grossberg_neuron_counts = len(classes)
# количество нейронов кохонена
kohonen_neuron_count = 6
# штрафы кластеров
s_w = np.ones((kohonen_neuron_count))

#инициализация начальных весов слоя Кохонена kohonen_w[x][y]
# x - индекс нейрона входного слоя
# y - индекс нейрона слоя Кохонена
kohonen_w = np.zeros((feature_count, kohonen_neuron_count))
for i in range(feature_count):
    for j in range(kohonen_neuron_count):
        kohonen_w[i, j] = random.uniform(0.01, 0.99)

# Инициализация начальных весов слоя Гроссберга grossberg_w[x][y]
# x - индекс нейрона слоя Кохонена
# y - индекс нейрона слоя Гроссберга
grossberg_w = np.zeros((kohonen_neuron_count, grossberg_neuron_counts))
for i in range(kohonen_neuron_count):
    for j in range(grossberg_neuron_counts):
        grossberg_w[i, j] = random.uniform(0, 1)

# Обучение на подготовленном датасете
for blossom in train_data:
    
    # Определение нейрона победителя
    winner_index = getKohonenWinnerIndex(blossom['features'], kohonen_neuron_count, kohonen_w, s_w)
    s_w[winner_index] *= 0.9
    
    # Корректировка весов нейрона победителя на слое Кохонена
    for i in range(feature_count):
        kohonen_w[i][winner_index] += theta * (blossom['features'][i] - kohonen_w[i][winner_index])
    
    # Корректировка весов для нейронов слоя Гроссберга, соединенных с нейроном победителем слоя Кохонена
    for i in range(grossberg_neuron_counts):
        if i == blossom['result']:
            grossberg_w[winner_index][i] += beta * (1 - grossberg_w[winner_index][i])
        else:
            grossberg_w[winner_index][i] += beta * (0 - grossberg_w[winner_index][i])
    
    # Изменение скорости обучения
    theta, beta = theta * 0.8, beta * 0.8  

# Тестирование

In [9]:
accuracy = 0
for blossom in test_data:
    
    print('Класс: ' + classes[blossom['result']])
    print(blossom['features'])
    print('Результаты нейросети:')
    
    # Определение нейрона победителя
    winner_index = getKohonenWinnerIndex(blossom['features'], kohonen_neuron_count, kohonen_w, s_w)
    best_result = 0.0
    best_index = 0

    for i in range(grossberg_neuron_counts):
        if (grossberg_w[winner_index][i] > best_result):
            best_result = grossberg_w[winner_index][i]
            best_indexe = i
        print(classes[i] + ': ' + str(grossberg_w[winner_index][i] * 100) + '%')
    
    if (blossom['result'] == best_index):
        accuracy += 1
    print('--------------------------------------------------')
print ('Точность: ' + str((accuracy / len(test_data)) * 100) + '%')

Класс: Virginica
[0.68619022 0.31670318 0.61229281 0.232249  ]
Результаты нейросети:
Setosa: 37.12785354402485%
Versicolor: 38.34603228122086%
Virginica: 14.806252310388246%
--------------------------------------------------
Класс: Setosa
[0.80212413 0.54690282 0.23699122 0.03646019]
Результаты нейросети:
Setosa: 41.45224670204737%
Versicolor: 34.79072223423149%
Virginica: 10.298474670702669%
--------------------------------------------------
Класс: Virginica
[0.69052512 0.32145135 0.60718588 0.22620651]
Результаты нейросети:
Setosa: 37.12785354402485%
Versicolor: 38.34603228122086%
Virginica: 14.806252310388246%
--------------------------------------------------
Класс: Versicolor
[0.7581754  0.32659863 0.5365549  0.17496355]
Результаты нейросети:
Setosa: 37.12785354402485%
Versicolor: 38.34603228122086%
Virginica: 14.806252310388246%
--------------------------------------------------
Класс: Versicolor
[0.72232962 0.35482858 0.57026022 0.16474184]
Результаты нейросети:
Setosa: 37.12785