In [1]:
import numpy as np
import pandas as pd
import csv
import random
import math

# Инициализация

In [2]:
# количество признаков входного слоя
feature_count = 4

# Считывание данных из файла и их подготовка

In [3]:
df = pd.read_csv('data/titanik.csv', sep=',')

drop_column = ['SibSp', 'Parch', 'Ticket', 'Fare', 'Cabin']

# подготовленный датасет
train_data = []
# датасет для тестирования
test_data = []

classes = df['Survived'].unique()

df['Sex'] = df['Sex'].replace(['male','female'], [0, 1])
df['Embarked'] = df['Embarked'].fillna(('S'))
df['Embarked'] = df['Embarked'].map( {'S': 0, 'C': 1, 'Q': 2} ).astype(int)
df['Pclass'] = df['Pclass'].fillna(np.mean(df['Pclass']))
df['Age'] = df['Age'].fillna(df['Age'].median())

for i in range(len(df)) : 

    features = np.zeros((feature_count))
    features[0] = df.loc[i, 'Sex']
    features[1] = df.loc[i, 'Embarked']
    features[2] = df.loc[i, 'Pclass']
    features[3] = df.loc[i, 'Age']
    
    
    # Нормализация входного вектора
    norm_features = np.zeros((feature_count))
    for j in range(len(features)):
        sum = 0 
        for k in range(len(features)):
            sum += features[k] ** 2
        norm_features[j] = features[j] / math.sqrt(sum)
    
    temp_data = dict(name = df.loc[i, 'Name'], 
                     features = norm_features, 
                     result = np.where(classes == df.loc[i, "Survived"])[0].item(0))
    
    if (len(train_data) / len(df)) < 0.9:
        train_data.append(temp_data)
    else:
        test_data.append(temp_data)

# Обучение

## Кохонен

In [4]:
def getKohonenWinnerIndex(x, neuron_counts, w, s):
    result = 0
    max_net = -1
    for i in range(neuron_counts):
        net = 0
        for j in range(len(x)):
            net += x[j] * w[j][i] * s[i]
        if (net > max_net):
            result = i
            max_net = net
    return result

In [5]:
# скорость обучения слоя Кохонена
theta = 0.7
# скорость обучения слоя Гроссберга
beta = 0.1
#количество нейронов выходного слоя (слоя Гроссберга) = количество проффессий 
grossberg_neuron_counts = len(classes)
# количество нейронов кохонена
kohonen_neuron_count = 16
# штрафы кластеров
s_w = np.ones((kohonen_neuron_count))
# количество эпох
epoch_count = 50

#инициализация начальных весов слоя Кохонена kohonen_w[x][y]
# x - индекс нейрона входного слоя
# y - индекс нейрона слоя Кохонена
kohonen_w = np.zeros((feature_count, kohonen_neuron_count))
for i in range(feature_count):
    for j in range(kohonen_neuron_count):
        kohonen_w[i, j] = random.uniform(0, 1)
        
# Инициализация начальных весов слоя Гроссберга grossberg_w[x][y]
# x - индекс нейрона слоя Кохонена
# y - индекс нейрона слоя Гроссберга
grossberg_w = np.zeros((kohonen_neuron_count, grossberg_neuron_counts))
for i in range(kohonen_neuron_count):
    for j in range(grossberg_neuron_counts):
        grossberg_w[i, j] = random.uniform(0, 1)
        
step = epoch_count* len(train_data)
# Обучение на подготовленном датасете
while step >= 0:
    
    man = train_data[random.randint(0, len(train_data) - 1)]
    
    # Определение нейрона победителя
    winner_index = getKohonenWinnerIndex(man['features'], kohonen_neuron_count, kohonen_w, s_w)
    s_w[winner_index] *= 0.999
    
    # Корректировка весов нейрона победителя на слое Кохонена
    for i in range(feature_count):
        kohonen_w[i][winner_index] += theta * (man['features'][i] - kohonen_w[i][winner_index])
    
    # Корректировка весов для нейронов слоя Гроссберга, соединенных с нейроном победителем слоя Кохонена
    for i in range(grossberg_neuron_counts):
        if i == man['result']:
            grossberg_w[winner_index][i] += beta * (1 - grossberg_w[winner_index][i])
        else:
            grossberg_w[winner_index][i] += beta * (0 - grossberg_w[winner_index][i])
    
    # Изменение скорости обучения
    theta, beta = theta - (theta * 0.00007), beta - (beta * 0.00007)  
    step -= 1
print(theta)
print(beta)
print(s_w)

0.04226300355960048
0.006037571937085852
[0.08092299 0.08092299 0.08092299 0.08092299 0.08084207 0.08084207
 0.08092299 0.08092299 0.08231114 0.08899191 0.08092299 0.08092299
 0.08092299 0.08084207 0.08084207 0.08084207]


# Тестирование

In [6]:
accuracy = 0
for man in test_data:
    
    print('Класс: ' + str(classes[man['result']]))
    print('ФИО: ' + man['name'])
    print('Результаты нейросети:')
    
    # Определение нейрона победителя
    winner_index = getKohonenWinnerIndex(man['features'], kohonen_neuron_count, kohonen_w, s_w)
    best_result = 0.0
    best_index = 0

    for i in range(grossberg_neuron_counts):
        if (grossberg_w[winner_index][i] > best_result):
            best_result = grossberg_w[winner_index][i]
            best_indexe = i
        print(str(classes[i]) + ': ' + str(grossberg_w[winner_index][i] * 100) + '%')
    
    if (man['result'] == best_index):
        accuracy += 1
    print('--------------------------------------------------')
print ('Точность: ' + str((accuracy / len(test_data)) * 100) + '%')

Класс: 1
ФИО: Carter, Master. William Thornton II
Результаты нейросети:
0: 79.58418272231297%
1: 20.415817277687033%
--------------------------------------------------
Класс: 1
ФИО: Thomas, Master. Assad Alexander
Результаты нейросети:
0: 48.27861096878577%
1: 51.721389031214215%
--------------------------------------------------
Класс: 1
ФИО: Hedman, Mr. Oskar Arvid
Результаты нейросети:
0: 86.77296782009594%
1: 13.227032179904064%
--------------------------------------------------
Класс: 0
ФИО: Johansson, Mr. Karl Johan
Результаты нейросети:
0: 77.79728915174199%
1: 22.202710848257993%
--------------------------------------------------
Класс: 0
ФИО: Andrews, Mr. Thomas Jr
Результаты нейросети:
0: 58.95045809629753%
1: 41.04954190370239%
--------------------------------------------------
Класс: 0
ФИО: Pettersson, Miss. Ellen Natalia
Результаты нейросети:
0: 81.23864052527891%
1: 18.761359474721058%
--------------------------------------------------
Класс: 0
ФИО: Meyer, Mr. August
Резу