In [1]:
import neat
import pandas as pd
import joblib

In [2]:
# 1. Загрузка наборов данных
df_small = pd.read_csv('dataset_1.csv')
df_large = pd.read_csv('dataset_12.csv')

In [3]:
# Функция для подготовки данных
def prepare_data(X, y):
    X = X.to_numpy()  # Преобразуем DataFrame в массив NumPy
    y = y.to_numpy()  # Преобразуем Series в массив NumPy
    data = list(zip(X, y))
    return data

In [4]:
# Конфигурация NEAT
def run_neat(config_file, dataset, generations=50):
    # Подготовка данных
    
    figure_dict = {
    'circle': 0,
    'rectangle': 1
    }
    color_dict = {
    'red' : 0, 
    'blue' : 1, 
    'green' : 2, 
    'yellow' : 3
    }
    dataset['figure1'] = dataset['figure1'].map(figure_dict)
    dataset['figure2'] = dataset['figure2'].map(figure_dict)
    try:
        dataset['color1'] = dataset['color1'].map(color_dict)
        dataset['color2'] = dataset['color2'].map(color_dict)
    except:
        print()
    X = dataset.drop('collision', axis=1)
    y = dataset['collision']
    inputs = X.shape[1]  # Количество входов = количество столбцов в X
    training_data = prepare_data(X, y)
    
    # Загрузка конфигурации
    config = neat.Config(neat.DefaultGenome, neat.DefaultReproduction,
                        neat.DefaultSpeciesSet, neat.DefaultStagnation,
                        config_file)
    
    # Создание популяции
    pop = neat.Population(config)
    
    # Добавление репортеров
    pop.add_reporter(neat.StdOutReporter(True))
    stats = neat.StatisticsReporter()
    pop.add_reporter(stats)
    
    # Функция оценки
    def eval_genomes(genomes, config):
        for genome_id, genome in genomes:
            net = neat.nn.FeedForwardNetwork.create(genome, config)
            error = 0
            for xi, xo in training_data:
                output = net.activate(xi)
                error += (output[0] - xo) ** 2
            genome.fitness = -error  # Чем меньше ошибка, тем выше приспособленность
    
    # Запуск эволюции
    winner = pop.run(eval_genomes, generations)
    
    # Возвращаем лучшую сеть
    return winner, stats

In [5]:
# Создание конфигурационных файлов
def create_config(filename, num_inputs, num_outputs=1):
    with open(filename, 'w') as f:
        f.write(f"""[NEAT]
fitness_criterion     = max
fitness_threshold     = 1.0
pop_size              = 200
reset_on_extinction   = False

[DefaultGenome]
# Параметры узлов
num_inputs              = {num_inputs}
num_hidden              = 0
num_outputs             = {num_outputs}
feed_forward            = True
initial_connection      = full
compatibility_disjoint_coefficient = 1.0
compatibility_weight_coefficient = 0.5

# Параметры инициализации смещений
bias_init_mean          = 0.0
bias_init_stdev         = 1.0
bias_max_value          = 30.0
bias_min_value          = -30.0
bias_mutate_power       = 0.5
bias_mutate_rate        = 0.7
bias_replace_rate       = 0.1

# Параметры инициализации характеристик узлов (response)
response_init_mean      = 1.0
response_init_stdev     = 0.0
response_max_value      = 30.0
response_min_value      = -30.0
response_mutate_power   = 0.5
response_mutate_rate    = 0.1
response_replace_rate   = 0.2

# Параметры активационных функций
activation_default      = sigmoid
activation_mutate_rate  = 0.05
activation_options      = sigmoid tanh relu

# Параметры мутаций
node_add_prob           = 0.1
node_delete_prob        = 0.2

# Параметры агрегационных функций
aggregation_default         = sum
aggregation_mutate_rate     = 0.1
aggregation_options         = sum
aggregation_init_mean       = 0.0
aggregation_init_stdev      = 1.0
aggregation_max_value       = 30.0
aggregation_min_value       = -30.0

# Параметры весовых коэффициентов
weight_init_mean         = 0.0
weight_init_stdev        = 1.0
weight_max_value         = 30.0
weight_min_value         = -30.0
weight_mutate_power      = 0.5
weight_mutate_rate       = 0.8
weight_replace_rate      = 0.1

# Параметры активации соединений
enabled_default         = True
enabled_mutate_rate     = 0.1
conn_add_prob           = 0.3
conn_delete_prob        = 0.5

[DefaultSpeciesSet]
compatibility_threshold = 2.0

[DefaultStagnation]
species_fitness_func = max
max_stagnation       = 50

[DefaultReproduction]
elitism            = 3
survival_threshold = 0.2
""")

In [6]:
# Создание конфигураций
create_config('config_1dataset', 8)
create_config('config_2dataset', 20)

In [7]:
print("Обучение модели для маленького датасета...")
data1_winner, data1_stats = run_neat('config_1dataset', df_small)
print("\nОбучение модели для большого датасета...")
data2_winner, data2_stats = run_neat('config_2dataset', df_large)

Обучение модели для маленького датасета...


 ****** Running generation 0 ****** 

Population's average fitness: -25.18247 stdev: 4.30831
Best fitness: -16.20350 - size: (1, 8) - species 1 - id 192
Average adjusted fitness: 0.581
Mean genetic distance 1.507, standard deviation 0.533
Population of 200 members in 3 species:
   ID   age  size  fitness  adj fit  stag
     1    0   137    -16.2    0.614     0
     2    0    62    -17.2    0.549     0
     3    0     1       --       --     0
Total extinctions: 0
Generation time: 0.132 sec

 ****** Running generation 1 ****** 

Population's average fitness: -3085.79100 stdev: 43206.11495
Best fitness: -14.80132 - size: (1, 7) - species 1 - id 316
Average adjusted fitness: 0.998
Mean genetic distance 1.657, standard deviation 0.550
Population of 200 members in 3 species:
   ID   age  size  fitness  adj fit  stag
     1    1    99    -14.8    0.993     0
     2    1    63    -17.2    1.000     1
     3    1    38    -31.8    1.000     0
Total 

In [8]:
# Сравнение моделей
print("Сравнение моделей:")
print(f"1 датасет - лучшая приспособленность: {data1_winner.fitness}")
print(f"2 датасет - лучшая приспособленность: {data2_winner.fitness}")

Сравнение моделей:
1 датасет - лучшая приспособленность: -10.590065912639021
2 датасет - лучшая приспособленность: -248.10440698166008


In [9]:
# Создание сетей для подсчета узлов и связей
config_smalldata = neat.Config(neat.DefaultGenome, neat.DefaultReproduction,
                        neat.DefaultSpeciesSet, neat.DefaultStagnation,
                        'config_1dataset')
config_bigdata = neat.Config(neat.DefaultGenome, neat.DefaultReproduction,
                            neat.DefaultSpeciesSet, neat.DefaultStagnation,
                            'config_2dataset')

smalldata_winner = neat.nn.FeedForwardNetwork.create(data1_winner, config_smalldata)
bigdata_winner = neat.nn.FeedForwardNetwork.create(data2_winner, config_bigdata)

In [10]:
print(f"Количество узлов 1 датасета: {len(data1_winner.nodes)}")
print(f"Количество связей 1 датасета: {len(data1_winner.connections)}")
print(f"Количество узлов 2 датасета: {len(data2_winner.nodes)}")
print(f"Количество связей 2 датасета: {len(data2_winner.connections)}")

Количество узлов 1 датасета: 1
Количество связей 1 датасета: 6
Количество узлов 2 датасета: 1
Количество связей 2 датасета: 9


In [11]:
# Сохранение моделей
joblib.dump(data1_winner, '3_smalldata_winner.pkl')
joblib.dump(data2_winner, '3_bigdata_winner.pkl')

['3_bigdata_winner.pkl']