## Иллюстрация модуля отбора столбцов на тривиальном примере

Импорт необходимых модулей:

In [1]:
!pwd

/home/tsa/big/champs/mlboot_foto/modules/libs/genetics


In [2]:
import sys
sys.path.append('../libs/genetics')
import numpy as np
from tqdm import tqdm_notebook
from binary_genetics import BinaryGenetics

Задача: найти бинарный вектор который максимизирует функцию.

Функция, которую необходимо соптимизировать по бинарному вектору - сумма знакопеременной последовательности. Берем или нет член последовательности зависит от соответствующего True или False в векторе. Сама последовательность:

In [3]:
bin_vector_size = 30

p_cross = np.array([i*(-1 if i%2 else 1) for i in range(bin_vector_size)])

p_cross

array([  0,  -1,   2,  -3,   4,  -5,   6,  -7,   8,  -9,  10, -11,  12,
       -13,  14, -15,  16, -17,  18, -19,  20, -21,  22, -23,  24, -25,
        26, -27,  28, -29])

Сама функция:

In [4]:
def sum_three(x):
    return sum(x*p_cross)

Инициализаруем генетический бинарный оптимизатор. В binary_shape записываем размерность вектора:

In [5]:
bg = BinaryGenetics(n_generations=10,
                    n_samples = 60,
                    save_best_n = 1,
                    binary_shape=bin_vector_size,
                    logging_obj=print,
                    p_point_mutate=0.1,
                    tournament_rounds = 2,
                    random_interchange_prob = 0.1,
                    inbreed_prob=0.1,
                    tqdm_obj=tqdm_notebook)

Устанавливаем функцию которую будем оптимизировать. greater_is_better=True означает что ищем её максимум:

In [6]:
bg.set_eval_func(sum_three,greater_is_better=True)

Запускаем оптимизатор функцией learn, она возвращает итератор, который выводит лучший вектор в текущем поколении и его скор:

In [7]:
best_results = list()
for res in bg.learn(yield_best=True):
    best_vec = res[0]
    best_result = res[1]
    best_results.append(res)
    print('Лучший результат:',best_result, 'Лучший вектор:',best_vec,'\n')

HBox(children=(IntProgress(value=0, max=60), HTML(value='')))


Generation 0 top score 98 median score 43.5
Лучший результат: 98 Лучший вектор: [ True  True False False  True False False  True  True  True False False
 False False  True False  True False False False False False  True False
  True False  True  True  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 1 top score 118 median score 98.5
Лучший результат: 118 Лучший вектор: [ True False  True False False False False False False  True  True False
  True False  True False  True False False False False False  True False
  True False  True  True  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 2 top score 144 median score 126.5
Лучший результат: 144 Лучший вектор: [ True False  True False False False False False False  True  True False
  True False  True False  True False False False  True  True  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 3 top score 193 median score 158.5
Лучший результат: 193 Лучший вектор: [False  True  True  True False False  True False  True  True  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 4 top score 202 median score 187.5
Лучший результат: 202 Лучший вектор: [False  True  True  True False False  True False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 5 top score 209 median score 202.0
Лучший результат: 209 Лучший вектор: [False  True  True False  True False  True False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 6 top score 210 median score 206.5
Лучший результат: 210 Лучший вектор: [False False  True False  True False  True False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 7 top score 210 median score 207.5
Лучший результат: 210 Лучший вектор: [False False  True False  True False  True False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 8 top score 210 median score 207.5
Лучший результат: 210 Лучший вектор: [False False  True False  True False  True False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 9 top score 210 median score 207.5
Лучший результат: 210 Лучший вектор: [False False  True False  True False  True False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



Оптимальный вектор найден:

In [8]:
sum_three(best_results[-1][0])

210

### Можно также пробросить стартовые векторы для нулевого поколения в функцию learn:

In [9]:
import random

### Начальные векторы удобно создавать как список списков, НО! Затем ОБЯЗАТЕЛЬНО преобразовывать в np.array при передаче в learn

In [10]:
s_vectors_count = 20

starting_vectors = [[True if random.random()>0.7 else False for _ in range(bin_vector_size)] for i in range(s_vectors_count)]

In [11]:
starting_vectors

[[False,
  False,
  True,
  False,
  False,
  False,
  False,
  False,
  False,
  False,
  False,
  True,
  False,
  False,
  False,
  False,
  False,
  False,
  False,
  False,
  False,
  False,
  False,
  True,
  True,
  False,
  False,
  False,
  False,
  False],
 [False,
  True,
  False,
  False,
  True,
  False,
  False,
  False,
  True,
  False,
  False,
  False,
  False,
  False,
  False,
  False,
  True,
  True,
  False,
  True,
  False,
  False,
  False,
  False,
  True,
  True,
  True,
  False,
  False,
  False],
 [False,
  False,
  True,
  False,
  True,
  False,
  False,
  False,
  False,
  False,
  True,
  False,
  False,
  False,
  True,
  False,
  False,
  False,
  False,
  False,
  False,
  True,
  False,
  True,
  False,
  True,
  False,
  True,
  False,
  False],
 [True,
  False,
  True,
  False,
  False,
  True,
  True,
  True,
  True,
  False,
  False,
  False,
  True,
  False,
  False,
  True,
  True,
  False,
  False,
  True,
  False,
  False,
  False,
  False,
  

In [12]:
best_results = list()
for res in bg.learn(samples=np.array(starting_vectors),yield_best=True):
    best_vec = res[0]
    best_result = res[1]
    best_results.append(res)
    print('Лучший результат:',best_result, 'Лучший вектор:',best_vec,'\n')

HBox(children=(IntProgress(value=0, max=20), HTML(value='')))


Generation 0 top score 66 median score 7.5
Лучший результат: 66 Лучший вектор: [False False False False False  True False False  True False False False
 False False False False  True False False False False False  True False
  True False False  True  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 1 top score 121 median score 58.0
Лучший результат: 121 Лучший вектор: [False False  True False False False False False  True False False False
  True False False False  True False  True False  True False  True False
  True False False False  True  True] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 2 top score 149 median score 106.0
Лучший результат: 149 Лучший вектор: [False False  True False False False False False  True False False False
  True False False False  True False  True False  True False  True False
  True False  True  True  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 3 top score 150 median score 147.0
Лучший результат: 150 Лучший вектор: [False False  True False False False False False  True False False False
  True False False False  True False  True False  True False  True False
  True False False False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 4 top score 176 median score 159.5
Лучший результат: 176 Лучший вектор: [False False  True False False False False False  True False False False
  True False False False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 5 top score 190 median score 183.0
Лучший результат: 190 Лучший вектор: [False False  True False False False False False  True False False False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 6 top score 200 median score 195.5
Лучший результат: 200 Лучший вектор: [ True False  True False False False False False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 7 top score 206 median score 199.5
Лучший результат: 206 Лучший вектор: [ True False  True False False False  True False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 8 top score 209 median score 204.0
Лучший результат: 209 Лучший вектор: [False  True  True False  True False  True False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 



HBox(children=(IntProgress(value=0, max=59), HTML(value='')))


Generation 9 top score 210 median score 205.5
Лучший результат: 210 Лучший вектор: [False False  True False  True False  True False  True False  True False
  True False  True False  True False  True False  True False  True False
  True False  True False  True False] 

