# Сама задача куда поставить крестик или нолик **очень сложная**, поэтому эту задачу надо разбить на подшаги.

1. Для начала определимся, что мы будем рассматривать задачу со стороны крестиков (для большей лаконичности в повествовании)

2. Также определимся, что мы будем рассчитывать вес (то, насколько хорошим решением будет ставить сюда крестик) для каждой клетки по-отдельности

## Но что влияет на этот вес?

Очевидно, все, что дальше чем 4 клетки от нашей рассматриваемой играет незначительную роль в конкретно ее весе, хоть там все будет заставлено крестиками, нашей клетки до этого нет дела, потому что все крестики находятся слишком далеко, чтобы образовать с нашей клеткой 5 подряд

In [1]:
# |X|X|X|X|X|X|X|X|X|X|X|
# |X| | | | | | | | | |X|
# |X| | | | | | | | | |X|
# |X| | | | | | | | | |X|
# |X| | | | | | | | | |X|
# |X| | | | |X| | | | |X|
# |X| | | | | | | | | |X|
# |X| | | | | | | | | |X|
# |X| | | | | | | | | |X|
# |X| | | | | | | | | |X|
# |X|X|X|X|X|X|X|X|X|X|X|

Очевидно также, что клетки, которые находятся не на прямой линии к нашей клетки так же играют незначительную роль в весе конкретно нашей клетки. 

In [2]:
# |_|X|X|X|_|X|X|X|_|
# |X|_|X|X|_|X|X|_|X|
# |X|X|_|X|_|X|_|X|X|
# |X|X|X|_|_|_|X|X|X|
# |_|_|_|_|X|_|_|_|_|
# |X|X|X|_|_|_|X|X|X|
# |X|X|_|X|_|X|_|X|X|
# |X|_|X|X|_|X|X|_|X|
# |_|X|X|X|_|X|X|X|_|

Поэтому от них мы отказываемся, в итоге остается такая "паутинка":

In [3]:
# |X| | | |X| | | |X|
# | |X| | |X| | |X| |
# | | |X| |X| |X| | |
# | | | |X|X|X| | | |
# |X|X|X|X| |X|X|X|X|
# | | | |X|X|X| | | |
# | | |X| |X| |X| | |
# | |X| | |X| | |X| |
# |X| | | |X| | | |X|

### Но в этой "паутинке" могут быть как пустые клетки, так и крестики, и нолики. 

Разобьем задачу дальше:

Будем рассматривать крестики и нолики по-отдельности:

То есть рассчитывать вес сначала только для ноликов, будто крестиков не существует, а потом вес крестиков, будто ноликов не существует. А потом просто сложим эти веса, но для наших клеток, мы добавим еще +1, чтобы при равенстве весов, мы ставили крестик так, как выгодно нам (это весьма сильное допущение, что мы можем просто посчитать чужие веса, будто других фигур нет, но без этого допущения, дальнейшая задача становится очень сложной)

In [4]:
# |X| | | | |   |X| | | | |   | | | | | |
# | |X|O| | |   | |X| | | |   | | |O| | |
# | | |X| | | = | | |X| | | + | | | | | |
# |O|X| |O| |   | |X| | | |   |O| | |O| |
# | | | | | |   | | | | | |   | | | | | |

Но и эту задачу тоже можно упростить, потеряв немного в строгости алгоритма:

Будем рассматривать не все 4 направления, а только одно, например горизонтальное. Тогда посчитав вес для 4-ех направлений, мы можем получить вес нашей клетки, сложив все остальные веса. (Это еще одно достаточно сильное допущение, но без него дальнейшая задача стала бы опять таки слишком сложной)


In [5]:
# |X| | | |X| | | |X|   | | | | | | | | | |   | | | | |X| | | | |   |X| | | | | | | | |   | | | | | | | | |X|
# | |X| | |X| | |X| |   | | | | | | | | | |   | | | | |X| | | | |   | |X| | | | | | | |   | | | | | | | |X| |
# | | |X| |X| |X| | |   | | | | | | | | | |   | | | | |X| | | | |   | | |X| | | | | | |   | | | | | | |X| | |
# | | | |X|X|X| | | |   | | | | | | | | | |   | | | | |X| | | | |   | | | |X| | | | | |   | | | | | |X| | | |
# |X|X|X|X| |X|X|X|X| = |X|X|X|X| |X|X|X|X| + | | | | | | | | | | + | | | | | | | | | | + | | | | | | | | | |
# | | | |X|X|X| | | |   | | | | | | | | | |   | | | | |X| | | | |   | | | | | |X| | | |   | | | |X| | | | | |
# | | |X| |X| |X| | |   | | | | | | | | | |   | | | | |X| | | | |   | | | | | | |X| | |   | | |X| | | | | | |
# | |X| | |X| | |X| |   | | | | | | | | | |   | | | | |X| | | | |   | | | | | | | |X| |   | |X| | | | | | | |
# |X| | | |X| | | |X|   | | | | | | | | | |   | | | | |X| | | | |   | | | | | | | | |X|   |X| | | | | | | | |

Теперь получается мы имеем полоску длиной 8, где каждая ячейка может принимать либо 1 (есть крестик/нолик), либо 0 (клетка пуста), тогда у нас получается 

In [6]:
def mask_to_str(str_mask:str):
    mask = bin(int_mask + 2**8)[3:]
    mask = mask[:4] + "0" + mask[4:]
    return "|" + mask.replace("1", "X|").replace("0", " |")

i = 1
for int_mask in range(2**8):
    mask = bin(2**8 + int_mask)[3:]
    space = " " * (3 - len(str(i)))
    print(f"{space}{i}. {mask_to_str(mask)}")
    i += 1

  1. | | | | | | | | | |
  2. | | | | | | | | |X|
  3. | | | | | | | |X| |
  4. | | | | | | | |X|X|
  5. | | | | | | |X| | |
  6. | | | | | | |X| |X|
  7. | | | | | | |X|X| |
  8. | | | | | | |X|X|X|
  9. | | | | | |X| | | |
 10. | | | | | |X| | |X|
 11. | | | | | |X| |X| |
 12. | | | | | |X| |X|X|
 13. | | | | | |X|X| | |
 14. | | | | | |X|X| |X|
 15. | | | | | |X|X|X| |
 16. | | | | | |X|X|X|X|
 17. | | | |X| | | | | |
 18. | | | |X| | | | |X|
 19. | | | |X| | | |X| |
 20. | | | |X| | | |X|X|
 21. | | | |X| | |X| | |
 22. | | | |X| | |X| |X|
 23. | | | |X| | |X|X| |
 24. | | | |X| | |X|X|X|
 25. | | | |X| |X| | | |
 26. | | | |X| |X| | |X|
 27. | | | |X| |X| |X| |
 28. | | | |X| |X| |X|X|
 29. | | | |X| |X|X| | |
 30. | | | |X| |X|X| |X|
 31. | | | |X| |X|X|X| |
 32. | | | |X| |X|X|X|X|
 33. | | |X| | | | | | |
 34. | | |X| | | | | |X|
 35. | | |X| | | | |X| |
 36. | | |X| | | | |X|X|
 37. | | |X| | | |X| | |
 38. | | |X| | | |X| |X|
 39. | | |X| | | |X|X| |
 40. | | |X| | | |X|X|X|


И того 256 вариантов, среди которых есть варианты, где до победы (5 в ряд) не хватает одного крестика, вес таких клеток очевиден = INF, потому что надо ставить сюда, чтобы выйграть, получается от таких вариантов, можно избавиться:

In [7]:
i = 1
for int_mask in range(2**8):
    mask = bin(2**8 + int_mask)[3:]
    if mask.count("1111"):
        continue

    space = " " * (3 - len(str(i)))
    print(f"{space}{i}. {mask_to_str(int_mask)}")
    i += 1

  1. | | | | | | | | | |
  2. | | | | | | | | |X|
  3. | | | | | | | |X| |
  4. | | | | | | | |X|X|
  5. | | | | | | |X| | |
  6. | | | | | | |X| |X|
  7. | | | | | | |X|X| |
  8. | | | | | | |X|X|X|
  9. | | | | | |X| | | |
 10. | | | | | |X| | |X|
 11. | | | | | |X| |X| |
 12. | | | | | |X| |X|X|
 13. | | | | | |X|X| | |
 14. | | | | | |X|X| |X|
 15. | | | | | |X|X|X| |
 16. | | | |X| | | | | |
 17. | | | |X| | | | |X|
 18. | | | |X| | | |X| |
 19. | | | |X| | | |X|X|
 20. | | | |X| | |X| | |
 21. | | | |X| | |X| |X|
 22. | | | |X| | |X|X| |
 23. | | | |X| | |X|X|X|
 24. | | | |X| |X| | | |
 25. | | | |X| |X| | |X|
 26. | | | |X| |X| |X| |
 27. | | | |X| |X| |X|X|
 28. | | | |X| |X|X| | |
 29. | | | |X| |X|X| |X|
 30. | | |X| | | | | | |
 31. | | |X| | | | | |X|
 32. | | |X| | | | |X| |
 33. | | |X| | | | |X|X|
 34. | | |X| | | |X| | |
 35. | | |X| | | |X| |X|
 36. | | |X| | | |X|X| |
 37. | | |X| | | |X|X|X|
 38. | | |X| | |X| | | |
 39. | | |X| | |X| | |X|
 40. | | |X| | |X| |X| |


И того 208 вариантов, так же очевидно, что среди этих вариантов есть много зеркальных, их мы тоже исключим

In [8]:
i = 1
visited = set()
for int_mask in range(2**8):
    mask = bin(2**8 + int_mask)[3:]
    if mask.count("1111"):
        continue

    if mask[::-1] in visited:
        continue
    visited.add(mask)

    space = " " * (3 - len(str(i)))
    print(f"{space}{i}. {mask_to_str(int_mask)}")
    i += 1

  1. | | | | | | | | | |
  2. | | | | | | | | |X|
  3. | | | | | | | |X| |
  4. | | | | | | | |X|X|
  5. | | | | | | |X| | |
  6. | | | | | | |X| |X|
  7. | | | | | | |X|X| |
  8. | | | | | | |X|X|X|
  9. | | | | | |X| | | |
 10. | | | | | |X| | |X|
 11. | | | | | |X| |X| |
 12. | | | | | |X| |X|X|
 13. | | | | | |X|X| | |
 14. | | | | | |X|X| |X|
 15. | | | | | |X|X|X| |
 16. | | | |X| | | | |X|
 17. | | | |X| | | |X| |
 18. | | | |X| | | |X|X|
 19. | | | |X| | |X| | |
 20. | | | |X| | |X| |X|
 21. | | | |X| | |X|X| |
 22. | | | |X| | |X|X|X|
 23. | | | |X| |X| | | |
 24. | | | |X| |X| | |X|
 25. | | | |X| |X| |X| |
 26. | | | |X| |X| |X|X|
 27. | | | |X| |X|X| | |
 28. | | | |X| |X|X| |X|
 29. | | |X| | | | | |X|
 30. | | |X| | | | |X| |
 31. | | |X| | | | |X|X|
 32. | | |X| | | |X| | |
 33. | | |X| | | |X| |X|
 34. | | |X| | | |X|X| |
 35. | | |X| | | |X|X|X|
 36. | | |X| | |X| | |X|
 37. | | |X| | |X| |X| |
 38. | | |X| | |X| |X|X|
 39. | | |X| | |X|X| | |
 40. | | |X| | |X|X| |X|


И того 110 вариантов, если не считать полностью пустого 1. | | | | | | | | | |, то у нас 109 параметров, которые надо каким-то образом подобрать. Этим и займется мой алгоритм:

## Генетический алгоритм

Для начала скачаем все необходимые библиотеки, загрузим заранее сделанные классы. И зададим параметры нашего алгоритма

In [1]:
import random
import matplotlib.pyplot as plt
from Player import Player
from Field import Field

from threading import Thread
from queue import Queue

# Константы задачи
HROMO_LENGTH = 109
SIZE_FIELD = 8

# Константы алгоритма
POPULATION_SIZE = 20
MAX_WEIGHT = 20

P_TOURNAMENT = 0.4

P_CROSSOVER = 0.9
COUNT_CROSSOVER = 8

P_MUTATION = 0.3
COUNT_MUTATION = 10
FORCE_MUTATION = 0.5

MAX_GENERATIONS = 8

RANDOM_SEED = 42
random.seed(RANDOM_SEED)

Определим класс, который будет хранить нашу "хромосому, сосотоящую" из 109 весов для каждого из вариантов расстановок крестиков или ноликов. А так же функции, которые создают индивидом и популяцию

In [2]:
class Individual(list):
    def __init__(self, *args):
        super().__init__(*args)
        self.fitness = 0

def individualCreator():
    return Individual([random.randint(0, MAX_WEIGHT) for _ in range(HROMO_LENGTH)])

def populationCreator():
    return list([individualCreator() for _ in range(POPULATION_SIZE)])

Определим функцию, которая принимает популяцию и индивидов, которых надо сравнить. Они играют пока один из них не выигрывает (ему добавляется + 1 рейтинг), или пока один из них не сделает запрещенный прием (поставит на клетку, где стоит другая фигура), тогда никто не получает баллов рейтинга

In [3]:
def get_win_index(population:list[list[int]], i:int, j:int, queue:Queue):
    field = Field()
    player1 = Player(Player.ZERO, SIZE_FIELD, population[i])
    player2 = Player(Player.CROSS, SIZE_FIELD, population[j])
    
    while field.game_is_over() == False:
        row, col = player1.get_move(field.get_last_move())
        if field._set_sign(Player.ZERO, row, col):
            return

        row, col = player2.get_move(field.get_last_move())
        if field._set_sign(Player.CROSS, row, col):
            return

    if (field.get_win_sign() == Player.ZERO):
        queue.put(i)
        return
    queue.put(j)

В этой функции мы формируем общий рейтинг, каждый индивид играет с определенным кол-вом других случайных особей используя многопоточность. И в итоге возвращает итоговый массив

In [4]:
def getPopulationFitness(population: list[list[int]]):
    fitnesses = [0] * POPULATION_SIZE

    for i in range(POPULATION_SIZE):
        queue = Queue()
        threadings = []

        opponents = list(range(0, POPULATION_SIZE))
        opponents.remove(i)
        random.shuffle(opponents)
        opponents = set(opponents[:int((POPULATION_SIZE-1) * P_TOURNAMENT)])

        for j in range(POPULATION_SIZE):
            if j not in opponents:
                continue

            thread = Thread(target=get_win_index, args=(population, i, j, queue))
            thread.start()
            threadings.append(thread)

        for thread in threadings:
            thread.join()

        while not queue.empty():
            fitnesses[queue.get()] += 1

    return fitnesses

Далее мы формируем популяцию и их первый рейтинг

In [5]:
population = populationCreator()
generationCounter = 0

fitnessValues = getPopulationFitness(population)
for fitnessValue, individ in zip(fitnessValues, population):
    individ.fitness = fitnessValue

print(fitnessValues)

maxFitnessValues = []
meanFitnessValues = []

[5, 7, 19, 10, 3, 4, 8, 3, 5, 8, 3, 2, 3, 4, 10, 4, 3, 6, 4, 5]


Далее нам надо определить функции которые будут отвечать за изменение и выборку особей:
1. clone(value) - возвращает копию индивида
2. tournament(population, length) - это турнирный отбор, который выбирает три случайные особи и на основе их рейтинга, отбирает самого сильного индивида, это позволяет набрать в следующую популяцию хороших особей (даже несколько раз), но так же не потерять слабых особей, которые могут носить полезные гены. Также это помогает не выраждаться особям, чтобы они не становились одинаковыми.
3. crossover(parent1, parent2, start=0, count=0) - это кроссинговер, который перемешивает гены у особей, несколько раз меняя их местами, в итоге у нас получается, что этот кросинговер, вырезает участки гена и вставляет их в другие особи
4. mutation(individ, mutationRate=0.01) - мутация отедльных генов, где их значение в зависимости от FORCE_MUTATION, изменяется как в плюс, так и в минус

In [6]:
def clone(value:Individual):
    individ = Individual(value[:])
    individ.fitness = value.fitness
    return individ

def tournament(population, length):
    offspring = []
    for _ in range(length):
        i1 = i2 = i3 = 0
        while (i1 == i2) or (i2 == i3) or (i1 == i3):
            i1, i2, i3 = random.randint(0, length - 1), random.randint(0, length - 1), random.randint(0, length - 1)

        offspring.append(max([population[i1], population[i2], population[i3]], key=lambda ind: ind.fitness))

    return offspring

def crossover(parent1, parent2, start=0, count=0):
    if (start >= HROMO_LENGTH - 2 or count == COUNT_CROSSOVER):
        return
    
    s = random.randint(start + 1, len(parent1) - 2)
    parent1[s:], parent2[s:] = parent2[s:], parent1[s:]
    crossover(parent1, parent2, s, count + 1)


def mutation(individ, mutationRate=0.01):
    max_mut = int(FORCE_MUTATION * MAX_WEIGHT)
    for i in range(len(individ)):
        if random.random() < mutationRate:
            individ[i] = (random.randint(0, max_mut) - max_mut//2)
            individ[i] = abs(individ[i])

Это уже итоговый цикл, где и происходят постепенные процессы эволюции:
1. Выбор особей, которые пройдут в новую популяцию offspring на основе их рейтинга
2. Кроссенговер особей с вероятностью P_CROSSOVER
3. Мутация особей с вероятностью P_MUTATION
4. Обновление рейтинга особей
5. Подведение статистики

In [7]:
while generationCounter < MAX_GENERATIONS:
    generationCounter += 1
    offspring = tournament(population, len(population))
    offspring = list(map(clone, offspring))

    for parent1, parent2 in zip(offspring[::2], offspring[1::2]):
        if random.random() < P_CROSSOVER:
            crossover(parent1, parent2)

    for individ in offspring:
        if random.random() < P_MUTATION:
            mutation(individ, (float(COUNT_MUTATION) / HROMO_LENGTH))

    freshFitnessValues = getPopulationFitness(offspring)

    for individual, fitnessValue in zip(offspring, freshFitnessValues):
        individual.fitness = fitnessValue

    population = offspring[:]

    fitnessValues = [individ.fitness for individ in population]

    maxFintess = max(fitnessValues)
    meanFitness = sum(fitnessValues) / len(fitnessValues)
    maxFitnessValues.append(maxFintess)
    meanFitnessValues.append(meanFitness)
    print(f"Поколение: {generationCounter}. Макс. приспособ: {maxFintess}. Средняя приспособ: {meanFitness}.")

    bestIndex = fitnessValues.index(maxFintess)
    print("Лучший индивид:", *population[bestIndex], "\n")

Поколение: 1. Макс. приспособ: 17. Средняя приспособ: 5.9.
Лучший индивид: 2 1 10 2 16 7 8 15 6 17 4 18 18 15 7 15 13 6 3 3 13 11 13 13 14 1 20 20 3 1 12 10 3 7 6 6 17 14 4 13 5 8 14 7 2 14 17 3 1 20 17 0 2 7 20 9 15 7 12 9 14 2 1 5 14 13 15 14 6 10 19 4 10 10 11 12 4 11 16 17 3 10 7 14 3 8 14 7 4 3 5 2 19 2 7 12 3 18 7 18 19 1 19 2 13 18 18 15 0 

Поколение: 2. Макс. приспособ: 13. Средняя приспособ: 6.35.
Лучший индивид: 2 1 10 2 16 7 8 15 6 17 4 18 18 15 7 15 13 6 3 3 13 11 13 13 14 1 20 20 3 1 12 10 3 7 6 6 17 14 4 13 5 8 14 7 2 14 17 3 1 20 17 0 2 7 20 9 15 7 12 9 14 2 1 5 14 13 15 14 8 6 5 19 4 20 2 5 20 15 14 18 18 14 18 20 3 8 14 7 4 3 5 2 19 2 7 12 3 18 1 11 16 2 9 14 14 1 18 1 7 

Поколение: 3. Макс. приспособ: 13. Средняя приспособ: 6.3.
Лучший индивид: 2 1 2 2 16 7 8 4 6 17 4 18 18 15 7 15 13 6 3 0 13 11 13 13 14 3 20 20 3 1 12 10 3 7 6 6 17 14 4 2 13 3 7 13 18 12 16 2 3 9 10 7 10 5 2 16 20 3 16 16 6 11 11 20 4 5 3 4 8 6 5 19 4 20 2 12 4 11 16 17 3 10 7 14 3 8 5 7 4 3 5 2 1

## Итог алгоритма

После многочисленных попыток, был получен такой индивид, и по совместительству веса для игрока:

In [6]:
weights = [3, 3, 4, 1, 5, 6, 3, 5, 1, 1, 2, 9, 6, 27, 8, 5, 9, 8, 19, 9, 28, 3, 0, 14, 13, 23, 5, 8, 21, 11, 7, 25, 7, 6, 5, 30, 7, 1, 22, 6, 0, 8, 7, 3, 1, 17, 30, 2, 1, 5, 3, 12, 4, 19, 1, 11, 12, 4, 4, 18, 1, 6, 24, 3, 21, 10, 11, 9, 4, 13, 20, 9, 11, 7, 27, 26, 3, 9, 6, 10, 6, 0, 9, 8, 12, 5, 11, 11, 27, 7, 7, 9, 17, 5, 1, 8, 9, 5, 13, 24, 24, 8, 8, 25, 20, 5, 5, 2, 10]

Проверим же наш прототип алгоритма для игры в крестики нолики:

In [8]:
from TicTacToe import TicTacToe
import tkinter as tk

root = tk.Tk()
game = TicTacToe(root, weights)
root.mainloop()

Кнопка нажата: (3, 3), Игрок: O
Кнопка нажата: (3, 4), Игрок: X
Кнопка нажата: (4, 3), Игрок: O
Кнопка нажата: (4, 4), Игрок: X
Кнопка нажата: (2, 3), Игрок: O
Кнопка нажата: (5, 3), Игрок: X
Кнопка нажата: (1, 3), Игрок: O
Кнопка нажата: (0, 3), Игрок: X
Кнопка нажата: (2, 4), Игрок: O
Кнопка нажата: (3, 5), Игрок: X
Кнопка нажата: (2, 6), Игрок: O
Кнопка нажата: (6, 2), Игрок: X
Кнопка нажата: (7, 1), Игрок: O
Кнопка нажата: (5, 2), Игрок: X
Кнопка нажата: (2, 5), Игрок: O
Кнопка нажата: (2, 2), Игрок: X
Кнопка нажата: (2, 7), Игрок: O
Игрок Компьютер победил!
