In [None]:
import random
import numpy as np
from matplotlib import pyplot as plt
from difflib import SequenceMatcher # difflib는 파이썬 내장 모듈이다

alphabet = "abcdefghijklmnopqrstuvwxyzABCDEFGHIJKLMNOPQRSTUVWXYZ,.! " # 개체를 구성하는 재료
target = "Hello World!" # 진화를 통해 개체들이 도달해야 하는 최종 목표

class individual:
    def __init__(self, string, fitness=0):
        self.string = string
        self.fitness = fitness

def similar(a, b):
    '''
    SequenceMatcher는 유연한(flexible) 클래스로 sequence 내부 원소들이 hashable하는 한, 어떤 자료형의 sequence든 상관없이 sequence쌍 비교를 위한 것이다
    ratio() 메서드는 sequence들 간 유사성의 정도를 [0, 1]범위 안의 float형 값으로 반환한다
    유사성을 측정하는 방법은 아래와 같다
    T = 양쪽 sequence들 내 모든 원소들의 개수(2개의 sequence의 길이가 각각 4, 6이라고 한다면 T는 10이 된다)
    M = 양쪽 sequence들 비교했을 때 일치하는 것의 개수
    유사성 = (2.0 * M) / T # M에 2.0을 곱하는 것은 애초에 T가 두 sequence 내 모든 원소들의 개수를 의미하고 있으며, 따라서 일치하는 원소의 개수도 각 sequence마다 별도로 세기 때문이다
    유사성 = 1.0 --> 두 sequence가 완전히 일치하는 이상적인 상황 / 유사성 = 0.0 --> 두 sequence가 전혀 일치하지 않는 상황
    '''
    return SequenceMatcher(None, a, b).ratio() # 두 문자열 간 유사도를 비율(확률)로 반환한다

# 초기 개체군 생성
def spawn_population(length=26, size=100):
    # length : 개체의 크기(문자열의 길이)
    # size : 개체군의 크기
    pop = [] # 개체군
    for i in range(size):
        string = ''.join(random.choices(alphabet, k=length)) # alphabet에서 k개의 문자를 중복을 허용하여(with replacement) 무작위로 추출한다
        individual = individual(string) # 굳이 클래스를 사용하지 않아도 된다
        # individual = {"string":string, "fitness":0}
        pop.append(individual)

    return pop

def recombine(p1_, p2_):
    p1 = p1_.string
    p2 = p2_.string
    # p1 = p1_["string"]
    # p2 = p2_["string"]
    child1, child2 = [], []
    cross_pt = random.randint(0, len(p1)) # [0, len(p1)] 구간에서 무작위 정수 하나를 반환한다
    chlid1.extend(p1[0:cross_pt]) # extend() 메서드는 인자로 주어진 리스트의 원소를 메서드를 호출한 리스트의 끝에 삽입한다
    chlid1.extend(p2[cross_pt:])
    chlid2.extend(p2[0:cross_pt])
    chlid2.extend(p1[cross_pt:])
    c1 = individual(''.join(child1))
    c2 = individual(''.join(child2))

    return c1, c2

def mutate(x, mut_rate=0.01):
    new_x = [] # 변이된 개체를 담는 변수
    for char in x.string:
        if random.random() < mut_rate: # [0.0, 1.0] 사이의 무작위 정수값을 추출하여 그것이 변이율보다 작으면 변이가 일어난다
            new_x.extend(random.choices(alphabet, k=1)) # random.choices()에서 반환되는 것은 원소가 1개인 리스트로 이를 그냥 append하면 리스트 그 자체가 new_x에 삽입된다
                                                        # 따라서 extend() 메서드를 사용해야 한다
        else:
            new_x.append(char)
    
    return individual(''.join(new_x))

def evaluate_population(pop, target):
    avg_fit = 0
    for i in range(len(pop)):
        fit = similar(pop[i].string, target) # 개체와 최종 목표 간 유사도를 계산한다
        pop[i].fitness = fit
        avg_fit += fit
    avg_fit /= len(pop) # 개체군의 적합도 평균을 계산한다

    return pop, avg_fit

def next_generation(pop, size=100, length=26, mut_rate=0.01):
    new_pop = []
    while len(new_pop) < size:
        parents = random.choices(pop, k=2, weights=[x.fitness for x in pop])
        offspring_

In [4]:
"".join([["abc"], ["def"]]), "".join(["abc", "def"])

TypeError: sequence item 0: expected str instance, list found

In [10]:
a = [1,2,3,4]
a.append(5)
print(a)
a.extend([6])
print(a)
a.append([7])
print(a)

[1, 2, 3, 4, 5]
[1, 2, 3, 4, 5, 6]
[1, 2, 3, 4, 5, 6, [7]]
