## 실습 문제: 로마니아 지도 데이터의 인접 행렬 변환

**설명**: 컴퓨터 과학 및 그래프 이론에서 가중치가 있는 그래프를 처리할 때, 딕셔너리 형태의 데이터를 선형 대수 연산이 가능한 행렬 형태로 변환하는 것은 매우 중요합니다. 이번 실습에서는 딕셔너리로 정의된 '로마니아 지도' 데이터를 입력받아, NumPy를 사용해 인접 행렬(Adjacency Matrix)로 변환합니다. 연결되지 않은 도시는 무한대(`np.inf`)로, 자기 자신은 `0`으로, 연결된 도시는 해당 거리 값으로 설정해야 합니다.

$$A_{ij} = \begin{cases} \text{distance}(i, j) & \text{if connected} \\ 0 & \text{if } i = j \\ \infty & \text{otherwise} \end{cases}$$

**요구사항**:

  - `romania_map`의 모든 도시 이름(Key)을 추출하고 알파벳 순으로 정렬하여 인덱스 매핑을 생성하세요.
  - `np.full` 함수를 사용하여 $N \times N$ 크기의 행렬을 `np.inf`로 초기화한 뒤, 대각 성분(자기 자신)은 0으로 설정하세요.
  - 이중 반복문 혹은 딕셔너리 순회를 통해 두 도시 간의 거리가 존재하는 경우 행렬의 해당 좌표 $(i, j)$에 거리 값을 할당하고 결과를 반환하세요.

<img src="https://lh3.googleusercontent.com/d/1Rl87UBEvs0aL1sMXqXXY_xU85bTucYK5" width="600">

In [1]:
import numpy as np
n=3
adj_matrix = np.array([[0 if i==j else np.inf for i in range(n)] for j in range(n)])
print(adj_matrix)

[[ 0. inf inf]
 [inf  0. inf]
 [inf inf  0.]]


In [2]:

import numpy as np

romania_map = {
    'Arad': {'Zerind': 75, 'Sibiu': 140, 'Timisoara': 118},
    'Zerind': {'Arad': 75, 'Oradea': 71},
    'Oradea': {'Zerind': 71, 'Sibiu': 151},
    'Sibiu': {'Arad': 140, 'Oradea': 151, 'Fagaras': 99, 'Rimnicu Vilcea': 80},
    'Timisoara': {'Arad': 118, 'Lugoj': 111},
    'Lugoj': {'Timisoara': 111, 'Mehadia': 70},
    'Mehadia': {'Lugoj': 70, 'Drobeta': 75},
    'Drobeta': {'Mehadia': 75, 'Craiova': 120},
    'Craiova': {'Drobeta': 120, 'Rimnicu Vilcea': 146, 'Pitesti': 138},
    'Rimnicu Vilcea': {'Sibiu': 80, 'Craiova': 146, 'Pitesti': 97},
    'Fagaras': {'Sibiu': 99, 'Bucharest': 211},
    'Pitesti': {'Rimnicu Vilcea': 97, 'Craiova': 138, 'Bucharest': 101},
    'Bucharest': {'Fagaras': 211, 'Pitesti': 101, 'Giurgiu': 90, 'Urziceni': 85},
    'Giurgiu': {'Bucharest': 90},
    'Urziceni': {'Bucharest': 85, 'Vaslui': 142, 'Hirsova': 98},
    'Hirsova': {'Urziceni': 98, 'Eforie': 86},
    'Eforie': {'Hirsova': 86},
    'Vaslui': {'Urziceni': 142, 'Iasi': 92},
    'Iasi': {'Vaslui': 92, 'Neamt': 87},
    'Neamt': {'Iasi': 87}
}

def create_adjacency_matrix(graph: dict[str, dict[str, int]]) -> tuple[list[str], np.ndarray]:
    """
    그래프 딕셔너리를 입력받아 정렬된 도시 이름 리스트와 인접 행렬을 반환합니다.
    """
    # 1. 도시 이름 추출 및 정렬
    cities = sorted([k for k in graph.keys()]) # TODO: graph의 키를 추출하여 알파벳순 정렬

    # 도시 이름을 인덱스로 매핑하기 위한 딕셔너리 생성
    city_to_idx = {city: i for i, city in enumerate(cities)}
    n = len(cities)

    # 2. 인접 행렬 초기화 (TODO)
    # np.inf로 초기화하고 대각선은 0으로 설정
    # adj_matrix = np.array([[0 if i==j else np.inf for i in range(n)] for j in range(n)])
    adj_matrix = np.full((n, n), np.inf)
    np.fill_diagonal(adj_matrix, 0)

    # 3. 거리 정보 채우기 (TODO)
    # graph 딕셔너리를 순회하며 연결된 도시의 거리를 adj_matrix에 할당
    for city, idx in city_to_idx.items() :
        for ter, dist in graph[city].items() :
            ter_idx = city_to_idx[ter]

            adj_matrix[idx][ter_idx] = dist

    return cities, adj_matrix


In [3]:
cities, matrix = create_adjacency_matrix(romania_map)

print(f"총 도시 수: {len(cities)}")

start_city, end_city = 'Arad', 'Sibiu'
idx_start = cities.index(start_city)
idx_end = cities.index(end_city)
dist = matrix[idx_start, idx_end]
print(f"\n{start_city} -> {end_city} 거리: {dist}")

start_city, end_city = 'Sibiu', 'Fagaras'
idx_start = cities.index(start_city)
idx_end = cities.index(end_city)
dist = matrix[idx_start, idx_end]
print(f"\n{start_city} -> {end_city} 거리: {dist}")

start_city, end_city = 'Arad', 'Fagaras'
idx_start = cities.index(start_city)
idx_end = cities.index(end_city)
dist = matrix[idx_start, idx_end]
print(f"\n{start_city} -> {end_city} 거리: {dist}")


총 도시 수: 20

Arad -> Sibiu 거리: 140.0

Sibiu -> Fagaras 거리: 99.0

Arad -> Fagaras 거리: inf


## 실습 문제: Floyd-Warshall과 완전 연결 그래프(Complete Graph)의 추상화

**설명**:
우리가 다루는 로마니아 지도는 모든 도시가 서로 연결되어 있지 않은 **희소 그래프(Sparse Graph)**입니다. 하지만 행렬 기반의 Floyd-Warshall 알고리즘을 수행하기 위해서는, 이를 **완전 연결 그래프(Complete Graph)** 로 변환해서 풀어야 합니다.

이를 위해 우리는 **"연결되지 않은 도시는 거리가 무한대($\infty$)인 도로로 연결되어 있다"**고 가정합니다. 이 추상화를 통해 우리는 `if connected:`와 같은 예외 처리 없이, 모든 $N \times N$ 쌍에 대해 동일한 행렬 연산을 수행할 수 있습니다. 무한대 값은 덧셈이나 최솟값 연산($\min$) 과정에서 자연스럽게 도태되므로, 실제 유효한 경로만 남게 됩니다.

$$D_{ij}^{(k)} = \min(D_{ij}^{(k-1)}, \ D_{ik}^{(k-1)} + D_{kj}^{(k-1)})$$
*(여기서 $D_{ij}$가 $\infty$라면, 더 짧은 경유 경로가 발견될 때까지 해당 값은 무한대로 유지됩니다.)*

**요구사항**:
- **행렬 초기화의 의미 이해하기**: 초기 인접 행렬을 생성할 때 `np.full`을 사용하여 모든 성분을 `np.inf`로 채웁니다. 이는 모든 도시 쌍 사이에 '무한히 긴 도로'가 있다고 가정하는 것입니다.
- **Floyd-Warshall 구현**: 3중 반복문 개념을 NumPy의 **브로드캐스팅**으로 최적화하여 구현합니다. `inf`가 포함된 연산이 어떻게 자동으로 최솟값을 걸러내는지 확인합니다.
- **결과 검증**: 'Arad'에서 직접 연결되지 않은 도시(예: 'Bucharest')까지의 거리가 `inf`에서 구체적인 수치로 변경되었는지 확인합니다.

In [4]:
import numpy as np

# -----------------------------------------------------------
# Floyd-Warshall 알고리즘
# -----------------------------------------------------------
def floyd_warshall(adj_matrix: np.ndarray) -> np.ndarray:
    """
    모든 쌍 최단 경로(All-Pairs Shortest Path)를 계산합니다.
    inf로 채워진 행렬을 연산하여 실제 최단 거리를 찾아냅니다.
    """
    # 원본 행렬 보호를 위해 복사
    dist_matrix = adj_matrix.copy()
    n = dist_matrix.shape[0]

    print(f"[*] 초기 상태: 전체 {n*n}개 경로 중 실제 연결된 도로 외에는 모두 inf입니다.")

    # 경유지 k를 하나씩 추가하며 모든 쌍(i, j)의 거리를 갱신
    # 수학적으로는 모든 i, j가 연결되어 있다고 가정하고(값은 inf), 최솟값을 찾습니다.
    for k in range(n):
        # [수정 완료] NumPy 브로드캐스팅을 사용하여 점화식을 구현
        # D[i, j] = min(D[i, j], D[i, k] + D[k, j])
        
        # 1. D[i, k] + D[k, j] 계산
        # dist_matrix[:, k]는 k번째 열 (i -> k), shape: (n,) -> (n, 1)로 변환
        # dist_matrix[k, :]는 k번째 행 (k -> j), shape: (n,)
        # (n, 1) + (n,) -> (n, n)으로 브로드캐스팅되어 모든 (i, j) 조합의 경유 거리가 계산됨
        new_routes = dist_matrix[:, k].reshape(-1, 1) + dist_matrix[k, :]
        
        # 2. 기존 거리와 경유 거리 중 최솟값으로 갱신
        dist_matrix = np.minimum(dist_matrix, new_routes)

    return dist_matrix

In [5]:
# 실행 및 검증
cities, initial_matrix = create_adjacency_matrix(romania_map)

# 알고리즘 수행
final_matrix = floyd_warshall(initial_matrix)

# 검증: Arad -> Bucharest (직접 연결 X)
# 초기에는 inf였으나, 알고리즘 수행 후 418.0이 되어야 함
start, end = 'Arad', 'Bucharest'
idx_s, idx_e = cities.index(start), cities.index(end)

initial_val = initial_matrix[idx_s, idx_e]
final_val = final_matrix[idx_s, idx_e]

print(f"\n[{start} -> {end}]")
print(f"  - 초기값 (인접 행렬): {initial_val} (연결 안 됨)")
print(f"  - 결과값 (최단 거리): {final_val}")

[*] 초기 상태: 전체 400개 경로 중 실제 연결된 도로 외에는 모두 inf입니다.

[Arad -> Bucharest]
  - 초기값 (인접 행렬): inf (연결 안 됨)
  - 결과값 (최단 거리): 418.0


## 실습 문제: TSP를 위한 Order Crossover 및 Inversion Mutation 구현

**설명**: 외판원 문제(TSP)에서 염색체는 방문하는 도시들의 순서(순열)로 표현됩니다. 일반적인 교차 연산을 수행하면 도시가 중복되거나 누락될 수 있으므로, 순열의 유효성을 보장하는 특수한 연산자가 필요합니다. \*\*Order Crossover (OX1)\*\*는 부모의 부분 경로 순서를 보존하며, **Inversion Mutation**은 경로의 일부분을 뒤집어 지역 최적해(Local Optima)를 탈출하는 데 도움을 줍니다.

$$T = (c_1, c_2, \dots, c_n) \quad \text{where} \quad c_i \in \{0, 1, \dots, n-1\}, \forall i \neq j \Rightarrow c_i \neq c_j$$

**요구사항**:

  - **Order Crossover**: 첫 번째 부모(Parent 1)에서 임의의 구간을 선택하여 자식에게 복사하고, 나머지 빈 공간은 두 번째 부모(Parent 2)의 도시 순서대로 채우되 이미 자식에게 있는 도시는 제외합니다.
  - **Inversion Mutation**: 경로 내에서 임의의 두 지점을 선택하고, 그 사이의 구간을 역순으로 뒤집습니다.
  - 주어진 부모 경로와 테스트용 인덱스를 사용하여 두 함수가 올바르게 작동하는지 출력하여 확인합니다.


In [6]:
import random

def order_crossover(parent1: list[int], parent2: list[int]) -> list[int]:
    """
    Order Crossover (OX1) 연산을 수행합니다.
    parent1의 start부터 end-1까지의 구간을 자식에게 복사하고,
    나머지 값은 parent2의 순서를 따르되 중복을 제외하고 채웁니다.

    Args:
        parent1: 첫 번째 부모 경로 (예: [0, 1, 2, 3, 4, 5, 6, 7, 8, 9])
        parent2: 두 번째 부모 경로 (예: [9, 8, 7, 6, 5, 4, 3, 2, 1, 0])
        start: 교차 구간 시작 인덱스 (포함)
        end: 교차 구간 끝 인덱스 (미포함)

    Returns:
        자식 경로 (list[int])
    """
    size = len(parent1)
    child = [-1] * size

    start = random.randint(0, size-1)
    end = random.randint(start+1, size)

    # 1. Parent1의 구간 복사
    # TODO: parent1[start:end]를 child의 해당 위치에 복사하세요.
    child[start:end] = parent1[start:end]

    # 2. Parent2를 순회하며 빈 공간 채우기
    # TODO: parent2의 요소를 순서대로 확인하며 child에 없는 도시들을 child의 빈 공간(-1인 곳)에 채우세요.
    # (주의: 리스트의 끝까지 가면 다시 0번 인덱스부터 탐색하는 방식이 아닌, 단순히 빈 칸을 순서대로 채우는 방식을 사용합니다.)
    j = 0
    for i in range(size):
        if parent2[i] in child : continue
        while child[j] != -1 : j += 1
        child[j] = parent2[i]
        j+=1
            
    return child

def inversion_mutation(state: list[int]) -> list[int]:
    """
    Inversion Mutation 연산을 수행합니다.
    주어진 구간 [start, end)의 도시 순서를 역순으로 뒤집습니다.

    Args:
        tour: 기존 경로
        start: 반전 구간 시작 인덱스
        end: 반전 구간 끝 인덱스

    Returns:
        변이된 새로운 경로
    """
    # 원본 리스트 보존을 위해 복사
    new_tour = state[:]
    size = len(state)
    start = random.randint(0,size-1)
    end = random.randint(start+1, size)
    # TODO: new_tour의 start부터 end-1까지의 구간을 뒤집으세요(reverse).
    new_tour[start:end] = new_tour[start:end][::-1]

    return new_tour



In [7]:
# 테스트 데이터 설정
p1 = [1, 2, 3, 4, 5, 6, 7, 8, 9]
p2 = [9, 8, 7, 6, 5, 4, 3, 2, 1]

# Crossover 실행
child_tour = order_crossover(p1, p2)
print(f"Parent 1: {p1}")
print(f"Parent 2: {p2}")
print(f"Child (OX): {child_tour}")

# Mutation 실행
mutated_tour = inversion_mutation(p1)
print(f"Original: {p1}")
print(f"Mutated : {mutated_tour}")

Parent 1: [1, 2, 3, 4, 5, 6, 7, 8, 9]
Parent 2: [9, 8, 7, 6, 5, 4, 3, 2, 1]
Child (OX): [1, 2, 3, 4, 9, 8, 7, 6, 5]
Original: [1, 2, 3, 4, 5, 6, 7, 8, 9]
Mutated : [1, 2, 3, 4, 5, 6, 7, 8, 9]


## 실습 문제: 객체 지향 설계를 활용한 TSP 유전 알고리즘(GA) 완성

**설명**:
지금까지 구현한 `TSPProblem` 클래스, **Order Crossover**, **Inversion Mutation**, 그리고 **Roulette Wheel Selection**을 결합하여 실제로 동작하는 유전 알고리즘(Genetic Algorithm) 클래스를 완성합니다. `GeneticAlgorithm` 클래스는 진화의 전체 과정을 관리하는 컨트롤러 역할을 수행합니다.

$$\text{Fitness} = \frac{1}{\text{Distance} + \epsilon}, \quad P(\text{Selection}) \propto \text{Fitness}$$

**요구사항**:

  - **초기화 (`__init__`)**: `TSPProblem`의 `initial_state`를 사용하여 설정된 크기(`pop_size`)만큼의 초기 개체군(Population)을 생성합니다.
  - **진화 (`evolve`)**: 다음 단계에 따라 한 세대를 진화시키는 로직을 구현합니다.
    1.  현재 개체군 각 경로의 거리를 계산합니다.
    2.  `select_parents` 함수(룰렛 휠)를 사용하여 부모 집단을 구성합니다.
    3.  부모 집단에서 두 개체를 뽑아 교차(Crossover)하고, 변이(Mutation) 확률에 따라 변이를 수행하여 다음 세대를 생성합니다.
  - **실행 (`run`)**: 지정된 세대 수만큼 `evolve`를 반복하고, 가장 우수한 경로(최단 거리)를 찾아 반환합니다.


In [8]:
import numpy as np
import random
from typing import TypeVar, Generic

S = TypeVar("S")
A = TypeVar("A")

class TSPProblem:
    def __init__(self, n_cities: int, dist_matrix: np.ndarray) -> None:
        self.n_cities = n_cities
        self.matrix = dist_matrix
        self.start_node = 0
        self.rest_cities = list(range(1, n_cities))

    def initial_state(self) -> list[int]:
        state = self.rest_cities[:]
        random.shuffle(state)
        return state

    def objective_function(self, state: list[int]) -> float:
        # 경로: Start -> state... -> Start
        full_path = np.array([self.start_node] + state + [self.start_node])
        cost = np.sum(self.matrix[full_path[:-1], full_path[1:]])
        return float(cost)

def select_parents(population: list[list[int]], distances: list[float]) -> list[list[int]]:
    # 거리 역수를 이용한 룰렛 휠 선택
    # Python 3.11+: 내장 제네릭 list 사용
    fitnesses = [1.0 / (d + 1e-6) for d in distances]
    # 복원 추출로 인구수만큼 부모 선택
    return random.choices(population, weights=fitnesses, k=len(population))


In [9]:
class GeneticAlgorithm:
    def __init__(self, problem: TSPProblem, pop_size: int = 50, mutation_rate: float = 0.1, elite_size: int = 2) -> None:
        self.problem = problem
        self.pop_size = pop_size
        self.mutation_rate = mutation_rate
        self.elite_size = elite_size

        # [정답 1] 초기 개체군 생성
        # List Comprehension을 사용하여 간결하게 초기화합니다.
        self.population: list[list[int]] = [self.problem.initial_state() for _ in range(pop_size)]

    def evolve(self) -> None:
        """한 세대를 진화시킵니다."""
        # 1. 현재 세대의 모든 개체에 대해 거리 계산
        distances = [self.problem.objective_function(ind) for ind in self.population]

        # 엘리티즘 적용: 거리 기준으로 정렬하여 상위 개체 추출
        # (거리, 개체) 튜플 리스트 생성 후 거리 오름차순(작은 순) 정렬
        sorted_pop = sorted(zip(self.population, distances), key=lambda x: x[1])

        # 상위 elite_size만큼은 다음 세대로 바로 진출 (유전자 보존)
        elites = [ind for ind, dist in sorted_pop[:self.elite_size]]
        next_population: list[list[int]] = elites[:]

        # 2. 룰렛 휠 선택을 통해 부모 집단(mating pool) 생성
        parents = select_parents(self.population, distances)

        # 3. 자식 세대 생성
        for _ in range(self.pop_size):
            # 무작위로 두 부모 선택 (parents 리스트에서 random.sample 등 사용)
            p1, p2 = random.sample(parents, 2)

            # TODO 2: 교차 (Crossover) 수행 -> order_crossover 사용
            child = order_crossover(p1, p2)

            # TODO 3: 변이 (Mutation) 수행
            if random.random() < self.mutation_rate :
                child = inversion_mutation(child)

            next_population.append(child)

        self.population = next_population

    def run(self, generations: int) -> tuple[list[int], float]:
        best_solution: list[int] = []
        best_dist = float('inf')

        for i in range(generations):
            self.evolve()

            # 모니터링: 현재 세대에서 가장 좋은 해 확인
            current_best = min(self.population, key=self.problem.objective_function)
            current_dist = self.problem.objective_function(current_best)

            if current_dist < best_dist:
                best_dist = current_dist
                best_solution = current_best

            if i % 10 == 0:
                print(f"Generation {i}: Best Distance = {best_dist:.2f}")

        return best_solution, best_dist

In [10]:
# 데이터 준비
cities, init_matrix = create_adjacency_matrix(romania_map)
dist_matrix = floyd_warshall(init_matrix)
n_cities = len(cities)

# 문제 객체 생성 (0번 인덱스 = Arad)
tsp = TSPProblem(n_cities, dist_matrix)

# GA 실행 (개선된 파라미터 적용)
ga = GeneticAlgorithm(tsp, pop_size=100, mutation_rate=0.05)
best_chromosome, best_dist = ga.run(generations=500)

start_node_idx = 0  # TSPProblem에서 고정된 시작점
full_path_indices = [start_node_idx] + best_chromosome + [start_node_idx]

final_path_names = [cities[idx] for idx in full_path_indices]

print("\n" + "="*60)
print(f"[*] Optimization Target: {cities[start_node_idx]} -> ... -> {cities[start_node_idx]}")
print("="*60)
print(f"▶ Final Path: {' -> '.join(final_path_names)}")
print(f"▶ Total Distance: {best_dist:.2f} km")
print("="*60)

[*] 초기 상태: 전체 400개 경로 중 실제 연결된 도로 외에는 모두 inf입니다.
Generation 0: Best Distance = 5389.00
Generation 10: Best Distance = 4474.00
Generation 20: Best Distance = 3956.00
Generation 30: Best Distance = 3956.00
Generation 40: Best Distance = 3831.00
Generation 50: Best Distance = 3681.00
Generation 60: Best Distance = 3494.00
Generation 70: Best Distance = 3494.00
Generation 80: Best Distance = 3494.00
Generation 90: Best Distance = 3494.00
Generation 100: Best Distance = 3334.00
Generation 110: Best Distance = 3334.00
Generation 120: Best Distance = 3334.00
Generation 130: Best Distance = 3334.00
Generation 140: Best Distance = 3334.00
Generation 150: Best Distance = 3334.00
Generation 160: Best Distance = 3334.00
Generation 170: Best Distance = 3334.00
Generation 180: Best Distance = 3334.00
Generation 190: Best Distance = 3334.00
Generation 200: Best Distance = 3334.00
Generation 210: Best Distance = 3334.00
Generation 220: Best Distance = 3334.00
Generation 230: Best Distance = 3334.00
Ge