BA 무작위 네트워크 생성

In [5]:
import networkx as nx
import pandas as pd
import random

# (1) test.csv 파일을 불러온다
df = pd.read_csv("test.csv")

# 가중치 리스트를 생성
weights = df["weight"].tolist()

# (2) 노드 수와 확률 p를 변수로 지정한다.
num_nodes = 50  # 예시로 50개의 노드
num_edges = 500  # 총 엣지 수

# ratio 계산
ratio = num_edges / num_nodes

# ratio의 소수점 부분을 p로 지정
p = ratio - int(ratio)

# (3) BA네트워크를 수동으로 생성한다.
G = nx.DiGraph()
G.add_nodes_from(range(num_nodes))

# 초기 완전 연결 그래프 생성
initial_nodes = 5
G.add_edges_from(
    (i, j) for i in range(initial_nodes) for j in range(initial_nodes) if i != j
)

for new_node in range(initial_nodes, num_nodes):
    targets = set()

    # 엣지 수를 확률적으로 결정
    num_edges_to_add = int(ratio) + 1 if random.random() < p else int(ratio)

    # 총 엣지 수를 절반으로 나누어 들어오는 엣지와 나가는 엣지를 설정
    num_incoming = num_edges_to_add // 2
    num_outgoing = num_edges_to_add - num_incoming

    # 들어오는 엣지 설정
    while len(targets) < num_incoming:
        potential_target = random.choice(list(G.nodes))
        if potential_target != new_node:
            targets.add((potential_target, new_node))

    # 나가는 엣지 설정
    while len(targets) < num_edges_to_add:
        potential_target = random.choice(list(G.nodes))
        if potential_target != new_node:
            targets.add((new_node, potential_target))

    G.add_edges_from(targets)

# 가중치를 랜덤으로 할당
used_weights = []
for u, v in G.edges():
    if not weights:
        # 모든 가중치를 사용했다면 리셋
        weights = df["weight"].tolist()
        used_weights = []

    # 사용하지 않은 가중치 중에서 랜덤 선택
    available_weights = list(set(weights) - set(used_weights))

    # available_weights가 비어있으면 weights를 리셋
    if not available_weights:
        weights = df["weight"].tolist()
        used_weights = []
        available_weights = list(set(weights) - set(used_weights))

    weight = random.choice(available_weights)
    G[u][v]["weight"] = weight
    used_weights.append(weight)

# (4) 엣지리스트를 csv파일로 저장한다.
# in-degree 혹은 out-degree가 0인 노드가 있는지 확인
has_zero_degree = any(G.in_degree(n) == 0 or G.out_degree(n) == 0 for n in G.nodes())

if has_zero_degree:
    print("경로가 없음")
else:
    # 엣지 리스트를 저장
    nx.write_edgelist(G, "BA_network(develope1).csv", data=["weight"])


아래는 공항 네트워크 데이터의 가중치를 불러와 무작위 네트워크 하나 생성하는 코드

In [10]:
import networkx as nx
import pandas as pd
import random

# (1) test.csv 파일을 불러온다
df = pd.read_csv("Project_link_final.csv")

# 가중치 리스트를 생성
weights = df["WEIGHT"].tolist()

# (2) 노드 수와 확률 p를 변수로 지정한다.
num_nodes = 331  # 331개의 노드
num_edges = 4851  # 총 엣지 수

# ratio 계산
ratio = num_edges / num_nodes

# ratio의 소수점 부분을 p로 지정
p = ratio - int(ratio)

# (3) BA네트워크를 수동으로 생성한다.
G = nx.DiGraph()
G.add_nodes_from(range(num_nodes))

# 초기 완전 연결 그래프 생성
initial_nodes = 5
G.add_edges_from(
    (i, j) for i in range(initial_nodes) for j in range(initial_nodes) if i != j
)

for new_node in range(initial_nodes, num_nodes):
    targets = set()

    # 엣지 수를 확률적으로 결정
    num_edges_to_add = int(ratio) + 1 if random.random() < p else int(ratio)

    # 총 엣지 수를 절반으로 나누어 들어오는 엣지와 나가는 엣지를 설정
    num_incoming = num_edges_to_add // 2
    num_outgoing = num_edges_to_add - num_incoming

    # 들어오는 엣지 설정
    while len(targets) < num_incoming:
        potential_target = random.choice(list(G.nodes))
        if potential_target != new_node:
            targets.add((potential_target, new_node))

    # 나가는 엣지 설정
    while len(targets) < num_edges_to_add:
        potential_target = random.choice(list(G.nodes))
        if potential_target != new_node:
            targets.add((new_node, potential_target))

    G.add_edges_from(targets)

# 가중치를 랜덤으로 할당
used_weights = []
for u, v in G.edges():
    if not weights:
        # 모든 가중치를 사용했다면 리셋
        weights = df["WEIGHT"].tolist()
        used_weights = []

    # 사용하지 않은 가중치 중에서 랜덤 선택
    available_weights = list(set(weights) - set(used_weights))

    # available_weights가 비어있으면 weights를 리셋
    if not available_weights:
        weights = df["WEIGHT"].tolist()
        used_weights = []
        available_weights = list(set(weights) - set(used_weights))

    weight = random.choice(available_weights)
    G[u][v]["WEIGHT"] = weight
    used_weights.append(weight)

# (4) 엣지리스트를 csv파일로 저장한다.
# in-degree 혹은 out-degree가 0인 노드가 있는지 확인
has_zero_degree = any(G.in_degree(n) == 0 or G.out_degree(n) == 0 for n in G.nodes())

if has_zero_degree:
    print("경로가 없음")
else:
    # 엣지 리스트를 저장
    nx.write_edgelist(G, "BA_network(developefinal).csv", data=["WEIGHT"])


몇번 실행해야 신뢰도 95의 구간을 얻을 수 있는지 확인할 수 있도록 일단 10개의 네트워크를 생성하는 코드

In [11]:
import networkx as nx
import pandas as pd
import random

# (1) 데이터 불러오기
df = pd.read_csv("Project_link_final.csv")

# 가중치 리스트 생성
weights = df["WEIGHT"].tolist()

# (2) 노드 수와 확률 p를 변수로 지정
num_nodes = 331  # 노드 수
num_edges = 4851  # 총 엣지 수

# ratio 계산
ratio = num_edges / num_nodes
p = ratio - int(ratio)  # 소수점 부분을 p로 지정

# (3) BA 네트워크를 10개 생성
for network_id in range(1, 11):  # 10개의 네트워크 생성
    # 네트워크 생성
    G = nx.DiGraph()
    G.add_nodes_from(range(num_nodes))
    
    # 초기 완전 연결 그래프 생성
    initial_nodes = 5
    G.add_edges_from(
        (i, j) for i in range(initial_nodes) for j in range(initial_nodes) if i != j
    )

    for new_node in range(initial_nodes, num_nodes):
        targets = set()

        # 엣지 수를 확률적으로 결정
        num_edges_to_add = int(ratio) + 1 if random.random() < p else int(ratio)

        # 들어오는 엣지와 나가는 엣지 설정
        num_incoming = num_edges_to_add // 2
        num_outgoing = num_edges_to_add - num_incoming

        # 들어오는 엣지 설정
        while len(targets) < num_incoming:
            potential_target = random.choice(list(G.nodes))
            if potential_target != new_node:
                targets.add((potential_target, new_node))

        # 나가는 엣지 설정
        while len(targets) < num_edges_to_add:
            potential_target = random.choice(list(G.nodes))
            if potential_target != new_node:
                targets.add((new_node, potential_target))

        G.add_edges_from(targets)

    # 가중치 랜덤 할당
    used_weights = []
    for u, v in G.edges():
        if not weights:
            # 모든 가중치를 사용했다면 리셋
            weights = df["WEIGHT"].tolist()
            used_weights = []

        # 사용하지 않은 가중치 중 랜덤 선택
        available_weights = list(set(weights) - set(used_weights))

        if not available_weights:
            weights = df["WEIGHT"].tolist()
            used_weights = []
            available_weights = list(set(weights) - set(used_weights))

        weight = random.choice(available_weights)
        G[u][v]["weight"] = weight
        used_weights.append(weight)

    # (4) 엣지 리스트를 CSV 파일로 저장
    has_zero_degree = any(G.in_degree(n) == 0 or G.out_degree(n) == 0 for n in G.nodes())
    if has_zero_degree:
        print(f"네트워크 {network_id}: 경로가 없음")
    else:
        # 네트워크를 파일로 저장
        file_name = f"BA_network_{network_id}.csv"
        nx.write_edgelist(G, file_name, data=["weight"])
        print(f"네트워크 {network_id} 저장 완료: {file_name}")


네트워크 1 저장 완료: BA_network_1.csv
네트워크 2 저장 완료: BA_network_2.csv
네트워크 3 저장 완료: BA_network_3.csv
네트워크 4 저장 완료: BA_network_4.csv
네트워크 5 저장 완료: BA_network_5.csv
네트워크 6 저장 완료: BA_network_6.csv
네트워크 7 저장 완료: BA_network_7.csv
네트워크 8 저장 완료: BA_network_8.csv
네트워크 9 저장 완료: BA_network_9.csv
네트워크 10 저장 완료: BA_network_10.csv


초기 신뢰구간 측정을 위해 하나를 불러와서 공격한 데이터 출력하도록 하기 총 10개출력

In [29]:
import csv
import heapq
import random
import os


def load_network(file_path):
    with open(file_path, "r") as file:
        reader = csv.reader(file)
        next(reader)  # Skip header
        edges = [
            (int(source), int(target), float(weight))
            for source, target, weight in reader
        ]
    return edges


def calculate_average_shortest_path(n, edges):
    arr = [[float("inf")] * n for _ in range(n)]
    for s, e, cost in edges:
        arr[s][e] = cost

    total_distance = 0
    path_count = 0

    for start in range(n):
        dist_arr = [float("inf")] * n
        dist_arr[start] = 0
        q = []
        heapq.heappush(q, (0, start))

        while q:
            cur_dist, cur_pos = heapq.heappop(q)
            if dist_arr[cur_pos] < cur_dist:
                continue
            for next_pos in range(n):
                if arr[cur_pos][next_pos] != float("inf"):
                    next_dist = cur_dist + arr[cur_pos][next_pos]
                    if dist_arr[next_pos] > next_dist:
                        dist_arr[next_pos] = next_dist
                        heapq.heappush(q, (next_dist, next_pos))

        for end in range(n):
            if start != end:
                if dist_arr[end] == float("inf"):
                    # If any node is unreachable, return immediately
                    return float("inf")
                total_distance += dist_arr[end]
                path_count += 1

    return total_distance / path_count if path_count > 0 else float("inf")


def attack_networks(network_files, output_dir):
    if not os.path.exists(output_dir):
        os.makedirs(output_dir)

    for network_file in network_files:
        print(f"Processing {network_file}...")
        edges = load_network(network_file)
        n = max(max(s, e) for s, e, _ in edges) + 1  # Determine number of nodes
        average_shortest_paths = []
        x = 0

        # Open a CSV file to write the results for this network
        output_file = os.path.join(output_dir, f"{os.path.basename(network_file).split('.')[0]}_paths.csv")
        with open(output_file, "w", newline="") as csvfile:
            writer = csv.writer(csvfile)
            writer.writerow(["Remaining Edges", "Average Shortest Path"])  # Write header

            while True:
                avg_path_length = calculate_average_shortest_path(n, edges)
                average_shortest_paths.append(avg_path_length)
                x += 1
                print(f"Average shortest path({x}): {avg_path_length}")

                # Write the current state to the CSV file
                writer.writerow([len(edges), avg_path_length])

                # Stop if no paths exist
                if avg_path_length == float("inf"):
                    break

                # Randomly remove an edge
                if len(edges) > 1:
                    edges.pop(random.randint(0, len(edges) - 1))
                else:
                    break

        print(f"Finished processing {network_file}. Results saved to {output_file}")


def main():
    # List of BA network files

    network_dir = "BA_random_network"

    network_files = [os.path.join(network_dir, f"BA_network_{i}.csv") for i in range(1, 11)]
    output_dir = os.path.join(network_dir, "attack_results")  # 결과 저장 디렉토리

    attack_networks(network_files, output_dir)


if __name__ == "__main__":
    main()


Processing BA_random_network\BA_network_1.csv...


ValueError: not enough values to unpack (expected 3, got 1)

In [37]:
import csv
import heapq
import random


def load_network(file_path):
    with open(file_path, "r") as file:
        reader = csv.reader(file)
        next(reader)  # Skip header
        edges = [
            (int(source), int(target), float(weight))
            for source, target, weight in reader
        ]
    return edges


def calculate_average_shortest_path(n, edges):
    arr = [[float("inf")] * n for _ in range(n)]
    for s, e, cost in edges:
        arr[s][e] = cost

    total_distance = 0
    path_count = 0

    for start in range(n):
        dist_arr = [float("inf")] * n
        dist_arr[start] = 0
        q = []
        heapq.heappush(q, (0, start))

        while q:
            cur_dist, cur_pos = heapq.heappop(q)
            if dist_arr[cur_pos] < cur_dist:
                continue
            for next_pos in range(n):
                if arr[cur_pos][next_pos] != float("inf"):
                    next_dist = cur_dist + arr[cur_pos][next_pos]
                    if dist_arr[next_pos] > next_dist:
                        dist_arr[next_pos] = next_dist
                        heapq.heappush(q, (next_dist, next_pos))

        for end in range(n):
            if start != end:
                if dist_arr[end] == float("inf"):
                    # If any node is unreachable, return immediately
                    return float("inf")
                total_distance += dist_arr[end]
                path_count += 1

    return total_distance / path_count if path_count > 0 else float("inf")


def main():
    edges = load_network("WS_network.csv")
    n = max(max(s, e) for s, e, _ in edges) + 1  # Determine number of nodes
    average_shortest_paths = []
    x = 0

    # Open a CSV file to write the results
    with open("paths.csv", "w", newline="") as csvfile:
        writer = csv.writer(csvfile)
        writer.writerow(["Remaining Edges", "Average Shortest Path"])  # Write header

        while True:
            avg_path_length = calculate_average_shortest_path(n, edges)
            average_shortest_paths.append(avg_path_length)
            x = x + 1
            print(f"Average shortest path({x}): {avg_path_length}")

            # Write the current state to the CSV file
            writer.writerow([len(edges), avg_path_length])

            # Stop if no paths exist
            if avg_path_length == float("inf"):
                break

            # Randomly remove an edge
            if len(edges) > 1:
                edges.pop(random.randint(0, len(edges) - 1))
            else:
                break

    print(f"Final average shortest paths:", average_shortest_paths)


if __name__ == "__main__":
    main()


ValueError: not enough values to unpack (expected 3, got 1)