In [5]:
import torch
import numpy as np
from torch_geometric.data import Data
from scipy.spatial.distance import pdist, squareform

def create_graph_dataset(x_data, y,threshold=0.5):
    """
    グラフニューラルネットワーク用のデータセットを作成する関数

    Parameters:
    -----------
    x_data : numpy.ndarray
        ノードの特徴量データ (shape: [num_nodes, num_features])
    threshold : float, optional
        ノード間の距離の閾値 (デフォルト: 0.5)

    Returns:
    --------
    torch_geometric.data.Data
        PyTorch Geometricのグラフデータオブジェクト
    """
    # データの次元を確認


    # 特徴量をPyTorch Tensorに変換
    x = torch.tensor(x_data, dtype=torch.float)

    # ユークリッド距離行列の計算
    dist_matrix = squareform(pdist(x_data))

    # 隣接行列の作成
    adjacency_matrix = (dist_matrix < threshold).astype(int)
    np.fill_diagonal(adjacency_matrix, 0)  # 自己ループを削除

    # エッジインデックスの作成
    edge_indices = np.where(adjacency_matrix == 1)
    edge_index = torch.tensor(np.array(edge_indices), dtype=torch.long)


    # PyTorch Geometricのデータオブジェクトを作成
    graph_data = Data(x=x, edge_index=edge_index, y=y)

    return graph_data

# データの生成例
np.random.seed(42)
x_data = np.random.randn(100, 6)  # 6次元の特徴量を持つ100個のノード
num_nodes, num_features = x_data.shape
# ダミーのターゲットラベル（オプション）
y = torch.randint(0, 2, (num_nodes,), dtype=torch.float)
# グラフデータセットの作成
graph_dataset = create_graph_dataset(x_data,y, threshold=0.5)
from icecream import ic
ic(graph_dataset)
# グラフ情報の表示
print("ノード数:", graph_dataset.num_nodes)
print("特徴量次元:", graph_dataset.num_features)
print("エッジ数:", graph_dataset.num_edges // 2)  # 無向グラフなので2で割る
print("特徴量テンソル:", graph_dataset.x)
print("エッジインデックス:", graph_dataset.edge_index)
print("ターゲットラベル:", graph_dataset.y)

ic| graph_dataset: Data(x=[100, 6], edge_index=[2, 0], y=[100])


ノード数: 100
特徴量次元: 6
エッジ数: 0
特徴量テンソル: tensor([[ 0.4967, -0.1383,  0.6477,  1.5230, -0.2342, -0.2341],
        [ 1.5792,  0.7674, -0.4695,  0.5426, -0.4634, -0.4657],
        [ 0.2420, -1.9133, -1.7249, -0.5623, -1.0128,  0.3142],
        [-0.9080, -1.4123,  1.4656, -0.2258,  0.0675, -1.4247],
        [-0.5444,  0.1109, -1.1510,  0.3757, -0.6006, -0.2917],
        [-0.6017,  1.8523, -0.0135, -1.0577,  0.8225, -1.2208],
        [ 0.2089, -1.9597, -1.3282,  0.1969,  0.7385,  0.1714],
        [-0.1156, -0.3011, -1.4785, -0.7198, -0.4606,  1.0571],
        [ 0.3436, -1.7630,  0.3241, -0.3851, -0.6769,  0.6117],
        [ 1.0310,  0.9313, -0.8392, -0.3092,  0.3313,  0.9755],
        [-0.4792, -0.1857, -1.1063, -1.1962,  0.8125,  1.3562],
        [-0.0720,  1.0035,  0.3616, -0.6451,  0.3614,  1.5380],
        [-0.0358,  1.5646, -2.6197,  0.8219,  0.0870, -0.2990],
        [ 0.0918, -1.9876, -0.2197,  0.3571,  1.4779, -0.5183],
        [-0.8085, -0.5018,  0.9154,  0.3288, -0.5298,  0.5133],
    