### 基础入门

- 参考文档 :[图神经网络库PyTorch geometric（PYG）零基础上手教程](https://zhuanlan.zhihu.com/p/91229616)
- 需要下载的库 :

- 当前 torch = 1.10.2
- cuda = 10.2
- pip install torch-scatter==2.0.9 -f https://pytorch-geometric.com/whl/torch-1.10.0+cu102.html


### 快速上手

![](https://haloos.oss-cn-beijing.aliyuncs.com/typero/20220304150705.png)


In [7]:
import torch
from torch_geometric.data import Data
print(torch.__version__)

1.10.2


In [9]:
# 定义边 shape = [2,num_edge]
edge_index = torch.tensor([[0, 1, 0, 2],
                           [1, 0, 2, 0]], dtype=torch.float)
edge_index

tensor([[0., 1., 0., 2.],
        [1., 0., 2., 0.]])

In [10]:
# 定义点 shape = [num_nodes, num_node_features]
x = torch.tensor([[-1], [0], [1]], dtype=torch.float)
x

tensor([[-1.],
        [ 0.],
        [ 1.]])

In [11]:
# 封装点和线
data = Data(x=x, edge_index=edge_index)
data

Data(x=[3, 1], edge_index=[2, 4])

## 数据集

PyTorch Geometric已经包含有很多常见的基准数据集，包括：

- Cora：一个根据科学论文之间相互引用关系而构建的Graph数据集合，论文分为7类：Genetic_Algorithms，Neural_Networks，Probabilistic_Methods，Reinforcement_Learning，Rule_Learning，Theory，共2708篇；
- Citeseer：一个论文之间引用信息数据集，论文分为6类：Agents、AI、DB、IR、ML和HCI，共包含3312篇论文；
- Pubmed：生物医学方面的论文搜寻以及摘要数据集

初始化这样的一个数据集也很简单，会自动下载对应的数据集然后处理成需要的格式，例如ENZYMES dataset (覆盖6大类的600个图，可用于graph-level的分类任务)

In [12]:
# ENZYMES dataset (覆盖6大类的600个图，可用于graph-level的分类任务)

from torch_geometric.datasets import TUDataset

dataset = TUDataset(root='../data/ENZYMES', name='ENZYMES')

Downloading https://www.chrsmrrs.com/graphkerneldatasets/ENZYMES.zip
Extracting ..\data\ENZYMES\ENZYMES\ENZYMES.zip
Processing...
Done!


In [13]:
# 数据集的数量
print("数据集的数量 : " , len(dataset))
print("数据集的类别 : " , dataset.num_classes)
print("数据集的节点特征 : " , dataset.num_node_features)

数据集的数量 :  600
数据集的类别 :  6
数据集的节点特征 :  3
