# (공부) PyG – lesson1: 자료형

신록예찬  
2023-07-02

In [2]:
import torch
import torch_geometric

# Download notebook

``` default
!wget https://raw.githubusercontent.com/miruetoto/yechan3/main/posts/2_Studies/PyG/ls1.ipynb
```

# PyG 의 Data 자료형

> ref:
> <https://pytorch-geometric.readthedocs.io/en/latest/notes/introduction.html#data-handling-of-graphs>

`-` 자료는 [PyG의 Data
오브젝트](https://pytorch-geometric.readthedocs.io/en/latest/notes/introduction.html#data-handling-of-graphs)를
기반으로 한다.

## **예제1**: 아래와 같은 그래프자료를 고려하자.

![](https://pytorch-geometric.readthedocs.io/en/latest/_images/graph.svg)

`-` 이러한 자료형은 아래와 같은 형식으로 저장한다.

In [81]:
edge_index = torch.tensor([[0, 1, 1, 2],
                           [1, 0, 2, 1]], dtype=torch.long)
x = torch.tensor([[-1], [0], [1]], dtype=torch.float)
data = torch_geometric.data.Data(x=x, edge_index=edge_index) # torch_geometric.data.Data는 그래프자료형을 만드는 클래스

`-` data 의 자료형

In [45]:
type(data)

torch_geometric.data.data.Data

`-` data의 `__str__`

In [83]:
data

Data(x=[3, 1], edge_index=[2, 4])

-   `x=[3, 1]`: 이 자료는 3개의 노드가 있으며, 각 노드에는 1개의
    feature가 있음
-   `edge_index=[2, 4]`: ${\cal E}$는 총 4개의 원소가 있음.

`-` 각 노드의 feature를 확인하는 방법 (즉
$f:{\cal V} \to \mathbb{R}^k$를 확인하는 방법)

In [46]:
data.x

tensor([[-1.],
        [ 0.],
        [ 1.]])

`-` ${\cal E}$를 확인하는 방법

In [47]:
data.edge_index

tensor([[0, 1, 1, 2],
        [1, 0, 2, 1]])

`-`

In [86]:
len(data)

2

## **예제2**: 잘못된 사용

`-` `edge_index`는 예제1과 같이 $[2,|{\cal E}|]$ 의 shape으로 넣어야
한다. 그렇지 않으면 에러가 난다.

In [41]:
edge_index = torch.tensor([[0, 1],
                           [1, 0],
                           [1, 2],
                           [2, 1]], dtype=torch.long)
x = torch.tensor([[-1], [0], [1]], dtype=torch.float)

data = torch_geometric.data.Data(x=x, edge_index=edge_index)

In [42]:
#data.validate(raise_on_error=True)
data.validate()

## **예제3**: 예제2의 수정

`-` `edge_index`의 shape이 $[|{\cal E}|,2]$ 꼴로 저장되어 있었을 경우
트랜스포즈이후 countiguous()함수를 사용하면 된다.[1]

[1] 그런데 그냥 transpose만 해도되는것 같음

In [50]:
edge_index = torch.tensor([[0, 1],
                           [1, 0],
                           [1, 2],
                           [2, 1]], dtype=torch.long)
x = torch.tensor([[-1], [0], [1]], dtype=torch.float)

data = torch_geometric.data.Data(
    x=x, 
    edge_index=edge_index.t().contiguous()
)

In [51]:
#data.validate(raise_on_error=True)
data.validate()

True