# Pytorch에서 Garbage Collection

In [1]:
import torch
device = torch.device("cuda:0")
torch.cuda.set_device(device)

In [2]:
test = torch.empty((1,), device=device) # empty 1개임에도 메모리는 800~ MB 차지. => torch의 kernel

In [3]:
del test

## Cached Memory

메모리를 매 번 초기화 하는 것보다 자리를 먼저 잡아두고 할당하는 방식이 빠르고 좋다.  
그렇기 때문에 모델을 돌릴 때 forward / backward propagation 한 번 씩 돌리고 시작하는 것도 좋은 방법.

In [23]:
test = torch.randn((1000,1000,300), device=device)

In [24]:
del test # 여전히 메모리 차지하고 있음 (cached memory)

In [29]:
torch.cuda.empty_cache() # Cached memory를 비워줌 / 하지만 많은 실험들에서 일일이 이 작업을 하지는 않음

# 그 대신 중요한 명령어 두 개

In [26]:
test1 = torch.randn((1000,1000,300), device=device)
test2 = test1

In [27]:
torch.cuda.memory_allocated() # 할당된 메모리

1200000000

In [30]:
torch.cuda.memory_reserved() # 할당된 메모리 (Cache 포함)

1203765248

### 기타 명령어...

In [31]:
torch.cuda.memory_snapshot()

[{'device': 0,
  'address': 21495808000,
  'total_size': 2097152,
  'allocated_size': 0,
  'active_size': 0,
  'segment_type': 'small',
  'blocks': [{'size': 2097152, 'state': 'inactive'}]},
 {'device': 0,
  'address': 22749904896,
  'total_size': 1201668096,
  'allocated_size': 1200000000,
  'active_size': 1200000000,
  'segment_type': 'large',
  'blocks': [{'size': 1200000000, 'state': 'active_allocated'},
   {'size': 1668096, 'state': 'inactive'}]}]

In [39]:
print(torch.cuda.max_memory_allocated()) # 현재까지 최대 값을 출력
print(torch.cuda.max_memory_reserved())

# torch.cuda.reset_max_memory_allocated() # 초기화

1200006144
1203765248


1203765248