Skip to content
Open
Changes from all commits
Commits
File filter

Filter by extension

Filter by extension

Conversations
Failed to load comments.
Loading
Jump to
Jump to file
Failed to load files.
Loading
Diff view
Diff view
10 changes: 5 additions & 5 deletions advanced_source/cpp_cuda_graphs.rst
Original file line number Diff line number Diff line change
Expand Up @@ -74,7 +74,7 @@ tensor를 재사용할 수 있도록 tensor를 미리 할당하는 것입니다.
training_step(model, optimizer, data, targets, output, loss);
}

여기서 ``training_step``은 단순히 해당 옵티마이저 호출과 함께 순전파 및 역전파로 구성됩니다
여기서 ``training_step`` 은 단순히 해당 옵티마이저 호출과 함께 순전파 및 역전파로 구성됩니다.

.. code-block:: cpp

Expand All @@ -92,7 +92,7 @@ tensor를 재사용할 수 있도록 tensor를 미리 할당하는 것입니다.
optimizer.step();
}

파이토치의 CUDA 그래프 API는 스트림 캡처에 의존하고 있으며, 이 경우 다음처럼 사용됩니다
파이토치의 CUDA 그래프 API는 스트림 캡처에 의존하고 있으며, 이 경우 다음처럼 사용됩니다.

.. code-block:: cpp

Expand All @@ -117,12 +117,12 @@ CUDA 라이브러리(CUBLAS와 CUDNN같은)를 준비하는 것이 중요합니
}

그래프 캡처에 성공하면 ``training_step(model, optimizer, data, target, output, loss);`` 호출을
``graph.replay()``로 대체하여 학습 단계를 진행할 수 있습니다.
``graph.replay()`` 로 대체하여 학습 단계를 진행할 수 있습니다.

훈련 결과
----------------

코드를 한 번 살펴보면 그래프가 아닌 일반 훈련에서 다음과 같은 결과를 볼 수 있습니다
코드를 한 번 살펴보면 그래프가 아닌 일반 훈련에서 다음과 같은 결과를 볼 수 있습니다.

.. code-block:: shell

Expand Down Expand Up @@ -152,7 +152,7 @@ CUDA 라이브러리(CUBLAS와 CUDNN같은)를 준비하는 것이 중요합니
user 0m44.018s
sys 0m1.116s

CUDA 그래프를 사용한 훈련은 다음과 같은 출력을 생성합니다
CUDA 그래프를 사용한 훈련은 다음과 같은 출력을 생성합니다.

.. code-block:: shell

Expand Down