In [1]:
# onnx전환을 할텐데
# 많이 복잡합니다


In [2]:
# 필요 module 임포트

import torch
import torch.nn as nn
import torch.onnx

import onnx
import onnxruntime
import numpy as np

In [3]:
# 신경망 커스텀 class 선언

# 함수들 만들기
class Encoder(nn.Module) :
    def __init__(self, embedding_vector) :
        super().__init__()
        self.embedding = nn.Embedding.from_pretrained(embedding_vector, freeze = True, padding_idx = 0) # 라벨값을 벡터로 바꾸는 Embedding 함수
        self.rnn = nn.LSTM(embedding_vector.shape[1], embedding_vector.shape[1], batch_first = True, bidirectional = True) #임베딩 열 크기를 받아서 임베딩 열 크기를 출력
    def forward(self, x) :
        x = self.embedding(x)
        y, hc = self.rnn(x)
        return y, hc

class Decoder(nn.Module) :
    def __init__(self, embedding_vector) :
        super().__init__()
        self.embedding = nn.Embedding.from_pretrained(embedding_vector, freeze = True, padding_idx = 0)
        self.rnn = nn.LSTM(embedding_vector.shape[1] * 3, embedding_vector.shape[1], batch_first = True, bidirectional = True)
        self.f = nn.Linear(embedding_vector.shape[1] * 4, embedding_vector.shape[0]) #RNN을 계산하고 난 뒤 벡터값을 다시 라벨값으로 바꾸는 용도, 단어 출력 용도
        self.encoder_h_context = None #encoder_h 가공값 저장할 변수
    def forward(self, encoder_output, encoder_hc, t = None) : #문장 여러개 처리하기 위해서 encoder_output.shape가 필요함
        #decoder 학습 방법 2가지 (greedy, teaching_force)
        #encoder_h 가공
        encoder_h_forward = encoder_hc[0][0:1,:,:]
        encoder_h_backward = encoder_hc[0][1:2,:,:] #encoder의 h값 반으로 쪼개기
        self.encoder_h_context = torch.concat([encoder_h_forward, encoder_h_backward], dim = -1).transpose(0,1)
        
        batch_size = encoder_output.shape[0] #문장 갯수 정하기 = encoder에서 처리한 문장 갯수
        decoder_input = torch.zeros(batch_size, 1).type(torch.long).to(encoder_output.device) #처음 넣는 단어 (0번째 단어인 padding)
        decoder_hc = encoder_hc
        decoder_output_list = [] #단어들 모아서 문장으로 만들어 출력

        for i in range(4) : #t의 문자갯수만큼 반복
            decoder_output, decoder_hc = self.forward_cal(decoder_input, decoder_hc)
            decoder_output_list.append(decoder_output)

            if t is None : #greedy (t가 없음)
                decoder_input = decoder_output.argmax(dim = -1).detach()
            else : #teaching-force (t가 있음)
                decoder_input = t[:, i:i+1]

        decoder_output_list = torch.cat(decoder_output_list, dim = 1) #for 문 종료 후 list로 모아놓은 tensor들을 tensor로 합치는 작업
        return decoder_output_list, decoder_hc, None
        
    def forward_cal(self, x, h) : #실제 신경망 계산 함수
        x = self.embedding(x) #라벨을 벡터로
        x = torch.concat([self.encoder_h_context, x], dim = -1)
        output, h = self.rnn(x, h) #처음 h값을 지정하고 싶으면 x 뒤에 h값 입력하세요
        output = torch.concat([self.encoder_h_context, output], dim = -1)
        output = self.f(output) #벡터 계산값을 다시 라벨값으로 변환
        return output, h


In [4]:
# encoder부터 전환작업
# encoder 신경망 불러오기

torch_encoder = torch.load("num_encoder.pt", weights_only=False).to("cpu")
torch_encoder.eval()
print(torch_encoder)

Encoder(
  (embedding): Embedding(12, 11, padding_idx=0)
  (rnn): LSTM(11, 11, batch_first=True, bidirectional=True)
)


In [5]:
# encoder를 onnx로 변환
x = torch.randint(0,12, size = (1,7)).type(torch.long)
dynamic_axes = {'input' : {0 : 'b'}, 'output' : {0 : 'b'}, "h" : {1 : 'b'}, "c" : {1 : 'b'}}

torch.onnx.export(
    torch_encoder, #변환할 신경망
    x, #torch 신경망에 넣을 파리미터
    "num_encoder.onnx", #저장할 파일 이름
    export_params = True, 
    opset_version = 10, #onnx 버전
    do_constant_folding = True,
    input_names = ["input"],
    output_names = ["output", "h", "c"],
    dynamic_axes = dynamic_axes
)



In [6]:
# 잘 변환되었는지 확인
onnx_encoder = onnx.load("num_encoder.onnx")
onnx.checker.check_model(onnx_encoder)

In [7]:
# torch 신경망과 비교

np_x = x.numpy().astype(np.int64)

onnx_encoder = onnxruntime.InferenceSession("num_encoder.onnx", providers =  ["CPUExecutionProvider"])

onnx_input = {onnx_encoder.get_inputs()[0].name : np_x}
onnx_output = onnx_encoder.run(None, onnx_input)

# print("output : ", onnx_output[0])
# print("h : ", onnx_output[1])
# print("c : ", onnx_output[2])

y, hc = torch_encoder(x)

np.testing.assert_allclose(y.detach().numpy(), onnx_output[0], rtol=1e-03, atol=1e-05)
np.testing.assert_allclose(hc[0].detach().numpy(), onnx_output[1], rtol=1e-03, atol=1e-05)
np.testing.assert_allclose(hc[1].detach().numpy(), onnx_output[2], rtol=1e-03, atol=1e-05)

#오류 메세지가 안뜨면 오차범위 내에서 변환이 잘 이루어 진 것입니다

In [8]:
#decoder 변환작업

torch_decoder = torch.load("num_decoder.pt", weights_only=False).to("cpu")
torch_decoder.eval()

print(torch_decoder)

Decoder(
  (embedding): Embedding(12, 11, padding_idx=0)
  (rnn): LSTM(33, 11, batch_first=True, bidirectional=True)
  (f): Linear(in_features=44, out_features=12, bias=True)
)


In [9]:
#decoder를 onnx로 변환
encoder_output = torch.randn(1,7,22)
encoder_h = torch.randn(2,1,11)
encoder_c = torch.randn(2,1,11)
dynamic_axes = {"encoder_output" : {0 : 'b'}, "encoder_h" : {1 : 'b'}, "encoder_c" : {1 : 'b'}, "output" : {0 : 'b'}, "h" : {1 : 'b'}, "c" : {1 : 'b'}}

torch.onnx.export(
    torch_decoder, #변환할 신경망
    (encoder_output, (encoder_h, encoder_c), None), #torch 신경망의 파라미터
    "num_decoder.onnx", #저장 파일 이름
    export_params = True, #w, b값 저장할지
    opset_version = 10, #onnx 버전
    do_constant_folding = True,
    input_names = ["encoder_output","encoder_h","encoder_c"],
    output_names = ["output", "h", "c"],
    dynamic_axes = dynamic_axes
)

In [10]:
#onnx로 변환이 잘 되었는지 확인
onnx_decoder = onnx.load("num_decoder.onnx")
onnx.checker.check_model(onnx_decoder)

In [11]:
# torch와 비교
np_encoder_output = encoder_output.numpy().astype(np.float32)
np_encoder_h = encoder_h.numpy().astype(np.float32)
np_encoder_c = encoder_c.numpy().astype(np.float32)

onnx_decoder = onnxruntime.InferenceSession("num_decoder.onnx", providers=["CPUExecutionProvider"])
inputs_names = onnx_decoder.get_inputs()
onnx_input = {inputs_names[0].name : np_encoder_output, inputs_names[1].name : np_encoder_h, inputs_names[2].name : np_encoder_c}
onnx_output = onnx_decoder.run(None, onnx_input)

y, hc, _ = torch_decoder(encoder_output, (encoder_h, encoder_c))

np.testing.assert_allclose(y.detach().numpy(), onnx_output[0], rtol=1e-03, atol=1e-05)
np.testing.assert_allclose(hc[0].detach().numpy(), onnx_output[1], rtol=1e-03, atol=1e-05)
np.testing.assert_allclose(hc[1].detach().numpy(), onnx_output[2], rtol=1e-03, atol=1e-05)