In [1]:
import pickle
import numpy as np
from tqdm import tqdm

In [2]:
file_name = 'data_256.pkl'
image_data, sentiment_data, sentence_data, sentence_tags, hashtag_data = pickle.load(open(file_name, 'rb'))

In [3]:
size = 3000

image_data = image_data[:size]
sentiment_data = sentiment_data[:size]
sentence_data = sentence_data[:size]
sentence_tags = sentence_tags[:size]
hashtag_data = hashtag_data[:size]

In [4]:
print(image_data.shape)
print(sentiment_data.shape)
print(sentence_data.shape)
print(len(sentence_tags))

(3000, 256, 256, 3)
(3000, 4)
(3000,)
3000


In [5]:
input_tags = [[tag[0] for tag in tags] for tags in sentence_tags]

In [6]:
from konlpy.tag import Komoran

komoran = Komoran()

output_tags = [[p[0] for p in komoran.pos(s)] for s in tqdm(sentence_data)]
[tags.insert(0, '\t') for tags in output_tags]
[tags.append('\n') for tags in output_tags]
None

100%|██████████| 3000/3000 [00:02<00:00, 1277.03it/s]


In [7]:
output_words = set()
for tags in output_tags:
    for tag in tags:
        if tag not in output_words:
            output_words.add(tag)
            
output_words = sorted(list(output_words))
output_words.insert(0, 'P')
n_output_words = len(output_words)

max_seq_length = max([len(_in) + len(_out) for _in, _out in zip(input_tags, output_tags)])

w2i_output = {w:i for i, w in enumerate(output_words)}
seq_list = []

for i, (_in, _out) in enumerate(zip(input_tags, output_tags)):
    for j in range(1, len(_out)):
        seq_list.append(_in + _out[:j+1])
        
n_seq_data = len(seq_list)

In [8]:
seq_data = np.zeros(shape=(n_seq_data, max_seq_length+1), dtype='int32')

for i, seq in enumerate(seq_list):
    seq_data[i, -len(seq):] = np.array([w2i_output[w] for w in seq])
    
x_seq_data = seq_data[:, :-1]

output_eye = np.eye(n_output_words)
y_seq_data = output_eye[seq_data[:, -1]]
# y_seq_data = seq_data[:, -1]

In [9]:
x_seq_data.shape, y_seq_data.shape

((129470, 232), (129470, 9948))

In [10]:
valid_size = 0
train_size = n_seq_data - valid_size
batch_size = 7000
n_batch = train_size // batch_size
n_valid = valid_size // batch_size

In [11]:
x_train, y_train = x_seq_data[:train_size], y_seq_data[:train_size]
x_valid, y_valid = x_seq_data[train_size:], y_seq_data[train_size:]

In [12]:
x_train.shape, y_train.shape

((129470, 232), (129470, 9948))

In [1]:
from tensorflow.keras.models import Sequential
from tensorflow.keras.layers import Embedding, Dense, SimpleRNN, LSTM

In [14]:
model = Sequential()
model.add(Embedding(n_output_words, 64, input_length=max_seq_length))
model.add(LSTM(128))
model.add(Dense(n_output_words, activation='softmax'))
model.compile(loss='categorical_crossentropy', optimizer='adam', metrics=['accuracy'])

In [15]:
model.summary()

Model: "sequential"
_________________________________________________________________
Layer (type)                 Output Shape              Param #   
embedding (Embedding)        (None, 232, 64)           636672    
_________________________________________________________________
lstm (LSTM)                  (None, 128)               98816     
_________________________________________________________________
dense (Dense)                (None, 9948)              1283292   
Total params: 2,018,780
Trainable params: 2,018,780
Non-trainable params: 0
_________________________________________________________________


In [16]:
model.fit(x_train, y_train, 
          validation_split=0.1,
          batch_size=batch_size,
          epochs=1000)

Epoch 1/1000
Epoch 2/1000
Epoch 3/1000
Epoch 4/1000
Epoch 5/1000
Epoch 6/1000
Epoch 7/1000
Epoch 8/1000
Epoch 9/1000
Epoch 10/1000
Epoch 11/1000
Epoch 12/1000
Epoch 13/1000
Epoch 14/1000
Epoch 15/1000
Epoch 16/1000
Epoch 17/1000
Epoch 18/1000
Epoch 19/1000
Epoch 20/1000
Epoch 21/1000
Epoch 22/1000
Epoch 23/1000
Epoch 24/1000
Epoch 25/1000
Epoch 26/1000
Epoch 27/1000
Epoch 28/1000
Epoch 29/1000
Epoch 30/1000
Epoch 31/1000
Epoch 32/1000
Epoch 33/1000
Epoch 34/1000
Epoch 35/1000
Epoch 36/1000
Epoch 37/1000
Epoch 38/1000
Epoch 39/1000
Epoch 40/1000
Epoch 41/1000
Epoch 42/1000
Epoch 43/1000
Epoch 44/1000
Epoch 45/1000
Epoch 46/1000
Epoch 47/1000
Epoch 48/1000
Epoch 49/1000
Epoch 50/1000
Epoch 51/1000
Epoch 52/1000
Epoch 53/1000
Epoch 54/1000
Epoch 55/1000
Epoch 56/1000
Epoch 57/1000
Epoch 58/1000
Epoch 59/1000
Epoch 60/1000
Epoch 61/1000
Epoch 62/1000
Epoch 63/1000
Epoch 64/1000
Epoch 65/1000
Epoch 66/1000
Epoch 67/1000
Epoch 68/1000
Epoch 69/1000
Epoch 70/1000
Epoch 71/1000
Epoch 72/1000
E

Epoch 114/1000
Epoch 115/1000
Epoch 116/1000
Epoch 117/1000
Epoch 118/1000
Epoch 119/1000
Epoch 120/1000
Epoch 121/1000
Epoch 122/1000
Epoch 123/1000
Epoch 124/1000
Epoch 125/1000
Epoch 126/1000
Epoch 127/1000
Epoch 128/1000
Epoch 129/1000
Epoch 130/1000
Epoch 131/1000
Epoch 132/1000
Epoch 133/1000
Epoch 134/1000
Epoch 135/1000
Epoch 136/1000
Epoch 137/1000
Epoch 138/1000
Epoch 139/1000
Epoch 140/1000
Epoch 141/1000
Epoch 142/1000
Epoch 143/1000
Epoch 144/1000
Epoch 145/1000
Epoch 146/1000
Epoch 147/1000
Epoch 148/1000
Epoch 149/1000
Epoch 150/1000
Epoch 151/1000
Epoch 152/1000
Epoch 153/1000
Epoch 154/1000
Epoch 155/1000
Epoch 156/1000
Epoch 157/1000
Epoch 158/1000
Epoch 159/1000
Epoch 160/1000
Epoch 161/1000
Epoch 162/1000
Epoch 163/1000
Epoch 164/1000
Epoch 165/1000
Epoch 166/1000
Epoch 167/1000
Epoch 168/1000
Epoch 169/1000
Epoch 170/1000
Epoch 171/1000
Epoch 172/1000
Epoch 173/1000
Epoch 174/1000
Epoch 175/1000
Epoch 176/1000
Epoch 177/1000
Epoch 178/1000
Epoch 179/1000
Epoch 180/

Epoch 226/1000
Epoch 227/1000
Epoch 228/1000
Epoch 229/1000
Epoch 230/1000
Epoch 231/1000
Epoch 232/1000
Epoch 233/1000
Epoch 234/1000
Epoch 235/1000
Epoch 236/1000
Epoch 237/1000
Epoch 238/1000
Epoch 239/1000
Epoch 240/1000
Epoch 241/1000
Epoch 242/1000
Epoch 243/1000
Epoch 244/1000
Epoch 245/1000
Epoch 246/1000
Epoch 247/1000
Epoch 248/1000
Epoch 249/1000
Epoch 250/1000
Epoch 251/1000
Epoch 252/1000
Epoch 253/1000
Epoch 254/1000
Epoch 255/1000
Epoch 256/1000
Epoch 257/1000
Epoch 258/1000
Epoch 259/1000
Epoch 260/1000
Epoch 261/1000
Epoch 262/1000
Epoch 263/1000
Epoch 264/1000
Epoch 265/1000
Epoch 266/1000
Epoch 267/1000
Epoch 268/1000
Epoch 269/1000
Epoch 270/1000
Epoch 271/1000
Epoch 272/1000
Epoch 273/1000
Epoch 274/1000
Epoch 275/1000
Epoch 276/1000
Epoch 277/1000
Epoch 278/1000
Epoch 279/1000
Epoch 280/1000
Epoch 281/1000
Epoch 282/1000
Epoch 283/1000
Epoch 284/1000
Epoch 285/1000
Epoch 286/1000
Epoch 287/1000
Epoch 288/1000
Epoch 289/1000
Epoch 290/1000
Epoch 291/1000
Epoch 292/

Epoch 338/1000
Epoch 339/1000
Epoch 340/1000
Epoch 341/1000
Epoch 342/1000
Epoch 343/1000
Epoch 344/1000
Epoch 345/1000
Epoch 346/1000
Epoch 347/1000
Epoch 348/1000
Epoch 349/1000
Epoch 350/1000
Epoch 351/1000
Epoch 352/1000
Epoch 353/1000
Epoch 354/1000
Epoch 355/1000
Epoch 356/1000
Epoch 357/1000
Epoch 358/1000
Epoch 359/1000
Epoch 360/1000
Epoch 361/1000
Epoch 362/1000
Epoch 363/1000
Epoch 364/1000
Epoch 365/1000
Epoch 366/1000
Epoch 367/1000
Epoch 368/1000
Epoch 369/1000
Epoch 370/1000
Epoch 371/1000
Epoch 372/1000
Epoch 373/1000
Epoch 374/1000
Epoch 375/1000
Epoch 376/1000
Epoch 377/1000
Epoch 378/1000
Epoch 379/1000
Epoch 380/1000
Epoch 381/1000
Epoch 382/1000
Epoch 383/1000
Epoch 384/1000
Epoch 385/1000
Epoch 386/1000
Epoch 387/1000
Epoch 388/1000
Epoch 389/1000
Epoch 390/1000
Epoch 391/1000
Epoch 392/1000
Epoch 393/1000
Epoch 394/1000
Epoch 395/1000
Epoch 396/1000
Epoch 397/1000
Epoch 398/1000
Epoch 399/1000
Epoch 400/1000
Epoch 401/1000
Epoch 402/1000
Epoch 403/1000
Epoch 404/

Epoch 450/1000
Epoch 451/1000
Epoch 452/1000
Epoch 453/1000
Epoch 454/1000
Epoch 455/1000
Epoch 456/1000
Epoch 457/1000
Epoch 458/1000
Epoch 459/1000
Epoch 460/1000
Epoch 461/1000
Epoch 462/1000
Epoch 463/1000
Epoch 464/1000
Epoch 465/1000
Epoch 466/1000
Epoch 467/1000
Epoch 468/1000
Epoch 469/1000
Epoch 470/1000
Epoch 471/1000
Epoch 472/1000
Epoch 473/1000
Epoch 474/1000
Epoch 475/1000
Epoch 476/1000
Epoch 477/1000
Epoch 478/1000
Epoch 479/1000
Epoch 480/1000
Epoch 481/1000
Epoch 482/1000
Epoch 483/1000
Epoch 484/1000
Epoch 485/1000
Epoch 486/1000
Epoch 487/1000
Epoch 488/1000
Epoch 489/1000
Epoch 490/1000
Epoch 491/1000
Epoch 492/1000
Epoch 493/1000
Epoch 494/1000
Epoch 495/1000
Epoch 496/1000
Epoch 497/1000
Epoch 498/1000
Epoch 499/1000
Epoch 500/1000
Epoch 501/1000
Epoch 502/1000
Epoch 503/1000
Epoch 504/1000
Epoch 505/1000
Epoch 506/1000
Epoch 507/1000
Epoch 508/1000
Epoch 509/1000
Epoch 510/1000
Epoch 511/1000
Epoch 512/1000
Epoch 513/1000
Epoch 514/1000
Epoch 515/1000
Epoch 516/

Epoch 562/1000
Epoch 563/1000
Epoch 564/1000
Epoch 565/1000
Epoch 566/1000
Epoch 567/1000
Epoch 568/1000
Epoch 569/1000
Epoch 570/1000
Epoch 571/1000
Epoch 572/1000
Epoch 573/1000
Epoch 574/1000
Epoch 575/1000
Epoch 576/1000
Epoch 577/1000
Epoch 578/1000
Epoch 579/1000
Epoch 580/1000
Epoch 581/1000
Epoch 582/1000
Epoch 583/1000
Epoch 584/1000
Epoch 585/1000
Epoch 586/1000
Epoch 587/1000
Epoch 588/1000
Epoch 589/1000
Epoch 590/1000
Epoch 591/1000
Epoch 592/1000
Epoch 593/1000
Epoch 594/1000
Epoch 595/1000
Epoch 596/1000
Epoch 597/1000
Epoch 598/1000
Epoch 599/1000
Epoch 600/1000
Epoch 601/1000
Epoch 602/1000
Epoch 603/1000
Epoch 604/1000
Epoch 605/1000
Epoch 606/1000
Epoch 607/1000
Epoch 608/1000
Epoch 609/1000
Epoch 610/1000
Epoch 611/1000
Epoch 612/1000
Epoch 613/1000
Epoch 614/1000
Epoch 615/1000
Epoch 616/1000
Epoch 617/1000
Epoch 618/1000
Epoch 619/1000
Epoch 620/1000
Epoch 621/1000
Epoch 622/1000
Epoch 623/1000
Epoch 624/1000
Epoch 625/1000
Epoch 626/1000
Epoch 627/1000
Epoch 628/

Epoch 674/1000
Epoch 675/1000
Epoch 676/1000
Epoch 677/1000
Epoch 678/1000
Epoch 679/1000
Epoch 680/1000
Epoch 681/1000
Epoch 682/1000
Epoch 683/1000
Epoch 684/1000
Epoch 685/1000
Epoch 686/1000
Epoch 687/1000
Epoch 688/1000
Epoch 689/1000
Epoch 690/1000
Epoch 691/1000
Epoch 692/1000
Epoch 693/1000
Epoch 694/1000
Epoch 695/1000
Epoch 696/1000
Epoch 697/1000
Epoch 698/1000
Epoch 699/1000
Epoch 700/1000
Epoch 701/1000
Epoch 702/1000
Epoch 703/1000
Epoch 704/1000
Epoch 705/1000
Epoch 706/1000
Epoch 707/1000
Epoch 708/1000
Epoch 709/1000
Epoch 710/1000
Epoch 711/1000
Epoch 712/1000
Epoch 713/1000
Epoch 714/1000
Epoch 715/1000
Epoch 716/1000
Epoch 717/1000
Epoch 718/1000
Epoch 719/1000
Epoch 720/1000
Epoch 721/1000
Epoch 722/1000
Epoch 723/1000
Epoch 724/1000
Epoch 725/1000
Epoch 726/1000
Epoch 727/1000
Epoch 728/1000
Epoch 729/1000
Epoch 730/1000
Epoch 731/1000
Epoch 732/1000
Epoch 733/1000
Epoch 734/1000
Epoch 735/1000
Epoch 736/1000
Epoch 737/1000
Epoch 738/1000
Epoch 739/1000
Epoch 740/

Epoch 786/1000
Epoch 787/1000
Epoch 788/1000
Epoch 789/1000
Epoch 790/1000
Epoch 791/1000
Epoch 792/1000
Epoch 793/1000
Epoch 794/1000
Epoch 795/1000
Epoch 796/1000
Epoch 797/1000
Epoch 798/1000
Epoch 799/1000
Epoch 800/1000
Epoch 801/1000
Epoch 802/1000
Epoch 803/1000
Epoch 804/1000
Epoch 805/1000
Epoch 806/1000
Epoch 807/1000
Epoch 808/1000
Epoch 809/1000
Epoch 810/1000
Epoch 811/1000
Epoch 812/1000
Epoch 813/1000
Epoch 814/1000
Epoch 815/1000
Epoch 816/1000
Epoch 817/1000
Epoch 818/1000
Epoch 819/1000
Epoch 820/1000
Epoch 821/1000
Epoch 822/1000
Epoch 823/1000
Epoch 824/1000
Epoch 825/1000
Epoch 826/1000
Epoch 827/1000
Epoch 828/1000
Epoch 829/1000
Epoch 830/1000
Epoch 831/1000
Epoch 832/1000
Epoch 833/1000
Epoch 834/1000
Epoch 835/1000
Epoch 836/1000
Epoch 837/1000
Epoch 838/1000
Epoch 839/1000
Epoch 840/1000
Epoch 841/1000
Epoch 842/1000
Epoch 843/1000
Epoch 844/1000
Epoch 845/1000
Epoch 846/1000
Epoch 847/1000
Epoch 848/1000
Epoch 849/1000
Epoch 850/1000
Epoch 851/1000
Epoch 852/

Epoch 898/1000
Epoch 899/1000
Epoch 900/1000
Epoch 901/1000
Epoch 902/1000
Epoch 903/1000
Epoch 904/1000
Epoch 905/1000
Epoch 906/1000
Epoch 907/1000
Epoch 908/1000
Epoch 909/1000
Epoch 910/1000
Epoch 911/1000
Epoch 912/1000
Epoch 913/1000
Epoch 914/1000
Epoch 915/1000
Epoch 916/1000
Epoch 917/1000
Epoch 918/1000
Epoch 919/1000
Epoch 920/1000
Epoch 921/1000
Epoch 922/1000
Epoch 923/1000
Epoch 924/1000
Epoch 925/1000
Epoch 926/1000
Epoch 927/1000
Epoch 928/1000
Epoch 929/1000
Epoch 930/1000
Epoch 931/1000
Epoch 932/1000
Epoch 933/1000
Epoch 934/1000
Epoch 935/1000
Epoch 936/1000
Epoch 937/1000
Epoch 938/1000
Epoch 939/1000
Epoch 940/1000
Epoch 941/1000
Epoch 942/1000
Epoch 943/1000
Epoch 944/1000
Epoch 945/1000
Epoch 946/1000
Epoch 947/1000
Epoch 948/1000
Epoch 949/1000
Epoch 950/1000
Epoch 951/1000
Epoch 952/1000


Epoch 953/1000
Epoch 954/1000
Epoch 955/1000
Epoch 956/1000
Epoch 957/1000
Epoch 958/1000
Epoch 959/1000
Epoch 960/1000
Epoch 961/1000
Epoch 962/1000
Epoch 963/1000
Epoch 964/1000
Epoch 965/1000
Epoch 966/1000
Epoch 967/1000
Epoch 968/1000
Epoch 969/1000
Epoch 970/1000
Epoch 971/1000
Epoch 972/1000
Epoch 973/1000
Epoch 974/1000
Epoch 975/1000
Epoch 976/1000
Epoch 977/1000
Epoch 978/1000
Epoch 979/1000
Epoch 980/1000
Epoch 981/1000
Epoch 982/1000
Epoch 983/1000
Epoch 984/1000
Epoch 985/1000
Epoch 986/1000
Epoch 987/1000
Epoch 988/1000
Epoch 989/1000
Epoch 990/1000
Epoch 991/1000
Epoch 992/1000
Epoch 993/1000
Epoch 994/1000
Epoch 995/1000
Epoch 996/1000
Epoch 997/1000
Epoch 998/1000
Epoch 999/1000
Epoch 1000/1000


<tensorflow.python.keras.callbacks.History at 0x7f28e0384110>

In [17]:
file_model = 'model_ver6.hdf5'
model.save(file_model)

In [13]:
from tensorflow.keras.models import load_model
file_model = 'model_ver6.hdf5'
model = load_model(file_model)

In [20]:
def sequence_generation(model, tags):
    tags = tags.copy()
    tags.append('\t')
    sentence = ''
    while tags[-1] != '\n' and len(tags) < max_seq_length:
        x_test = np.zeros(shape=(1, max_seq_length), dtype='int32')
        x_test[0, -len(tags):] = [w2i_output[w] for w in tags]
        result = model.predict_classes(x_test, verbose=0)
        tags.append(output_words[result[0]])
        sentence += ' ' + tags[-1]
    return sentence.replace('\n', '')

In [25]:
start_idx = 60
end_idx = start_idx + 20
for ori, tags in zip(sentence_data[start_idx:end_idx], input_tags[start_idx:end_idx]):
    print('원본')
    print(ori[1:-1])
    print(tags)
    print('예측')
    print(sequence_generation(model, tags))
    print()

원본
오버핏투버튼자켓 엉덩이를 덮는 기장의 오버핏투버튼자켓이예용 간절기부터 쌀쌀한 가을에도 애용하기 좋은 두께감 스타일리쉬한 핏과 세련된 컬러가 포인트예용 그레이 블랙
['오버핏투버튼자켓', '엉덩이', '덮', '기장', '오버핏투버튼자켓이예용', '간', '절기', '쌀쌀', '가을', '애용', '좋', '두께', '감', '스타일', '리', '쉬', '핏과', '세련', '컬러', '포인트', '예', '그레이', '블랙']
예측
 오버핏투버튼자켓 엉덩이 를 덮 는 기장 의 오버핏투버튼자켓이예용 간 절기 부터 쌀쌀 하 ㄴ 가을 에 도 애용 하 기 좋 은 두께 감 스타일 리 쉬 하 ㄴ 핏과 세련 되 ㄴ 컬러 가 포인트 예 용 그레이 블랙 

원본
데일리자켓은 도대체 안어울리는 옷이 뭐야 다 잘어울리고 난리 같이 매치하니 또 깔꾸미한 완스엉 넘나 예쁘죠
['데일리자켓은', '도대체', '안', '어울리', '옷', '뭐', '다', '잘', '어울리', '난리', '같이', '매치', '하니', '또', '깔', '꾸미', '하', '완스엉', '넘', '예쁘']
예측
 데일리자켓은 도대체 안 어울리 는 게 다임 제가 한 번 씩 중간 러 오 아서 먹 었 는데 아들 도 좋 아 용 

원본
벨뷰 사이즈 최상의 퀄리티 안전하고 빠른 배송 좋은 상품 약속합니다 내가 쓸 제품이라는 마음으로 확실한 제품 꼼꼼한 검수 약속합니다 저렴한 제품에는 이유가 있습니다 동일 퀄리티 대비 최저가 자부합니다 빠르지만 안전을 최우선으로 고객님이 확실하게 전달 받으실 수 있게 노력하겠습니다 게시된 사진은 모두 실사입니다 피드에 없는 제품도 문의주세요
['벨뷰', '사이즈', '최상', '퀄리티', '안전', '빠르', '배', '송', '좋', '상품', '약속', '내', '쓰', '제품', '이', '마음', '확실', '제품', '꼼꼼', '검', '수', '약속', '저렴', '제품', '이유', '있', '동일', '퀄리티', '대비', '최저', '자부', '빠르', '안

 사랑 가득 환하 ㄴ 웃음 이 설레임 가득 예쁘 었 던 정미 님 커플 이 감스에 방문 하 아 주 시 었 습니다 미소 에 서로 에 대하 ㄴ 사랑 이 시간 이 시간 이 었 습니다 

원본
추억을 담아드리는 사진관 소중한 시간을 사진으로 담아드립니다 흑백사진 평일 만원인기준 인화 액자 점 제공 수정컷 카톡메일 발송 주말의 경우 만원 추가 이벤트 참여시 전체이미지 제공
['추억', '담', '드리', '사진관', '소중', '시간', '사진', '담', '드리', '흑백', '사진', '평일', '만', '원인', '기준', '인화', '액자', '점', '제공', '수정', '컷', '카', '톡', '메이', '발송', '주말', '경우', '만원', '추가', '이벤트', '참여', '전체', '이미지', '제공']
예측
 추억 을 담 아 드리 는 사진관 소중 하 ㄴ 시간 을 사진 으로 담 아 드리 ㅂ니다 흑백 사진 평일 만 원인 기준 인화 액자 점 제공 수정 컷 카 톡 메이 ㄹ 발송 주말 의 경우 만원 추가 이벤트 참여 시 전체 이미지 제공 



['맛집', '오늘', '포인트', '이', '없', '거']

In [58]:
import tensorflow.compat.v1 as tf
tf.disable_v2_behavior()

In [125]:
tf.reset_default_graph()

n_embedding = 64
n_hidden = 64
learning_rate = 1e-2

X = tf.placeholder(tf.int32, shape=(None, max_seq_length))
Y = tf.placeholder(tf.int32, shape=(None,))
# Y = tf.placeholder(tf.float32, shape=(None,))

embedding = tf.Variable(tf.random_uniform((n_output_words, n_embedding), -1, 1))
embed = tf.nn.embedding_lookup(embedding, X)

cell = tf.nn.rnn_cell.BasicLSTMCell(n_hidden)
outputs, states = tf.nn.dynamic_rnn(cell, embed, dtype=tf.float32)

model = tf.layers.dense(tf.reshape(outputs, [-1, max_seq_length*n_hidden]), n_output_words, activation=tf.nn.softmax)
# cost = tf.reduce_mean(tf.nn.softmax_cross_entropy_with_logits_v2(logits=model, labels=Y))
cost = tf.reduce_mean(tf.nn.sparse_softmax_cross_entropy_with_logits(logits=model, labels=Y))
optimizer = tf.train.AdamOptimizer(learning_rate).minimize(cost)

predict = tf.arg_max(model, 1)

Instructions for updating:
This class is equivalent as tf.keras.layers.LSTMCell, and will be replaced by that in Tensorflow 2.0.


In [126]:
with tf.device('/gpu:0'):
    sess = tf.Session(config=tf.ConfigProto(allow_soft_placement=True, 
                                            log_device_placement=True))
    sess.run(tf.global_variables_initializer())

Device mapping:
/job:localhost/replica:0/task:0/device:XLA_CPU:0 -> device: XLA_CPU device
/job:localhost/replica:0/task:0/device:XLA_GPU:0 -> device: XLA_GPU device
/job:localhost/replica:0/task:0/device:GPU:0 -> device: 0, name: GeForce RTX 2080 Ti, pci bus id: 0000:68:00.0, compute capability: 7.5



In [127]:
tf.trainable_variables()

[<tf.Variable 'Variable:0' shape=(6883, 64) dtype=float32_ref>,
 <tf.Variable 'rnn/basic_lstm_cell/kernel:0' shape=(128, 256) dtype=float32_ref>,
 <tf.Variable 'rnn/basic_lstm_cell/bias:0' shape=(256,) dtype=float32_ref>,
 <tf.Variable 'dense/kernel:0' shape=(14848, 6883) dtype=float32_ref>,
 <tf.Variable 'dense/bias:0' shape=(6883,) dtype=float32_ref>]

In [128]:
total_epoch = 100

# for epoch in tqdm(range(total_epoch)):
for epoch in range(total_epoch):
    total_loss = 0
    for batch in tqdm(range(n_batch)):
#     for batch in range(n_batch):
        batch_xs = x_train[batch*batch_size:(batch+1)*batch_size]
        batch_ys = y_train[batch*batch_size:(batch+1)*batch_size]
        
        _, loss = sess.run([optimizer, cost], feed_dict={
                X: batch_xs,
                Y: batch_ys
            })
        
        total_loss += loss
    
    total_valid_loss = 0
    for batch in range(n_valid):
        valid_xs = x_valid[batch*batch_size:(batch+1)*batch_size]
        valid_ys = y_valid[batch*batch_size:(batch+1)*batch_size]
        
        val_loss = sess.run(cost, feed_dict={
                X: valid_xs,
                Y: valid_ys
            })
        total_valid_loss += val_loss
    
    print('Epoch: %04d Cost: %.6f Valid Cost: %.6f' %(epoch + 1, total_loss / n_batch, total_valid_loss / n_valid))

100%|██████████| 22/22 [00:05<00:00,  4.08it/s]
  0%|          | 0/22 [00:00<?, ?it/s]

Epoch: 0001 Cost: 8.803528 Valid Cost: 8.801259


100%|██████████| 22/22 [00:05<00:00,  4.22it/s]
  0%|          | 0/22 [00:00<?, ?it/s]

Epoch: 0002 Cost: 8.800805 Valid Cost: 8.801259


100%|██████████| 22/22 [00:05<00:00,  4.19it/s]
  0%|          | 0/22 [00:00<?, ?it/s]

Epoch: 0003 Cost: 8.800805 Valid Cost: 8.801259


 45%|████▌     | 10/22 [00:02<00:03,  3.88it/s]


KeyboardInterrupt: 

In [115]:
def translate(tags):
    x_test = np.zeros(shape=(1, max_seq_length), dtype='float32')
    tags = tags + ['\t']
    idx = -len(tags)
    x_test[0, idx:] = [w2i_output[w] for w in tags]
    while x_test[0, -1] != w2i_output['\n'] and x_test[0][0] == 0:
        print(idx)
        pred = sess.run(predict, feed_dict={X: x_test})[0]
        x_test[0, idx-1:-1] = x_test[0, idx:]
        x_test[0, -1] = pred
        idx -= 1
    end = np.where(x_test[0]==w2i_output['\n'])[0]
    end = end[0] if end.shape[0] > 0 else -1
    ret = x_test[0, np.where(x_test[0]==w2i_output['\t'])[0][0]:end]
    return ''.join([output_words[ret]])

In [121]:
tags = input_tags[0]
x_test = np.zeros(shape=(1, max_seq_length), dtype='float32')
tags = tags + ['\t']
idx = -len(tags)
x_test[0, idx:] = [w2i_output[w] for w in tags]
while x_test[0, -1] != w2i_output['\n'] and x_test[0][0] == 0:
    print(idx)
    pred = sess.run(predict, feed_dict={X: x_test})[0]
    x_test[0, idx-1:-1] = x_test[0, idx:]
    x_test[0, -1] = pred
    idx -= 1
end = np.where(x_test[0]==w2i_output['\n'])[0]
end = end[0] if end.shape[0] > 0 else -1
ret = x_test[0, np.where(x_test[0]==w2i_output['\t'])[0][0]:end]
''.join([output_words[map(int, ret)]])

-7
-8
-9
-10
-11
-12
-13
-14
-15
-16
-17
-18
-19
-20
-21
-22
-23
-24
-25
-26
-27
-28
-29
-30
-31
-32
-33
-34
-35
-36
-37
-38
-39
-40
-41
-42
-43
-44
-45
-46
-47
-48
-49
-50
-51
-52
-53
-54
-55
-56
-57
-58
-59
-60
-61
-62
-63
-64
-65
-66
-67
-68
-69
-70
-71
-72
-73
-74
-75
-76
-77
-78
-79
-80
-81
-82
-83
-84
-85
-86
-87
-88
-89
-90
-91
-92
-93
-94
-95
-96
-97
-98
-99
-100
-101
-102
-103
-104
-105
-106
-107
-108
-109
-110
-111
-112
-113
-114
-115
-116
-117
-118


KeyboardInterrupt: 

In [124]:
''.join([output_words[int(i)] for i in ret])

'\t하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하하'