In [2]:
import os
os.environ["CUDA_DEVICE_ORDER"]="PCI_BUS_ID"   
os.environ["CUDA_VISIBLE_DEVICES"]="0"

In [3]:
from transformers import BertForSequenceClassification
from transformers import BertTokenizer, BertModel, BertConfig
import numpy as np
import torch
from torch import nn
from torch import softmax

def run_inference5():
    sent = input("Sentence(s) : ")
    print("predicting...")
    labels = ['上去','下去','下来','出来','起来']
    model = torch.load("../models/5_mac_large/5_mac_large.tar")
    model = model.to('cuda')
    model.eval()
    
    tokenizer = BertTokenizer.from_pretrained('hfl/chinese-macbert-large')
    sent = sent.replace('！','。')
    sent = sent.replace('？','。')
    sents = sent.split('。')[:-1]
    for sent in sents:
        sent = sent.strip()
        sent_ids = tokenizer(sent)['input_ids']
        sent_tensor = torch.tensor(sent_ids).unsqueeze(0).to('cuda')
        output = model(sent_tensor)[0]
        logits =output.detach().cpu().numpy()[0]
        predict = labels[np.argmax(logits, axis=0)]
        softmax_output = softmax(output, 1)
        print(sent)
        print(f"[MASK] : {predict}")
        result = dict()
        for prob, label in zip(softmax_output[0].tolist(), labels):
            result[label] = prob
        print(f"\t出来 : {result['出来']*100:.2f}%")
        print(f"\t起来 : {result['起来']*100:.2f}%")
        print(f"\t上去 : {result['上去']*100:.2f}%")
        print(f"\t下来 : {result['下来']*100:.2f}%")
        print(f"\t下去 : {result['下去']*100:.2f}%")        

def run_inference8():
    sent = input("Sentence(s) : ")
    print("predicting...")
    labels = ['上去','下去','下来','出来','起来','上来','过来','过去']
    model = torch.load("../models/8_mac_large/8_mac_large.tar")
    model = model.to('cuda')
    model.eval()
    
    tokenizer = BertTokenizer.from_pretrained('hfl/chinese-macbert-large')
    sent = sent.replace('！','。')
    sent = sent.replace('？','。')
    sents = sent.split('。')[:-1]
    for sent in sents:
        sent = sent.strip()
        sent_ids = tokenizer(sent)['input_ids']
        sent_tensor = torch.tensor(sent_ids).unsqueeze(0).to('cuda')
        output = model(sent_tensor)[0]
        logits =output.detach().cpu().numpy()[0]
        predict = labels[np.argmax(logits, axis=0)]
        softmax_output = softmax(output, 1)
        print(sent)
        print(f"[MASK] : {predict}")
        result = dict()
        for prob, label in zip(softmax_output[0].tolist(), labels):
            result[label] = prob
        print(f"\t出来 : {result['出来']*100:.2f}%")
        print(f"\t过来 : {result['过来']*100:.2f}%")
        print(f"\t过去 : {result['过去']*100:.2f}%")        
        print(f"\t起来 : {result['起来']*100:.2f}%")
        print(f"\t上来 : {result['上来']*100:.2f}%")   
        print(f"\t上去 : {result['上去']*100:.2f}%")
        print(f"\t下来 : {result['下来']*100:.2f}%")
        print(f"\t下去 : {result['下去']*100:.2f}%")

def run_inference5_file(filename):
    with open(filename, 'r') as f:
        sents = f.readlines()
    print("predicting...")
    labels = ['上去','下去','下来','出来','起来']
    model = torch.load("../models/5_mac_large/5_mac_large.tar")
    model = model.to('cuda')
    model.eval()
    
    tokenizer = BertTokenizer.from_pretrained('hfl/chinese-macbert-large')

    for sent in sents:
        sent = sent.strip()
        sent_ids = tokenizer(sent)['input_ids']
        sent_tensor = torch.tensor(sent_ids).unsqueeze(0).to('cuda')
        output = model(sent_tensor)[0]
        logits =output.detach().cpu().numpy()[0]
        predict = labels[np.argmax(logits, axis=0)]
        softmax_output = softmax(output, 1)
        print(sent)
        print(f"[MASK] : {predict}")
        result = dict()
        for prob, label in zip(softmax_output[0].tolist(), labels):
            result[label] = prob
        print(f"\t出来 : {result['出来']*100:.2f}%")
        print(f"\t起来 : {result['起来']*100:.2f}%")
        print(f"\t上去 : {result['上去']*100:.2f}%")
        print(f"\t下来 : {result['下来']*100:.2f}%")
        print(f"\t下去 : {result['下去']*100:.2f}%")            

def run_inference8_file(filename):
    with open(filename, 'r') as f:
        sents = f.readlines()
    print("predicting...")
    labels = ['上去','下去','下来','出来','起来','上来','过来','过去']
    model = torch.load("../models/8_mac_large/8_mac_large.tar")
    model = model.to('cuda')
    model.eval()
    
    tokenizer = BertTokenizer.from_pretrained('hfl/chinese-macbert-large')

    for sent in sents:
        sent = sent.strip()
        sent_ids = tokenizer(sent)['input_ids']
        sent_tensor = torch.tensor(sent_ids).unsqueeze(0).to('cuda')
        output = model(sent_tensor)[0]
        logits =output.detach().cpu().numpy()[0]
        predict = labels[np.argmax(logits, axis=0)]
        softmax_output = softmax(output, 1)
        print(sent)
        print(f"[MASK] : {predict}")
        result = dict()
        for prob, label in zip(softmax_output[0].tolist(), labels):
            result[label] = prob
        print(f"\t出来 : {result['出来']*100:.2f}%")
        print(f"\t过来 : {result['过来']*100:.2f}%")
        print(f"\t过去 : {result['过去']*100:.2f}%")        
        print(f"\t起来 : {result['起来']*100:.2f}%")
        print(f"\t上来 : {result['上来']*100:.2f}%")   
        print(f"\t上去 : {result['上去']*100:.2f}%")
        print(f"\t下来 : {result['下来']*100:.2f}%")
        print(f"\t下去 : {result['下去']*100:.2f}%")

### 방향보어 5개 중에 1개 선택하기
**예시 문장**  
你是用什么办法把这种习惯坚持[MASK]的？    
只要有信心，环境再残酷，也能坚持[MASK]。  
这是一场梦，这地方我绝对不会再住[MASK]。  
他的眼睛仍然望着窗外在旋转着的大地，心情有些沉重[MASK]。  


In [40]:
run_inference5()

Sentence(s) : 你是用什么办法把这种习惯坚持[MASK]的？   只要有信心，环境再残酷，也能坚持[MASK]。  这是一场梦，这地方我绝对不会再住[MASK]。
predicting...
你是用什么办法把这种习惯坚持[MASK]的
[MASK] : 下来
	出来 : 0.00%
	起来 : 0.00%
	上去 : 0.00%
	下来 : 99.26%
	下去 : 0.74%
只要有信心，环境再残酷，也能坚持[MASK]
[MASK] : 下去
	出来 : 0.00%
	起来 : 0.00%
	上去 : 0.00%
	下来 : 0.10%
	下去 : 99.89%
这是一场梦，这地方我绝对不会再住[MASK]
[MASK] : 下去
	出来 : 0.00%
	起来 : 0.00%
	上去 : 0.00%
	下来 : 0.00%
	下去 : 99.99%


### 방향보어 8개 중에 1개 
你是用什么办法把这种习惯坚持[MASK]的？    
只要有信心，环境再残酷，也能坚持[MASK]。  
这是一场梦，这地方我绝对不会再住[MASK]。  
他的眼睛仍然望着窗外在旋转着的大地，心情有些沉重[MASK]。 

In [6]:
run_inference8()

Sentence(s) : 你是用什么办法把这种习惯坚持[MASK]的？ 只要有信心，环境再残酷，也能坚持[MASK]。 这是一场梦，这地方我绝对不会再住[MASK]。 他的眼睛仍然望着窗外在旋转着的大地，心情有些沉重[MASK]。
predicting...
你是用什么办法把这种习惯坚持[MASK]的
[MASK] : 下来
	出来 : 0.00%
	过来 : 0.00%
	过去 : 0.00%
	起来 : 0.00%
	上来 : 0.00%
	上去 : 0.00%
	下来 : 99.98%
	下去 : 0.01%
只要有信心，环境再残酷，也能坚持[MASK]
[MASK] : 下去
	出来 : 0.00%
	过来 : 0.01%
	过去 : 0.07%
	起来 : 0.00%
	上来 : 0.00%
	上去 : 0.01%
	下来 : 0.51%
	下去 : 99.40%
这是一场梦，这地方我绝对不会再住[MASK]
[MASK] : 下去
	出来 : 0.00%
	过来 : 0.00%
	过去 : 0.00%
	起来 : 0.00%
	上来 : 0.00%
	上去 : 0.00%
	下来 : 0.00%
	下去 : 99.99%
他的眼睛仍然望着窗外在旋转着的大地，心情有些沉重[MASK]
[MASK] : 起来
	出来 : 0.00%
	过来 : 0.00%
	过去 : 0.00%
	起来 : 100.00%
	上来 : 0.00%
	上去 : 0.00%
	下来 : 0.00%
	下去 : 0.00%
