In [1]:
%pip install --upgrade --force-reinstall --no-cache-dir ../../

Processing /home/sbumseo/git/ivete
Building wheels for collected packages: ivete
  Building wheel for ivete (setup.py) ... [?25ldone
[?25h  Created wheel for ivete: filename=ivete-1.0.0-py3-none-any.whl size=34585 sha256=20fdbfce3c9032f3c2b79884aeae24a4e1c84aa73e98a197c0633a24a364b295
  Stored in directory: /tmp/pip-ephem-wheel-cache-45rfe7ag/wheels/d3/e8/99/b45fc6158bfdebc264a05d8781941b49d19db5b0694e57ecb4
Successfully built ivete
Installing collected packages: ivete
  Attempting uninstall: ivete
    Found existing installation: ivete 1.0.0
    Uninstalling ivete-1.0.0:
      Successfully uninstalled ivete-1.0.0
Successfully installed ivete-1.0.0
Note: you may need to restart the kernel to use updated packages.


In [2]:
import torch
from transformers import BertConfig, BertForQuestionAnswering, BertTokenizer
from ivete.deploy import DeployArguments, deploy

In [3]:
args = DeployArguments(
    pretrained_model_name="beomi/kcbert-base",
    downstream_model_path="./checkpoints/",
    inference_args={
        'max_seq_length': 128,
        'max_query_length': 32,
    }
)

downstream_model_path: ./checkpoints/epoch=0-val_loss=0.47.ckpt


In [4]:
checkpoint = torch.load(
    args.downstream_model_path, 
    map_location=torch.device("cpu"),
)

In [5]:
pretrained_model_config = BertConfig.from_pretrained(
    args.pretrained_model_name
)
model = BertForQuestionAnswering(pretrained_model_config)

In [6]:
model.load_state_dict({k.replace("model.", ""): v for k, v in checkpoint['state_dict'].items()})

<All keys matched successfully>

In [7]:
model.eval()

BertForQuestionAnswering(
  (bert): BertModel(
    (embeddings): BertEmbeddings(
      (word_embeddings): Embedding(30000, 768, padding_idx=0)
      (position_embeddings): Embedding(300, 768)
      (token_type_embeddings): Embedding(2, 768)
      (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_affine=True)
      (dropout): Dropout(p=0.1, inplace=False)
    )
    (encoder): BertEncoder(
      (layer): ModuleList(
        (0): BertLayer(
          (attention): BertAttention(
            (self): BertSelfAttention(
              (query): Linear(in_features=768, out_features=768, bias=True)
              (key): Linear(in_features=768, out_features=768, bias=True)
              (value): Linear(in_features=768, out_features=768, bias=True)
              (dropout): Dropout(p=0.1, inplace=False)
            )
            (output): BertSelfOutput(
              (dense): Linear(in_features=768, out_features=768, bias=True)
              (LayerNorm): LayerNorm((768,), eps=1e-12, elementwise_

In [8]:
tokenizer = BertTokenizer.from_pretrained(
    args.pretrained_model_name,
    do_lower_case=False,
)

In [9]:
def inference(question, context):
    if question and context:
        truncated_query = tokenizer.encode(
            question,
            add_special_tokens=False,
            truncation=True,
            max_length=args.inference_args['max_query_length'],
       )
        inputs = tokenizer.encode_plus(
            text=truncated_query,
            text_pair=context,
            truncation="only_second",
            padding="max_length",
            max_length=args.inference_args['max_seq_length'],
            return_token_type_ids=True,
        )
        with torch.no_grad():
            outputs = model(**{k: torch.tensor([v]) for k, v in inputs.items()})
            start_pred = outputs.start_logits.argmax(dim=-1).item()
            end_pred = outputs.end_logits.argmax(dim=-1).item()
            pred_text = tokenizer.decode(inputs['input_ids'][start_pred:end_pred+1])
    else:
        pred_text = ""
    return {
        'question': question,
        'context': context,
        'answer': pred_text,
    }

In [10]:
context = "한강대교(漢江大橋)는 서울특별시 용산구 이촌동에 있는 용산구 한강로3가와 동작구 본동 사이를 잇는 총연장 1,005m의 길이의 교량(다리)이다. 한강에 놓인 최초의 도로 교량으로, 제1한강교라고 불렸다. 1917년 개통된 뒤 몇 차례의 수난을 거쳐 지금에 이른다. 다리 아래로는 노들섬이 있다. 과거에는 국도 제1호선이 이 다리를 통하여 서울로 연결되었었다."
question = "한강대교가 위치한 곳은?"
inference(question=question, context=context)

{'question': '한강대교가 위치한 곳은?',
 'context': '한강대교(漢江大橋)는 서울특별시 용산구 이촌동에 있는 용산구 한강로3가와 동작구 본동 사이를 잇는 총연장 1,005m의 길이의 교량(다리)이다. 한강에 놓인 최초의 도로 교량으로, 제1한강교라고 불렸다. 1917년 개통된 뒤 몇 차례의 수난을 거쳐 지금에 이른다. 다리 아래로는 노들섬이 있다. 과거에는 국도 제1호선이 이 다리를 통하여 서울로 연결되었었다.',
 'answer': '서울특별시 용산구 이촌동에'}

In [11]:
import os, ivete
os.path.dirname(ivete.__file__)

'/home/sbumseo/git/ivete/experiments/qa/.venv/lib/python3.8/site-packages/ivete'

In [12]:
import os
app = deploy(
    inference=inference,
    api_name="qa",
)
app.run()

/home/sbumseo/git/ivete/experiments/qa/.venv/lib/python3.8/site-packages/ivete/deploy/templates/default
 * Serving Flask app 'ivete.deploy' (lazy loading)
 * Environment: production
[2m   Use a production WSGI server instead.[0m
 * Debug mode: off


 * Running on http://127.0.0.1:5000 (Press CTRL+C to quit)
127.0.0.1 - - [20/Jul/2022 15:04:51] "[32mGET /qa HTTP/1.1[0m" 308 -
127.0.0.1 - - [20/Jul/2022 15:04:51] "GET /qa/ HTTP/1.1" 200 -
127.0.0.1 - - [20/Jul/2022 15:04:55] "POST /qa/api HTTP/1.1" 200 -
