In [1]:
import torch
from langchain.chains import LLMChain
from langchain.llms import HuggingFacePipeline
from langchain.prompts import PromptTemplate
from transformers import AutoModelForCausalLM, AutoTokenizer, pipeline

  from .autonotebook import tqdm as notebook_tqdm


In [2]:
repo_id = "rinna/japanese-gpt2-medium"

In [3]:
# device = "cuda:0" if torch.cuda.is_available() else "cpu"
device = "cpu"

In [4]:
tokenizer = AutoTokenizer.from_pretrained(repo_id, use_fast=False)
tokenizer.do_lower_case = True  # due to some bug of tokenizer config loading

model = AutoModelForCausalLM.from_pretrained(repo_id)

Downloading (…)okenizer_config.json: 100%|██████████| 282/282 [00:00<00:00, 2.09MB/s]
Downloading spiece.model: 100%|██████████| 806k/806k [00:00<00:00, 10.9MB/s]
Downloading (…)cial_tokens_map.json: 100%|██████████| 153/153 [00:00<00:00, 1.26MB/s]
Downloading (…)lve/main/config.json: 100%|██████████| 799/799 [00:00<00:00, 4.51MB/s]
Downloading model.safetensors: 100%|██████████| 1.37G/1.37G [00:23<00:00, 59.1MB/s]


In [5]:
pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_new_tokens=64,
    device=device,
)
llm = HuggingFacePipeline(pipeline=pipe)

In [6]:
print(llm("吾輩は猫である。"))

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


 」第9話、第17話、第30話、第34話、第38話 第3作「風邪をひいたら 俺が食べたいもの だからおやすみなさい」、第16作「ぼくら家族で ごめんね 3」、第17作「


In [7]:
template = """日本の{question}に、競馬場はありますか。"""

prompt = PromptTemplate(
    input_variables=["question"],
    template=template,
)

llm_chain = LLMChain(prompt=prompt, llm=llm)

In [8]:
text = "岩手県"

In [9]:
print(llm_chain.run(text))

Setting `pad_token_id` to `eos_token_id`:2 for open-end generation.


 岩手県競馬組合が管理する競馬場の中で、岩手県にあるのはどこか。 岩手県で競馬ができる地方競馬の競馬場で、敷地面積はどのくらいですか? 岩手県で中央競馬ができる地方競馬の競馬場で、地方競馬の中でも特に地方競馬が盛んなのはどこですか。 岩手県でプロ野球ができる野球場はどこですか。 岩手県でプロ野球ができる
