In [8]:
from transformers import AutoTokenizer, AutoModelForCausalLM

# load tokenizer
tokenizer = AutoTokenizer.from_pretrained("tohoku-nlp/bert-base-japanese-v3")

# load pre-trained model
model = AutoModelForCausalLM.from_pretrained("tohoku-nlp/bert-base-japanese-v3", is_decoder=True)

# Set input word
input = tokenizer.encode("リンゴの色は?", return_tensors="pt")

# inference
output = model.generate(input, do_sample=True, max_length=30, num_return_sequences=3)

# inferred output
print(tokenizer.batch_decode(output))

['[CLS] リンゴ の 色 は ? [SEP] より より より より より より より より より より より より より より より より より より より より より より より', '[CLS] リンゴ の 色 は ? [SEP] の の の の の の の の の の の の の の の の の の の の の の の', '[CLS] リンゴ の 色 は ? [SEP] 年 年 年 年 年 年 年 年 年 年 年 年 年 年 年 年 年 年 年 年 年 年 年']


In [2]:
from transformers import GPT2LMHeadModel, GPT2Tokenizer

# load tokenizer
tokenizer = GPT2Tokenizer.from_pretrained("gpt2")

# load pre-trained model
model = GPT2LMHeadModel.from_pretrained("gpt2")

# Set input word
input = tokenizer.encode("Hello, world", return_tensors="pt")

# inference
output = model.generate(input, do_sample=True, max_length=30, num_return_sequences=3)

# inferred output
print(tokenizer.batch_decode(output))

The attention mask and the pad token id were not set. As a consequence, you may observe unexpected behavior. Please pass your input's `attention_mask` to obtain reliable results.
Setting `pad_token_id` to `eos_token_id`:None for open-end generation.


["Hello, world, the U.S. isn't trying to invade any country without permission. [U]nworld was designed as a free country", "Hello, world. We are all trying.\n\nYou're the best.\n\nYou are perfect. Not to mention, you're the best", 'Hello, world.\n\nWhy do we even have all the food in those little pockets?\n\nIf we were all living in these big-']


In [14]:
from transformers import AutoTokenizer, AutoModelForQuestionAnswering, pipeline

# 東北BERTの日本語質問応答モデルをロード
model_name = "cl-tohoku/bert-base-japanese"
tokenizer = AutoTokenizer.from_pretrained(model_name)
model = AutoModelForQuestionAnswering.from_pretrained(model_name)

# pipelineを使用して質問応答パイプラインを設定
qa_pipeline = pipeline("question-answering", model=model, tokenizer=tokenizer)

# 質問とコンテキストを設定
question = "AI研究で重要な要素は何ですか？"
context = "AI研究には多くの重要な要素がありますが、特にデータの質と量、アルゴリズムの選択、計算資源が重要です。"

# 質問応答を実行
result = qa_pipeline(question=question, context=context)

# 結果を表示
print("回答:", result['answer'])

Some weights of BertForQuestionAnswering were not initialized from the model checkpoint at cl-tohoku/bert-base-japanese and are newly initialized: ['qa_outputs.bias', 'qa_outputs.weight']
You should probably TRAIN this model on a down-stream task to be able to use it for predictions and inference.
Hardware accelerator e.g. GPU is available in the environment, but no `device` argument is passed to the `Pipeline` object. Model will be on CPU.


回答: AI研究には多くの重要な要素がありますが、特にデータの質と量、アルゴリズムの選択、計算資源が重要です。


In [16]:
from transformers import pipeline

# モデルを指定して質問応答パイプラインを作成
qa_pipeline = pipeline("question-answering", model="roberta-large-squad2")

# 質問とコンテキストを入力して回答を取得
result = qa_pipeline({
    "question": "What is the main purpose of BERT?",
    "context": "BERT is a model developed by Google for NLP tasks including question answering."
})

print(result["answer"])

OSError: roberta-large-squad2 is not a local folder and is not a valid model identifier listed on 'https://huggingface.co/models'
If this is a private repository, make sure to pass a token having permission to this repo either by logging in with `huggingface-cli login` or by passing `token=<your_token>`