In [None]:
import torch
from transformers.models.auto.tokenization_auto import AutoTokenizer
from transformers.models.auto.modeling_auto import AutoModelForCausalLM
from typing import Any
# from transformers.models.bert import BertTokenizer, BertForSequenceClassification
# from transformers.trainer import Trainer
# from transformers.training_args import TrainingArguments
# from datasets import load_dataset #, load_metric
# from datasets.dataset_dict import DatasetDict


model_name = "rinna/japanese-gpt-1b"
tokenizer = AutoTokenizer.from_pretrained(model_name, cache_dir="/mnt/c/LLM/rinna/japanese-gpt-1b", use_fast=False, legacy=False)
model = AutoModelForCausalLM.from_pretrained(model_name, cache_dir="/mnt/c/LLM/rinna/japanese-gpt-1b")

# model_name = "bert-base-uncased"
# tokenizer = BertTokenizer.from_pretrained(model_name, cache_dir="/mnt/c/LLM/bert-base-uncased")
# model = BertForSequenceClassification.from_pretrained(model_name, cache_dir="/mnt/c/LLM/bert-base-uncased", num_labels=2)


# Trueが表示されればGPUが利用可能
print(torch.cuda.is_available())
# 利用可能なGPUのディバイス名を表示
print(torch.cuda.get_device_name(0))  

In [None]:
"""
「CUDA」という単語は、「Compute Unified Device Architecture」の略です。
これはNVIDIAによって開発された並列計算プラットフォームおよびプログラミングモデルで、
GPUを汎用計算に利用できるようにするためのものです。
GPUを使用することで、特定の計算タスク（例えば機械学習や深層学習）が大幅に高速化されることがあります。
"""

if torch.cuda.is_available():
    # model = model.to("cuda")    # RAMからGPU側へ転送
    device = torch.device("cuda")  # GPUデバイスを取得
    model = model.to(device)       # GPUにモデルを転送


In [None]:
text = "西田幾多郎は、"
# token_ids = tokenizer.encode(text, add_special_tokens=False, return_tensors="pt")
any: Any = tokenizer.encode(text, add_special_tokens=False, return_tensors="pt")
token_ids: torch.Tensor = any


In [None]:
# トークンもGPUに転送
# if torch.cuda.is_available():
#     token_ids = token_ids.to("cuda")    # RAMからGPU側へ転送


In [None]:
with torch.no_grad():
    output_ids = model.generate(
        token_ids.to(model.device),
        max_length=100,
        min_length=100,
        do_sample=True,
        top_k=500,
        top_p=0.95,
        pad_token_id=tokenizer.pad_token_id,
        bos_token_id=tokenizer.bos_token_id,
        eos_token_id=tokenizer.eos_token_id,
        bad_words_ids=[[tokenizer.unk_token_id]]
    )


In [None]:
output = tokenizer.decode(output_ids.tolist()[0])
print(output)  