In [5]:
from IPython.display import HTML, display

# カスタムCSSの適用
display(HTML("""
<style>
    .h1, h2, h3, h4, h5, h6, div, span, p, a, ul, ol, li, pre, code, blockquote, table, thead, tbody, tr, th, td {
        color: black !important;
        background-color: white !important;
    }
</style>
"""))


In [6]:
from transformers import BertTokenizer, BertModel
from bertviz import head_view
import torch

# モデルとトークナイザーのロード
model_path = '../output_WN18RR'
tokenizer = BertTokenizer.from_pretrained(model_path)
model = BertModel.from_pretrained(model_path, output_attentions=True)

# GPUが利用可能か確認し、利用可能であればモデルをGPUに移動
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model.to(device)

# 複数の文を [SEP] トークンで区切って結合
texts = ["mammal",
         "hypernym",
         "man"]
combined_text = " [SEP] ".join(texts)

# テキストのトークン化
inputs = tokenizer.encode_plus(combined_text, return_tensors='pt', add_special_tokens=True)
input_ids = inputs['input_ids'].to(device)  # 入力データをGPUに移動

# モデルの実行とアテンションの取得
outputs = model(input_ids)
attention = outputs[-1]  # アテンションは最終出力の一部

# BertVizでの視覚化
tokens = tokenizer.convert_ids_to_tokens(input_ids[0].cpu().numpy())
head_view(attention, tokens)


<IPython.core.display.Javascript object>