# 1.1

## 1.1.1

In [2]:
from transformers import pipeline

In [3]:
text_classification = pipeline(model="llm-book/bert-base-japanese-v3-marc_ja")

Device set to use cuda:0


In [4]:
positive_text = "世界には言葉がわからなくても感動する音楽がある"

In [5]:
text_classification(positive_text)

[{'label': 'positive', 'score': 0.9994138479232788}]

In [6]:
negative_text = "世界には言葉がでないほどひどい音楽がある"

In [7]:
text_classification(negative_text)

[{'label': 'negative', 'score': 0.9750520586967468}]

## 1.1.2

In [8]:
nli_pipeline = pipeline(model="llm-book/bert-base-japanese-v3-jnli")

Device set to use cuda:0


In [16]:
text = "二人の男性がジェット機を見ています"
entailment_text = "ジェット機を見ている人が二人います"
contradiction_text = "二人の男性が飛んでいます"
neutral_text = "2人の男性が，白い飛行機を眺めています．"

In [14]:
nli_pipeline({"text": text, "text_pair": entailment_text})

{'label': 'entailment', 'score': 0.9964311122894287}

In [None]:
nli_pipeline({"text": text, "text_pair": contradiction_text})

{'label': 'contradiction', 'score': 0.9990535378456116}

In [17]:
nli_pipeline({"text": text, "text_pair": neutral_text})

{'label': 'neutral', 'score': 0.9959046244621277}

## 1.1.3

In [18]:
text_sim_pipeline = pipeline(model="llm-book/bert-base-japanese-v3-jsts", function_to_apply="none")

Device set to use cuda:0


In [22]:
text = "川べりでサーフボードを持った人たちがいます"
sim_text = "サーファーたちが川べりに立っています"
dissim_text = "トイレの壁に黒いタオルが掛けられています"

In [20]:
result = text_sim_pipeline({"text": text, "text_pair": sim_text})

In [21]:
result

{'label': 'LABEL_0', 'score': 3.570356607437134}

In [None]:
text_sim_pipeline({"text": text, "text_pair": dissim_text})

{'label': 'LABEL_0', 'score': 0.035030558705329895}

In [24]:
from torch.nn.functional import cosine_similarity

In [25]:
sim_enc_pipeline = pipeline(model="llm-book/bert-base-japanese-v3-unsup-simcse-jawiki", task="feature-extraction") 

Device set to use cuda:0


In [30]:
text_emb = sim_enc_pipeline(text, return_tensors=True)[0][0]
sim_text_emb = sim_enc_pipeline(sim_text, return_tensors=True)[0][0]
dissim_text_emb = sim_enc_pipeline(dissim_text, return_tensors=True)[0][0]

In [33]:
cosine_similarity(text_emb, sim_text_emb, dim=0).item()

0.8568587899208069

In [None]:
cosine_similarity(text_emb, dissim_text_emb, dim=0).item()

0.45993202924728394

## 1.1.4

In [34]:
ner_pipeline = pipeline(model="llm-book/bert-base-japanese-v3-ner-wikipedia-dataset", aggregation_strategy="simple")

Device set to use cuda:0


In [35]:
text = "大谷祥平は岩手県水沢市出身のプロ野球選手である。"

In [36]:
ner_pipeline(text)

[{'entity_group': '人名',
  'score': np.float32(0.99876785),
  'word': '大谷 祥平',
  'start': None,
  'end': None},
 {'entity_group': '地名',
  'score': np.float32(0.99872315),
  'word': '岩手 県 水沢 市',
  'start': None,
  'end': None}]

## 1.1.5

In [40]:
text2text_pipeline = pipeline(model="llm-book/t5-base-long-livedoor-news-corpus", task="summarization")

Device set to use cuda:0


In [41]:
article = "ついに始まった３連休。テレビを見ながら過ごしている人も多いのではないだろうか？　今夜オススメなのは何と言っても、NHKスペシャル「世界を変えた男 スティーブ・ジョブズ」だ。実は知らない人も多いジョブズ氏の養子に出された生い立ちや、アップル社から一時追放されるなどの経験。そして、彼が追い求めた理想の未来とはなんだったのか、ファンならずとも気になる内容になっている。 今年、亡くなったジョブズ氏の伝記は日本でもベストセラーになっている。今後もアップル製品だけでなく、世界でのジョブズ氏の影響は大きいだろうと想像される。ジョブズ氏のことをあまり知らないという人もこの機会にぜひチェックしてみよう。 世界を変えた男　スティーブ・ジョブズ（NHKスペシャル）"

In [42]:
text2text_pipeline(article)

[{'summary_text': '今夜はNHKスペシャル「世界を変えた男 スティーブ・ジョブズ」'}]