### 処理内容
* 日本語の文章を入力し、固有表現を抽出する。
* フレームワークでは、`spacy`と`transformers`を活用した。

In [1]:
# ライブラリを読み込む。
!pip install spacy
import spacy
from transformers import pipeline



In [2]:
# spaCyの日本語モデルを読み込む。
!python -m spacy download ja_core_news_sm
nlp = spacy.load("ja_core_news_sm")

Collecting ja-core-news-sm==3.7.0
  Downloading https://github.com/explosion/spacy-models/releases/download/ja_core_news_sm-3.7.0/ja_core_news_sm-3.7.0-py3-none-any.whl (12.1 MB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m12.1/12.1 MB[0m [31m54.5 MB/s[0m eta [36m0:00:00[0m
[38;5;2m✔ Download and installation successful[0m
You can now load the package via spacy.load('ja_core_news_sm')
[38;5;3m⚠ Restart to reload dependencies[0m
If you are in a Jupyter or Colab notebook, you may need to restart Python in
order to load all the package's dependencies. You can do this by selecting the
'Restart kernel' or 'Restart runtime' option.


In [3]:
# Transformersの会話モデルを読み込む。
chatbot = pipeline("text-generation", model="facebook/blenderbot-400M-distill")

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


In [4]:
# チャットボットの対話ループ
print("AIチャットボットと会話を始めましょう！ (終了するには 'exit' と入力)")

while True:
    user_input = input("あなた: ")
    if user_input.lower() == 'exit':
        break

    # spaCyで入力を解析
    doc = nlp(user_input)
    entities = [ent.text for ent in doc.ents]

    # Transformersで応答を生成
    response = chatbot(user_input)

    print(f"Bot: {response[0]['generated_text']}")
    if entities:
        print(f"認識された固有表現: {entities}")

AIチャットボットと会話を始めましょう！ (終了するには 'exit' と入力)
あなた: 私は東京に住んでいます。
Bot: 私は東京に住んでいます。    I have been to places where I will be for a long time.
認識された固有表現: ['東京']
あなた: あなたの苗字は、田中です。
Bot: あなたの苗字は、田中です。 to to a to to where to go to school.
認識された固有表現: ['田中']
あなた: あれは新宿駅です。
Bot: あれは新宿駅です。    I'm dying right now.
認識された固有表現: ['新宿駅']
あなた: 日本の公用語は、日本語です。
Bot: 日本の公用語は、日本語です。 etc.   
認識された固有表現: ['日本', '日本語']
あなた: exit
