# 第13章 RAG

## 13.1 RAG とは

### 13.1.1 RAG の必要性

In [None]:
!pip install transformers[torch,sentencepiece]

In [None]:
from transformers.trainer_utils import set_seed

# 乱数のシードを設定
set_seed(42)

In [None]:
import torch
from transformers import (
    AutoModelForCausalLM,
    AutoTokenizer,
    pipeline,
)

# Hugging Face Hubにおけるモデル名を指定
model_name = "llm-book/Swallow-7b-hf-oasst1-21k-ja"

# モデルを読み込む
model = AutoModelForCausalLM.from_pretrained(
    model_name, torch_dtype=torch.bfloat16, device_map="auto"
)

# トークナイザを読み込む
tokenizer = AutoTokenizer.from_pretrained(model_name)

# テキスト生成用のパラメータを指定
generation_config = {
    "max_new_tokens": 128,
    "do_sample": False,
    "temperature": None,
    "top_p": None,
}

# テキスト生成を行うパイプラインを作成
text_generation_pipeline = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    device_map="auto",
    **generation_config,
)

In [None]:
def generate_answer(query_text: str) -> str:
    """質問に対してモデルが生成する回答を返す関数"""

    # モデルに入力する会話データ
    messages = [{"role": "user", "content": query_text}]

    # モデルに会話データを入力し、出力会話データからモデルの回答部分を抽出
    pipeline_output = text_generation_pipeline(messages)
    output_messages = pipeline_output[0]["generated_text"]
    response_text = output_messages[-1]["content"]

    return response_text

print(generate_answer("日本で一番高い山は？"))

In [None]:
print(generate_answer("四国地方で一番高い山は？"))