In [None]:
# テキストコーパスをチャンクに分割
with open("./RAGdata/query.txt", encoding = "utf-8") as f:
    text = f.read()

from langchain.text_splitter import RecursiveCharacterTextSplitter
text_splitter = RecursiveCharacterTextSplitter(
    chunk_size = 100,
    chunk_overlap = 0,
)

texts = text_splitter.split_text(text)

# LangChainで利用する埋め込みモデルの設定
from langchain_community.embeddings import HuggingFaceEmbeddings

# 埋め込みモデルの設定
embeddings = HuggingFaceEmbeddings(
    model_name="intfloat/multilingual-e5-large",
    model_kwargs={
        'device': 'cuda:0'
    }
)

from langchain.vectorstores import FAISS
db = FAISS.from_texts(texts, embeddings)
# データベースを保存
db.save_local("./RAGdata/query.db")

In [None]:
# LangChainで利用する埋め込みモデルの設定
from langchain_community.embeddings import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings(
    model_name="intfloat/multilingual-e5-large",
    model_kwargs={
        'device': 'cuda:0'
    }
)

# データベースの読み込み
from langchain.vectorstores import FAISS
db = FAISS.load_local(
    "./RAGdata/query.db/",
    embeddings,
    allow_dangerous_deserialization = True
)

# データベースからの情報検索のためのリトリーバーを作成
retriever = db.as_retriever(
    search_kwargs = {'k': 3},
)

# プロンプトの準備
template = """
ユーザー: 以下のテキストから「ユーザーに対する質問」を1つだけ抽出してください。ユーザーの質問文を1文だけ。余計な説明は出力しない。
{context}

{question}

システム:"""

from langchain.prompts import PromptTemplate

prompt = PromptTemplate(
    template = template,
    input_variables = ["context", "question"],
    template_format = "f-string",
)

from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline
import torch

modelID = "line-corporation/japanese-large-lm-3.6b-instruction-sft"

tokenizer = AutoTokenizer.from_pretrained(
    modelID,
    legacy = False,
    use_fast = False
)

model = AutoModelForCausalLM.from_pretrained(
    modelID,
    torch_dtype = torch.float16,
    device_map = "auto",
    low_cpu_mem_usage = True
).eval()

pipe = pipeline(
    "text-generation",
    model = model,
    tokenizer = tokenizer,
    max_new_tokens = 64,
    do_sample = True,
    temperature = 0.7,
    repetition_penalty = 2.0,
)

from langchain.chains import RetrievalQA
from langchain_community.llms.huggingface_pipeline import HuggingFacePipeline

qa = RetrievalQA.from_chain_type(
    llm = HuggingFacePipeline(pipeline = pipe),
    retriever = retriever,
    chain_type = "stuff",
    return_source_documents = True,
    chain_type_kwargs = {
        "prompt": prompt,
    },
    verbose = True,
)

q = "趣味に対する質問は？"
ans = qa.invoke(q)
print(ans['result'])

Some parameters are on the meta device because they were offloaded to the cpu.
Device set to use cuda:0




[1m> Entering new RetrievalQA chain...[0m

[1m> Finished chain.[0m

ユーザー: 以下のテキストから「ユーザーに対する質問」を1つだけ抽出してください。ユーザーの質問文を1文だけ。余計な説明は出力しない。
教えてください。何か毎日続けている習慣はありますか？休日はどのように過ごすことが多いですか？あなたの得意料理は何ですか？健康のために何か気をつけていることはありますか？普段、音楽は聴きますか？どんなジ

戦してみたいことは何ですか？人生で絶対に成し遂げたいことは何ですか？もし1億円が手に入ったら、何をしますか？どんな場所に住んでみたいですか？引退したら、どんな生活を送りたいですか？未来の世界は、どのよ

詳しいと自信を持って言える分野は何ですか？今、一番学びたいと思っていることは何ですか？学校の勉強で、一番好きだった科目と嫌いだった科目は何ですか？どうやって新しい情報を得ることが多いですか？人に何かを

趣味に対する質問は？

システム: ニュース
本文; 中国外交部の姜瑜報道官中国国務院台湾事務弁公室の王毅主任は現在カナダのバンクーバーに滞在し、「一つの中国の原則に符合する台湾の海峡両岸関係協会の協議案について調整を行うためである」(第47号)などの状況を発表した後まもなく2


In [None]:
a = db.similarity_search("", k=3)
print(len(a))
print(type(a[0]))
print(a[0].page_content)

3
<class 'langchain_core.documents.base.Document'>
教えてください。何か毎日続けている習慣はありますか？休日はどのように過ごすことが多いですか？あなたの得意料理は何ですか？健康のために何か気をつけていることはありますか？普段、音楽は聴きますか？どんなジ


In [None]:
# データベースの構築
from langchain_community.embeddings import HuggingFaceEmbeddings

embeddings = HuggingFaceEmbeddings(
    model_name = "intfloat/multilingual-e5-large",
    model_kwargs = {'device':'cuda:0'},
#    encode_kwargs = {'normalize_embeddings': False}
)

from langchain_community.vectorstores import FAISS

# 保存してあるデータベースを読み込む
db = FAISS.load_local('./RAGdata/query.db',
                      embeddings,
                      allow_dangerous_deserialization = True
)


# 検索機の構築
# retriever = db.as_retriever()
retriever = db.as_retriever(search_kwargs={'k':2})


# モデルの準備
import torch
from transformers import AutoTokenizer, AutoModelForCausalLM, pipeline

model_id = "line-corporation/japanese-large-lm-3.6b-instruction-sft"

tokenizer = AutoTokenizer.from_pretrained(model_id,
                                          legacy=False,
                                          use_fast=False
)

model = AutoModelForCausalLM.from_pretrained(
    model_id,
    device_map="auto",
#    device_map="cuda:0",
    torch_dtype=torch.float16,
    low_cpu_mem_usage=True,
).eval()

pipe = pipeline(
    "text-generation",
    model=model,
    tokenizer=tokenizer,
    max_new_tokens=128,
    do_sample=True,
    temperature=0.01,
    repetition_penalty=2.0,
)

# プロンプトの準備
template = """
ユーザー: 以下のテキストを参照して、それに続く質問に答えてください。
{context}

{question}

システム:"""

from langchain.prompts import PromptTemplate

prompt = PromptTemplate(
    template=template,
    input_variables=["context", "question"],
    template_format="f-string"
)

# RetrievalQAのインスタンス作成
from langchain.chains import RetrievalQA
from langchain_community.llms.huggingface_pipeline import HuggingFacePipeline

qa = RetrievalQA.from_chain_type(
    llm=HuggingFacePipeline(pipeline=pipe),
    retriever=retriever,
    chain_type="stuff",
    return_source_documents=True,
    chain_type_kwargs={"prompt": prompt},
    verbose=True,
)

# 実行
q = "趣味に関する質問はどれですか？"
ans = qa.invoke(q)
# print(ans['result'])

print("--------------------------")

import re
pattern = re.compile(r'システム:(.*)',re.DOTALL)
match = pattern.search(ans['result'])
ans0 = match.group(1)
print(ans0)

# docs = ans['source_documents']
# for d in docs:
#     print()
#     print(d.page_content[:100])

Device set to use cuda:0




[1m> Entering new RetrievalQA chain...[0m

[1m> Finished chain.[0m
--------------------------
 ウェブ
本文: 「20代で知っておくべきお金のこと」をテーマに、「お金の教養フェスティバル」(主催・ファイナンシャルアカデミー)がこのほど東京国際フォーラム(東京都千代田区丸の内3丁目5番...[記事全文を表示する] (出典 i.imgur [画像を見る](https://i-chartoutils/
