In [1]:
!pip install langchain
!pip install langchain-openai
!pip install langchain-chroma

Collecting langchain
  Downloading langchain-0.2.1-py3-none-any.whl (973 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m973.5/973.5 kB[0m [31m4.1 MB/s[0m eta [36m0:00:00[0m
Collecting langchain-core<0.3.0,>=0.2.0 (from langchain)
  Downloading langchain_core-0.2.1-py3-none-any.whl (308 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m308.5/308.5 kB[0m [31m22.6 MB/s[0m eta [36m0:00:00[0m
[?25hCollecting langchain-text-splitters<0.3.0,>=0.2.0 (from langchain)
  Downloading langchain_text_splitters-0.2.0-py3-none-any.whl (23 kB)
Collecting langsmith<0.2.0,>=0.1.17 (from langchain)
  Downloading langsmith-0.1.63-py3-none-any.whl (122 kB)
[2K     [90m━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━━[0m [32m122.8/122.8 kB[0m [31m7.6 MB/s[0m eta [36m0:00:00[0m
Collecting jsonpatch<2.0,>=1.33 (from langchain-core<0.3.0,>=0.2.0->langchain)
  Downloading jsonpatch-1.33-py2.py3-none-any.whl (12 kB)
Collecting packaging<24.0,>=23.2 (from langchain

In [2]:
import os
from google.colab import userdata

# 環境変数の準備 (OPENAI_API_KEYを設定)
os.environ["OPENAI_API_KEY"] = userdata.get("OPENAI_API_KEY")

In [3]:
from langchain_core.documents import Document

# ドキュメントの準備
documents = [
    Document(
        page_content="犬は忠誠心とフレンドリーさで知られる、素晴らしいパートナーです。",
        metadata={"source": "mammal-pets-doc"},
    ),
    Document(
        page_content="猫は独立したペットであり、自分だけの空間を楽しむことがよくあります。",
        metadata={"source": "mammal-pets-doc"},
    ),
    Document(
        page_content="金魚は比較的簡単な飼育で初心者にも人気のペットです。",
        metadata={"source": "fish-pets-doc"},
    ),
    Document(
        page_content="オウムは人間の言葉を真似ることができる賢い鳥です。",
        metadata={"source": "bird-pets-doc"},
    ),
    Document(
        page_content="ウサギは社会的な動物であり、飛び回るのに十分なスペースが必要です。",
        metadata={"source": "mammal-pets-doc"},
    ),
]

In [4]:
from langchain_chroma import Chroma
from langchain_openai import OpenAIEmbeddings

# VectorStoreの準備
vectorstore = Chroma.from_documents(
    documents,
    embedding=OpenAIEmbeddings(),
)

In [5]:
vectorstore.similarity_search("猫")

[Document(page_content='猫は独立したペットであり、自分だけの空間を楽しむことがよくあります。', metadata={'source': 'mammal-pets-doc'}),
 Document(page_content='犬は忠誠心とフレンドリーさで知られる、素晴らしいパートナーです。', metadata={'source': 'mammal-pets-doc'}),
 Document(page_content='金魚は比較的簡単な飼育で初心者にも人気のペットです。', metadata={'source': 'fish-pets-doc'}),
 Document(page_content='ウサギは社会的な動物であり、飛び回るのに十分なスペースが必要です。', metadata={'source': 'mammal-pets-doc'})]

In [6]:
await vectorstore.asimilarity_search("猫")

[Document(page_content='猫は独立したペットであり、自分だけの空間を楽しむことがよくあります。', metadata={'source': 'mammal-pets-doc'}),
 Document(page_content='犬は忠誠心とフレンドリーさで知られる、素晴らしいパートナーです。', metadata={'source': 'mammal-pets-doc'}),
 Document(page_content='金魚は比較的簡単な飼育で初心者にも人気のペットです。', metadata={'source': 'fish-pets-doc'}),
 Document(page_content='ウサギは社会的な動物であり、飛び回るのに十分なスペースが必要です。', metadata={'source': 'mammal-pets-doc'})]

In [7]:
vectorstore.similarity_search_with_score("猫")

[(Document(page_content='猫は独立したペットであり、自分だけの空間を楽しむことがよくあります。', metadata={'source': 'mammal-pets-doc'}),
  0.3026679456233978),
 (Document(page_content='犬は忠誠心とフレンドリーさで知られる、素晴らしいパートナーです。', metadata={'source': 'mammal-pets-doc'}),
  0.41140973567962646),
 (Document(page_content='金魚は比較的簡単な飼育で初心者にも人気のペットです。', metadata={'source': 'fish-pets-doc'}),
  0.42104315757751465),
 (Document(page_content='ウサギは社会的な動物であり、飛び回るのに十分なスペースが必要です。', metadata={'source': 'mammal-pets-doc'}),
  0.434312105178833)]

In [8]:
embedding = OpenAIEmbeddings().embed_query("猫")
vectorstore.similarity_search_by_vector(embedding)

[Document(page_content='猫は独立したペットであり、自分だけの空間を楽しむことがよくあります。', metadata={'source': 'mammal-pets-doc'}),
 Document(page_content='犬は忠誠心とフレンドリーさで知られる、素晴らしいパートナーです。', metadata={'source': 'mammal-pets-doc'}),
 Document(page_content='金魚は比較的簡単な飼育で初心者にも人気のペットです。', metadata={'source': 'fish-pets-doc'}),
 Document(page_content='ウサギは社会的な動物であり、飛び回るのに十分なスペースが必要です。', metadata={'source': 'mammal-pets-doc'})]

In [9]:
# Retrieverの準備
retriever = vectorstore.as_retriever(
    search_type="similarity",
    search_kwargs={"k": 1},
)

# Retrieverの実行
retriever.batch(["猫", "魚"])

[[Document(page_content='猫は独立したペットであり、自分だけの空間を楽しむことがよくあります。', metadata={'source': 'mammal-pets-doc'})],
 [Document(page_content='金魚は比較的簡単な飼育で初心者にも人気のペットです。', metadata={'source': 'fish-pets-doc'})]]

In [10]:
from langchain_openai import ChatOpenAI

# LLMの準備
llm = ChatOpenAI(model="gpt-3.5-turbo")

In [11]:
from langchain_core.prompts import ChatPromptTemplate
from langchain_core.runnables import RunnablePassthrough

# プロンプトテンプレートの準備
message = """
以下のContextのみを使用して、Questionに答えてください。

Context:
{context}

Question:
{question}
"""

prompt = ChatPromptTemplate.from_messages([("human", message)])

In [12]:
# RAGチェーンの準備
rag_chain = {"context": retriever, "question": RunnablePassthrough()} | prompt | llm

In [13]:
# 質問応答
response = rag_chain.invoke("猫について教えてください")
print(response.content)

猫は独立したペットであり、自分だけの空間を楽しむことがよくあります。
