#  初めに

このノートブックでは、VectorStoreに関連する基本的な機能が紹介されています。VectorStoreを扱うための重要な部分として、通常は埋め込みを介して生成されるベクトルの作成があります。ですので、このノートブックに入る前に、[embedding notebook](../../models/text_embedding.htpl)について理解することをお勧めします。

ここでは、すべてのベクトルストアに関連する一般的な高レベルの機能について説明しています。

In [None]:
from langchain.embeddings.openai import OpenAIEmbeddings
from langchain.text_splitter import CharacterTextSplitter
from langchain.vectorstores import Chroma

In [None]:
with open('../../state_of_the_union.txt') as f:
    state_of_the_union = f.read()
text_splitter = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0)
texts = text_splitter.split_text(state_of_the_union)

embeddings = OpenAIEmbeddings()

In [None]:
docsearch = Chroma.from_texts(texts, embeddings)

query = "What did the president say about Ketanji Brown Jackson"
docs = docsearch.similarity_search(query)

In [None]:
print(docs[0].page_content)

## テキストの追加
`add_texts`メソッドを使用すると、簡単にベクターストアにテキストを追加することができます。返り値は文書IDのリストであり、下流の処理で使用する必要がある場合に備えています。

In [None]:
docsearch.add_texts(["Ankush went to Princeton"])

In [None]:
query = "Where did Ankush go to college?"
docs = docsearch.similarity_search(query)

In [None]:
docs[0]

## ドキュメントからの初期化
ドキュメントから直接ベクトルストアを初期化することもできます。これは、元のドキュメントに関連するメタデータがある場合に、テキストスプリッターのメソッドを使用して直接ドキュメントを取得する場合に便利です。

In [None]:
documents = text_splitter.create_documents([state_of_the_union], metadatas=[{"source": "State of the Union"}])

In [None]:
docsearch = Chroma.from_documents(documents, embeddings)

query = "What did the president say about Ketanji Brown Jackson"
docs = docsearch.similarity_search(query)

In [None]:
print(docs[0].page_content)