# Epsilla

>[Epsilla](https://www.epsilla.com) 是一个开源向量数据库，它利用先进的并行图遍历技术进行向量索引。Epsilla 的许可协议为 GPL-3.0。

您需要安装 `langchain-community`（通过 `pip install -qU langchain-community`）才能使用此集成。

本 Notebook 展示了如何使用与 `Epsilla` 向量数据库相关的功能。

作为先决条件，您需要运行一个 Epsilla 向量数据库（例如，通过我们的 docker 镜像），并安装 `pyepsilla` 包。请访问 [文档](https://epsilla-inc.gitbook.io/epsilladb/quick-start) 查看完整文档。

In [None]:
!pip/pip3 install pyepsilla

我们想使用 OpenAIEmbeddings，所以我们需要获取 OpenAI API 密钥。

In [None]:
import getpass
import os

if "OPENAI_API_KEY" not in os.environ:
    os.environ["OPENAI_API_KEY"] = getpass.getpass("OpenAI API Key:")

OpenAI API 密钥：········

In [None]:
from langchain_community.vectorstores import Epsilla
from langchain_openai import OpenAIEmbeddings

In [None]:
from langchain_community.document_loaders import TextLoader
from langchain_text_splitters import CharacterTextSplitter

loader = TextLoader("../../how_to/state_of_the_union.txt")
documents = loader.load()

documents = CharacterTextSplitter(chunk_size=1000, chunk_overlap=0).split_documents(
    documents
)

embeddings = OpenAIEmbeddings()

Epsilla vectordb 正在以默认主机 "localhost" 和端口 "8888" 运行。我们使用了自定义的数据库路径、数据库名称和集合名称，而不是默认的。

In [None]:
from pyepsilla import vectordb

client = vectordb.Client()
vector_store = Epsilla.from_documents(
    documents,
    embeddings,
    client,
    db_path="/tmp/mypath",
    db_name="MyDB",
    collection_name="MyCollection",
)

In [None]:
query = "What did the president say about Ketanji Brown Jackson"
docs = vector_store.similarity_search(query)
print(docs[0].page_content)

在各州，新的法律不断通过，这些法律不仅是为了压制投票，更是为了颠覆整个选举。

我们不能让这种事情发生。

今晚，我呼吁参议院：通过《投票自由法案》。通过《约翰·刘易斯投票权法案》。另外，通过《披露法案》，让美国人民知道谁在资助我们的选举。

今晚，我想纪念一位将毕生精力奉献于服务国家的人：史蒂芬·布雷耶大法官——他曾是陆军退伍军人、宪法学者，以及即将退休的美国最高法院大法官。布雷耶大法官，感谢您的服务。

总统最严重的宪法职责之一是提名人选来担任美国最高法院大法官。

四天前，我提名了巡回上诉法院法官凯坦吉·布朗·杰克逊，完成了这项工作。她是美国顶尖的法律人才之一，将延续布雷耶大法官卓越的法律遗产。