# Elasticsearch

[![在 Colab 中打开](https://colab.research.google.com/assets/colab-badge.svg)](https://colab.research.google.com/github/langchain-ai/langchain/blob/master/docs/docs/use_cases/qa_structured/integrations/elasticsearch.ipynb)

我们可以使用LLMs以自然语言与Elasticsearch分析数据库进行交互。

该链通过Elasticsearch DSL API（过滤器和聚合）构建搜索查询。

Elasticsearch客户端必须具有索引列表、映射描述和搜索查询的权限。

请参阅[这里](https://www.elastic.co/guide/en/elasticsearch/reference/current/docker.html)以了解如何在本地运行Elasticsearch的说明。

In [2]:
# 安装所需的包
! pip install langchain langchain-experimental openai elasticsearch

# 设置环境变量 OPENAI_API_KEY 或从 .env 文件中加载
# 导入 dotenv 包
# dotenv.load_dotenv()

In [15]:
# 导入Elasticsearch模块
from elasticsearch import Elasticsearch
# 导入ElasticsearchDatabaseChain模块
from langchain.chains.elasticsearch_database import ElasticsearchDatabaseChain
# 导入ChatOpenAI模块
from langchain_openai import ChatOpenAI

In [None]:
# 初始化 Elasticsearch Python 客户端。
# 参考文档：https://elasticsearch-py.readthedocs.io/en/v8.8.2/api.html#elasticsearch.Elasticsearch
ELASTIC_SEARCH_SERVER = "https://elastic:pass@localhost:9200"
db = Elasticsearch(ELASTIC_SEARCH_SERVER)

取消注释下一个单元格以初始化您的数据库。

In [None]:
# # 客户信息列表
# customers = [
#     {"firstname": "Jennifer", "lastname": "Walters"},
#     {"firstname": "Monica","lastname":"Rambeau"},
#     {"firstname": "Carol","lastname":"Danvers"},
#     {"firstname": "Wanda","lastname":"Maximoff"},
#     {"firstname": "Jennifer","lastname":"Takeda"},
# ]

# # 遍历客户列表并将客户信息存入数据库
# for i, customer in enumerate(customers):
#     db.create(index="customers", document=customer, id=i)

In [None]:
# 创建一个ChatOpenAI对象，使用"gpt-4"模型，设置温度为0
llm = ChatOpenAI(model="gpt-4", temperature=0)
# 从llm和数据库db创建一个ElasticsearchDatabaseChain对象，设置verbose为True
chain = ElasticsearchDatabaseChain.from_llm(llm=llm, database=db, verbose=True)

In [None]:
问题 = "所有客户的名字是什么？"  # 将英文问题直译为中文
chain.run(question)  # 运行chain对象的run方法来执行问题的查询操作

我们可以自定义提示符。

In [None]:
from langchain.prompts.prompt import PromptTemplate

PROMPT_TEMPLATE = """给定一个输入问题，创建一个语法正确的Elasticsearch查询来运行。除非用户在问题中指定了他们希望获得的特定数量的示例，否则始终将查询限制在最多{top_k}个结果。您可以按照相关列对结果进行排序，以返回数据库中最有趣的示例。

除非被告知不要查询特定索引的所有列，否则只查询给定问题中的少数相关列。

注意只使用您在映射描述中看到的列名。小心不要查询不存在的列。此外，注意哪个列在哪个索引中。将查询作为有效的json返回。

使用以下格式：

问题：在这里提问
ESQuery：格式化为json的Elasticsearch查询
"""

PROMPT = PromptTemplate.from_template(
    PROMPT_TEMPLATE,
)
chain = ElasticsearchDatabaseChain.from_llm(llm=llm, database=db, query_prompt=PROMPT)