# Cassandra

[Cassandra](https://cassandra.apache.org/) 是一种 NoSQL、面向行的、高度可扩展且可用性极高的数据库。从 5.0 版本开始，该数据库便内置了[向量搜索功能](https://cassandra.apache.org/doc/trunk/cassandra/vector-search/overview.html)。

## 概览

Cassandra 文档加载器会从 Cassandra 数据库返回一个 Langchain 文档列表。

你必须提供 CQL 查询或表名来检索文档。
加载器接受以下参数：

* `table`: (可选) 加载数据的表。
* `session`: (可选) Cassandra 驱动程序会话。如果未提供，将使用 cassio 解析的会话。
* `keyspace`: (可选) 表的键空间。如果未提供，将使用 cassio 解析的键空间。
* `query`: (可选) 用于加载数据的查询。
* `page_content_mapper`: (可选) 用于将行转换为页面内容的函数。默认是将行转换为 JSON。
* `metadata_mapper`: (可选) 用于将行转换为元数据字典的函数。
* `query_parameters`: (可选) 调用 `session.execute` 时使用的查询参数。
* `query_timeout`: (可选) 调用 `session.execute` 时使用的查询超时。
* `query_custom_payload`: (可选) 调用 `session.execute` 时使用的查询自定义负载。
* `query_execution_profile`: (可选) 调用 `session.execute` 时使用的查询执行配置文件。
* `query_host`: (可选) 调用 `session.execute` 时使用的查询主机。
* `query_execute_as`: (可选) 调用 `session.execute` 时使用的查询 `execute_as`。

## 使用 Document Loader 加载文档

In [None]:
from langchain_community.document_loaders import CassandraLoader

### 从 Cassandra 驱动的 Session 初始化

你需要创建一个 `cassandra.cluster.Session` 对象，具体方法请参考[Cassandra 驱动文档](https://docs.datastax.com/en/developer/python-driver/latest/api/cassandra/cluster/#module-cassandra.cluster)。具体细节会有所不同（例如网络设置和身份验证），但可能类似如下：

In [None]:
from cassandra.cluster import Cluster

cluster = Cluster()
session = cluster.connect()

您需要提供 Cassandra 实例中现有 keyspace 的名称：

In [None]:
CASSANDRA_KEYSPACE = input("CASSANDRA_KEYSPACE = ")

创建文档加载器：

In [16]:
loader = CassandraLoader(
    table="movie_reviews",
    session=session,
    keyspace=CASSANDRA_KEYSPACE,
)

In [17]:
docs = loader.load()

In [19]:
docs[0]

Document(page_content='Row(_id=\'659bdffa16cbc4586b11a423\', title=\'Dangerous Men\', reviewtext=\'"Dangerous Men,"  the picture\\\'s production notes inform, took 26 years to reach the big screen. After having seen it, I wonder: What was the rush?\')', metadata={'table': 'movie_reviews', 'keyspace': 'default_keyspace'})

### 从 cassio 初始化

也可以使用 cassio 来配置 session 和 keyspace。

In [None]:
import cassio

cassio.init(contact_points="127.0.0.1", keyspace=CASSANDRA_KEYSPACE)

loader = CassandraLoader(
    table="movie_reviews",
)

docs = loader.load()

#### 归属声明

> Apache Cassandra、Cassandra 和 Apache 是 Apache Software Foundation 在美国和/或其他国家的注册商标或商标。