# 演示 ByzerStorageCache 的使用

本演示展示了如何使用 ByzerStorageCache 进行文档的存储和检索。

In [None]:
import pathspec
import os
from autocoder.rag.cache.byzer_storage_cache import ByzerStorageCache
from autocoder.common import SourceCode
from loguru import logger

## 1. 初始化 ByzerStorageCache

首先我们需要创建一个 ByzerStorageCache 实例。

In [None]:
# 设置示例路径和过滤规则
path = "/path/to/your/docs"
ignore_spec = None  # 可以使用 pathspec 创建忽略规则
required_exts = [".md", ".txt"]  # 只处理这些扩展名的文件

# 创建 ByzerStorageCache 实例
cache = ByzerStorageCache(path, ignore_spec, required_exts)

## 2. 获取缓存内容

In [None]:
# 获取所有缓存的文档
cache_content = cache.get_cache()

# 打印缓存内容
for file_path, data in cache_content.items():
    print(f"\nFile: {file_path}")
    for doc in data['content']:
        print(f"Module name: {doc.module_name}")
        print(f"Content preview: {doc.source_code[:100]}...")

## 3. 搜索缓存内容

In [None]:
# 设置搜索选项
search_options = {
    "query": "特定关键词",
    "enable_vector_search": True,
    "enable_text_search": True
}

# 执行搜索
search_results = list(cache.search_cache(search_options))

# 打印搜索结果
for doc in search_results:
    print(f"\nFound in: {doc.module_name}")
    print(f"Content preview: {doc.source_code[:100]}...")

## 说明

1. ByzerStorageCache 会自动将文档分块并存储在 Byzer Storage 中
2. 支持向量搜索和全文检索
3. 文档会被自动向量化以支持语义搜索
4. 缓存会在第一次访问时自动构建