1.1.0 (2026-03-07)
Release Notes
Added
-
MCP 服务器支持
- 新增
xore-mcpcrate,提供 Model Context Protocol 服务器 - 集成到 Roo Code 等 AI 助手,实现文件搜索和数据处理能力
- 提供 7 个 MCP 工具:
find_files,search_index,get_schema,query_data,sample_data,quality_check,get_config - 详细文档见 docs/mcp.md
- 新增
-
错误处理优化 (修复)
- Bug 修复:修复
--verbose标志在子命令上不工作的问题- 原因:
verbose参数未设置为全局标志 (global = true) - 修复:在
xore-cli/src/main.rs中添加global = true属性 - 现在支持:
xore find --verbose "query"和xore --verbose find "query"两种用法
- 原因:
- Bug 修复:修复
-
错误处理优化
- 扩展
XoreError枚举 (xore-core/src/error/mod.rs):- 新增错误类型:
SearchError,ParseError,ValidationError,Timeout,PermissionDenied - 新增
error_code()方法,返回机器可读的错误代码字符串 - 新增
XoreErrorExttrait,提供context(),with_location(),hint()方法 - 新增
ErrorContext结构,支持多条上下文消息和位置信息 - 新增
ErrorHint结构,支持智能提示、建议命令和文档链接 - 新增
ErrorChain结构,支持错误来源追踪
- 新增错误类型:
- 统一错误格式化器 (
xore-core/src/error/format.rs):- 实现
ErrorFormatter,参考 Rust 编译器风格输出 - 支持彩色/无彩色模式(
use_color配置) - 支持
--verbose模式显示详细堆栈和解决方案 - 支持智能提示开关(
show_hints配置) - 提供
print_error()和print_anyhow_error()CLI 辅助函数
- 实现
- CLI 集成 (
xore-cli/src/main.rs):- 重构
main()函数,统一错误输出格式 - 错误时调用
print_anyhow_error()格式化输出 --verbose模式显示完整错误链- 错误退出码
std::process::exit(1)
- 重构
- 各模块错误上下文优化:
xore-process/src/parser.rs:文件不存在、CSV/Parquet 读取失败均附带友好提示xore-process/src/sql.rs:SQL 执行失败附带xore agent explain建议xore-search/src/indexer.rs:索引创建/打开/提交失败附带重建建议xore-search/src/query.rs:查询解析/执行失败附带语法提示
- 测试覆盖:43 个错误处理测试全部通过(新增 28 个)
- 扩展
-
文档与示例完善
- README 文档完善:添加项目定位和性能数据
- 命令文档完善:
docs/commands/下所有命令文档更新 - 新增
docs/commands/agent.md: Agent 命令文档 - 示例目录完善:
examples/benchmark-data/,examples/benchmark-results/ - 帮助信息完善:所有命令
--help输出完整且清晰 - Roo Code Skills 文档:
.roo/skills/*/SKILL.md完善 - MVP 开发完成总结:27/28 天任务完成
-
Agent-Native 接口与 Roo Code Skills 集成
- Agent 命令模块 (
xore-cli/src/commands/agent.rs):- 实现
xore agent命令,提供 5 个子命令:xore agent init- 生成 Agent 提示词模板(支持 Claude/GPT-4 等模型)xore agent schema- 获取数据结构(零拷贝,不读取完整文件)xore agent sample- 智能采样(random/head/tail/smart 四种策略)xore agent query- SQL 查询并输出 JSON 格式xore agent explain- SQL 错误分析与修复建议
- 计算下推优化:通过 schema 和 sample 减少 90%+ Token 消耗
- 结构化输出:JSON 格式便于 AI Agent 解析和处理
- 实现
- Roo Code Skills 集成 (
.roo/skills/):xore-search- 本地文件搜索 skillxore-data-analysis- 数据分析 skillxore-agent- Agent 优化 skill- 支持 VS Code AI 助手快速调用 XORE 功能
- 依赖更新:
- 添加
polars0.45(用于数据处理) - 添加
rand0.8(用于随机采样)
- 添加
- 测试覆盖:6 个单元测试全部通过
- Agent 命令模块 (
-
智能推荐系统
- 搜索历史模块 (
xore-core/src/history.rs):- 实现
SearchType枚举:FullText, Semantic, FileType, SemanticWithFilter - 实现
SearchHistoryEntry结构:记录查询、搜索类型、路径、时间戳、结果数、执行时间 - 实现
HistoryStore存储引擎:JSON 文件持久化,自动加载历史数据 - 支持搜索统计:查询频率、平均结果数、平均执行时间
- 自动创建
~/.xore/history/目录
- 实现
- 推荐引擎模块 (
xore-core/src/recommendation.rs):- 实现
RecommendationEngine智能推荐引擎 - 基于搜索频率的推荐生成
- 支持多种推荐类型:频繁查询、路径模式、文件类型模式
- 置信度评分系统
- 实现
- CLI 集成:
xore f "query"自动记录搜索历史xore f --history显示搜索历史xore f --recommend显示智能推荐xore f --clear-history清除搜索历史
- 数据存储:JSON 文件存储在
~/.xore/history/history.json - 测试覆盖:16 个单元测试通过
- 搜索历史模块 (
-
语义搜索 CLI 集成
- CLI 集成:
- 实现
xore f --semantic语义搜索命令(xore-cli/src/commands/find.rs) - 支持环境变量配置模型路径(
XORE_MODEL_PATH,XORE_TOKENIZER_PATH) - 自动文件内容读取和向量索引构建
- 实时进度显示和相似度评分输出
- 实现
- 功能特性:
- 最多索引 1000 个文件(防止内存溢出)
- 跳过大于 1MB 的文件
- 跳过空文件和二进制文件
- 返回 Top-20 相似结果
- 文档更新:
- 更新
docs/commands/find.md添加语义搜索章节 - 包含使用示例、性能指标、最佳实践
- 对比全文搜索与语义搜索的区别
- 更新
- CLI 集成:
-
ONNX 集成与语义搜索基础
- ONNX Runtime 集成:
- 实现
EmbeddingModel加载和推理(xore-ai/src/embedding.rs) - 支持 MiniLM-L6-v2 模型(384维向量)
- 文本嵌入向量生成功能
- L2 归一化和平均池化
- 实现
- Tokenizer 封装:
- 基于 HuggingFace tokenizers 实现(
xore-ai/src/tokenizer.rs) - 支持 WordPiece 分词
- 批量编码优化
- 基于 HuggingFace tokenizers 实现(
- 向量搜索引擎:
- 实现
VectorSearcher语义搜索(xore-ai/src/search.rs) - 余弦相似度计算
- 文档索引管理
- Top-K 搜索结果排序
- 实现
- 测试覆盖:6 个单元测试通过
- 文档:完整的 README 和使用示例
- ONNX Runtime 集成:
Fixed
- 修复
is_binary_content()函数的UTF-8字符边界错误,避免在8000字节位置切割多字节字符时panic - 修复 Watch 模式增量索引功能
- 修复
execute_watch_mode()缺少事件循环调用的问题,现在能够正确处理文件变更事件 - 修复
IncrementalIndexer::commit()空实现问题,现在能够真正持久化索引变更 - 添加
IndexBuilder::commit_changes()方法,支持增量索引场景的多次提交 - 使用
tokio::select!优雅处理 Ctrl+C 信号,确保退出时提交最后的变更 - 增强统计报告,每10秒显示创建/修改/删除的文件数和待提交变更数
- 添加文件存在性检查,避免处理已删除文件时出错
- 测试验证:文件创建/修改/删除事件均能正确索引,搜索结果实时更新
- 修复
Changed
- 更新项目定位为 Agent-Native
- README 中强调 XORE 作为 AI Agent 的高性能工具,通过"计算下推"和"结构化摘要"降低 90%+ Token 消耗
- 新增"核心差异化"章节,对比 XORE 与 ripgrep 等传统工具的优势
- 更新性能基准,增加 Agent Efficiency (Token Savings) 指标
Added
-
SIMD 优化与数据导出功能
- SIMD 数值计算优化:
- 实现循环展开优化的数值计算函数(
xore-process/src/simd.rs) - 提供
sum_f64_simd,mean_f64_simd,variance_f64_simd,std_dev_f64_simd等函数 - 提供
min_f64_simd,max_f64_simd高性能查找函数 - 使用 4 路循环展开技术提升性能 2-3x
- 测试覆盖:14 个单元测试全部通过
- 基准测试:新增
xore-process/benches/simd_bench.rs
- 实现循环展开优化的数值计算函数(
- 完整数据导出功能:
- 重写
xore-process/src/export.rs,支持 4 种导出格式 - 支持格式:CSV, JSON (JSONL), Parquet, Arrow (使用 Parquet 替代)
- 支持流式导出大文件(分块写入)
- 支持自定义配置:缓冲区大小、分隔符、压缩类型
- 支持导出到标准输出(管道模式)
- CLI 集成:
xore p <file> "<sql>" -o output.csv - 测试覆盖:8 个单元测试全部通过
- 重写
- 性能优化:
- 数值计算性能提升 2-3x(循环展开)
- 支持 GB 级文件导出,内存占用 <100MB
- 自动格式检测(从文件扩展名推断)
- SIMD 数值计算优化:
-
数据质量检测增强
- 扩展
QualityReport结构,增加智能建议和离群值信息 - 实现智能建议生成系统:
- 基于缺失值比例自动生成处理建议(Error/Warning/Info 三级严重程度)
- 基于重复行数生成去重建议
- 基于离群值检测生成数据异常提示
- 优化离群值检测算法:
- 支持批量检测所有数值列的离群值
- 使用 IQR 方法(四分位距)检测异常值
- 自动过滤非数值列,避免类型错误
- 完善 CLI 输出格式:
- 彩色高亮显示不同严重程度的问题(红色/黄色/正常)
- 按严重程度排序显示建议(Error > Warning > Info)
- 增加离群值检测结果展示
- 测试覆盖:新增 5 个单元测试,总计 9 个测试全部通过
- 扩展
-
SQL 查询引擎实现
- 实现基于 Polars
SQLContext的 SQL 查询引擎 - 支持完整的 SQL 查询功能:
- 基本查询:
SELECT,WHERE,ORDER BY,LIMIT - 聚合查询:
GROUP BY,COUNT,SUM,AVG,MIN,MAX - 多表查询:
INNER JOIN,LEFT JOIN
- 基本查询:
- CLI 集成:
xore p <file> "<sql>"命令支持 - 自动表注册:使用文件名作为表名
- 结果渲染:表格化输出,最多显示 100 行
- 测试覆盖:9 个单元测试全部通过
- 性能优化:LazyFrame 延迟执行 + 零拷贝读取
- 实现基于 Polars
-
测试与基准
- 创建完整的基准测试数据集(
examples/benchmark-data/) - 自动化基准测试脚本(
examples/benchmark-results/run_benchmark.sh) - 测试覆盖:130+ 单元测试 + 30+ 集成测试全部通过
- 代码质量检查:cargo fmt + clippy + check 通过
- 创建完整的基准测试数据集(
-
搜索优化
- 模糊匹配实现(Levenshtein 距离 <2)
- 前缀搜索实现(基于 FST)
- 文件类型权重调整(代码 > 文档 > 日志)
- 批量索引优化和缓存优化
-
增量索引与文件监控
- 增量索引模块(
xore-search/src/incremental.rs) - 文件监控模块(
xore-search/src/watcher.rs,基于 notify crate) - 事件防抖(500ms)
- CLI 集成:
xore f "error" --index --watch - Bug 修复:Watch 模式增量索引功能
- 增量索引模块(
-
Tantivy 全文搜索引擎集成
- Tantivy 索引核心模块(
xore-search/src/indexer.rs) - 查询引擎(
xore-search/src/query.rs) - 自定义中英文分词器(
xore-search/src/tokenizer.rs) - 支持 BM25 排序算法
- 支持分页查询和高亮显示
- 测试覆盖:20 个单元测试全部通过
- Tantivy 索引核心模块(
-
Polars 数据处理引擎集成
- 实现
DataParser模块,支持 CSV 和 Parquet 文件的高性能读取 - 集成
memmap2实现零拷贝读取,支持 GB 级大文件(阈值 1MB) - 实现
LazyFrame模式,延迟执行优化内存占用 - 实现
DataProfiler模块,提供数据质量检测功能 - 支持自动 Schema 推断和数据类型识别
- 重构
xore p命令,使用 Polars 替代手动字符串解析 - 新增功能:
- CSV/Parquet 数据预览(显示前 10 行)
- 数据质量检查(缺失值、重复行检测)
- 列统计信息(唯一值、缺失值百分比)
- 离群值检测(IQR 方法)
- 测试覆盖:13 个单元测试全部通过
- 性能验证:成功读取和处理测试数据集
- 实现
-
初始项目脚手架
-
基础CLI框架
-
核心模块结构
xore 1.1.0
Install xore 1.1.0
Install prebuilt binaries via shell script
curl --proto '=https' --tlsv1.2 -LsSf https://github.com/shuheng-mo/xore/releases/download/v1.1.0/xore-installer.sh | shDownload xore 1.1.0
| File | Platform | Checksum |
|---|---|---|
| xore-aarch64-apple-darwin.tar.xz | Apple Silicon macOS | checksum |
xore-mcp 1.1.0
Install xore-mcp 1.1.0
Install prebuilt binaries via shell script
curl --proto '=https' --tlsv1.2 -LsSf https://github.com/shuheng-mo/xore/releases/download/v1.1.0/xore-mcp-installer.sh | shDownload xore-mcp 1.1.0
| File | Platform | Checksum |
|---|---|---|
| xore-mcp-aarch64-apple-darwin.tar.xz | Apple Silicon macOS | checksum |