Skip to content

havenask性能

xuxijie edited this page Apr 3, 2023 · 2 revisions

普通检索性能测试

  小数据场景 大数据场景
测试场景 数据集:公开数据集(esrally官方测试集) 文档数:57万(22G) 数据集:商品订单数据集 文档数:1亿(395G)
测试方式 9万query且无重复词 26万query无重复词
测试环境 OpenSearch召回引擎版16核64G机器 OpenSearch召回引擎版16核64G机器
耗时 90 Percentile: 7.33ms
99 Percentile: 32.72ms
avg 4.51ms
90 Percentile: 3.73ms
99 Percentile: 11.71ms
avg 3.07ms
QPS 6490 8680
索引存储 16G 96G
索引压缩率 72.7% 24.3%
CPU负载 75% 78%
内存占用 13.4G 22G

向量检索性能测试

数据场景 小数据 中数据 大数据
数据情况 sift公开数据集100万数据128维 deep公开数据集1000万数据96维 阿里巴巴内部数据集1亿数据384维
测试机器规格 16 VCPU, 64 GiB
本地盘存储:1788 GiB
ecs.i2gne.4xlarge
16 VCPU, 64 GiB
本地盘存储:1788 GiB
ecs.i2gne.4xlarge
64 vCPU, 512 GiB
本地盘存储: 3576 GiB
ecs.i4r.16xlarge
原始数据大小 501MB 3.6GB 288GB
向量算法 Qc(int8量化) HNSW Qc(int8量化)
索引构建时间 14s 53s 20.6min
CPU负载情况 低负载 高负载 低负载
CPU占用率(%) 6.3 81.9 6.4
内存占用(GB) 0.647 0.647 1.08
QPS 460.37 5013.07 383.62
耗时(ms) 2.17 9.61 2.6
召回率(%) Top 1:99
Top 10:97.1
Top 50:95.82
Top 100:94.94
Top 1:100
Top 10:98.8
Top 50:99.1
Top 100:97.9
Top 1:100
Top 10:98.09
Top 50:96.99
Top 100:96.86
Clone this wiki locally