关于milvus数据的去重 #31178
Unanswered
131452099900
asked this question in
Q&A and General discussion
关于milvus数据的去重
#31178
Replies: 2 comments 2 replies
-
去重有两种意思: 另一种是向量重复,相同的文本产生相同的向量,搜索出来它们得分一样。你可以结合一些其他的标量字段来辨别,比如10条一样的文本产生10条一样的向量,表里增加若干字段表示额外的属性,比如来自哪本书,什么时间导入milvus的,然乎在搜索结果里做选择。 对于第二种情况,或者干脆在插入数据的时候就去重,步骤如下:
|
Beta Was this translation helpful? Give feedback.
2 replies
-
关于这个issue,我们将尝试在#31552 中想办法解决。解决的方式也是先查询后写入 |
Beta Was this translation helpful? Give feedback.
0 replies
Sign up for free
to join this conversation on GitHub.
Already have an account?
Sign in to comment
-
想问下你们milvus有对于数据的一个去重么策略么,比如我有可能添加了10条一摸一样的文字段,我现在检索出来10条的数据可能都是100分数,现在我的话需要去重,不要重复的数据,我是要根据得分来进行判断么,或者有没有什么更好的方案呢。
Beta Was this translation helpful? Give feedback.
All reactions