实现一个简单的查询扩展功能。

In [19]:
pip install jieba


Note: you may need to restart the kernel to use updated packages.


In [20]:
import jieba
from itertools import product

def expand_query(original_query, knowledge_base):
    """
    扩展原始查询以提高搜索相关性
    
    参数:
    original_query (str): 原始查询
    knowledge_base (dict): 知识库，包含同义词和相关术语
    
    返回:
    list: 扩展后的查询列表
    """
    # 使用jieba进行分词
    words = jieba.lcut(original_query)

    expanded_queries = []

    # 遍历查询中的每个词
    for word in words:
        # 如果该词在知识库中，替换为同义词或相关词汇
        if word in knowledge_base:
            expanded_queries.append(knowledge_base[word])  # 用相关词汇替换
        else:
            expanded_queries.append([word])  # 保留原始词

    # 生成所有可能的查询组合
    expanded_query_list = list(product(*expanded_queries))

    # 将所有扩展后的查询列表转换为字符串形式
    expanded_query_strings = [" ".join(query) for query in expanded_query_list]

    return expanded_query_strings


# 测试
query = "便宜的笔记本电脑"
kb = {
    "笔记本电脑": ["笔记本", "电脑", "便携式计算机"],
    "便宜": ["经济", "实惠", "低价"],
}

expanded_queries = expand_query(query, kb)
for q in expanded_queries:
    print(q)


经济 的 笔记本
经济 的 电脑
经济 的 便携式计算机
实惠 的 笔记本
实惠 的 电脑
实惠 的 便携式计算机
低价 的 笔记本
低价 的 电脑
低价 的 便携式计算机
