# 1. 安装Python环境和依赖

- Python版本：3.12
- 安装依赖的库：uv pip install sentence-transformers chromadb google-genai ollama
    - sentence_transformers：加载embedding和cross-encoder模型。sentence-transformers 是一个基于 Hugging Face Transformers 的 Python 库，专门用于将文本（尤其是句子或段落）转换为高质量的语义向量（embeddings）。这些向量可以用于衡量文本之间的语义相似度，在自然语言处理（NLP）任务中非常有用。
    - chromadb：向量数据库
    - google-genai：Google的AI SDK，调用Gemini模型（如gemini-2.5-flash）。旧版本的库为google-generativeai，2025年12月之后推荐google-genai。官方建议：https://ai.google.dev/gemini-api/docs/libraries?hl=zh-cn
    - ollama：通过Ollama调用本地运行的大模型


# 2. 索引

## 2.1 数据切片
对文档【跨时空便民服务站.md】的内容，按照段落的维度进行切片，一共切成100段内容

In [6]:
from typing import List

# 对单个文档按段落切片（非空行）
def split_doc_into_chunks(doc_file: str) -> List[str]:
    with open(doc_file, 'r', encoding='utf-8') as file:
        content = file.read()
    # 按换行分割，并过滤掉空白段落
    return [chunk.strip() for chunk in content.split("\n") if chunk.strip()]

# 处理多个文档，并合并所有段落
def split_multiple_docs_into_chunks(doc_files: List[str]) -> List[str]:
    all_chunks = []
    for doc_file in doc_files:
        print(f"正在处理文档: {doc_file}")
        chunks = split_doc_into_chunks(doc_file)
        all_chunks.extend(chunks)  # 合并到总列表
    return all_chunks

# 为所有文档分片，并保存到chunks变量中
doc_paths = [
    "./docs/TwinFun商贸有限公司双十一活动优惠政策.txt",
    "./docs/TwinFun双人游戏机旗舰XPro的使用说明.txt",
    "./docs/TwinFun双人游戏机旗舰XPro的保修政策.txt"
]
chunks = split_multiple_docs_into_chunks(doc_paths)

for i, chunk in enumerate(chunks):
    print(f"[{i+1}] {chunk}\n")

正在处理文档: ./docs/TwinFun商贸有限公司双十一活动优惠政策.txt
正在处理文档: ./docs/TwinFun双人游戏机旗舰XPro的使用说明.txt
正在处理文档: ./docs/TwinFun双人游戏机旗舰XPro的保修政策.txt
[1] 一年一度的双十一消费狂欢已然开启，TwinFun商贸有限公司秉持“感恩回馈，让利消费者”的核心理念，率先推出面向全体新客户的专属优惠政策：活动期间（2025年10月24日-2025年11月11日）首次注册成为TwinFun会员的消费者，无需满足任何消费门槛，可直接在会员中心领取一张价值50元的无门槛现金券，券有效期与活动周期一致，可用于平台内除定制家具、进口奢侈品外的所有品类消费，下单时直接抵扣。

[2] 针对长期支持TwinFun的老客户，公司特别定制了体现专属权益的优惠政策：以2025年1月1日-2025年10月23日为统计周期，依托CRM系统分析客户消费数据，消费金额1万元及以上的高活跃客户，直接赠送“1000减300”“2000减700”“5000减2000”满减券各1张；消费金额3000元-9999元的潜力客户，赠送“500减100”满减券2张+15%复购补贴券（单笔最高补贴200元）；消费金额3000元以下的复苏客户，赠送“300减50”满减券3张，所有券种2025年11月1日-2025年11月11日可用。

[3] 为简化购物流程，让消费者直观享受实惠，TwinFun推出“官方直降，一件也打折”的优惠政策：10月24日0点起，平台内1200款热门商品直接标注双十一折扣价，无需凑单、计算满减，其中冰箱、洗衣机这几类大家电全场5折，空调、热水器全场5.5折；潮流服饰、鞋帽箱包类商品直降30%，部分断码款式直降50%；美妆护肤类商品直降20%，且支持叠加品牌优惠券，折扣信息在商品详情页实时更新。

[4] 聚焦家庭消费场景，TwinFun精心设计了“套餐组合更省钱”的优惠政策：针对家电、家居、母婴三大品类推出8款主题套餐，“厨房焕新套餐”包含指定品牌烟机（原价2999元）、灶具（原价1599元）、热水器（原价1899元），组合价4997元，比单独购买立省1500元；“亲子成长套餐”包含1-3岁儿童羽绒服2件、益智玩具3套、婴幼儿洗护用品4件，套餐价899元，较单品总价直降40%；所有套餐支持拆分发

## 2.2 把文档的所有的分片都转化为向量

In [7]:
from sentence_transformers import SentenceTransformer

# 创建一个embedding模型，首次加载速度可能较慢，需要从Hugging Face上拉取模型
embedding_model= SentenceTransformer("shibing624/text2vec-base-chinese")

# 定义一个方法embed_chunk，用于将某一段文本转化为对应的多维向量，返回这段文字所对应的多维向量的数组
def embed_chunk(chunk: str) -> List[float]:
    embedding = embedding_model.encode(chunk)
    return embedding;

# 把文档的所有分片结果chunks，依次转化为向量，并存到embeddings变量中
embeddings=[embed_chunk(chunk) for chunk in chunks]
print(f"所有片段转化为向量数组后的数组数量：{len(embeddings)}")
print(f"第1个向量的维度：{len(embeddings[0])}")
print(f"第1个向量的内容：{embeddings[0]}")

所有片段转化为向量数组后的数组数量：25
第1个向量的维度：768
第1个向量的内容：[-2.01269060e-01  8.80607814e-02 -2.36491695e-01  3.39772664e-02
  3.34142670e-02 -6.69817388e-01 -4.83846664e-03  7.44304180e-01
  1.19527370e-01  3.21651660e-02  1.63980484e-01  6.63809538e-01
  8.32436442e-01 -5.37724316e-01  3.11321110e-01 -9.69663411e-02
  7.40329772e-02  8.59662890e-01 -3.37648809e-01  1.24123059e-01
  2.55539834e-01 -2.00450003e-01 -3.54564071e-01  2.29889423e-01
 -7.59480000e-02 -4.12604690e-01  4.35838103e-01  3.73591781e-01
 -5.21245301e-01  3.18055004e-01  2.39310265e-01  2.36980006e-01
 -1.10087919e+00  4.67515349e-01 -2.85631478e-01  4.08554018e-01
 -1.70965374e-01 -4.41616297e-01  4.18979883e-01 -1.38581038e-01
  1.10791460e-01 -1.77704364e-01 -9.29287851e-01 -1.26049012e-01
 -4.74500060e-01  8.69396448e-01 -4.60947990e-01 -2.10819691e-01
 -8.73456478e-01  8.82662386e-02 -6.99612647e-02  7.64180279e+00
  2.26956517e-01 -3.42034042e-01 -3.03934753e-01  2.75357068e-02
  8.08885992e-01  5.23244739e-01  3.11235011e-0

## 2.3 把文本和对应的向量存入向量数据库

In [8]:
import chromadb

# 创建一个文件型的数据库
chromadb_client=chromadb.PersistentClient("./db/chroma.db")
# chromadb表
chromadb_collection = chromadb_client.get_or_create_collection(name="default")

# 把文本及对应的向量保存到向量数据库（也可以用collection的upsert方法按照id更新）
def save_embeddings(chunks:List[str], embeddings:List[List[float]]) -> None:
    ids = [str(i) for i in range(len(chunks))]
    chromadb_collection.add(
        documents=chunks,
        embeddings=embeddings,
        ids=ids
    )

# 保存文本数组及对应的向量数组
save_embeddings(chunks,embeddings)

# 3. 检索

In [9]:
# 定义一个方法，用于检索指定文本在向量数据库中语义相近的前k个片段
def retrieve(query:str,top_k:int) -> List[str]:
    # 把查询文本（也就是用户提问的问题）转化为检索向量
    query_embeding=embed_chunk(query)
    # 根据检索向量在数据库中查询语义相近的前k个片段
    results = chromadb_collection.query(
        query_embeddings=[query_embeding],
        n_results=top_k
    )
    return results['documents'][0]

#question="TwinFun XPro手柄链接不上是什么原因？"
question="哪些渠道购买的TwinFun XPro可享受官方保修？主机和无线手柄的免费保修期限分别是多久？"
retrieve_chunks=retrieve(question,5)

print(f"从向量数据库中查询到的与问题【{question}】语义相近的前n个匹配的结果：\n")
for i, result in enumerate(retrieve_chunks):
    print(f"{i+1}. {result}\n")

从向量数据库中查询到的与问题【哪些渠道购买的TwinFun XPro可享受官方保修？主机和无线手柄的免费保修期限分别是多久？】语义相近的前n个匹配的结果：

1. 保修范围与期限界定：本保修政策仅适用于通过TwinFun品牌官方商城、线下授权门店及天猫、京东官方旗舰店购买的XPro正品设备，非授权渠道购买的设备不享受官方保修服务。核心部件保修期限差异明确：主机（含主板、芯片、散热模块）享受自购买日起2年免费保修；无线手柄、双人摇杆控台等标配功能性配件保修1年；HDMI线、电源线、充电线等易损耗附件保修期限为3个月。保修起始日期以购机发票开具日期为准，无发票时则以设备首次激活日期或电商平台订单生成日期中最早者计算，且仅在中国内地（不含港澳台）区域有效。

2. 维修服务保障与规范：设备经审核符合保修条件后，采取“双向免邮”服务模式，用户寄回故障设备的运费由品牌方承担（需选择顺丰快递到付），维修完成后寄回的运费同样由官方承担。维修周期通常为5-7个工作日，若需更换核心部件（如主机主板），客服会提前通过短信或电话与用户确认部件信息及维修时长，征得同意后方可操作。维修后的设备将享受“双重保障”：若原保修未到期，延续剩余保修时间；若原保修已到期，自维修完成日起额外提供90天保修服务，维修记录可在官方客服中心查询。

3. 系统更新与维护：在线更新可在“系统设置-系统更新”中手动触发，系统会自动检测最新固件，更新包大小约500MB-1GB，建议在WiFi稳定环境下进行，更新过程中主机将自动重启。若在线更新失败，可采用USB手动更新：在电脑上登录TwinFun官网下载最新固件，将其保存至FAT32格式的USB硬盘（需新建“XPro”文件夹，子文件夹命名“UPDATE”，固件文件重命名为“XPROUPDATE.PUP”），将USB插入主机USB接口，按住主机背面复位键的同时开机，待指示灯呈橙色闪烁时松开，选择“USB更新”即可。日常维护需每月用压缩空气清理主机散热孔灰尘，避免积尘导致过热。

4. 延保服务与增值保障：为延长设备保障周期，用户可在原保修到期前30天内，通过官方APP或客服热线购买延保服务。延保费用明确定价：主机单独延保1年费用199元，延保2年费用349元；全套设备（主机+所有标配配件）延保1年费用299元，延保2年费用549元。延保服务与原保修范围一致，购买后即时

# 4. 重排（增强）

In [10]:
from sentence_transformers import CrossEncoder

# 定义一个排序方法，通过cross-encoder模型，对用户问题和多个片段之间的相似度打分、排序
def rerank(query:str, retrieve_chunks: List[str], top_k:int) -> List[str]:
    # 创建cross_encoder模型
    cross_encoder=CrossEncoder('cross-encoder/mmarco-mMiniLMv2-L12-H384-v1')
    # 用户问题+相似片段 列表
    pairs=[(query,chunk) for chunk in retrieve_chunks]
    # 用户问题和每个相似片段的重排分数
    scores=cross_encoder.predict(pairs)

    # 用户问题+每个相似片段 重排分数的列表
    chunk_with_score_list=[
        (chunk,score) for chunk,score in zip(retrieve_chunks,scores)
    ]
    # 按照分数倒序排序
    chunk_with_score_list.sort(key=lambda pair:pair[1],reverse=True)
    # 取top k
    return [chunk for chunk,_ in chunk_with_score_list][:top_k]

reranked_chunks=rerank(question,retrieve_chunks,3)

print(f"对匹配结果增强重排后，与问题【{question}】语义相近的前n个匹配的结果：\n")

for i,chunk in enumerate(reranked_chunks):
    print(f"{i+1}. {chunk}\n")

对匹配结果增强重排后，与问题【哪些渠道购买的TwinFun XPro可享受官方保修？主机和无线手柄的免费保修期限分别是多久？】语义相近的前n个匹配的结果：

1. 保修范围与期限界定：本保修政策仅适用于通过TwinFun品牌官方商城、线下授权门店及天猫、京东官方旗舰店购买的XPro正品设备，非授权渠道购买的设备不享受官方保修服务。核心部件保修期限差异明确：主机（含主板、芯片、散热模块）享受自购买日起2年免费保修；无线手柄、双人摇杆控台等标配功能性配件保修1年；HDMI线、电源线、充电线等易损耗附件保修期限为3个月。保修起始日期以购机发票开具日期为准，无发票时则以设备首次激活日期或电商平台订单生成日期中最早者计算，且仅在中国内地（不含港澳台）区域有效。

2. 延保服务与增值保障：为延长设备保障周期，用户可在原保修到期前30天内，通过官方APP或客服热线购买延保服务。延保费用明确定价：主机单独延保1年费用199元，延保2年费用349元；全套设备（主机+所有标配配件）延保1年费用299元，延保2年费用549元。延保服务与原保修范围一致，购买后即时生效并与原保修无缝衔接。此外，可额外购买“意外保障服务”，399元/年，覆盖人为摔落、液体泼溅、意外挤压等非人为故障，购买后需在48小时内完成设备外观及功能验机备案，未备案则保障无效。

3. 维修服务保障与规范：设备经审核符合保修条件后，采取“双向免邮”服务模式，用户寄回故障设备的运费由品牌方承担（需选择顺丰快递到付），维修完成后寄回的运费同样由官方承担。维修周期通常为5-7个工作日，若需更换核心部件（如主机主板），客服会提前通过短信或电话与用户确认部件信息及维修时长，征得同意后方可操作。维修后的设备将享受“双重保障”：若原保修未到期，延续剩余保修时间；若原保修已到期，自维修完成日起额外提供90天保修服务，维修记录可在官方客服中心查询。



# 5. 生成

生成阶段，我们可以依赖不同的大语言模型进行生成。如果需要集成多个不同的大模型，可以使用OneAPI等聚合API来实现。

下面我们用两种方式来举例说明：通过Ollama调用本地大语言模型（通过Ollama等方式在本地部署大语言模型如Llama、DeepSeek等）、通过SDK调用三方大语言模型（Gemini、ChatGPT等）。


In [15]:
# 通过Ollama的SDK调用本地大模型生成结果
# 本地要先通过Ollama运行大模型

import ollama

def generate(query:str,chunks:List[str] )->str:
    prompt = f"""你是一位知识助手，请根据用户的问题和参考资料生成准确的回答。

用户问题: {query}

参考资料:
{"\n\n".join(chunks)}

请严格基于上述内容作答，不要编造信息，如果资料中没有答案，请回答“文档中未找到相关信息”。"""

    print(f"{prompt}\n\n---\n")
    
    try:
        response = ollama.chat(
            model='deepseek-r1:1.5b',
            messages=[{'role': 'user', 'content': prompt}],
        )
        return response['message']['content']
    except Exception as e:
        print(f"API调用失败: {e}")
        return "API调用失败";

# 生成测试
answer = generate(question,reranked_chunks);
print(answer)

你是一位知识助手，请根据用户的问题和参考资料生成准确的回答。

用户问题: 哪些渠道购买的TwinFun XPro可享受官方保修？主机和无线手柄的免费保修期限分别是多久？

参考资料:
保修范围与期限界定：本保修政策仅适用于通过TwinFun品牌官方商城、线下授权门店及天猫、京东官方旗舰店购买的XPro正品设备，非授权渠道购买的设备不享受官方保修服务。核心部件保修期限差异明确：主机（含主板、芯片、散热模块）享受自购买日起2年免费保修；无线手柄、双人摇杆控台等标配功能性配件保修1年；HDMI线、电源线、充电线等易损耗附件保修期限为3个月。保修起始日期以购机发票开具日期为准，无发票时则以设备首次激活日期或电商平台订单生成日期中最早者计算，且仅在中国内地（不含港澳台）区域有效。

延保服务与增值保障：为延长设备保障周期，用户可在原保修到期前30天内，通过官方APP或客服热线购买延保服务。延保费用明确定价：主机单独延保1年费用199元，延保2年费用349元；全套设备（主机+所有标配配件）延保1年费用299元，延保2年费用549元。延保服务与原保修范围一致，购买后即时生效并与原保修无缝衔接。此外，可额外购买“意外保障服务”，399元/年，覆盖人为摔落、液体泼溅、意外挤压等非人为故障，购买后需在48小时内完成设备外观及功能验机备案，未备案则保障无效。

维修服务保障与规范：设备经审核符合保修条件后，采取“双向免邮”服务模式，用户寄回故障设备的运费由品牌方承担（需选择顺丰快递到付），维修完成后寄回的运费同样由官方承担。维修周期通常为5-7个工作日，若需更换核心部件（如主机主板），客服会提前通过短信或电话与用户确认部件信息及维修时长，征得同意后方可操作。维修后的设备将享受“双重保障”：若原保修未到期，延续剩余保修时间；若原保修已到期，自维修完成日起额外提供90天保修服务，维修记录可在官方客服中心查询。

请严格基于上述内容作答，不要编造信息，如果资料中没有答案，请回答“文档中未找到相关信息”。

---

<think>
好，我现在需要处理用户的查询。用户问的是TwinFun XPro可以享受官方保修的渠道有哪些，以及主机和无线手柄的免费保修期限分别是多久。首先，我要仔细阅读参考资料，确保理解所有信息。

根据参考资料，Prime会员购买的设备是免修的，而且不享受保修服务。而线下授

In [16]:
# 调用大语言模型生成结果
# 调用Google的Gemini，依赖google-genai
# 运行需要通过设置国外节点VPN（建议热点）
from google import genai
client = genai.Client(api_key="AIzaSyD-l1J5qt0VhDOmLASJPxaG_7If5BXvm8Q")

def generate(query:str,chunks:List[str] )->str:
    prompt = f"""你是一位知识助手，请根据用户的问题和参考资料生成准确的回答。

用户问题: {query}

参考资料:
{"\n\n".join(chunks)}

请严格基于上述内容作答，不要编造信息，如果资料中没有答案，请回答“文档中未找到相关信息”。"""

    print(f"{prompt}\n\n---\n")
    
    try:
        response = client.models.generate_content(
            model="gemini-2.5-flash",
            contents=prompt,
        )
        return response.text
    except Exception as e:
        print(f"API调用失败: {e}")
        return "API调用失败";

# 生成测试
answer = generate(question,reranked_chunks);
print(answer)

你是一位知识助手，请根据用户的问题和参考资料生成准确的回答。

用户问题: 哪些渠道购买的TwinFun XPro可享受官方保修？主机和无线手柄的免费保修期限分别是多久？

参考资料:
保修范围与期限界定：本保修政策仅适用于通过TwinFun品牌官方商城、线下授权门店及天猫、京东官方旗舰店购买的XPro正品设备，非授权渠道购买的设备不享受官方保修服务。核心部件保修期限差异明确：主机（含主板、芯片、散热模块）享受自购买日起2年免费保修；无线手柄、双人摇杆控台等标配功能性配件保修1年；HDMI线、电源线、充电线等易损耗附件保修期限为3个月。保修起始日期以购机发票开具日期为准，无发票时则以设备首次激活日期或电商平台订单生成日期中最早者计算，且仅在中国内地（不含港澳台）区域有效。

延保服务与增值保障：为延长设备保障周期，用户可在原保修到期前30天内，通过官方APP或客服热线购买延保服务。延保费用明确定价：主机单独延保1年费用199元，延保2年费用349元；全套设备（主机+所有标配配件）延保1年费用299元，延保2年费用549元。延保服务与原保修范围一致，购买后即时生效并与原保修无缝衔接。此外，可额外购买“意外保障服务”，399元/年，覆盖人为摔落、液体泼溅、意外挤压等非人为故障，购买后需在48小时内完成设备外观及功能验机备案，未备案则保障无效。

维修服务保障与规范：设备经审核符合保修条件后，采取“双向免邮”服务模式，用户寄回故障设备的运费由品牌方承担（需选择顺丰快递到付），维修完成后寄回的运费同样由官方承担。维修周期通常为5-7个工作日，若需更换核心部件（如主机主板），客服会提前通过短信或电话与用户确认部件信息及维修时长，征得同意后方可操作。维修后的设备将享受“双重保障”：若原保修未到期，延续剩余保修时间；若原保修已到期，自维修完成日起额外提供90天保修服务，维修记录可在官方客服中心查询。

请严格基于上述内容作答，不要编造信息，如果资料中没有答案，请回答“文档中未找到相关信息”。

---

TwinFun XPro可通过以下渠道购买并享受官方保修：TwinFun品牌官方商城、线下授权门店、天猫官方旗舰店及京东官方旗舰店。

关于免费保修期限：
*   主机（含主板、芯片、散热模块）享受自购买日起2年免费保修。
*   无线手柄享受1年免费保修。
