In [1]:
import logging
import sys
import os
from llama_index.core import PromptTemplate, Settings, SimpleDirectoryReader, VectorStoreIndex, load_index_from_storage, StorageContext, QueryBundle
from llama_index.core.schema import MetadataMode
from llama_index.core.node_parser import SentenceSplitter
from llama_index.llms.dashscope import DashScope, DashScopeGenerationModels
from llama_index.embeddings.dashscope import DashScopeEmbedding, DashScopeTextEmbeddingModels

In [None]:
定义日志配置

In [2]:
logging.basicConfig(stream=sys.stdout, level=logging.INFO)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

In [None]:
指定全局llm与embedding模型

In [3]:
Settings.llm = DashScope(model_name=DashScopeGenerationModels.QWEN_MAX,api_key=os.getenv("DASHSCOPE_API_KEY"))
Settings.embed_model = DashScopeEmbedding(model_name=DashScopeTextEmbeddingModels.TEXT_EMBEDDING_V1)

In [None]:
读取文档

In [5]:
documents = SimpleDirectoryReader("./data", required_exts=[".txt"]).load_data()

In [None]:
对文档进行切分，将切分后的片段转化为embedding向量，构建向量索引

In [6]:
index = VectorStoreIndex.from_documents(documents, transformations=[SentenceSplitter(chunk_size=256)])

In [None]:
构建查询引擎

In [7]:
# streaming 流式输出
# similarity_top_k 检索结果的数量
query_engine = index.as_query_engine(streaming=True, similarity_top_k=5)

In [None]:
生成答案

In [8]:
response = query_engine.query("不耐疲劳，口燥、咽干可能是哪些证候？")
response.print_response_stream()
print()

不耐疲劳，口燥、咽干这些症状可能与内燥证相关。这种情况下，患者还可能出现皮肤干燥或脱屑、瘙痒，唇裂、皱揭，大便干结，小便短少等症状，舌质偏红或瘦，舌苔干而少津，脉细或数。此外，也可能伴有形体消瘦，肌肤甲错，关节僵痛等特征。


In [None]:
向量存储

In [9]:
# 将embedding向量和向量索引存储到文件中
# ./doc_emb 是存储路径
index.storage_context.persist(persist_dir='./doc_emb')

In [None]:
从向量数据库检索

In [10]:
# 从存储文件中读取embedding向量和向量索引
storage_context = StorageContext.from_defaults(persist_dir="./doc_emb")

# 根据存储的embedding向量和向量索引重新构建检索索引
index = load_index_from_storage(storage_context)

# 构建查询引擎
query_engine = index.as_query_engine(streaming=True, similarity_top_k=5)

# 查询获得答案
response = query_engine.query("不耐疲劳，口燥、咽干可能是哪些证候？")
response.print_response_stream()
print()

INFO:llama_index.core.indices.loading:Loading all indices.
Loading all indices.
不耐疲劳，口燥、咽干这些症状可能与内燥证相关。这种证候通常表现为皮肤干燥或脱屑、咽喉干燥、口渴想喝水、大便干结等症状。此外，还可能伴有形体消瘦、肌肤甲错、关节僵痛等特征。


In [None]:
追踪哪些文档片段被检索

In [11]:
# 从存储文件中读取embedding向量和向量索引
storage_context = StorageContext.from_defaults(persist_dir="./doc_emb")

# 根据存储的embedding向量和向量索引重新构建检索索引
index = load_index_from_storage(storage_context)

# 构建查询引擎
query_engine = index.as_query_engine(similarity_top_k=5)

# 获取我们抽取出的相似度 top 5 的片段
contexts = query_engine.retrieve(QueryBundle("不耐疲劳，口燥、咽干可能是哪些证候？"))
print('-' * 10 + 'ref' + '-' * 10)
for i, context in enumerate(contexts):
    print('#' * 10 + f'chunk {i} start' + '#' * 10)
    content = context.node.get_content(metadata_mode=MetadataMode.LLM)
    print(content)
    print('#' * 10 + f'chunk {i} end' + '#' * 10)
print('-' * 10 + 'ref' + '-' * 10)

# 查询获得答案
response = query_engine.query("不耐疲劳，口燥、咽干可能是哪些证候？")
print(response)

INFO:llama_index.core.indices.loading:Loading all indices.
Loading all indices.
----------ref----------
##########chunk 0 start##########
file_path: E:\AI\AI-Driven TCM Smart Diagnosis\data\demo.txt

临床以鼻咽干涩或痛，口唇燥干，舌质红，舌苔白或燥，脉浮或微数，伴见发热、无汗，头痛或肢节酸痛等为特征的证候。

3.6.3.2
    燥干清窍证        
    因气候或环境干燥，津液耗损，清窍失濡所致。临床以口鼻、咽喉干燥，两眼干涩，少泪、少涕、少津、甚则衄血，舌质瘦小、舌苔干而少津，脉细等为特征的证候。

3.6.
##########chunk 0 end##########
##########chunk 1 start##########
file_path: E:\AI\AI-Driven TCM Smart Diagnosis\data\demo.txt

3.6.3.2
    燥干清窍证        
    因气候或环境干燥，津液耗损，清窍失濡所致。临床以口鼻、咽喉干燥，两眼干涩，少泪、少涕、少津、甚则衄血，舌质瘦小、舌苔干而少津，脉细等为特征的证候。

3.6.3.3
    燥邪犯肺证        
    燥邪伤肺证
    因外感燥邪，或感受风热，化燥伤阴，肺失清肃所致。
##########chunk 1 end##########
##########chunk 2 start##########
file_path: E:\AI\AI-Driven TCM Smart Diagnosis\data\demo.txt

临床以口鼻皮肤干燥，频频饮水难解口渴，咽干、唾少，或口腔溃疡频发，目涩少泪或无泪，阴道涩滞，形体消瘦，大便燥结，舌质偏红，舌苔干而少津，脉细涩等为特征的证候。

3.8.6.2
    燥毒痹阻证         
    因燥毒伤阴，痹阻经脉、骨节所致。
##########chunk 2 end##########
##########chunk 3 start##########
file_path: E:

In [None]:
rag检索底层实现细节

In [13]:
import logging
import sys
import os
from llama_index.core import PromptTemplate, Settings, StorageContext, load_index_from_storage
from llama_index.core.callbacks import LlamaDebugHandler, CallbackManager
from llama_index.llms.dashscope import DashScope, DashScopeGenerationModels
from llama_index.embeddings.dashscope import DashScopeEmbedding, DashScopeTextEmbeddingModels

# 定义日志
logging.basicConfig(stream=sys.stdout, level=logging.DEBUG)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))


# 定义system prompt
SYSTEM_PROMPT = """You are a helpful AI assistant."""
query_wrapper_prompt = PromptTemplate(
    "[INST]<<SYS>>\n" + SYSTEM_PROMPT + "<</SYS>>\n\n{query_str}[/INST] "
)

# 1. 指定全局llm与embedding模型
Settings.llm = DashScope(model_name=DashScopeGenerationModels.QWEN_MAX,api_key=os.getenv("DASHSCOPE_API_KEY"))
Settings.embed_model = DashScopeEmbedding(model_name=DashScopeTextEmbeddingModels.TEXT_EMBEDDING_V1)

# 使用LlamaDebugHandler构建事件回溯器，以追踪LlamaIndex执行过程中发生的事件
llama_debug = LlamaDebugHandler(print_trace_on_end=True)
callback_manager = CallbackManager([llama_debug])
Settings.callback_manager = callback_manager


# 从存储文件中读取embedding向量和向量索引
storage_context = StorageContext.from_defaults(persist_dir="./doc_emb")

# 根据存储的embedding向量和向量索引重新构建检索索引
index = load_index_from_storage(storage_context)

# 构建查询引擎
query_engine = index.as_query_engine(similarity_top_k=5)

# 查询获得答案
response = query_engine.query("不耐疲劳，口燥、咽干可能是哪些证候？")
print(response)

# get_llm_inputs_outputs 返回每个LLM调用的开始/结束事件
event_pairs = llama_debug.get_llm_inputs_outputs()

# print(event_pairs[0][1].payload.keys()) # 输出事件结束时所有相关的属性

# 输出 Promt 构建过程
print(event_pairs[0][1].payload["messages"])

INFO:llama_index.core.indices.loading:Loading all indices.
Loading all indices.
Loading all indices.
Loading all indices.
**********
Trace: index_construction
**********
**********
Trace: query
    |_CBEventType.QUERY -> 3.913099 seconds
      |_CBEventType.RETRIEVE -> 0.824707 seconds
        |_CBEventType.EMBEDDING -> 0.606989 seconds
      |_CBEventType.SYNTHESIZE -> 3.088392 seconds
        |_CBEventType.TEMPLATING -> 0.0 seconds
        |_CBEventType.LLM -> 3.084323 seconds
**********
不耐疲劳，口燥、咽干这些症状可能与内燥证相关。这种证候通常表现为皮肤干燥或脱屑、瘙痒，咽喉干燥，唇裂等症状，并伴有口渴、大便干结等特征。此外，还可能伴随形体消瘦、肌肤甲错以及关节僵痛等症状。
[ChatMessage(role=<MessageRole.SYSTEM: 'system'>, additional_kwargs={}, blocks=[TextBlock(block_type='text', text="You are an expert Q&A system that is trusted around the world.\nAlways answer the query using the provided context information, and not prior knowledge.\nSome rules to follow:\n1. Never directly reference the given context in your answer.\n2. Avoid statements like 'Based on the context, ...' o

In [None]:
合成响应器

In [17]:
import logging
import sys
import os
# 导入DashScope相关的LLM和Embedding模型
from llama_index.llms.dashscope import DashScope, DashScopeGenerationModels
from llama_index.embeddings.dashscope import DashScopeEmbedding, DashScopeTextEmbeddingModels
# 保留llama-index核心依赖
from llama_index.core import PromptTemplate, Settings, StorageContext, load_index_from_storage
from llama_index.core.callbacks import LlamaDebugHandler, CallbackManager

# 定义日志，保持原有配置
logging.basicConfig(stream=sys.stdout, level=logging.INFO)
logging.getLogger().addHandler(logging.StreamHandler(stream=sys.stdout))

# -------------------------- 1. 配置DashScope API Key（关键） --------------------------
# 方式1：从系统环境变量读取（推荐，避免硬编码）
# 需提前在系统中设置环境变量 DASHSCOPE_API_KEY=你的灵积API密钥
if not os.getenv("DASHSCOPE_API_KEY"):
    # 方式2：直接赋值（测试用，生产环境不推荐）
    os.environ["DASHSCOPE_API_KEY"] = "your-dashscope-api-key-here"

# -------------------------- 2. 定义医疗相关Prompt模板（保留原有逻辑） --------------------------
# 系统提示词（适配DashScope，无需INST包裹，云端模型会自动处理系统/用户prompt）
SYSTEM_PROMPT = """你是一个医疗人工智能助手。"""

# 问答Prompt模板（保留原有医疗严谨性要求）
qa_prompt_tmpl_str = (
    "上下文信息如下。\n"
    "---------------------\n"
    "{context_str}\n"
    "---------------------\n"
    "请根据上下文信息而不是先验知识来回答以下的查询。"
    "作为一个医疗人工智能助手，你的回答要尽可能严谨。\n"
    "Query: {query_str}\n"
    "Answer: "
)
qa_prompt_tmpl = PromptTemplate(qa_prompt_tmpl_str)

# 优化Prompt模板（保留原有逻辑）
refine_prompt_tmpl_str = (
    "原始查询如下：{query_str}\n"
    "我们提供了现有答案：{existing_answer}\n"
    "我们有机会通过下面的更多上下文来完善现有答案（仅在需要时）。\n"
    "------------\n"
    "{context_msg}\n"
    "------------\n"
    "考虑到新的上下文，优化原始答案以更好地回答查询。 如果上下文没有用，请返回原始答案。\n"
    "Refined Answer:"
)
refine_prompt_tmpl = PromptTemplate(refine_prompt_tmpl_str)

# -------------------------- 3. 全局配置：DashScope LLM + Embedding（核心修改） --------------------------
# 配置云端大模型（QWEN_MAX，也可替换为QWEN_TURBO/QWEN_PLUS等）
Settings.llm = DashScope(
    model_name=DashScopeGenerationModels.QWEN_MAX,
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    temperature=0.0,  # 医疗场景推荐低温度，保证回答严谨
    max_tokens=2048,  # 最大生成token数
)

# 配置云端嵌入模型（阿里云通用文本嵌入v1，适配中文）
Settings.embed_model = DashScopeEmbedding(
    model_name=DashScopeTextEmbeddingModels.TEXT_EMBEDDING_V1,
    api_key=os.getenv("DASHSCOPE_API_KEY"),
    embed_batch_size=16,  # 批量嵌入大小，按需调整
)

# -------------------------- 4. 回调管理器：保留执行追踪（原有逻辑） --------------------------
llama_debug = LlamaDebugHandler(print_trace_on_end=True)
callback_manager = CallbackManager([llama_debug])
Settings.callback_manager = callback_manager

# -------------------------- 5. 加载本地向量索引（原有逻辑） --------------------------
# 从存储目录加载已构建的embedding向量和索引
storage_context = StorageContext.from_defaults(persist_dir="doc_emb")
index = load_index_from_storage(storage_context)

# -------------------------- 6. 构建查询引擎并更新Prompt（原有逻辑） --------------------------
# 构建查询引擎，相似性检索top5
query_engine = index.as_query_engine(similarity_top_k=5)

# 打印查询引擎原有Prompt类型（验证用）
prompts_dict = query_engine.get_prompts()
print("查询引擎原有Prompt类型：", list(prompts_dict.keys()))

# 更新医疗专用的QA和Refine Prompt
query_engine.update_prompts(
    {
        "response_synthesizer:text_qa_template": qa_prompt_tmpl,
        "response_synthesizer:refine_template": refine_prompt_tmpl
    }
)

# -------------------------- 7. 执行医疗问题查询（原有逻辑） --------------------------
# 医疗问题查询
response = query_engine.query("不耐疲劳，口燥、咽干可能是哪些证候？")
print("\n===== 问答结果 =====")
print(response)

# -------------------------- 8. 打印实际发送给模型的格式化Prompt（调试用） --------------------------
event_pairs = llama_debug.get_llm_inputs_outputs()
if event_pairs:
    print("\n===== 发送给模型的格式化Prompt =====")
    print(event_pairs[0][1].payload["messages"])
else:
    print("未捕获到LLM输入输出事件")

INFO:llama_index.core.indices.loading:Loading all indices.
Loading all indices.
Loading all indices.
Loading all indices.
Loading all indices.
Loading all indices.
**********
Trace: index_construction
**********
查询引擎原有Prompt类型： ['response_synthesizer:text_qa_template', 'response_synthesizer:refine_template']
**********
Trace: query
    |_CBEventType.QUERY -> 10.037027 seconds
      |_CBEventType.RETRIEVE -> 0.860153 seconds
        |_CBEventType.EMBEDDING -> 0.618487 seconds
      |_CBEventType.SYNTHESIZE -> 9.176874 seconds
        |_CBEventType.TEMPLATING -> 0.0 seconds
        |_CBEventType.LLM -> 9.174875 seconds
**********

===== 问答结果 =====
根据提供的上下文信息，不耐疲劳、口燥、咽干的症状可能与以下几种证候相关：

1. **内燥证**（3.6.2）：此证候因久病虚损，阴血津液不足，机体失却濡润所致。临床表现为皮肤粗燥或脱屑、瘙痒，咽喉干燥，唇裂、皱揭，口渴引饮，大便干结，小便短少，舌质偏红或瘦，舌苔干而少津，脉细或数。虽然直接未提及“不耐疲劳”，但这些症状中的部分表现如口燥、咽干符合描述，并且长期的阴血津液不足可能导致体力下降，从而出现不耐疲劳的情况。

2. **外燥袭表证**（3.6.3.1）：由于燥邪侵袭体表导致阴津受损。其特征包括鼻咽干涩或痛，口唇燥干，舌质红，舌苔白或燥，脉浮或微数，伴有发热、无汗，头痛或肢体酸痛等症状。这里明确提到了口燥和咽干的症状，尽管没有直接提到“不耐疲劳”，但是伴随的其他不适感也可能间