In [1]:
from openai import OpenAI

client = OpenAI(api_key="0", base_url="http://192.168.106.26:20000/v1")

def llm_qwen(prompt, model="Qwen3", temperature=0.7, top_p=0.8, max_tokens=2048, presence_penalty=1.5):
    chat_response = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "user", "content": prompt},
        ],
        temperature=temperature,
        top_p=top_p,
        max_tokens=max_tokens,
        presence_penalty=presence_penalty,
    )
    return chat_response.choices[0].message.content

if __name__ == "__main__":
    llm_output = llm_qwen("你好")
    print(llm_output)

你好！有什么我可以帮你的吗？😊


In [9]:
import json
import nltk
import numpy as np
import torch
import concurrent.futures
import re
from typing import List, Tuple, Dict, Any, Optional, Union
from transformers import AutoModel, AutoTokenizer
from nltk.tokenize import word_tokenize
from collections import Counter

# 下载NLTK所需资源（首次运行时取消注释）
# nltk.download('punkt')
# nltk.download('punkt_tab')

class ComplexityWeightedAggregationLayer(torch.nn.Module):
    def __init__(self, hidden_size=768, num_perspectives=3, complexity_weight_ratio=0.7):
        """
        基于复杂度加权的聚合层：
        - 保留全局聚合路径
        - 用文本复杂度替代注意力权重
        - complexity_weight_ratio控制复杂度权重影响程度
        """
        super().__init__()
        self.num_perspectives = num_perspectives
        self.complexity_weight_ratio = complexity_weight_ratio
        
        # 第一级：两两视角聚合
        self.pairwise_aggregators = torch.nn.ModuleList([
            torch.nn.Sequential(
                torch.nn.Linear(hidden_size * 2, hidden_size),
                torch.nn.LayerNorm(hidden_size),
                torch.nn.GELU()
            )
            for _ in range(num_perspectives * (num_perspectives - 1) // 2)
        ])
        
        # 第二级：全局聚合
        num_pairwise = num_perspectives * (num_perspectives - 1) // 2
        self.global_aggregator = torch.nn.Sequential(
            torch.nn.Linear(hidden_size * num_pairwise, hidden_size * 2),
            torch.nn.LayerNorm(hidden_size * 2),
            torch.nn.GELU(),
            torch.nn.Dropout(0.15),
            torch.nn.Linear(hidden_size * 2, hidden_size)
        )
        
        # 文本复杂度计算模型（外部传入）
        self.complexity_model = None
        self.complexity_tokenizer = None
    
    def set_complexity_tools(self, model: AutoModel, tokenizer: AutoTokenizer):
        """设置复杂度计算所需的模型和分词器"""
        self.complexity_model = model
        self.complexity_tokenizer = tokenizer
    
    def forward(self, encoded_responses: List[torch.Tensor], response_texts: List[str]):
        """
        前向传播过程
        
        参数：
            encoded_responses: 视角特征列表 [num_perspectives, hidden_size]
            response_texts: 视角文本列表 [num_perspectives]
        """
        stacked = torch.stack(encoded_responses)  # [num_perspectives, hidden_size]
        
        # 第一阶段：两两视角聚合
        pairwise_outputs = []
        idx = 0
        for i in range(self.num_perspectives):
            for j in range(i + 1, self.num_perspectives):
                pair = torch.cat([stacked[i], stacked[j]], dim=-1).unsqueeze(0)
                pairwise_outputs.append(self.pairwise_aggregators[idx](pair))
                idx += 1
        
        # 第二阶段：全局聚合
        pairwise_concat = torch.cat(pairwise_outputs, dim=-1)  # [1, hidden_size*num_pairs]
        global_repr = self.global_aggregator(pairwise_concat)  # [1, hidden_size]
        
        # 第三阶段：基于复杂度的权重计算
        complexities = [
            calculate_complexity(text, self.complexity_model, self.complexity_tokenizer)
            for text in response_texts
        ]
        
        # 归一化为概率分布
        complexities = torch.tensor(complexities, dtype=torch.float32)
        weights = torch.softmax(complexities, dim=-1)  # [num_perspectives]
        
        # 原始视角的加权和
        weighted_aggregation = torch.sum(
            stacked * weights.t().unsqueeze(-1),
            dim=0
        )  # [hidden_size]
        
        # 最终输出融合
        final_output = (self.complexity_weight_ratio * weighted_aggregation.unsqueeze(0) + 
                       (1 - self.complexity_weight_ratio) * global_repr)  # [1, hidden_size]
        
        return final_output, weights

def load_encoder_model() -> Tuple[AutoModel, AutoTokenizer]:
    """加载预训练的BERT编码器和分词器"""
    model_name = "/app/sda1/xiangyue/model/bert-base-chinese"
    return AutoModel.from_pretrained(model_name), AutoTokenizer.from_pretrained(model_name)

def encode_text(text: str, model: AutoModel, tokenizer: AutoTokenizer) -> torch.Tensor:
    """将文本编码为BERT的CLS向量"""
    inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=512)
    with torch.no_grad():
        return model(**inputs).last_hidden_state[:, 0, :].squeeze(0)  # [hidden_size]

def calculate_complexity(text: str, model: AutoModel, tokenizer: AutoTokenizer) -> float:
    """
    计算文本复杂度（多维度指标融合）：
    1. 文本长度复杂度
    2. 词汇多样性（TF-IDF熵）
    3. 语义嵌入方差
    """
    if not text:
        return 0.0
    
    # 1. 文本长度复杂度（对数归一化）
    word_count = len(word_tokenize(text))
    length_score = np.log(word_count + 1) / np.log(100 + 1)  # 归一化到[0,1]
    
    # 2. 词汇多样性（TF-IDF熵）
    words = [word for word in word_tokenize(text) if word.isalpha() and len(word) > 1]
    if len(words) < 2:
        diversity_score = 0.0
    else:
        word_freq = Counter(words)
        probs = np.array(list(word_freq.values()), dtype=float) / len(words)
        diversity_score = -np.sum(probs * np.log(probs + 1e-10)) / np.log(len(word_freq))
        diversity_score = max(0.0, min(1.0, diversity_score))  # 裁剪到[0,1]
    
    # 3. 语义嵌入方差（BERT各token向量的方差）
    inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=512)
    with torch.no_grad():
        embeddings = model(**inputs).last_hidden_state.squeeze(0)
        valid_mask = inputs.input_ids.squeeze(0) != 0  # 忽略padding
        valid_embeddings = embeddings[valid_mask]
        if len(valid_embeddings) < 2:
            semantic_variance = 0.0
        else:
            variance = torch.var(valid_embeddings, dim=0).mean().item()
            # 动态范围归一化（假设方差通常在0.01-1.0之间）
            semantic_variance = (variance - 0.01) / (1.0 - 0.01) if variance > 0.01 else 0.0
            semantic_variance = max(0.0, min(1.0, semantic_variance))  # 裁剪到[0,1]
    
    # 综合复杂度分数（各指标加权求和）
    complexity_score = 0.3 * length_score + 0.3 * diversity_score + 0.4 * semantic_variance
    return max(complexity_score, 1e-6)  # 防止全零

def process_perspective(
    index: int, 
    question: str, 
    encoder_model: AutoModel, 
    tokenizer: AutoTokenizer, 
    llm: callable, 
    temperature: float
) -> Tuple[int, str, torch.Tensor]:
    """处理单个视角：生成回答 -> 编码向量"""
    response = llm(f"{question}", temperature=temperature)
    encoded = encode_text(response, encoder_model, tokenizer)
    return index, response, encoded

def multi_perspective_analysis(
    metaprompt: str, 
    p: int = 3, 
    topk: int = 1, 
    llm: callable = None, 
    temperature_settings: List[float] = None,
    complexity_weight_ratio: float = 0.4,
    hidden_size: int = 768,
    length_weight: float = 0.3,
    diversity_weight: float = 0.3,
    variance_weight: float = 0.4,
) -> Dict[str, Any]:
    """
    多视角分析主函数：
    1. 并行生成p个视角回答
    2. 计算各视角复杂度权重
    3. 聚合特征并返回topk视角
    
    参数:
        metaprompt: 元提示文本
        p: 视角数量
        topk: 返回的顶部视角数量
        llm: 大语言模型调用函数
        temperature_settings: 各视角的温度设置
        complexity_weight_ratio: 复杂度权重占比
        hidden_size: 隐藏层大小
        length_weight: 文本长度复杂度权重
        diversity_weight: 词汇多样性权重
        variance_weight: 语义嵌入方差权重
    """
    global calculate_complexity
    
    if llm is None:
        llm = llm_qwen  # 默认使用模拟LLM
    
    # 处理temperature设置
    if temperature_settings is None:
        temperatures = [0.1] * p
    elif isinstance(temperature_settings, (int, float)):
        temperatures = [temperature_settings] * p
    elif len(temperature_settings) == p:
        temperatures = temperature_settings
    else:
        raise ValueError("temperature_settings需为单个值或长度为p的列表")
    
    # 初始化模型
    encoder_model, tokenizer = load_encoder_model()
    
    # 创建闭包以修改复杂度计算的权重
    original_calculate_complexity = calculate_complexity
    def calculate_complexity_with_weights(text: str, model: AutoModel, tokenizer: AutoTokenizer) -> float:
        """使用自定义权重的文本复杂度计算函数"""
        if not text:
            return 0.0
        
        # 1. 文本长度复杂度
        word_count = len(word_tokenize(text))
        length_score = np.log(word_count + 1) / np.log(100 + 1)
        
        # 2. 词汇多样性
        words = [word for word in word_tokenize(text) if word.isalpha() and len(word) > 1]
        if len(words) < 2:
            diversity_score = 0.0
        else:
            word_freq = Counter(words)
            probs = np.array(list(word_freq.values()), dtype=float) / len(words)
            diversity_score = -np.sum(probs * np.log(probs + 1e-10)) / np.log(len(word_freq))
            diversity_score = max(0.0, min(1.0, diversity_score))
        
        # 3. 语义嵌入方差
        inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=512)
        with torch.no_grad():
            embeddings = model(**inputs).last_hidden_state.squeeze(0)
            valid_mask = inputs.input_ids.squeeze(0) != 0
            valid_embeddings = embeddings[valid_mask]
            if len(valid_embeddings) < 2:
                semantic_variance = 0.0
            else:
                variance = torch.var(valid_embeddings, dim=0).mean().item()
                semantic_variance = (variance - 0.01) / (1.0 - 0.01) if variance > 0.01 else 0.0
                semantic_variance = max(0.0, min(1.0, semantic_variance))
        
        # 使用传入的权重
        complexity_score = (length_weight * length_score + 
                           diversity_weight * diversity_score + 
                           variance_weight * semantic_variance)
        return max(complexity_score, 1e-6)
    
    # 临时替换复杂度计算函数
    calculate_complexity = calculate_complexity_with_weights
    
    aggregation_model = ComplexityWeightedAggregationLayer(
        num_perspectives=p, 
        complexity_weight_ratio=complexity_weight_ratio,
        hidden_size=hidden_size
    )
    aggregation_model.set_complexity_tools(encoder_model, tokenizer)
    aggregation_model.eval()  # 设置为评估模式
    
    # 并行处理多视角
    with concurrent.futures.ThreadPoolExecutor(max_workers=p) as executor:
        futures = [
            executor.submit(
                process_perspective, 
                i, 
                metaprompt, 
                encoder_model, 
                tokenizer, 
                llm, 
                temperatures[i]
            ) for i in range(p)
        ]
        results = [future.result() for future in futures]
    
    # 恢复原始的复杂度计算函数
    calculate_complexity = original_calculate_complexity
    
    # 整理结果
    results.sort(key=lambda x: x[0])
    encoded_responses = [enc for _, _, enc in results]
    response_texts = [resp for _, resp, _ in results]
    
    # 打印各视角信息（含复杂度）
    print("\n=== 各视角分析结果 ===")
    complexities = [
        calculate_complexity_with_weights(text, encoder_model, tokenizer)
        for text in response_texts
    ]
    for idx, (text, temp, comp) in enumerate(zip(response_texts, temperatures, complexities), start=1):
        # print(f"视角{idx} (temp={temp:.2f}, 复杂度={comp:.4f}):")
        print(f"视角{idx} temp={temp:.2f}")
        print(f"  {text}\n")
    
    if not encoded_responses:
        return {"error": "未获取到有效视角"}
    
    # 执行复杂度加权聚合
    with torch.no_grad():
        aggregated_output, weights = aggregation_model(encoded_responses, response_texts)
    
    # 整理topk结果
    sorted_items = sorted(
        [(i, f"视角{i+1}", weights[i].item(), complexities[i]) for i in range(p)],
        key=lambda x: x[2], reverse=True
    )
    top_indices = [item[0] for item in sorted_items[:topk]]
    top_perspectives = [
        {
            "视角": f"视角{idx+1}",
            "权重": weights[idx].item(),
            "复杂度": complexities[idx],
            "回答": response_texts[idx]
        }
        for idx in top_indices
    ]
    
    return {
        "总视角数": p,
        "topk结果": top_perspectives,
        "所有视角权重": [(item[1], item[2]) for item in sorted_items],
        "复杂度指标": [(item[1], item[3]) for item in sorted_items],
        "参数配置": {
            "complexity_weight_ratio": complexity_weight_ratio,
            "length_weight": length_weight,
            "diversity_weight": diversity_weight,
            "variance_weight": variance_weight,
            "temperature_settings": temperatures
        }
    }

if __name__ == "__main__":
    
    metaprompt = """
任务： 从给定的客服对话记录中提取关键信息，并生成一个结构化的 JSON 格式输出。

要求：
1. 提取以下字段：
  order_number（从系统消息或用户反馈中查找办理业务订单号）
  business_Number（用户要办理的手机号）
  name（用户提供的姓名，区分客服的姓名，和用户的姓名）
  contact_Phone（用户提供的手机号）
  user_feedback_issue（用户的主要投诉或咨询内容，尽量详细，且要以客服的视角描述）
  user_request（用户希望解决的问题或需求，尽量详细，且要以客服的视角描述）
  cons_progress（工号xx开头的客服为用户查询了什么，和用户确认了什么，尽量详细）
  cardType（判断用户咨询的业务类型号的卡，必须是这些门类：充值 权益包 流量包 业务办理 不确定）
2. 确保 JSON 格式正确，字段值尽量从对话原文中提取
3. 如果没有输出为空值！！！
最终输出格式：
{
  "order_number": "",
  "business_Number": "",
  "name": "",
  "contact_Phone": "",
  "user_feedback_issue": "",
  "user_request": "",
  "cons_progress": "",
  "cardType": ""
}
下面是要处理的客服对话片段：

(系统消息)      2025-05-11 14:13:04
正在为您接入人工服务，请稍等；您也可以发送【00】退出服务
(系统消息)      2025-05-11 14:13:04
客户IM号码（TYMY_H5dq250511024844208）已关联号码（TYMY_H515767962194）
梁鑫一(95047)      2025-05-11 14:13:05
您好，感谢您的耐心等待，系统已为您接入人工服务。中国电信95047号客服为您服务。
(0)      2025-05-11 14:13:05
【系统消息】15767962194,null,null ; 不可办理5G升级包
(0)      2025-05-11 14:13:05
人工[文本]
(0)      2025-05-11 14:13:05
【系统消息】亲，您可以#LinkIDSwitchToCSR马上召唤人工客服为您服务。<br/>以下是小知经常回答的问题哦：<br/>[1]购买号卡后找不到订单<br/>[2]我的卡有余额但无法使用<br/>[3]我想换个套餐有什么推荐吗<br/>[4]携号转网问题<br/>[5]我的卡提示被保护，停机了[文本]
(0)      2025-05-11 14:13:05
【客服请回复】请及时答复用户问题
(0)      2025-05-11 14:13:27
这个卡购买卡的30块不会作为预存话费的吗[文本]
梁鑫一(95047)      2025-05-11 14:13:49
尊敬的用户您好！这里是中国电信网上营业厅人工客服，工号95047，请问您有什么问题需要帮助吗？我将尽力为您提供最优质的服务！
梁鑫一(95047)      2025-05-11 14:13:53
辛苦您方便提供一下收货号码或身份证号吗？
(0)      2025-05-11 14:14:04
15767962194[文本]
(0)      2025-05-11 14:15:18
我昨天号码卡到了，快递小哥开卡后一直没信号，我打电话你们客服，客服让我再充值30元，但是现在只有30块话费，正常来说不应该是60块话费吗？[文本]
梁鑫一(95047)      2025-05-11 14:15:30
亲，正在为您积极查询中，预计需要1到3分钟，请您稍等。 （正在为您查询~!这句无需回复喔~）
梁鑫一(95047)      2025-05-11 14:17:02
15767962194未查询到信息，您是通过什么渠道购买的呢？方便提供订单编号吗？
梁鑫一(95047)      2025-05-11 14:17:16
抱歉亲亲查询错误
(0)      2025-05-11 14:17:17
你们这个小程序啊[文本]
梁鑫一(95047)      2025-05-11 14:17:19
2025-05-08 21:25:59下单的这个吗？
(0)      2025-05-11 14:17:23
对啊[文本]
梁鑫一(95047)      2025-05-11 14:17:47
亲，请您稍等不要离开呦~我现在为您查询，谢谢亲的配合与理解。
梁鑫一(95047)      2025-05-11 14:18:01
通用可用余额: 0专用余额: 30
梁鑫一(95047)      2025-05-11 14:18:02
您好，为了您能得到更专业的服务，您所咨询的问题需要转到号码归属（省）专席为您跟进（以上对话记录也会一同转接），转接期间请勿退出，如线路繁忙，可以联系号码归属省10000万号，同意转接回复1
(0)      2025-05-11 14:18:38
怎么回事？[文本]
(0)      2025-05-11 14:18:48
我就是问你怎么话费只有30块啊[文本]
(0)      2025-05-11 14:19:05
这个卡是买卡的30块不是作为预存话费的吗？[文本]
梁鑫一(95047)      2025-05-11 14:19:10
话费是您订单内的30激活已充值
(0)      2025-05-11 14:19:13
听不懂话吗？[文本]
(0)      2025-05-11 14:19:22
那我买卡的30块呢[文本]
梁鑫一(95047)      2025-05-11 14:19:33
这个就是买卡的亲亲
梁鑫一(95047)      2025-05-11 14:19:40
激活中要求您充值的这边查询不到
梁鑫一(95047)      2025-05-11 14:19:41
为您转接省内客服为您核实看看好吗？
(0)      2025-05-11 14:19:57
买卡的钱不会变成话费的意思是吗？[文本]
梁鑫一(95047)      2025-05-11 14:20:52
会
梁鑫一(95047)      2025-05-11 14:20:55
已经到了亲亲
(0)      2025-05-11 14:21:02
并没有啊[文本]
(0)      2025-05-11 14:21:15
我现在的30块是后面充值的啊[文本]
(0)      2025-05-11 14:21:24
现在你们两边踢皮球还是怎么样[文本]
梁鑫一(95047)      2025-05-11 14:21:36
亲，您说的问题这边为您记录反馈，请您提供一下能联系到您的手机号和您的姓名，给您带来不便请您谅解，我们会通过电话的方式告知您处理结果，请您保持电话畅通
梁鑫一(95047)      2025-05-11 14:21:54
您激活充值的30 账单麻烦截图
(0)      2025-05-11 14:22:22
SVU2OE1NIXhqeFMhUyFPTyFYO05IT1lqak5jeFlPbUNR1007-100-100-11-lnsy.png
梁鑫一(95047)      2025-05-11 14:22:47
亲亲稍等加载图片看下
(0)      2025-05-11 14:22:55
昨天充值的，赶紧看怎么回事啊，不然我就工信局投诉你们欺骗消费者了[文本]
梁鑫一(95047)      2025-05-11 14:24:45
15767962194这个号码能联系到您吗？
(0)      2025-05-11 14:25:29
可以[文本]
梁鑫一(95047)      2025-05-11 14:25:51
您好，您反馈的问题，客服已反馈到相关部门，预计48小时内，我们的工作人员会使用4008开头的电话跟您15767962194的号码联系，请您保持电话畅通，感谢您的理解！
梁鑫一(95047)      2025-05-11 14:27:44
亲亲您还有其他需要帮助的吗？
(系统消息)      2025-05-11 14:29:45
请问您还在线吗？ 如随后2分钟仍未收到您的消息，本次会话将暂时结束；如您的问题已解决，可发送【00】结束本次会话。
(系统消息)      2025-05-11 14:29:45
用户2分钟未发言或回复消息，系统已向用户发送提示消息
(系统消息)      2025-05-11 14:30:05
【系统消息】用户主动结束了该会话
"""

    # 手动设置每次并发的温度值
    # manual_temperatures = [0.2, 0.4, 0.6, 0.8, 1, 1.4,1.8,2]
    # manual_temperatures = [0.2, 0.4, 0.6, 0.8, 1, 1.4, 2]
    manual_temperatures = [0.2, 0.5, 0.8, 1, 1.4, 2]
    # manual_temperatures = [0.2, 0.6, 0.8, 1.4, 2]
    # manual_temperatures = [0.2, 0.6, 1, 2]
    # manual_temperatures = [0.2, 0.8, 2] # 客服总结
    # manual_temperatures = [0.2, 2] # topk = 1

    
    # 执行多视角分析，将所有参数都放在函数调用中
    result = multi_perspective_analysis(
        metaprompt=metaprompt,
        p=len(manual_temperatures),  # 视角数量
        topk=2,  # 返回前2个视角
        temperature_settings=manual_temperatures,
        complexity_weight_ratio=0.6,  # 复杂度权重占比
        hidden_size=768,  # 隐藏层大小
        length_weight=0.4,  # 文本长度复杂度权重
        diversity_weight=0.5,  # 词汇多样性权重
        variance_weight=0.3  # 语义嵌入方差权重
    )

    # 输出结果（格式化JSON）
    print("\n=== 多视角分析最终结果 ===")
    print(json.dumps(result, ensure_ascii=False, indent=2))



=== 各视角分析结果 ===
视角1 temp=0.20
  {
  "order_number": "2025-05-08 21:25:59",
  "business_Number": "15767962194",
  "name": "",
  "contact_Phone": "15767962194",
  "user_feedback_issue": "用户反映新购买的号码卡到货后一直没信号，之前联系客服被要求再充值30元，但目前只有30元话费，用户认为购买卡的30元应该作为预存话费，但实际只有30元是充值的，存在疑问和不满。",
  "user_request": "用户希望确认购买卡的30元是否会被作为预存话费使用，以及当前话费金额是否合理，同时希望得到明确的解释和解决方案。",
  "cons_progress": "客服首先询问用户提供的号码和订单编号，确认用户通过小程序购买，随后查询发现话费余额为30元，解释为订单内的30元已激活充值。用户表示不理解，客服尝试转接省内客服核实，但用户未提供姓名和手机号，客服要求用户提供信息以便后续联系，并承诺48小时内通过电话告知处理结果。",
  "cardType": "充值"
}

视角2 temp=0.50
  ```json
{
  "order_number": "2025-05-08 21:25:59",
  "business_Number": "15767962194",
  "name": "",
  "contact_Phone": "15767962194",
  "user_feedback_issue": "用户反映购买的卡收到后一直没信号，客服让再充值30元，但用户认为买卡的30元应该作为预存话费，但目前只有30元话费，正常应为60元，质疑充值和买卡费用的使用问题。",
  "user_request": "用户希望确认买卡的30元是否会被作为预存话费使用，并希望解决当前话费金额不足的问题，同时希望得到明确的解释和处理结果。",
  "cons_progress": "客服首先询问用户提供的号码和订单编号，确认用户通过小程序购买，随后查询发现通用余额为0，专用余额为30元，解释为买卡费用已充值。用户质疑充值和买卡费用的用途，客服表示买卡费用已激活充值，但系统查询不到，随后转接省

In [21]:
import json
from pydantic import KafkaDsn
import torch
import concurrent.futures
import re
from transformers import AutoModel, AutoTokenizer

class HierarchicalAggregationLayer(torch.nn.Module):
    def __init__(self, hidden_size=768, num_perspectives=3, attn_smoothing=0.1):
        """
        分层聚合层：通过三级处理融合多视角特征
        1) 两两视角组合的初级聚合
        2) 所有组合结果的全局聚合 
        3) 原始视角的注意力加权聚合
        
        参数：
            hidden_size (int): 特征向量的维度（默认768）
            num_perspectives (int): 需要聚合的视角数量（默认3）
            attn_smoothing (float): 注意力权重的标签平滑系数（默认0.1）
        """
        super().__init__()
        self.num_perspectives = num_perspectives
        self.attn_smoothing = attn_smoothing
        
        # 第一级聚合器：处理所有视角的两两组合
        # 共需要n*(n-1)/2个聚合器（n=视角数量）
        self.pairwise_aggregators = torch.nn.ModuleList([
            torch.nn.Sequential(
                torch.nn.Linear(hidden_size * 2, hidden_size),  # 将两个视角拼接后线性变换
                torch.nn.LayerNorm(hidden_size),               # 层归一化稳定训练
                torch.nn.GELU()                                # 高斯误差线性单元激活
            )
            for _ in range(num_perspectives * (num_perspectives - 1) // 2)
        ])
        
        # 第二级聚合器：整合所有两两组合的结果
        num_pairwise = num_perspectives * (num_perspectives - 1) // 2
        self.global_aggregator = torch.nn.Sequential(
            torch.nn.Linear(hidden_size * num_pairwise, hidden_size * 2),  # 扩大维度增强表达能力
            torch.nn.LayerNorm(hidden_size * 2),                           # 归一化
            torch.nn.GELU(),                                               # 非线性激活
            torch.nn.Dropout(0.15),                                        # 随机失活防止过拟合
            torch.nn.Linear(hidden_size * 2, hidden_size)                  # 降维到原始维度
        )
        
        # 注意力机制：计算各原始视角的重要性权重
        self.attention = torch.nn.Sequential(
            torch.nn.Linear(hidden_size * num_perspectives, hidden_size),  # 压缩视角拼接信息
            torch.nn.LayerNorm(hidden_size),                               # 归一化
            torch.nn.GELU(),                                              # 激活函数
            torch.nn.Linear(hidden_size, num_perspectives)                 # 输出各视角权重
        )
        
        self.softmax = torch.nn.Softmax(dim=-1)  # 将权重归一化为概率分布
        
    def forward(self, encoded_responses):
        """
        前向传播过程
        
        参数：
            encoded_responses: 多个视角的特征列表，每个元素形状为[hidden_size]
        
        返回：
            final_output: 聚合后的最终特征 [1, hidden_size]
            weights: 各视角的注意力权重 [1, num_perspectives] 
        """
        # 将多个视角特征堆叠为张量 [num_perspectives, hidden_size]
        stacked = torch.stack(encoded_responses)  
        
        # 第一阶段：两两视角聚合
        pairwise_outputs = []
        idx = 0  # 用于选择对应的聚合器
        
        # 遍历所有独特的视角组合对
        for i in range(self.num_perspectives):
            for j in range(i + 1, self.num_perspectives):
                # 拼接两个视角特征 [1, hidden_size*2]
                pair = torch.cat([stacked[i], stacked[j]], dim=-1).unsqueeze(0)
                
                # 通过对应的聚合器处理
                pairwise_outputs.append(self.pairwise_aggregators[idx](pair))
                idx += 1
        
        # 第二阶段：全局聚合
        # 拼接所有两两聚合结果 [1, hidden_size*num_pairs]
        pairwise_concat = torch.cat(pairwise_outputs, dim=-1)
        
        # 生成全局聚合特征 [1, hidden_size]
        global_repr = self.global_aggregator(pairwise_concat)
        
        # 第三阶段：注意力权重计算
        # 展平所有原始视角特征 [1, num_perspectives*hidden_size]
        concat = stacked.view(1, -1)
        
        # 计算归一化注意力权重 [1, num_perspectives]
        weights = self.softmax(self.attention(concat))
        
        # 应用标签平滑（正则化技术）
        if self.attn_smoothing > 0:
            uniform_dist = 1 / self.num_perspectives  # 均匀分布
            weights = weights * (1 - self.attn_smoothing) + self.attn_smoothing * uniform_dist
        
        # 计算原始视角的加权和 [hidden_size]
        weighted_aggregation = torch.sum(
            stacked * weights.t().unsqueeze(-1),  # 加权
            dim=0
        )
        
        # 最终输出：全局特征 + 加权原始特征 [1, hidden_size]
        final_output = global_repr + weighted_aggregation.unsqueeze(0)
        
        return final_output, weights

def load_encoder_model():
    """加载预训练的BERT编码器和分词器"""
    model_name = "D:\\xiangyue\\model\\bert-base-chinese"
    return AutoModel.from_pretrained(model_name), AutoTokenizer.from_pretrained(model_name)

def encode_text(text, model, tokenizer):
    """
    将文本编码为向量表示
    使用BERT模型提取[CLS]标记作为文本的整体表示
    """
    inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=512)
    with torch.no_grad():  # 不计算梯度以提高推理效率
        # 提取[CLS]标记的嵌入作为文本表示
        return model(**inputs).last_hidden_state[:, 0, :].squeeze(0)

def process_perspective(index, question, encoder_model, tokenizer, llm, temperature=0.1):
    """
    处理单个视角：
    1. 调用大语言模型生成特定视角的回答
    2. 将回答编码为向量表示
    返回包含索引、回答文本和编码向量的元组
    
    参数:
        index: 视角索引
        question: 问题文本
        encoder_model: 编码器模型
        tokenizer: 分词器
        llm: 大语言模型调用函数
        temperature: 控制生成随机性的温度值
    """
    # 使用特定视角前缀提示大语言模型，并传入temperature参数
    response = llm(f"【换一种视角思考{index+1}】{question}", temperature=temperature)
    return index, response, encode_text(response, encoder_model, tokenizer)

def multi_perspective_analysis(metaprompt, p=3, topk=1, llm=None, temperature_settings=None):
    """
    多视角分析主函数：
    1. 并行生成多个视角的回答
    2. 对回答进行编码
    3. 使用增强聚合层计算各视角权重
    4. 选择权重最高的视角作为最终结果
    
    参数:
        metaprompt: 输入的问题/提示
        p: 视角数量
        topk: 返回topk个最佳视角
        llm: 大语言模型调用函数
        temperature_settings: 温度值设置，可以是单个值或长度为p的列表
    """
    # 如果未提供llm，则使用全局导入的llm_qwen
    if llm is None:
        llm = llm_qwen
    
    # 处理temperature设置
    if temperature_settings is None:
        temperatures = [0.1] * p  # 默认所有请求使用0.1
    elif isinstance(temperature_settings, (int, float)):
        temperatures = [temperature_settings] * p  # 单个值应用到所有请求
    elif isinstance(temperature_settings, (list, tuple)) and len(temperature_settings) == p:
        temperatures = temperature_settings  # 使用提供的温度列表
    else:
        raise ValueError("temperature_settings should be a single value or a list of length p")
    
    # 初始化聚合模型和编码器
    aggregation_model = HierarchicalAggregationLayer(hidden_size=768, num_perspectives=p)
    encoder_model, tokenizer = load_encoder_model()
    
    # 使用线程池并行处理多个，每个请求使用不同的temperature
    with concurrent.futures.ThreadPoolExecutor(max_workers=p) as executor:
        futures = [
            executor.submit(
                process_perspective, 
                i, 
                metaprompt, 
                encoder_model, 
                tokenizer, 
                llm, 
                temperatures[i]
            ) for i in range(p)
        ]
        results = [future.result() for future in futures]
    
    # 按索引排序确保顺序正确
    results.sort(key=lambda x: x[0])
    encoded_responses = [enc for _, _, enc in results]  # 提取编码向量
    response_texts = [resp for _, resp, _ in results]  # 提取回答文本
    for idx, (text, temp) in enumerate(zip(response_texts, temperatures), start=1):
        print(f"第{idx}个(temperature={temp:.2f})：{text}")
        
    if encoded_responses:
        # 聚合多视角信息并获取权重
        aggregated_output, weights = aggregation_model(encoded_responses)
        
        # 按权重排序视角
        sorted_items = sorted([(i, f"response_{i+1}", weights[0, i].item()) for i in range(p)], 
                             key=lambda x: x[2], reverse=True)
        
        # 获取topk视角
        top_indices = torch.topk(weights[0], topk).indices
        top_perspectives = [(f"response_{idx+1}", weights[0, idx].item(), response_texts[idx]) 
                           for idx in top_indices]
        
        # 构建最终标题（当前已注释掉）
        final_title = "\n".join(re.sub(r'【[^】]+】', '', content).strip() for _, _, content in top_perspectives)
        
        return {
            # "final_title": final_title,
            "top_perspectives": top_perspectives,
            # "temperature_settings": temperatures,  # 返回使用的温度设置
            # "all_weights": [(f"response_{i+1}", weights[0, i].item()) for i in range(p)]
        }
    return None


if __name__ == "__main__":
    
    
    metaprompt = """
任务： 从给定的客服对话记录中提取关键信息，并生成一个结构化的 JSON 格式输出。

要求：
1. 提取以下字段：
  order_number（从系统消息或用户反馈中查找办理业务订单号）
  business_Number（用户要办理的手机号）
  name（用户提供的姓名，区分客服的姓名，和用户的姓名）
  contact_Phone（用户提供的手机号）
  user_feedback_issue（用户的主要投诉或咨询内容，尽量详细，且要以客服的视角描述）
  user_request（用户希望解决的问题或需求，尽量详细，且要以客服的视角描述）
  cons_progress（工号xx开头的客服为用户查询了什么，和用户确认了什么，尽量详细）
  cardType（判断用户咨询的业务类型号的卡，必须是这些门类：充值 权益包 流量包 业务办理 不确定）
2. 确保 JSON 格式正确，字段值尽量从对话原文中提取
3. 如果没有输出为空值！！！
最终输出格式：
{
  "order_number": "",
  "business_Number": "",
  "name": "",
  "contact_Phone": "",
  "user_feedback_issue": "",
  "user_request": "",
  "cons_progress": "",
  "cardType": ""
}
下面是要处理的客服对话片段：

(系统消息)      2025-05-11 14:13:04
正在为您接入人工服务，请稍等；您也可以发送【00】退出服务
(系统消息)      2025-05-11 14:13:04
客户IM号码（TYMY_H5dq250511024844208）已关联号码（TYMY_H515767962194）
梁鑫一(95047)      2025-05-11 14:13:05
您好，感谢您的耐心等待，系统已为您接入人工服务。中国电信95047号客服为您服务。
(0)      2025-05-11 14:13:05
【系统消息】15767962194,null,null ; 不可办理5G升级包
(0)      2025-05-11 14:13:05
人工[文本]
(0)      2025-05-11 14:13:05
【系统消息】亲，您可以#LinkIDSwitchToCSR马上召唤人工客服为您服务。<br/>以下是小知经常回答的问题哦：<br/>[1]购买号卡后找不到订单<br/>[2]我的卡有余额但无法使用<br/>[3]我想换个套餐有什么推荐吗<br/>[4]携号转网问题<br/>[5]我的卡提示被保护，停机了[文本]
(0)      2025-05-11 14:13:05
【客服请回复】请及时答复用户问题
(0)      2025-05-11 14:13:27
这个卡购买卡的30块不会作为预存话费的吗[文本]
梁鑫一(95047)      2025-05-11 14:13:49
尊敬的用户您好！这里是中国电信网上营业厅人工客服，工号95047，请问您有什么问题需要帮助吗？我将尽力为您提供最优质的服务！
梁鑫一(95047)      2025-05-11 14:13:53
辛苦您方便提供一下收货号码或身份证号吗？
(0)      2025-05-11 14:14:04
15767962194[文本]
(0)      2025-05-11 14:15:18
我昨天号码卡到了，快递小哥开卡后一直没信号，我打电话你们客服，客服让我再充值30元，但是现在只有30块话费，正常来说不应该是60块话费吗？[文本]
梁鑫一(95047)      2025-05-11 14:15:30
亲，正在为您积极查询中，预计需要1到3分钟，请您稍等。 （正在为您查询~!这句无需回复喔~）
梁鑫一(95047)      2025-05-11 14:17:02
15767962194未查询到信息，您是通过什么渠道购买的呢？方便提供订单编号吗？
梁鑫一(95047)      2025-05-11 14:17:16
抱歉亲亲查询错误
(0)      2025-05-11 14:17:17
你们这个小程序啊[文本]
梁鑫一(95047)      2025-05-11 14:17:19
2025-05-08 21:25:59下单的这个吗？
(0)      2025-05-11 14:17:23
对啊[文本]
梁鑫一(95047)      2025-05-11 14:17:47
亲，请您稍等不要离开呦~我现在为您查询，谢谢亲的配合与理解。
梁鑫一(95047)      2025-05-11 14:18:01
通用可用余额: 0专用余额: 30
梁鑫一(95047)      2025-05-11 14:18:02
您好，为了您能得到更专业的服务，您所咨询的问题需要转到号码归属（省）专席为您跟进（以上对话记录也会一同转接），转接期间请勿退出，如线路繁忙，可以联系号码归属省10000万号，同意转接回复1
(0)      2025-05-11 14:18:38
怎么回事？[文本]
(0)      2025-05-11 14:18:48
我就是问你怎么话费只有30块啊[文本]
(0)      2025-05-11 14:19:05
这个卡是买卡的30块不是作为预存话费的吗？[文本]
梁鑫一(95047)      2025-05-11 14:19:10
话费是您订单内的30激活已充值
(0)      2025-05-11 14:19:13
听不懂话吗？[文本]
(0)      2025-05-11 14:19:22
那我买卡的30块呢[文本]
梁鑫一(95047)      2025-05-11 14:19:33
这个就是买卡的亲亲
梁鑫一(95047)      2025-05-11 14:19:40
激活中要求您充值的这边查询不到
梁鑫一(95047)      2025-05-11 14:19:41
为您转接省内客服为您核实看看好吗？
(0)      2025-05-11 14:19:57
买卡的钱不会变成话费的意思是吗？[文本]
梁鑫一(95047)      2025-05-11 14:20:52
会
梁鑫一(95047)      2025-05-11 14:20:55
已经到了亲亲
(0)      2025-05-11 14:21:02
并没有啊[文本]
(0)      2025-05-11 14:21:15
我现在的30块是后面充值的啊[文本]
(0)      2025-05-11 14:21:24
现在你们两边踢皮球还是怎么样[文本]
梁鑫一(95047)      2025-05-11 14:21:36
亲，您说的问题这边为您记录反馈，请您提供一下能联系到您的手机号和您的姓名，给您带来不便请您谅解，我们会通过电话的方式告知您处理结果，请您保持电话畅通
梁鑫一(95047)      2025-05-11 14:21:54
您激活充值的30 账单麻烦截图
(0)      2025-05-11 14:22:22
SVU2OE1NIXhqeFMhUyFPTyFYO05IT1lqak5jeFlPbUNR1007-100-100-11-lnsy.png
梁鑫一(95047)      2025-05-11 14:22:47
亲亲稍等加载图片看下
(0)      2025-05-11 14:22:55
昨天充值的，赶紧看怎么回事啊，不然我就工信局投诉你们欺骗消费者了[文本]
梁鑫一(95047)      2025-05-11 14:24:45
15767962194这个号码能联系到您吗？
(0)      2025-05-11 14:25:29
可以[文本]
梁鑫一(95047)      2025-05-11 14:25:51
您好，您反馈的问题，客服已反馈到相关部门，预计48小时内，我们的工作人员会使用4008开头的电话跟您15767962194的号码联系，请您保持电话畅通，感谢您的理解！
梁鑫一(95047)      2025-05-11 14:27:44
亲亲您还有其他需要帮助的吗？
(系统消息)      2025-05-11 14:29:45
请问您还在线吗？ 如随后2分钟仍未收到您的消息，本次会话将暂时结束；如您的问题已解决，可发送【00】结束本次会话。
(系统消息)      2025-05-11 14:29:45
用户2分钟未发言或回复消息，系统已向用户发送提示消息
(系统消息)      2025-05-11 14:30:05
【系统消息】用户主动结束了该会话
"""
    
    # 手动设置每次并发的温度值
    manual_temperatures = [0.2, 0.4, 0.6, 0.8, 1, 1.4,1.8,2]
    # manual_temperatures = [0.2, 0.4, 0.6, 0.8, 1, 1.4, 2]
    # manual_temperatures = [0.2, 0.5, 0.8, 1, 1.4, 2]
    # manual_temperatures = [0.2, 0.6, 0.8, 1.4, 2]
    # manual_temperatures = [0.2, 0.6, 1, 2]
    # manual_temperatures = [0.2, 0.8, 2] # 客服总结
    # manual_temperatures = [0.2, 2] # topk = 1

    result = multi_perspective_analysis(
        metaprompt, 
        p=len(manual_temperatures),  # 自动根据温度列表长度确定p值
        topk=2, 
        llm=llm_qwen, 
        temperature_settings=manual_temperatures  # 传入手动设置的温度列表
    )
    
    print(json.dumps(result, ensure_ascii=False, indent=2))  # 以JSON格式输出结果

第1个(temperature=0.20)：{
  "order_number": "2025-05-08 21:25:59",
  "business_Number": "15767962194",
  "name": "梁鑫一",
  "contact_Phone": "15767962194",
  "user_feedback_issue": "用户反映新购买的号码卡在激活后没有收到预存的30元话费，只收到30元充值的话费，认为购买卡的30元不应作为充值使用，而是应该作为预存话费，否则可能构成欺骗消费者行为。",
  "user_request": "用户希望确认购买卡的30元是否会被系统自动充值为话费，如果不会，希望得到明确解释，并希望尽快解决当前话费不足的问题，避免投诉。",
  "cons_progress": "客服首先尝试查询用户号码信息，但未找到相关记录，随后询问用户购买渠道和订单编号。用户提供了订单编号为2025-05-08 21:25:59，并说明是通过小程序购买。客服进一步确认用户号码的余额情况，发现通用余额为0，专用余额为30元，解释该30元是订单内的激活充值。用户表示不理解，要求截图充值记录，客服随后要求用户提供能联系到的手机号和姓名，并承诺48小时内通过电话联系用户解决。",
  "cardType": "充值"
}
第2个(temperature=0.40)：{
  "order_number": "2025-05-08 21:25:59",
  "business_Number": "15767962194",
  "name": "梁鑫一",
  "contact_Phone": "15767962194",
  "user_feedback_issue": "用户反映新购买的号码卡在激活后没有收到预存的30元话费，只收到了后续充值的30元，且对客服的解释表示不满，认为存在误导。",
  "user_request": "用户希望确认购买卡时的30元是否被正确预存为话费，并要求客服核实问题，避免因误解而引发投诉。",
  "cons_progress": "客服首先尝试查询用户号码信息，但未找到相关记录，随后询问用户购买渠道和订单编号。用户提供了订单时间，客服确认了订单信息，但系统显示通用余额为0，专用余额为30。客服解释该30

In [None]:
import torch
import concurrent.futures
import re
import json
from typing import List, Tuple, Dict, Optional
from openai import OpenAI

class EnhancedAggregationLayer(torch.nn.Module):
    """
    增强型聚合层，用于多视角响应的语义聚合
    融合ParScale技术的注意力平滑机制，提升多视角分析的稳定性
    """
    def __init__(self, hidden_size=768, num_perspectives=3, parscale_smoothing=0.1):
        """
        初始化聚合层
        
        Args:
            hidden_size: 编码器输出的隐藏层维度，默认768（BERT-base配置）
            num_perspectives: 多视角分析的视角数量，默认3个视角
            parscale_smoothing: ParScale注意力平滑系数，防止极端权重，默认0.1
        """
        super().__init__()
        self.num_perspectives = num_perspectives
        self.hidden_size = hidden_size
        self.parscale_smoothing = parscale_smoothing
        
        # 定义聚合网络结构：线性变换+层归一化+激活函数+Dropout+输出权重
        self.aggregate_layer = torch.nn.Sequential(
            torch.nn.Linear(hidden_size * num_perspectives, hidden_size),
            torch.nn.LayerNorm(hidden_size),
            torch.nn.SiLU(),  # 平滑激活函数，替代ReLU
            torch.nn.Dropout(0.1),  # 防止过拟合
            torch.nn.Linear(hidden_size, num_perspectives)
        )
        self.softmax = torch.nn.Softmax(dim=-1)  # 权重归一化
        
    def forward(self, encoded_responses):
        """
        前向传播：计算多视角响应的聚合权重和综合表示
        
        Args:
            encoded_responses: 各视角响应的编码向量列表，形状为[p, h]
        
        Returns:
            aggregated_output: 聚合后的综合向量，形状为[h]
            weights: 各视角的注意力权重，形状为[1, p]
        """
        stacked_responses = torch.stack(encoded_responses)  # 堆叠视角编码为[p, h]
        concat_responses = stacked_responses.view(1, -1)  # 拼接为[1, p*h]用于特征提取
        
        raw_weights = self.aggregate_layer(concat_responses)  # 计算原始权重
        weights = self.softmax(raw_weights)  # 权重归一化
        
        # 应用ParScale注意力平滑：防止某个视角权重过大
        if self.parscale_smoothing > 0:
            uniform_weight = 1.0 / self.num_perspectives
            weights = weights * (1 - self.parscale_smoothing) + self.parscale_smoothing * uniform_weight
        
        # 加权求和生成综合表示
        weighted_sum = torch.sum(stacked_responses * weights.t(), dim=0)  # [p, h] * [p, 1] 后求和
        return weighted_sum, weights


# 初始化OpenAI客户端，连接到本地Qwen模型服务
client = OpenAI(api_key="0", base_url="http://192.168.106.26:20000/v1")

def llm_qwen(prompt, model="Qwen3", temperature=0.7, top_p=0.8, max_tokens=1024):
    """
    调用Qwen模型API生成响应
    
    Args:
        prompt: 输入提示词
        model: 模型名称，默认Qwen3
        temperature: 生成温度，控制随机性，默认0.7
        top_p: 核采样参数，控制生成多样性，默认0.8
        max_tokens: 最大生成长度，默认1024
    
    Returns:
        模型生成的文本响应
    """
    chat_response = client.chat.completions.create(
        model=model,
        messages=[
            {"role": "user", "content": prompt},
        ],
        temperature=temperature,
        top_p=top_p,
        max_tokens=max_tokens,
    )
    return chat_response.choices[0].message.content


def load_encoder_model():
    """
    加载文本编码器模型（BERT-base）用于语义向量化
    
    Returns:
        model: BERT模型实例
        tokenizer: 对应的分词器
    """
    from transformers import AutoModel, AutoTokenizer
    model_name = "/app/sda1/xiangyue/model/bert-base-chinese"
    tokenizer = AutoTokenizer.from_pretrained(model_name)
    model = AutoModel.from_pretrained(model_name)
    return model, tokenizer


def encode_text(text, model, tokenizer):
    """
    将文本转换为语义向量表示（使用BERT的[CLS]标记）
    
    Args:
        text: 输入文本
        model: BERT模型实例
        tokenizer: 分词器实例
    
    Returns:
        文本的语义编码向量，形状为[hidden_size]
    """
    inputs = tokenizer(text, return_tensors="pt", truncation=True, max_length=512)
    with torch.no_grad():  # 推理时关闭梯度计算
        outputs = model(**inputs)
    # 使用BERT的第一个标记（[CLS]）作为整体语义表示
    return outputs.last_hidden_state[:, 0, :].squeeze(0)


def process_perspective(index, question, encoder_model, tokenizer, llm_qwen):
    """
    处理单个视角：生成响应并进行语义编码
    
    Args:
        index: 视角索引（从0开始）
        question: 分析问题
        encoder_model: 编码器模型
        tokenizer: 分词器
        llm_qwen: LLM调用函数
    
    Returns:
        index: 视角索引
        response: 模型生成的响应文本
        encoded_response: 响应的语义编码
    """
    # 为每个视角添加标识，引导模型从不同角度思考
    perspective_prompt = f"【视角{index+1}】{question}"
    response = llm_qwen(perspective_prompt)  # 调用Qwen模型生成响应
    encoded_response = encode_text(response, encoder_model, tokenizer)  # 编码响应文本
    return index, response, encoded_response


def multi_perspective_analysis(metaprompt, p=3, topk=1):
    """
    多视角分析主函数：生成多个视角响应并聚合分析结果
    
    Args:
        metaprompt: 元提示词（分析问题）
        p: 生成的视角数量，默认3个
        topk: 保留的关键视角数量，默认1个
    
    Returns:
        包含聚合结果、关键视角和所有视角权重的字典
    """
    # 初始化聚合模型与编码器
    aggregation_model = EnhancedAggregationLayer(hidden_size=768, num_perspectives=p)
    encoder_model, tokenizer = load_encoder_model()
    
    # 并行处理多个视角（使用线程池提高效率）
    with concurrent.futures.ThreadPoolExecutor(max_workers=p) as executor:
        futures = [
            executor.submit(
                process_perspective, i, metaprompt, encoder_model, tokenizer, llm_qwen
            )
            for i in range(p)
        ]
        # 收集所有视角的处理结果
        results = [future.result() for future in concurrent.futures.as_completed(futures)]
    
    # 按视角索引排序结果
    results.sort(key=lambda x: x[0])
    # 提取响应文本和编码向量
    responses = [(f"response_{i+1}", resp) for i, (_, resp, _) in enumerate(results)]
    encoded_responses = [enc for _, _, enc in results]
    response_texts = [resp for _, resp, _ in results]
    
    # 打印原始响应（调试和可视化）
    print("=== 原始响应 ===")
    for i, (key, response) in enumerate(responses):
        print(f"{key}: {response}")
    
    # 执行聚合逻辑（仅当有有效响应时）
    if encoded_responses:
        aggregated_output, weights = aggregation_model(encoded_responses)
        
        # 打印各视角的聚合权重
        print("\n=== 聚合权重 ===")
        for i, (key, _) in enumerate(responses):
            print(f"{key}: {weights[0, i].item():.4f}")
        
        # 获取权重最高的topk个视角
        top_weights, top_indices = torch.topk(weights[0], topk)
        print(f"\n=== Top {topk} 视角 ===")
        top_perspectives = []
        for i, idx in enumerate(top_indices):
            key = responses[idx][0]
            weight = top_weights[i].item()
            content = response_texts[idx]
            print(f"{key}: 权重={weight:.4f}\n内容: {content}")
            top_perspectives.append((key, weight, content))
        
        # 生成最终聚合结果（合并关键视角内容）
        final_title = "\n".join(re.sub(r'【[^】]+】', '', content).strip() for _, _, content in top_perspectives)
        print("\n=== 最终聚合结果 ===")
        print(final_title)
        
        return {
            "final_title": final_title,
            "top_perspectives": top_perspectives,
            "all_weights": [(responses[i][0], weights[0, i].item()) for i in range(p)]
        }
    else:
        print("没有有效的回答可供聚合")
        return None


if __name__ == "__main__":
    # 示例元提示词（空提示用于测试基本功能）
    metaprompt = """
/no_think
"""
    # 执行多视角分析（生成3个视角，保留1个关键视角）
    result = multi_perspective_analysis(metaprompt, p=3, topk=1)