<a href="https://colab.research.google.com/github/njucs/notebook/blob/master/LMM_Design_Patterns.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## LLM Design Patterns
- 模型响应太慢
    - 分层缓存 - Layered Caching
- 需要与已有系统整合
    - 工具利用 - Tool Use
    - 规则融合 - Blending Rules Based & Generative
- 问题过于复杂
    - 多步规划 - Planning
    - 多重解析 - Discriminate→Re-Compose→ReSolve→Re-Decompose (Dr3)
    - 记忆认知- Memory Cognition For LLM's
- 需要集合多个视角解决问题
    - 专家集成 - Multiplexing AI Agents For A Panel Of Experts
    - 群体智能 - Swarm Of Generative AI Agents
- 多功能性和适应性不足
    - 多任务微调 - Fine-Tuning LLM's For Multiple Tasks
    - 模块化组合 - Modular Monolith LLM Approach With Composability
- 输出质量和用户体验不可控
    - 知识库驱动 - Utilizing Knowledge Graphs with LLM's
    - 双模评估 - Red & Blue Team Dual-Model Evaluation

### 分层缓存 Layered Caching
![图片描述](https://drive.google.com/uc?id=1XntvJMky5BuZwp16Xo_-YlUJBkinHNH0)

In [1]:
import time
import datetime
import random
import os
import requests
import json

API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"

# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()
            return response.json()
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None


# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm

    def generate_response(self, input_text):
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return None

# 模拟缓存
class Cache:
    def __init__(self):
        self.cache = {}  # 使用字典存储缓存

    def check(self, query):
        """检查缓存，如果命中则返回缓存结果，否则返回 None"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 检查缓存：'{query}'")
        time.sleep(random.uniform(0.1, 0.3))
        if query in self.cache:
            print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 缓存命中：'{query}'")
            return self.cache[query]
        else:
            print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 缓存未命中：'{query}'")
            return None

    def store(self, query, result):
        """存储查询结果到缓存"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 存储缓存：查询：'{query}'，结果：'{result}'")
        self.cache[query] = result

# 模拟强大的LLM (GPT/Gemini)
class PowerfulLLM:
    def __init__(self, name, model):
        self.name = name
        self.model = model

    def generate_response(self, input_text):
        """模拟调用强大的LLM生成回复"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 强大的LLM '{self.name}' 处理输入：'{input_text}'")
        time.sleep(random.uniform(1, 2))
        prompt = f"请根据以下内容生成回复: '{input_text}'"
        return self.model.generate_response(prompt)


# 模拟专有的小型LLM
class SpecializedSmallLLM:
    def __init__(self, name, model):
        self.name = name
        self.model = model

    def fine_tune(self, input_text):
       """模拟专有小模型的微调"""
       print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 专有的小LLM '{self.name}' 根据输入进行微调：'{input_text}'")
       time.sleep(random.uniform(0.5, 1.0))
       return f"专有的小LLM '{self.name}' 微调完成"


    def generate_response(self, input_text):
        """模拟调用专有的小LLM生成回复"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 专有的小LLM '{self.name}' 处理输入：'{input_text}'")
        time.sleep(random.uniform(0.3, 0.8))
        prompt = f"请根据以下内容生成回复: '{input_text}'"
        return self.model.generate_response(prompt)



# 主流程
def process_query(query_type, query_text, cache, powerful_llm, specialized_llm):
  """处理不同类型的查询"""
  print(f">>> {query_type} 查询：'{query_text}'")

  if query_type == "initial":
      # 初始查询直接使用强大的LLM
      llm_response = powerful_llm.generate_response(query_text)
      cache.store(query_text, llm_response) # 同时存储到缓存
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 输出：{llm_response}")
      return llm_response
  elif query_type == "follow-up":
       # 后续查询先检查缓存
      cached_response = cache.check(query_text)
      if cached_response:
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 输出(缓存命中)：{cached_response}")
        return cached_response
      else:
           # 如果缓存未命中，使用强大的LLM， 并存入缓存
        llm_response = powerful_llm.generate_response(query_text)
        cache.store(query_text, llm_response)
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 输出(缓存未命中)：{llm_response}")
        return llm_response

  elif query_type == "new":
      # 新查询使用专有的小LLM，先进行微调
      specialized_llm.fine_tune(query_text)
      llm_response = specialized_llm.generate_response(query_text)
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 输出(新查询，使用专有LLM): {llm_response}")
      return llm_response
  else:
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 无效查询类型：'{query_type}'")
      return "无效查询类型"


def main():
    # 创建大模型调用器实例
    call_llm = CallLLM()
    llm_model = Model("THUDM/glm-4-9b-chat", call_llm)
    # 初始化组件
    cache = Cache()
    powerful_llm = PowerfulLLM("GPT/Gemini", llm_model)
    specialized_llm = SpecializedSmallLLM("专有的小LLM", llm_model)



    # 示例输入
    queries = [
        ("initial", "你好"),
        ("follow-up", "你好"),
        ("follow-up", "你叫什么名字？"),
        ("new", "翻译：今天天气不错"),
         ("follow-up", "你叫什么名字？"),# 测试缓存命中
        ("invalid", "test")
    ]

    for query_type, query_text in queries:
       process_query(query_type, query_text, cache, powerful_llm, specialized_llm)
       time.sleep(1)  # 加入时间间隔，方便观察输出

if __name__ == "__main__":
    main()

>>> initial 查询：'你好'
06:02:28: 强大的LLM 'GPT/Gemini' 处理输入：'你好'
06:02:30: 存储缓存：查询：'你好'，结果：'
你好！很高兴收到你的问候，有什么可以帮助你的吗？'
06:02:30: 输出：
你好！很高兴收到你的问候，有什么可以帮助你的吗？
>>> follow-up 查询：'你好'
06:02:31: 检查缓存：'你好'
06:02:31: 缓存命中：'你好'
06:02:31: 输出(缓存命中)：
你好！很高兴收到你的问候，有什么可以帮助你的吗？
>>> follow-up 查询：'你叫什么名字？'
06:02:32: 检查缓存：'你叫什么名字？'
06:02:33: 缓存未命中：'你叫什么名字？'
06:02:33: 强大的LLM 'GPT/Gemini' 处理输入：'你叫什么名字？'
06:02:35: 存储缓存：查询：'你叫什么名字？'，结果：'
您好！我是人工智能助手，很高兴为您服务，请问有什么可以帮助您的？'
06:02:35: 输出(缓存未命中)：
您好！我是人工智能助手，很高兴为您服务，请问有什么可以帮助您的？
>>> new 查询：'翻译：今天天气不错'
06:02:36: 专有的小LLM '专有的小LLM' 根据输入进行微调：'翻译：今天天气不错'
06:02:36: 专有的小LLM '专有的小LLM' 处理输入：'翻译：今天天气不错'
06:02:38: 输出(新查询，使用专有LLM): 
Translation: Today's weather is nice.
>>> follow-up 查询：'你叫什么名字？'
06:02:39: 检查缓存：'你叫什么名字？'
06:02:39: 缓存命中：'你叫什么名字？'
06:02:39: 输出(缓存命中)：
您好！我是人工智能助手，很高兴为您服务，请问有什么可以帮助您的？
>>> invalid 查询：'test'
06:02:40: 无效查询类型：'invalid'


### 工具利用 Tool Use
![图片描述](https://drive.google.com/uc?id=1UFLljvksBOc_MhxkYr25vxABvPKU2WN4)

In [None]:
# 参考前面 function call 课程内容

### 规则融合 Blending Rules Based & Generative
![图片描述](https://drive.google.com/uc?id=1yFkf7Xtq8x_IURgP6oBD61Istj5rg7JY)

In [3]:
'''
在这个场景中，我们的目标是创建一个智能系统，能够自动审查合同条款，并识别潜在的风险或问题：
1. 输入：合同文本。
2. 原始规则库：预先定义一些基本的合同审查规则，例如：
   - "必须包含合同双方的名称和地址"。
   - "合同中必须明确标明生效日期"。
   - "合同中必须包含违约责任条款"。
3. 规则引擎：检查合同文本是否符合预设的规则。
4. LLM生成规则：如果合同文本不符合现有规则，则使用 LLM 生成新的规则，例如：
   - “如果合同中缺少争议解决条款，则生成一条新的规则要求合同中必须包含争议解决条款”
   - “ 如果合同中没有明确规定保密义务，则生成一条新的规则要求合同中包含保密义务条款”。
5. 人工校对：将 LLM 生成的新规则交由律师或法律专家进行人工校对和审核。
6. 规则执行验证：验证新规则是否能够正确地识别问题，是否会产生误报。
7. 日志与反馈：将规则应用的情况记录下来，并根据验证结果调整规则。
'''

import time
import datetime
import random
import os
import requests

API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"

# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()
            return response.json()
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None


# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm

    def generate_response(self, input_text):
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return None


# 模拟原始规则库
class OriginalRuleBase:
   def __init__(self, name):
      self.name = name
      self.rules = [
        "必须包含合同双方的名称和地址",
         "合同中必须明确标明生效日期",
         "合同中必须包含违约责任条款"
      ] # 初始预填规则

   def get_all_rules(self):
      """获取所有规则"""
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 原始规则库 '{self.name}' 获取所有规则")
      return self.rules

   def update_rules(self, new_rule):
      """更新规则库"""
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 原始规则库 '{self.name}' 更新规则，新规则: '{new_rule}'")
      self.rules.append(new_rule)

# 模拟规则引擎
class RuleEngine:
    def __init__(self, name, original_rule_base):
        self.name = name
        self.rules = original_rule_base.get_all_rules() # 获取预填规则
        self.rule_counter = 0

    def apply_rules(self, input_text):
      """模拟规则引擎应用规则，如果匹配，返回True 和应用的规则，否则返回 False 和 None"""
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规则引擎 '{self.name}' 应用规则：输入：'{input_text}'")
      time.sleep(random.uniform(0.3, 0.8))
      for rule in self.rules:
        if rule in input_text:
            print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规则命中，规则：'{rule}'")
            self.rule_counter += 1
            return True, rule
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规则未命中")
      return False, None

    def adjust_rules(self, new_rule):
        """ 模拟调整规则"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规则引擎 '{self.name}' 调整规则，新规则：'{new_rule}'")
        self.rules.append(new_rule)


# 模拟生成式模型
class GenerativeModel:
    def __init__(self, name, model):
       self.name = name
       self.model = model

    def generate_rule(self, input_text):
      """模拟生成式模型，从输入生成规则"""
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 生成式模型 '{self.name}' 生成规则，基于输入：'{input_text}'")
      time.sleep(random.uniform(0.5, 1.5))
      prompt = f"""
         你是一位法律专家，请根据以下合同文本，生成一条新的合同审查规则，用于检查合同文本是否符合规范：
         合同文本：{input_text}
      """
      return f"基于合同文本：'{input_text}' 生成的规则： {self.model.generate_response(prompt)}"


# 模拟规则执行验证器
class RuleValidator:
   def __init__(self, name):
       self.name = name

   def validate(self, generated_rule):
       """模拟规则执行验证，返回规则是否有效"""
       print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规则执行验证器 '{self.name}' 验证规则: '{generated_rule}'")
       time.sleep(random.uniform(0.3, 0.8))
       if "必须包含" in generated_rule or "必须明确" in generated_rule:  # 简单模拟，如果包含 “必须” 字眼，则有效
           print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规则 '{generated_rule}' 有效")
           return True
       else:
           print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规则 '{generated_rule}' 无效")
           return False

# 模拟日志和反馈机制
class LogAndFeedback:
    def __init__(self, name):
         self.name = name
         self.logs = []

    def log(self, input_text, validation_result, rule=None):
      """记录日志和反馈信息"""
      log_entry = {
            "timestamp": datetime.datetime.now(),
            "input_text": input_text,
            "validation_result": validation_result,
            "rule": rule
        }
      self.logs.append(log_entry)
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 日志和反馈机制 '{self.name}' 记录日志: {log_entry}")

    def adjust_based_on_feedback(self, rule_engine):
      """根据反馈信息调整规则(简单模拟)"""
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 日志和反馈机制 '{self.name}' 根据反馈调整规则")
      if self.logs and any (not entry["validation_result"] for entry in self.logs): # 简单模拟，如果有无效规则，调整规则引擎
          rule_to_adjust = self.logs[-1]["rule"]
          if rule_to_adjust:
             rule_engine.adjust_rules(f"调整后的规则: '{rule_to_adjust}'")
          print(f"{datetime.datetime.now().strftime('%H:%M:%S')}:  根据反馈调整了规则引擎")
      else:
          print(f"{datetime.datetime.now().strftime('%H:%M:%S')}:  没有发现需要调整规则")

# 模拟人工校对
def manual_review(generated_rule):
    """模拟人工校对，可以返回一个新的规则或者修正后的规则"""
    print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 人工校对：'{generated_rule}'")
    time.sleep(random.uniform(0.5,1))
    if "保密" not in generated_rule:
        return f"人工校对后的规则: '{generated_rule}， 并且需要包含保密条款'"
    else:
        return generated_rule


# 主函数
def main():
    # 创建大模型调用器实例
    call_llm = CallLLM()
    llm_model = Model("THUDM/glm-4-9b-chat", call_llm)

    original_rule_base = OriginalRuleBase("原始规则库")
    rule_engine = RuleEngine("规则引擎", original_rule_base)
    generative_model = GenerativeModel("生成式模型", llm_model)
    rule_validator = RuleValidator("规则执行验证器")
    log_feedback = LogAndFeedback("日志与反馈机制")

    # 示例合同文本
    contracts = [
        "本合同由甲方XX公司和乙方YY公司于2024年1月1日签订。",
         "本合同由甲方XX公司和乙方YY公司于2024年1月1日签订。乙方有责任在收到货物后，有义务承担货物的责任",
         "本合同由甲方XX公司和乙方YY公司于2024年1月1日签订, 但是没有明确指出双方的联系方式。",
         "本合同由甲方XX公司和乙方YY公司于2024年1月1日签订, 并规定了双方的保密条款, 以及违约责任",
         "本合同由甲方XX公司和乙方YY公司于2024年1月1日签订。 但是合同中缺少争议解决条款。",
    ]

    for contract in contracts:
        print(f"\n{datetime.datetime.now().strftime('%H:%M:%S')}: 接收到合同文本：'{contract}'")

        # 1. 规则引擎应用规则
        rule_hit, applied_rule = rule_engine.apply_rules(contract)

        if rule_hit:
           # 规则命中，直接输出
           print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规则命中, 直接输出结果")
           log_feedback.log(contract, True, applied_rule)  # 记录命中规则的反馈
           print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规则引擎处理结果: '{contract}'")
        else:
           # 规则未命中，生成新的规则
          generated_rule = generative_model.generate_rule(contract)

          # 进行人工校对
          reviewed_rule = manual_review(generated_rule)

          # 规则执行验证
          validation_result = rule_validator.validate(reviewed_rule)
          if validation_result:
             rule_engine.adjust_rules(reviewed_rule) # 更新规则引擎
          log_feedback.log(contract, validation_result, reviewed_rule if validation_result else None)  # 记录反馈
          log_feedback.adjust_based_on_feedback(rule_engine)


          if validation_result:
              # 输出
              print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 新规则验证通过，输出结果")
              print(f"{datetime.datetime.now().strftime('%H:%M:%S')}:  规则引擎处理结果(新规则)：'{contract}'")
          else:
              print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 新规则验证未通过，输出结果")
              print(f"{datetime.datetime.now().strftime('%H:%M:%S')}:  规则引擎处理结果(新规则未通过)：'{contract}'")

        time.sleep(1)

if __name__ == "__main__":
    main()

06:21:13: 原始规则库 '原始规则库' 获取所有规则

06:21:13: 接收到合同文本：'本合同由甲方XX公司和乙方YY公司于2024年1月1日签订。'
06:21:13: 规则引擎 '规则引擎' 应用规则：输入：'本合同由甲方XX公司和乙方YY公司于2024年1月1日签订。'
06:21:13: 规则未命中
06:21:13: 生成式模型 '生成式模型' 生成规则，基于输入：'本合同由甲方XX公司和乙方YY公司于2024年1月1日签订。'
06:21:22: 人工校对：'基于合同文本：'本合同由甲方XX公司和乙方YY公司于2024年1月1日签订。' 生成的规则： 
合同审查规则：

1. 合同主体审查：
   - 确认甲方和乙方是否为合法注册的法人实体，具有签订合同的法律资格。
   - 核实甲方和乙方的名称、注册地址、法定代表人或授权代表等信息是否准确无误。

2. 合同签订日期审查：
   - 核实合同签订日期是否为2024年1月1日，确保日期准确无误。
   - 检查合同签订日期是否符合相关法律法规规定，如合同法、公司法等。

3. 合同内容审查：
   - 审查合同内容是否完整、明确，包括但不限于合同标的、数量、质量、价款或报酬、履行期限、地点和方式等。
   - 检查合同条款是否存在矛盾或遗漏，确保双方权利义务清晰。

4. 合同格式审查：
   - 确认合同格式规范，包括标题、编号、正文、附件等部分齐全。
   - 检查合同文本是否存在错别字、语法错误等问题。

5. 合同附件审查：
   - 审查合同附件是否与正文内容相符，附件内容应与合同标的、履行期限等相关。
   - 核实附件签署人身份及授权情况。

6. 合同签字盖章审查：
   - 检查甲方和乙方是否在合同上签字盖章，确保双方对合同内容达成一致意见。
   - 核实签字盖章人身份及授权情况。

7. 合同法律效力审查：
   - 审查合同是否符合我国相关法律法规的规定，确保合同的合法性。
   - 检查合同条款是否存在违反公序良俗的情况。

8. 其他特殊要求审查：
   - 根据具体情况，可能需要审查其他特殊要求，如保密条款、争议解决方式等。

以上八条为基本审查规则，具体可结合实际情况进行调整。'
06:21:22: 规则执行验证器 '规则执行验证器' 验证规则: '基于合同

### 多步规划 Planning
![图片描述](https://drive.google.com/uc?id=12y2AVBs81nfgPYwcYeJY-Sl8IHN7Hxrn)


In [12]:
import time
import datetime
import random
import os
import requests
import json

API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"

# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()
            return response.json()
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None

# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm

    def generate_response(self, input_text):
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return None

# 模拟外部工具
class ExternalTool:
    def __init__(self, name, description):
        self.name = name
        self.description = description

    def execute(self, input_data):
        """模拟执行工具，返回结果"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 执行工具 '{self.name}'，输入: '{input_data}'")
        time.sleep(random.uniform(0.5, 1.5))
        if self.name == "机票查询":
            return f"查询到从北京到上海的机票，价格大约1000元"
        elif self.name == "酒店查询":
            return f"查询到上海市中心的酒店，价格大约800元/晚"
        elif self.name == "景点查询":
            return f"查询到上海知名的景点，包括外滩，豫园，东方明珠"
        else:
             return f"工具 '{self.name}' 无法处理输入 '{input_data}'"

# 定义可用的工具
available_tools = [
    ExternalTool("机票查询", "查询机票信息"),
    ExternalTool("酒店查询", "查询酒店信息"),
    ExternalTool("景点查询", "查询景点信息")
]

# 任务规划器
class TaskPlanner:
    def __init__(self, name, model):
        self.name = name
        self.model = model

    def plan(self, user_request):
        """使用大模型进行任务规划，将用户请求分解为子任务"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 任务规划器 '{self.name}' 规划任务，用户请求：'{user_request}'")
        prompt = f"""你是一个旅行规划助手，请根据用户的请求，将其分解为一系列可执行的子任务，输出子任务列表，用逗号隔开。
        例如：
          用户请求：我想去北京玩三天
           你需要输出：确定旅行时间,查询机票,查询酒店,制定旅游路线
        用户请求：{user_request}
        """

        tasks_str = self.model.generate_response(prompt)
        if tasks_str:
            return [task.strip() for task in tasks_str.split(",")]
        else:
            return []

# 模型选择器
class ModelSelector:
  def __init__(self, name):
    self.name = name

  def select(self, task, available_tools):
    """根据任务选择合适的工具"""
    print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 模型选择器 '{self.name}' 选择工具，任务：'{task}'")
    if "机票" in task:
       return [tool for tool in available_tools if tool.name == "机票查询"][0]
    elif "酒店" in task:
       return [tool for tool in available_tools if tool.name == "酒店查询"][0]
    elif "景点" in task or "旅游路线" in task:
       return [tool for tool in available_tools if tool.name == "景点查询"][0]
    else:
       return None


# 任务执行器
class TaskExecutor:
  def __init__(self, name):
      self.name = name

  def execute(self, tool, input_data = None):
     """执行选择的工具，并返回结果"""
     print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 任务执行器 '{self.name}' 执行任务，工具：'{tool.name}'")
     if tool:
       return tool.execute(input_data)
     else:
         return "没有合适的工具来完成该任务"


# 响应生成器
class ResponseGenerator:
  def __init__(self, name, model):
    self.name = name
    self.model = model

  def generate(self, user_request, task_results):
      """使用大模型生成最终回复"""
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 响应生成器 '{self.name}' 生成回复，用户请求：'{user_request}'")
      prompt = f"""
        请根据以下用户请求和任务结果，生成一个完整的回复。
        用户请求: {user_request}
        任务结果：{task_results}
      """
      return self.model.generate_response(prompt)


# 主函数
def main():
    # 创建大模型调用器实例
    call_llm = CallLLM()
    llm_model = Model("THUDM/glm-4-9b-chat", call_llm)

    # 初始化组件
    task_planner = TaskPlanner("任务规划器", llm_model)
    model_selector = ModelSelector("模型选择器")
    task_executor = TaskExecutor("任务执行器")
    response_generator = ResponseGenerator("响应生成器", llm_model)

    # 获取用户输入
    user_input = "我想去上海玩三天"

    # 1. 任务规划
    tasks = task_planner.plan(user_input)
    print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 规划的任务： {tasks}")

    # 2. 任务执行
    task_results = []
    for task in tasks:
        tool = model_selector.select(task, available_tools)
        if tool:
           result = task_executor.execute(tool, task)
           task_results.append(result)
        else:
          task_results.append(f"找不到合适的工具处理任务:{task}")

    # 3. 响应生成
    final_response = response_generator.generate(user_input, task_results)
    print(f"\n{datetime.datetime.now().strftime('%H:%M:%S')}: 最终响应：{final_response}")



if __name__ == "__main__":
    main()

16:59:05: 任务规划器 '任务规划器' 规划任务，用户请求：'我想去上海玩三天'
16:59:06: 规划的任务： ['确定旅行时间', '查询机票', '查询酒店', '制定旅游路线']
16:59:06: 模型选择器 '模型选择器' 选择工具，任务：'确定旅行时间'
16:59:06: 模型选择器 '模型选择器' 选择工具，任务：'查询机票'
16:59:06: 任务执行器 '任务执行器' 执行任务，工具：'机票查询'
16:59:06: 执行工具 '机票查询'，输入: '查询机票'
16:59:07: 模型选择器 '模型选择器' 选择工具，任务：'查询酒店'
16:59:07: 任务执行器 '任务执行器' 执行任务，工具：'酒店查询'
16:59:07: 执行工具 '酒店查询'，输入: '查询酒店'
16:59:08: 模型选择器 '模型选择器' 选择工具，任务：'制定旅游路线'
16:59:08: 任务执行器 '任务执行器' 执行任务，工具：'景点查询'
16:59:08: 执行工具 '景点查询'，输入: '制定旅游路线'
16:59:08: 响应生成器 '响应生成器' 生成回复，用户请求：'我想去上海玩三天'

16:59:11: 最终响应：

您好！根据您的请求，我为您整理了以下信息：

**旅行时间**：目前还无法确定最合适的旅行时间，建议您根据个人日程安排来选择。

**机票信息**：从北京到上海的机票价格大约在1000元左右。

**酒店信息**：上海市中心的酒店价格大约在800元/晚。

**景点推荐**：在上海，您可以参观以下知名景点：
- 外滩
- 豫园
- 东方明珠

希望这些信息能帮助您规划愉快的上海之旅！如果您需要更多帮助或有其他具体问题，请随时告诉我。


### 多重解析 - Discriminate→Re-Compose→ReSolve→Re-Decompose (Dr3)
![图片描述](https://drive.google.com/uc?id=17N5FeE8SIUSpjO9n7cM-CfjjeLtmJ-t4)

In [None]:
# https://github.com/Gy915/Dr3.git

### 记忆认知 Memory Cognition For LLM’s
![图片描述](https://drive.google.com/uc?id=1aQRLlQER_MckkuKbwpwZdzQ-7Pum_VfD)


In [8]:
'''
1. 以电影推荐为场景，实现一个多轮对话过程
2. 每次大模型都会基于短期记忆库进行答复的生成
3. 每一轮对话的内容都会存储到长期记忆库中
4. 长期记忆库中的内容通过总结归纳，不断更新到短期记忆库中
5. 对话内容不会直接存在短期记忆库中，短期记忆库中存储的都是长期记忆库更新过来的信息
'''

import time
import datetime
import random
import os
import requests
import json

API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"

# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()
            return response.json()
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None

# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm

    def generate_response(self, input_text):
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return None

# 模拟大语言模型
class LargeLanguageModel:
    def __init__(self, name, model):
        self.name = name
        self.model = model

    def generate_response(self, input_text, short_term_memory=None):
        """模拟大语言模型生成回复，包含对短期记忆的使用"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 大语言模型 '{self.name}' 处理输入：'{input_text}'")
        time.sleep(random.uniform(0.5, 1.5))
        if short_term_memory and short_term_memory.query(input_text) :
          print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 大语言模型使用短期记忆: '{short_term_memory.query(input_text)}'")
          prompt = f"根据以下输入 '{input_text}' 和短期记忆 '{short_term_memory.query(input_text)}'， 生成回复"
          return self.model.generate_response(prompt)

        return self.model.generate_response(input_text) # 如果短期记忆是空，则直接使用输入

    def generate_information_for_memory(self,input_text):
        """模拟大语言模型生成可以存储到长期记忆中的信息，包括对话内容和用户偏好"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 大语言模型 '{self.name}' 生成可以存储到长期记忆的信息：'{input_text}'")
        prompt = f"请总结以下文本，提取用户可能偏好信息，并包括原对话内容，请输出JSON格式：'{input_text}'"
        return self.model.generate_response(prompt)


# 短期记忆库
class ShortTermMemory:
    def __init__(self):
        self.memory = []
        self.max_size = 3  # 设置短期记忆库的最大容量

    def store(self, information):
        """存储信息, 存储多条，超出最大限制则清除最旧的数据"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 短期记忆库存储信息：'{information}'")
        self.memory.append(information)
        if len(self.memory) > self.max_size:
            self.memory.pop(0) # 移除最老的记录

    def query(self, query_text):
        """查询信息"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 短期记忆库查询信息：'{query_text}'")
        if self.memory:
            combined_memory = " ".join(self.memory)
            return f"短期记忆：{combined_memory}"
        return None

    def update(self, information):
        """更新信息"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 短期记忆库更新信息，新的信息：'{information}'")
        self.memory.append(information)
        if len(self.memory) > self.max_size:
            self.memory.pop(0)

    def clear(self):
        """清理记忆"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 短期记忆库清理记忆")
        self.memory = []

# 长期记忆库（使用字典模拟）
class LongTermMemory:
    def __init__(self):
        self.memory = {}  # 使用字典，键为索引，值为信息

    def store(self, information):
      """存储信息，简单使用时间戳作为索引"""
      index = datetime.datetime.now().strftime("%Y%m%d%H%M%S%f")
      self.memory[index] = information
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 长期记忆库存储信息，索引为 '{index}'， 内容为：'{information}'")

    def retrieve(self, query):
        """根据查询语句，检索长期记忆"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 长期记忆库检索信息：'{query}'")
        if self.memory:
          for key, value in self.memory.items():
            if query in value:
                return value
          return None
        else:
            return None

    def index_and_query(self, query):
       """ 模拟索引和查询长期记忆，返回检索结果 """
       print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 长期记忆库索引并检索信息：'{query}'")
       result = self.retrieve(query)
       return result

# 总结器
class Summarizer:
    def __init__(self, name, model):
        self.name = name
        self.model = model

    def summarize(self, long_term_memory):
        """ 总结长期记忆，得到新的结论，并准备存储到长期记忆库"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 总结器 '{self.name}' 总结长期记忆库")
        time.sleep(random.uniform(0.5, 1.0))
        long_memory_content = list(long_term_memory.memory.values())
        if not long_memory_content:
          print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 总结器 '{self.name}' 没有发现可以总结的内容。")
          return None
        combined_memory = f"长期记忆: {' '.join(long_memory_content)}"
        prompt = f"请根据以下长期记忆的内容，提取出用户可能的偏好，并总结出新的结论，输出JSON格式：'{combined_memory}'"
        summary_result =  self.model.generate_response(prompt)
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 总结器 '{self.name}' 总结后的结果: {summary_result}")
        return summary_result

# 记忆评估器
class MemoryEvaluator:
    def __init__(self, name):
         self.name = name

    def evaluate(self, long_term_memory, short_term_memory):
       """评估长期记忆库有没有新增和用户偏好相关的知识，有的话，补充到短期记忆库"""
       print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 记忆评估器 '{self.name}' 评估长期记忆库")
       time.sleep(random.uniform(0.5, 1.0))
       if long_term_memory.memory:
           recent_memory_key = list(long_term_memory.memory.keys())[-1]
           recent_memory_value = long_term_memory.memory[recent_memory_key]
           if recent_memory_value:
                print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 记忆评估器 '{self.name}' 发现长期记忆库有新的用户偏好， 补充到短期记忆库")
                short_term_memory.update(recent_memory_value)  # 添加长期记忆信息到短期记忆
                return True
       print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 记忆评估器 '{self.name}' 没有发现新的用户偏好。")
       return False

# 初始化组件
def main():
    # 创建大模型调用器实例
    call_llm = CallLLM()
    llm_model = Model("THUDM/glm-4-9b-chat", call_llm)

    llm = LargeLanguageModel("电影推荐大语言模型", llm_model)
    short_term_memory = ShortTermMemory()
    long_term_memory = LongTermMemory()
    summarizer = Summarizer("电影推荐总结器", llm_model)
    memory_evaluator = MemoryEvaluator("电影推荐记忆评估器")

    # 主流程
    def process_input(input_text):
        """处理输入的整体流程"""
        print(f"\n{datetime.datetime.now().strftime('%H:%M:%S')}: 接收到输入: '{input_text}'")

        # 1. 使用大语言模型生成回复，尝试利用短期记忆
        llm_output = llm.generate_response(input_text, short_term_memory)

        # 2. 生成存储到长期记忆库的信息，包括对话内容和用户偏好信息
        long_term_memory_information = llm.generate_information_for_memory(input_text)
        long_term_memory.store(long_term_memory_information)

        # 3. 总结长期记忆，并存储到长期记忆
        summary_result = summarizer.summarize(long_term_memory)
        if summary_result:
            long_term_memory.store(summary_result) #  存储总结信息到长期记忆

        # 4.  记忆评估和更新
        memory_evaluator.evaluate(long_term_memory, short_term_memory)

        # 5. 输出
        print(f">>> 系统输出：{llm_output}")
        return llm_output

    # 示例输入 (连续的对话过程)
    inputs = [
        "我喜欢科幻电影，你能推荐一些吗？",
        "我最近看了《星际穿越》，觉得还不错，但是有点烧脑。",
        "有没有类似《星际穿越》但是情节简单一些的科幻片？",
        "我对莱昂纳多的电影挺感兴趣的，你知道他演过哪些科幻片吗？",
        "《盗梦空间》是不是他演的？",
        "除了他之外，你还推荐哪些演员演的科幻片？",
         "我想看一些喜剧片，有什么推荐？",
         "我喜欢那种轻松搞笑的，不要太无厘头的喜剧。",
        "我最近有点累，想看些放松心情的。",
        "听说诺兰导演的片子都挺有深度的，推荐一些他的喜剧片看看？",
        "之前推荐的那几部科幻片我都很喜欢，谢谢你！",
        "我现在想看点动画片了，你能给我推荐一些吗？",
         "我最近看了一部莱昂纳多演的喜剧片，很不错，你能根据我的偏好，推荐一些类似吗？",
        "我想知道莱昂纳多还演过哪些其他的喜剧片？",
        "能再推荐几部科幻片吗？",
         "除了科幻片，还有其他类型的片子吗"
    ]

    for input_text in inputs:
        print(f">>> 用户输入：{input_text}")
        process_input(input_text)
         # 模拟长期记忆库的查询，在每次处理输入之后
        long_term_query = llm.generate_information_for_memory(input_text)
        long_term_result = long_term_memory.index_and_query(long_term_query)
        if long_term_result:
          print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 长期记忆库的查询结果：'{long_term_result}'\n")
        else:
          print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 长期记忆库没有查询到相关结果\n")
        time.sleep(1)

if __name__ == "__main__":
    main()

>>> 用户输入：我喜欢科幻电影，你能推荐一些吗？

16:47:33: 接收到输入: '我喜欢科幻电影，你能推荐一些吗？'
16:47:33: 大语言模型 '电影推荐大语言模型' 处理输入：'我喜欢科幻电影，你能推荐一些吗？'
16:47:34: 短期记忆库查询信息：'我喜欢科幻电影，你能推荐一些吗？'
16:47:40: 大语言模型 '电影推荐大语言模型' 生成可以存储到长期记忆的信息：'我喜欢科幻电影，你能推荐一些吗？'
16:47:41: 长期记忆库存储信息，索引为 '20250111164741874625'， 内容为：'
```json
{
  "user_preference": "科幻电影",
  "original_dialog": "我喜欢科幻电影，你能推荐一些吗？"
}
```'
16:47:41: 总结器 '电影推荐总结器' 总结长期记忆库
16:47:45: 总结器 '电影推荐总结器' 总结后的结果: 
```json
{
  "user_preferences": {
    "genre": "Science Fiction",
    "activity": "movie watching",
    "interest": "recommendations"
  },
  "new_conclusion": {
    "user_is_likely_to_enjoy": {
      "media_type": "science fiction movies",
      "in_context_of": ["entertainment", "future-oriented themes"]
    },
    "user_is Seeking": {
      "content": ["movie recommendations", "sci-fi film suggestions"]
    }
  }
}
```
16:47:45: 长期记忆库存储信息，索引为 '20250111164745195499'， 内容为：'
```json
{
  "user_preferences": {
    "genre": "Science Fiction",
    "activity": "movie watching",


### 专家集成 Multiplexing AI Agents For A Panel Of Experts

![图片描述](https://drive.google.com/uc?id=1UGAWW6her0p4DCdj9ScGZnzIHDUDi5g2)

In [None]:
import time
import datetime
import random
import os
import requests
import json

API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"

# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()
            return response.json()
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None


# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm

    def generate_response(self, input_text):
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return None

# 模拟通用大语言模型
class GeneralLanguageModel:
    def __init__(self, name, model):
        self.name = name
        self.model = model

    def understand_context(self, input_text):
        """模拟通用大语言模型理解上下文，并确定需要哪些领域的信息"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 通用大语言模型 '{self.name}' 理解上下文：'{input_text}'")
        time.sleep(random.uniform(0.2, 0.5))

        prompt = f"""
            你是一个天气信息理解专家，你的任务是理解用户输入的query，并细化出回答这个问题需要得到哪些信息。
            请只返回需要的信息，信息之间用逗号隔开。如果不能识别，则返回空字符串。

             例如：
                 query: 北京市今天天气如何？
                 你需要返回：温度,湿度,风力风向,空气质量

                 query: 我想知道上海的PM2.5
                 你需要返回：空气质量

            现在请你输出：query: {input_text}
        """
        response = self.model.generate_response(prompt)
        if response:
          return response.strip()
        else:
           return ""


# 模拟小规模领域模型
class DomainSpecificModel:
    def __init__(self, name, domain):
        self.name = name
        self.domain = domain

    def process_input(self, input_text):
        """模拟特定领域模型处理输入，返回特定领域的模拟数据"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 领域模型 '{self.name}' 处理输入：'{input_text}'")
        time.sleep(random.uniform(0.3, 0.8))
        if self.domain == "温度":
          return  f"温度25度"
        elif self.domain == "湿度":
          return  f"湿度60%"
        elif self.domain == "风力风向":
          return f"风力3级，东南风"
        elif self.domain == "空气质量":
           return f"空气质量良好，PM2.5为30"
        else:
           return f"未知领域模型输出"

# 模拟综合输出
class OutputSynthesizer:
  def __init__(self, name):
    self.name = name

  def synthesize(self, outputs):
    """综合不同模型的输出"""
    print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 综合输出器 '{self.name}' 综合输出：'{outputs}'")
    time.sleep(random.uniform(0.3, 0.7))
    if not outputs:
        return "没有任何输出"
    if len(outputs) == 1:
      return f"综合输出: {outputs[0]}"
    else:
      return f"综合输出：{', '.join([f'{output}' for idx, output in enumerate(outputs)])}"


# 定义主函数
def main():
    # 创建大模型调用器实例
    call_llm = CallLLM()
    llm_model = Model("THUDM/glm-4-9b-chat", call_llm)


    # 初始化通用大语言模型
    general_model = GeneralLanguageModel("通用大语言模型", llm_model)

    # 初始化领域模型
    domain_models = {
        "温度": DomainSpecificModel("温度模型", "温度"),
        "湿度": DomainSpecificModel("湿度模型", "湿度"),
        "风力风向": DomainSpecificModel("风力风向模型", "风力风向"),
          "空气质量": DomainSpecificModel("空气质量模型", "空气质量")
    }

    # 初始化综合输出器
    synthesizer = OutputSynthesizer("综合输出器")

    # 示例输入
    input_text = "南京市明天天气怎么样"

    print(f"\n{datetime.datetime.now().strftime('%H:%M:%S')}: 用户输入: '{input_text}'")

    # 1. 使用通用模型理解上下文
    required_info = general_model.understand_context(input_text)
    print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 通用模型分析得到所需信息：{required_info}")

    # 2. 特定领域模型处理
    outputs = []
    for info_type in required_info.split(","):
        info_type = info_type.strip()
        if info_type in domain_models:
            domain_output = domain_models[info_type].process_input(input_text)
            outputs.append(domain_output)
        else:
          print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 未能识别的信息：'{info_type}'，跳过处理")


    # 3. 综合输出
    final_output = synthesizer.synthesize(outputs)

    print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 最终输出: '{final_output}'")
    time.sleep(1)


if __name__ == "__main__":
    main()


15:37:33: 用户输入: '南京市明天天气怎么样'
15:37:33: 通用大语言模型 '通用大语言模型' 理解上下文：'南京市明天天气怎么样'
15:37:36: 通用模型分析得到所需信息：天气,温度,湿度,风力风向
15:37:36: 未能识别的信息：'天气'，跳过处理
15:37:36: 领域模型 '温度模型' 处理输入：'南京市明天天气怎么样'
15:37:36: 领域模型 '湿度模型' 处理输入：'南京市明天天气怎么样'
15:37:37: 领域模型 '风力风向模型' 处理输入：'南京市明天天气怎么样'
15:37:37: 综合输出器 '综合输出器' 综合输出：'['温度25度', '湿度60%', '风力3级，东南风']'
15:37:38: 最终输出: '综合输出：温度25度, 湿度60%, 风力3级，东南风'


### 群体智能 Swarm Of Generative AI Agents

![图片描述](https://drive.google.com/uc?id=1Cuf13olacW6rNR0ZLBy4TGTWunfIQXRj)



In [None]:
import time
import datetime
import random
import os
import requests
import json


API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"


# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()
            return response.json()
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None

# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm

    def generate_response(self, input_text):
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return None

# 定义智能体
class TranslationReviewAgent:
    def __init__(self, name, preference, llm_model):
        self.name = name
        self.preference = preference # 偏好，例如侧重于“流畅”，“准确”，“风格”
        self.llm_model = llm_model

    def evaluate_translation(self, input_text, translation_output):
      """
       评估翻译输出，根据偏好返回不同的输出
      """
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 翻译评价智能体 '{self.name}' (偏好：{self.preference}) 评估翻译：'{translation_output}'")
      time.sleep(random.uniform(0.3, 0.8))
      prompt = f"""
         你是一位专业的翻译评价专家，你擅长从不同的角度评估翻译的质量。
         现在，你需要评估以下翻译结果：'{translation_output}'， 原始文本为：'{input_text}'。
        你的偏好是 '{self.preference}'。 请根据你的偏好给翻译输出打分，并给出你的评价和改进建议。
        请使用以下格式输出：

        评分： （0-10， 10为满分）
        评价：（基于你的偏好给出的评价）
        改进建议： （针对翻译的改进建议）
      """
      return f"翻译评价智能体 '{self.name}' (偏好：{self.preference}) 的评价： \n {self.llm_model.generate_response(prompt)}"

# 模拟智能体路由
class AgentRouter:
  def __init__(self, name):
        self.name = name

  def route(self, input_text, available_agents):
      """模拟智能体路由，根据输入选择合适的智能体处理， 这里返回所有的智能体"""
      print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 智能体路由 '{self.name}' 路由输入：'{input_text}'")
      time.sleep(random.uniform(0.2, 0.5))
      return available_agents

# 模拟共识层
class ConsensusLayer:
  def __init__(self, name, llm_model):
     self.name = name
     self.llm_model = llm_model

  def aggregate(self, agent_outputs):
       """模拟共识层集成，将多个智能体的输出进行整合"""
       print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 共识层 '{self.name}' 集成输出：'{agent_outputs}'")
       time.sleep(random.uniform(0.3, 0.7))
       if not agent_outputs:
          return "没有智能体的输出"
       prompt = f"""
          你是一个翻译评估的共识专家，你的任务是综合以下多个翻译评价专家的反馈，形成一个共识的输出：
          {agent_outputs}
          你的职责是综合所有专家的评价，给出总体的评分，并给出最终的改进建议。
          输出格式请使用以下格式：

          共识评分： （0-10， 10为满分）
          共识评价： （所有专家的共识意见）
          共识改进建议：（总体的改进建议）
       """
       return f"共识层 '{self.name}'的输出：\n{self.llm_model.generate_response(prompt)}"

# 模拟反馈机制
class FeedbackMechanism:
    def __init__(self, name):
        self.name = name
        self.logs = []

    def record_feedback(self, final_output, input_text):
        """记录反馈信息"""
        feedback_entry = {
            "timestamp": datetime.datetime.now(),
            "input_text": input_text,
            "output": final_output,
        }
        self.logs.append(feedback_entry)
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 反馈机制 '{self.name}' 记录反馈：{feedback_entry}")

    def adjust_strategy(self, consensus_layer):
        """根据反馈信息调整共识策略（简单模拟）"""
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 反馈机制 '{self.name}' 根据反馈调整共识策略")
        if self.logs and any("1/" in entry["output"] for entry in self.logs): # 如果共识结果中有1分， 则认为共识过程出现问题
          print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 反馈机制 '{self.name}' 发现共识层可能出现问题， 调整共识层")
          consensus_layer.aggregate(f"使用更严格的共识策略") #这里只是简单模拟，实际可以有更复杂的调整机制
        else:
          print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 反馈机制 '{self.name}': 没有发现共识层需要调整")


# 定义主函数
def main():
    # 创建大模型调用器实例
    call_llm = CallLLM()
    llm_model = Model("THUDM/glm-4-9b-chat", call_llm)

    # 初始化智能体
    agents = [
        TranslationReviewAgent("流畅评价智能体", "流畅", llm_model),
        TranslationReviewAgent("准确评价智能体", "准确", llm_model),
        TranslationReviewAgent("风格评价智能体", "风格", llm_model),
        TranslationReviewAgent("全面评价智能体", "全面", llm_model)
    ]

    # 初始化智能体路由
    router = AgentRouter("智能体路由")

    # 初始化共识层
    consensus_layer = ConsensusLayer("共识层", llm_model)

    # 初始化反馈机制
    feedback = FeedbackMechanism("反馈机制")

    # 示例输入
    inputs = [
        ("我喜欢编程，编程使我快乐", "I like program and it let me happy."),
        ("这是一个非常复杂的句子，需要高质量的翻译", "This is a very complicated sentence need high quality translate"),
        ("计算机程序设计是一项富有挑战性，同时又充满乐趣的智力活动", "Computer programming design is a challenging, but also fun intellectual activity."),
        ("今天天气真好，我想出去玩", "The weather is very good today, I'm thinking to go play outside.")
    ]

    for input_text, translation_output in inputs:
        print(f"\n{datetime.datetime.now().strftime('%H:%M:%S')}:  用户输入：'{input_text}', 翻译输出： '{translation_output}'")

        # 1. 智能体路由
        selected_agents = router.route(input_text, agents)

        # 2. 每个智能体处理输入, 生成评价结果
        agent_outputs = [agent.evaluate_translation(input_text, translation_output) for agent in selected_agents]

        # 3. 共识层集成
        consensus_output = consensus_layer.aggregate(agent_outputs)
        print(f"{datetime.datetime.now().strftime('%H:%M:%S')}: 共识层输出：{consensus_output}")
        # 4.  反馈
        feedback.record_feedback(consensus_output, input_text)
        feedback.adjust_strategy(consensus_layer)
        time.sleep(1) #加入时间间隔

if __name__ == "__main__":
    main()


12:22:08:  用户输入：'我喜欢编程，编程使我快乐', 翻译输出： 'I like program and it let me happy.'
12:22:08: 智能体路由 '智能体路由' 路由输入：'我喜欢编程，编程使我快乐'
12:22:09: 翻译评价智能体 '流畅评价智能体' (偏好：流畅) 评估翻译：'I like program and it let me happy.'
12:22:13: 翻译评价智能体 '准确评价智能体' (偏好：准确) 评估翻译：'I like program and it let me happy.'
12:22:17: 翻译评价智能体 '风格评价智能体' (偏好：风格) 评估翻译：'I like program and it let me happy.'
12:22:20: 翻译评价智能体 '全面评价智能体' (偏好：全面) 评估翻译：'I like program and it let me happy.'
12:22:24: 共识层 '共识层' 集成输出：'['翻译评价智能体 \'流畅评价智能体\' (偏好：流畅) 的评价： \n \n评分： 4/10\n\n评价： 翻译在传达原意方面做得不错，但存在语法错误和不够流畅的问题。\n\n改进建议：\n1. 语法方面，可以将句子改为 "I like programming, and it makes me happy." 这样更符合英语的语法结构。\n2. 流畅度方面，可以适当调整词汇和句子结构，使翻译更加自然。例如，可以将 "program" 改为 "programming"，因为 "like programming" 是一个固定的搭配，表示喜欢编程这项活动。同时，将 "let me happy" 改为 "makes me happy"，这样更符合英语表达习惯。', '翻译评价智能体 \'准确评价智能体\' (偏好：准确) 的评价： \n \n评分： 4/10\n\n评价：翻译结果在准确性和流畅性上都有所欠缺。虽然基本传达了原文的意思，但使用了不自然的英语表达。\n\n改进建议：\n1. 将“我喜欢编程”翻译为 "I enjoy programming" 或 "I like programming"，这样更加符合英语表达习惯。\n2. 将“编程使我快乐”翻译为 "

### 多任务微调 Fine-Tuning LLM's For Multiple Tasks (null)

![图片描述](https://drive.google.com/uc?id=1R6fSbVBAY93MKkGo7bJxgPn4fG_iW0Qk)


### 模块化组合 Modular Monolith LLM Approach With Composability

![图片描述](https://drive.google.com/uc?id=1uTF3Lv457E4-hkeIBEdUvsrl7gCqA46Q)

In [None]:
import time
import datetime
import random
import os
import requests

API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"

# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()
            return response.json()
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None

# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm

    def generate_response(self, input_text):
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return "API调用出错或者没有返回文本"

# 模拟独立功能智能体
class IndependentAgent:
    def __init__(self, name, expertise, llm_model):
        self.name = name
        self.expertise = expertise
        self.llm_model = llm_model

    def process_input(self, input_text):
        """模拟独立智能体处理输入，根据专业领域返回不同的输出"""
        print(f">>> 独立智能体 '{self.name}' 处理输入：'{input_text}'")
        time.sleep(random.uniform(0.3, 0.8))
        if self.expertise == "古诗":
           related_prompt = f"请仅提取出以下内容中关于诗词写作的要求，其他部分忽略：{input_text}"
           related_input = self.llm_model.generate_response(related_prompt)
           prompt = f"请用古诗的形式表达以下内容：{related_input}"
           return f"独立智能体 '{self.name}' (古诗专家)： \n {self.llm_model.generate_response(prompt)}"
        elif self.expertise == "笑话":
             related_prompt = f"请仅提取出以下内容中关于讲笑话的要求，其他部分忽略：{input_text}"
             related_input = self.llm_model.generate_response(related_prompt)
             prompt = f"请讲一个关于 {related_input} 的笑话"
             return  f"独立智能体 '{self.name}' (笑话专家)：\n {self.llm_model.generate_response(prompt)}"
        elif self.expertise == "翻译":
           related_prompt = f"请仅提取出以下内容中关于翻译的要求，其他部分忽略：{input_text}"
           related_input = self.llm_model.generate_response(related_prompt)
           prompt = f"请将以下中文翻译成法语：{related_input}"
           return  f"独立智能体 '{self.name}' (翻译专家)：\n{self.llm_model.generate_response(prompt)}"
        else:
            return f"独立智能体 '{self.name}': 无法处理该输入"

# 模拟智能体选择器
class AgentSelector:
    def __init__(self, name, llm_model):
        self.name = name
        self.selection_strategy = "simple"  # 默认选择策略
        self.llm_model = llm_model

    def select_agents(self, input_text, available_agents):
        """模拟智能体选择，根据输入选择合适的智能体处理"""
        print(f">>> 智能体选择器 '{self.name}' 根据输入选择智能体：'{input_text}'")
        time.sleep(random.uniform(0.2, 0.5))
        if self.selection_strategy == "simple":
            prompt = f"请根据以下文本'{input_text}'，选择最合适的独立智能体，备选智能体包括：古诗智能体, 笑话智能体, 翻译智能体。请返回选择的智能体名称。"
            selected_agent_name = self.llm_model.generate_response(prompt)
            selected_agents = []
            for agent in available_agents:
                if agent.expertise in selected_agent_name:
                    selected_agents.append(agent)
            if selected_agents:
                return selected_agents
            else:
                return [random.choice(available_agents)]
        else:
          prompt = f"请根据以下文本'{input_text}'，选择一个或多个合适的独立智能体，备选智能体包括：古诗智能体, 笑话智能体, 翻译智能体。请返回选择的智能体名称"
          selected_agent_name = self.llm_model.generate_response(prompt)
          selected_agents = []
          for agent in available_agents:
             if agent.expertise in selected_agent_name:
                selected_agents.append(agent)
          if selected_agents:
                return selected_agents
          else:
               return [random.choice(available_agents)]

    def adjust_selection_strategy(self, feedback_result):
      """根据反馈结果调整选择策略（简单模拟）"""
      print(f">>> 智能体选择器 '{self.name}' 根据反馈调整选择策略")
      time.sleep(random.uniform(0.2,0.5))
      if "错误" in feedback_result:
         print(f">>> 智能体选择器 '{self.name}': 发现错误，将选择策略设置为更加复杂的选择策略(实际中可以使用更复杂的策略)")
         self.selection_strategy = "complex" # 这里只是简单地修改一个参数，实际可以使用更复杂的策略
      else:
         print(f">>> 智能体选择器 '{self.name}': 没有发现错误，维持当前的选择策略")


# 模拟输出集成器
class OutputAggregator:
    def __init__(self, name):
        self.name = name

    def aggregate(self, agent_outputs):
        """模拟输出集成，将多个智能体的输出进行整合"""
        print(f">>> 输出集成器 '{self.name}' 集成输出：'{agent_outputs}'")
        time.sleep(random.uniform(0.3, 0.7))
        if not agent_outputs:
           return "没有智能体的输出"
        elif len(agent_outputs) == 1:
            return agent_outputs[0]
        else:
            return f"集成输出：\n{', '.join([f'{idx+1}: {output}' for idx, output in enumerate(agent_outputs)])}"

# 模拟统一输出
class UnifiedOutput:
  def __init__(self, name, llm_model):
    self.name = name
    self.llm_model = llm_model

  def generate_unified_output(self, input_text, aggregated_output):
    """模拟生成统一的输出"""
    prompt = f"基于输入'{input_text}'以及多个智能体的输出：'{aggregated_output}'，综合生成一段针对输入的回复"
    unified_output = self.llm_model.generate_response(prompt)
    print(f">>> 最终输出: \n{unified_output}")
    return unified_output

# 模拟反馈机制
class FeedbackMechanism:
  def __init__(self, name):
    self.name = name
    self.logs = []

  def record_feedback(self, final_output, input_text):
      """记录性能反馈"""
      feedback_entry = {
          "timestamp": datetime.datetime.now(),
          "input_text": input_text,
          "output": final_output,
      }
      self.logs.append(feedback_entry)
      print(f"\n>>> 反馈机制 '{self.name}' 记录反馈：{feedback_entry}")

  def get_feedback_result(self):
     """简单根据是否有输出错误来返回反馈结果"""
     if self.logs and any("无法处理" in entry["output"] for entry in self.logs):
          return "输出包含错误"
     else:
          return "输出正确"

# 初始化组件
call_llm = CallLLM()
llm_model = Model("THUDM/glm-4-9b-chat", call_llm) # 使用同一个大模型
agents = [
    IndependentAgent("古诗智能体", "古诗", llm_model),
    IndependentAgent("笑话智能体", "笑话", llm_model),
    IndependentAgent("翻译智能体", "翻译", llm_model)
]

selector = AgentSelector("智能体选择器", llm_model)
aggregator = OutputAggregator("输出集成器")
unified_output = UnifiedOutput("统一输出器", llm_model)
feedback = FeedbackMechanism("反馈机制")

# 主流程
def process_input(input_text):
    """处理输入的整体流程"""
    print(f">>> 接收到输入：'{input_text}'")

    # 1. 智能体选择
    selected_agents = selector.select_agents(input_text, agents)


    # 2. 每个智能体处理输入
    agent_outputs = [agent.process_input(input_text) for agent in selected_agents]


    # 3. 输出集成
    aggregated_output = aggregator.aggregate(agent_outputs)

    # 4. 统一输出
    final_output = unified_output.generate_unified_output(input_text, aggregated_output)

    # 5. 反馈
    feedback.record_feedback(final_output, input_text)
    feedback_result = feedback.get_feedback_result()
    selector.adjust_selection_strategy(feedback_result)

    return final_output

# 示例输入
inputs = [
    "请用古诗的形式描述一下秋天的景色",
     "讲一个关于猫的笑话",
     "将今天天气真好翻译成法语",
     "请用古诗的形式描述一下猫，并且讲一个关于猫的笑话", # 测试多个智能体
     "请用古诗的形式描述一下猫, 讲一个关于猫的笑话并且将今天天气真好翻译成法语", # 测试多个智能体
]


for input_text in inputs:
    process_input(input_text)
    label = "例子分隔符"
    print(f"\n{'-'*10} {label} {'-'*10}\n")
    time.sleep(1)

>>> 接收到输入：'请用古诗的形式描述一下秋天的景色'
>>> 智能体选择器 '智能体选择器' 根据输入选择智能体：'请用古诗的形式描述一下秋天的景色'
>>> 独立智能体 '古诗智能体' 处理输入：'请用古诗的形式描述一下秋天的景色'
>>> 输出集成器 '输出集成器' 集成输出：'["独立智能体 '古诗智能体' (古诗专家)： \n \n秋风送爽入园林，\n落叶纷飞舞翩跹。\n碧水静流映晴空，\n红叶满山染秋颜。\n\n霜重露浓花渐稀，\n菊黄梅瘦映斜阳。\n诗心独醉寻幽径，\n秋意渐浓画中藏。"]'
>>> 最终输出: 


秋风送爽，园林深处，独立智能体与古诗智能体共同描绘出一幅秋日画卷。古诗专家以诗意的笔触，将秋天的景色娓娓道来：

秋风送爽入园林，
落叶纷飞舞翩跹。
碧水静流映晴空，
红叶满山染秋颜。

霜重露浓花渐稀，
菊黄梅瘦映斜阳。
诗心独醉寻幽径，
秋意渐浓画中藏。

此情此景，令人陶醉，仿佛置身于秋天的诗画之中。
>>> 反馈机制 '反馈机制' 记录反馈：{'timestamp': datetime.datetime(2025, 1, 8, 5, 2, 47, 314693), 'input_text': '请用古诗的形式描述一下秋天的景色', 'output': '\n\n秋风送爽，园林深处，独立智能体与古诗智能体共同描绘出一幅秋日画卷。古诗专家以诗意的笔触，将秋天的景色娓娓道来：\n\n秋风送爽入园林，\n落叶纷飞舞翩跹。\n碧水静流映晴空，\n红叶满山染秋颜。\n\n霜重露浓花渐稀，\n菊黄梅瘦映斜阳。\n诗心独醉寻幽径，\n秋意渐浓画中藏。\n\n此情此景，令人陶醉，仿佛置身于秋天的诗画之中。'}
>>> 智能体选择器 '智能体选择器' 根据反馈调整选择策略
>>> 智能体选择器 '智能体选择器': 没有发现错误，维持当前的选择策略

---------- 例子分隔符 ----------

>>> 接收到输入：'讲一个关于猫的笑话'
>>> 智能体选择器 '智能体选择器' 根据输入选择智能体：'讲一个关于猫的笑话'
>>> 独立智能体 '笑话智能体' 处理输入：'讲一个关于猫的笑话'
>>> 输出集成器 '输出集成器' 集成输出：'["独立智能体 '笑话智能体' (笑话专家)：\n \n有一天，一只猫走进了一家餐厅，对服务员说：“请

### 知识库驱动 Utilizing Knowledge Graphs with LLM's

![图片描述](https://drive.google.com/uc?id=112Epf5e4OteOGRREvCZUqQa92pSz2eoW)


In [None]:
# 直接拼接知识文本，相当于RAG

import os
import requests
import json

API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"

# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()  # 检查 HTTP 错误状态码
            return response.json()  # 返回JSON
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None # API错误时，返回None

# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm # 依赖注入

    def generate_response(self, input_text):
        # 处理输入并生成中间输出
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return "API调用出错或者没有返回文本"

def main():
    knowledge_graph = KnowledgeGraph()

    # 创建大模型调用器实例
    call_llm = CallLLM()
    llm_model = Model("THUDM/glm-4-9b-chat", call_llm)

    question = "张四丰是哪里人？"
    print("开始提问：", question)

    print("知识图谱更新前：")
    answer = llm_model.generate_response(question)
    print(answer)

    print("大模型回答错误，开始学习新知识...")

    text = """
    张四丰，1985年出生于中国浙江省杭州市的一个书香门第。
    自幼受到家庭浓厚文化氛围的熏陶，对传统文化和艺术有着深厚的兴趣。
    张四丰毕业于北京清华大学，主修信息技术工程专业，并在学期间辅修了中国哲学，这使得他不仅在技术领域有卓越的能力，同时对中国传统思想也有着深入的理解。
    他的毕业设计——一款结合虚拟现实与传统文化体验的应用程序，获得了当年的最佳创新奖。
    毕业后，张四丰加入了阿里巴巴集团，目前担任高级算法工程师一职。
    他在人工智能和大数据处理方面的工作受到了公司内外的高度评价，是团队中不可或缺的一员。
    除了工作上的成就，他还积极投身于公益事业，致力于通过科技改善偏远地区教育资源不足的问题。
    业余时间里，张四丰喜好广泛，尤其钟情于书法和太极拳。
    他常常在周末参加各种书法交流活动，并且在当地的一家武术馆教授太极拳，传承这一项中国传统的健身运动。
    此外，他也是一位旅行爱好者，足迹遍布世界各地，喜欢探索不同的文化和自然景观。
    """

    # 更新后的知识图谱可以用来辅助生成更好的提示词（prompt）给大模型
    updated_prompt = f"{question}\n基于以下知识:\n{text}"

    # LLM待补充: 实现从知识图谱中检索到相关的三元组，并拼接到updated_prompt

    print(updated_prompt)
    # 再次尝试回答问题，这次包含额外的知识作为上下文
    improved_answer = llm_model.generate_response(updated_prompt)
    print(f"再次回答问题: {improved_answer}")

if __name__ == "__main__":
    main()

开始提问： 张四丰是哪里人？
知识图谱更新前：

张四丰，本名张君宝，是明末清初的武术家、道士，被认为是太极拳的创始人之一。关于他的籍贯，有不同说法，但普遍认为他是湖北省麻城市人。不过，由于历史记载有限，具体的出生地仍有争议。
大模型回答错误，开始学习新知识...
张四丰是哪里人？
基于以下知识:

    张四丰，1985年出生于中国浙江省杭州市的一个书香门第。
    自幼受到家庭浓厚文化氛围的熏陶，对传统文化和艺术有着深厚的兴趣。
    张四丰毕业于北京清华大学，主修信息技术工程专业，并在学期间辅修了中国哲学，这使得他不仅在技术领域有卓越的能力，同时对中国传统思想也有着深入的理解。
    他的毕业设计——一款结合虚拟现实与传统文化体验的应用程序，获得了当年的最佳创新奖。
    毕业后，张四丰加入了阿里巴巴集团，目前担任高级算法工程师一职。
    他在人工智能和大数据处理方面的工作受到了公司内外的高度评价，是团队中不可或缺的一员。
    除了工作上的成就，他还积极投身于公益事业，致力于通过科技改善偏远地区教育资源不足的问题。
    业余时间里，张四丰喜好广泛，尤其钟情于书法和太极拳。
    他常常在周末参加各种书法交流活动，并且在当地的一家武术馆教授太极拳，传承这一项中国传统的健身运动。
    此外，他也是一位旅行爱好者，足迹遍布世界各地，喜欢探索不同的文化和自然景观。
    
再次回答问题: 
张四丰是浙江省杭州市人。根据提供的信息，他1985年出生于杭州，这是一个书香门第的家庭，自幼受到家庭文化氛围的熏陶。


In [None]:
import os
import requests
import json
import re

API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"

# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()  # 检查 HTTP 错误状态码
            return response.json()  # 返回JSON
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None # API错误时，返回None

# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm # 依赖注入

    def generate_response(self, input_text):
        # 处理输入并生成中间输出
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return "API调用出错或者没有返回文本"

class KnowledgeGraph:
    def __init__(self):
        self.graph = []

    def add_triple(self, subject, predicate, object):
        self.graph.append((subject, predicate, object))

    def query(self, text):
        related_triples = []
        for triple in self.graph:
            subject, predicate, obj = triple
            if subject in text:
                related_triples.append(f"({subject}, {predicate}, {obj})")
        return "\n".join(related_triples)

def extract_triples(text):
    # 这基于CallLLM从文本中提取三元组。
    call_llm = CallLLM()
    llm_model = Model("THUDM/glm-4-9b-chat", call_llm)
    prompt = f"请从以下文本中提取三元组，并以(subject, predicate, obj)数组形式返回: {text}"
    triples_str = llm_model.generate_response(prompt)

    # 定义一个正则表达式模式，用于匹配三元组
    pattern = re.compile(r'\(([^,]+),\s*([^,]+),\s*([^)]+)\)')

    try:
        # 使用正则表达式查找所有匹配的三元组
        matches = pattern.findall(triples_str)

        # 将匹配结果转换为三元组（元组），并去除可能存在的多余空格
        triples = [tuple(map(str.strip, match)) for match in matches]

        return triples
    except Exception as e:
        print(f"解析三元组时出错: {e}")
        return []

def main():
    knowledge_graph = KnowledgeGraph()

    # 创建大模型调用器实例
    call_llm = CallLLM()
    llm_model = Model("THUDM/glm-4-9b-chat", call_llm)

    question = "张四丰是哪里人？"
    print("开始提问：", question)

    print("\n知识图谱更新前：")
    answer = llm_model.generate_response(question)
    print(answer)

    print("\n大模型回答错误，开始学习新知识...")

    text = """
    张四丰，1985年出生于中国浙江省杭州市的一个书香门第。
    自幼受到家庭浓厚文化氛围的熏陶，对传统文化和艺术有着深厚的兴趣。
    张四丰毕业于北京清华大学，主修信息技术工程专业，并在学期间辅修了中国哲学，这使得他不仅在技术领域有卓越的能力，同时对中国传统思想也有着深入的理解。
    他的毕业设计——一款结合虚拟现实与传统文化体验的应用程序，获得了当年的最佳创新奖。
    毕业后，张四丰加入了阿里巴巴集团，目前担任高级算法工程师一职。
    他在人工智能和大数据处理方面的工作受到了公司内外的高度评价，是团队中不可或缺的一员。
    除了工作上的成就，他还积极投身于公益事业，致力于通过科技改善偏远地区教育资源不足的问题。
    业余时间里，张四丰喜好广泛，尤其钟情于书法和太极拳。
    他常常在周末参加各种书法交流活动，并且在当地的一家武术馆教授太极拳，传承这一项中国传统的健身运动。
    此外，他也是一位旅行爱好者，足迹遍布世界各地，喜欢探索不同的文化和自然景观。
    """

    triples = extract_triples(text)
    for triple in triples:
      knowledge_graph.add_triple(triple[0], triple[1], triple[2])
    print("\n知识已添加到知识图谱")

    # 更新后的知识图谱可以用来辅助生成更好的提示词（prompt）给大模型
    related_knowledge = knowledge_graph.query(question)
    updated_prompt = f"{question}\n基于以下知识:\n{related_knowledge}"
    print(updated_prompt)

    # 再次尝试回答问题，这次包含额外的知识作为上下文
    improved_answer = llm_model.generate_response(updated_prompt)
    print(f"\n再次回答问题: {improved_answer}")

if __name__ == "__main__":
    main()

开始提问： 张四丰是哪里人？

知识图谱更新前：

张四丰是中国湖北省十堰市郧西县人，他是明朝末年著名的道士、武术家、内丹家，也是道教武当派的创始人之一。他生于明嘉靖二十年（1540年），卒于明万历三十二年（1604年）。张四丰在道教史上有着重要的地位，他的武当派武术对后世影响深远。

大模型回答错误，开始学习新知识...
('张四丰', '出生于', '1985年')
('张四丰', '出生地', '中国浙江省杭州市')
('张四丰', '家庭背景', '书香门第')
('张四丰', '兴趣爱好', '传统文化和艺术')
('张四丰', '毕业', '北京清华大学')
('张四丰', '主修专业', '信息技术工程专业')
('张四丰', '辅修专业', '中国哲学')
('张四丰', '毕业设计获奖情况', '最佳创新奖')
('张四丰', '加入公司', '阿里巴巴集团')
('张四丰', '职位', '高级算法工程师')
('张四丰', '工作评价', '高度评价')
('张四丰', '公益事业方向', '改善偏远地区教育资源不足问题')
('张四丰', '业余爱好1', '书法')
('张四丰', '业余爱好2', '太极拳')
('张四丰', '行为活动1', '参加书法交流活动')
('张四丰', '行为活动2', '教授太极拳')

知识已添加到知识图谱
张四丰是哪里人？
基于以下知识:
(张四丰, 出生于, 1985年)
(张四丰, 出生地, 中国浙江省杭州市)
(张四丰, 家庭背景, 书香门第)
(张四丰, 兴趣爱好, 传统文化和艺术)
(张四丰, 毕业, 北京清华大学)
(张四丰, 主修专业, 信息技术工程专业)
(张四丰, 辅修专业, 中国哲学)
(张四丰, 毕业设计获奖情况, 最佳创新奖)
(张四丰, 加入公司, 阿里巴巴集团)
(张四丰, 职位, 高级算法工程师)
(张四丰, 工作评价, 高度评价)
(张四丰, 公益事业方向, 改善偏远地区教育资源不足问题)
(张四丰, 业余爱好1, 书法)
(张四丰, 业余爱好2, 太极拳)
(张四丰, 行为活动1, 参加书法交流活动)
(张四丰, 行为活动2, 教授太极拳)

再次回答问题: 
张四丰是浙江省杭州市人。


### 双模评估 Red & Blue Team Dual-Model Evaluation

![图片描述](https://drive.google.com/uc?id=16kGxyCgNB9pRpHx5LOBVcQ69rRXk0hJF)


In [None]:
# 导入必要的库
# from transformers import pipeline, AutoModelForSeq2SeqLM, AutoTokenizer
# import requests
import json
import os

API_KEY = os.getenv('SILICONFLOW_API_KEY', 'sk-aerqsdefgpftbyerwomejvrrhgfkpgrbouhzwklhwbruuitc')
BASE_URL = "https://api.siliconflow.cn/v1/chat/completions"

# 定义大模型调用类
class CallLLM:
    def __init__(self):
      self.url = BASE_URL
      self.headers = {
            "Authorization": f"Bearer {API_KEY}",
            "Content-Type": "application/json"
        }

    def call(self, model_name, prompt):
        payload = {
            "model": model_name,
            "messages": [
                {
                    "role": "user",
                    "content": [
                        {
                            "type": "text",
                            "text": prompt
                        }
                    ]
                }
            ],
            "stream": False,
            "max_tokens": 512,
            "stop": ["null"],
            "temperature": 0.7,
            "top_p": 0.7,
            "top_k": 50,
            "frequency_penalty": 0.5,
            "n": 1,
            "response_format": {"type": "text"}
        }

        try:
            response = requests.post(self.url, json=payload, headers=self.headers)
            response.raise_for_status()  # 检查 HTTP 错误状态码
            return response.json()  # 返回JSON
        except requests.exceptions.RequestException as e:
            print(f"API 请求错误: {e}")
            return None # API错误时，返回None

# 定义大模型类
class Model:
    def __init__(self, model_name, call_llm):
        self.model_name = model_name
        self.call_llm = call_llm # 依赖注入

    def generate_response(self, input_text):
        # 处理输入并生成中间输出
        response_data = self.call_llm.call(self.model_name, input_text)
        if response_data and "choices" in response_data and response_data["choices"]:
          return response_data["choices"][0]["message"]["content"]
        else:
            return "API调用出错或者没有返回文本"


# 主函数
def main():

    # 创建大模型调用器实例
    call_llm = CallLLM()

    # 创建学生大模型实例
    student_model = Model("THUDM/chatglm3-6b", call_llm)

    # 创建老师大模型实例
    teacher_model = Model("THUDM/glm-4-9b-chat", call_llm)

    # 获取用户输入
    user_input = "为南京大学写一首诗。"

    # 学生大模型处理
    intermediate_output = student_model.generate_response(user_input)
    print("\n中间输出:", intermediate_output)

    # 老师大模型评估

    eval_prompt = """
    你是一位精通古诗词的专家，你的任务是评估学生AI模型创作的诗歌（包括古诗或者现代诗），并给出专业的修改意见，要求学生模型以古诗的形式改进。

    学生的诗歌如下：
    ---
    {intermediate_output}
    ---

    你需要：
    1.  **格律审查：**
        *  如果学生诗歌是古诗，你需要严格检查格律是否正确，包括平仄、押韵、对仗等。请详细指出不符合格律的地方。
        *  如果学生诗歌是现代诗，则忽略格律审查，但请评估其韵律和节奏感。

    2.  **意境评估：**
        *  评估学生诗歌的意境是否深远，是否能表达情感。如果意境不够，请指出并提出改进建议。
        * 评估学生诗歌是否符合诗歌的主题，如果主题不明确或者偏离，请指出。

    3.  **用词分析：**
        *  评估学生诗歌的用词是否准确、精炼，是否有用典，并评估用典是否恰当。如果用词不当，请给出修改建议。
        *  评估学生诗歌用字是否符合古诗词用字习惯，是否有违和感。

    4.  **艺术性评估：**
        * 评估学生诗歌是否具有艺术性，是否有想象力和创造力。如果缺乏艺术性，请指出并给出改进建议。

    5.  **修改指导：**
        *  根据以上评估，给学生模型提供一个明确的修改方向，并明确要求学生模型以古诗的形式进行改进，包括给出新的韵脚和对仗方式（如果需要）。
        *  如果学生模型不是创作古诗而是现代诗，则需要明确提示学生模型用古诗形式进行改进。

    请使用以下格式输出你的评估结果和改进建议：

    格律审查：（详细的格律问题，如果没有，请写 “无” 。如果不是古诗，写 “现代诗，无需格律审查”）
    意境评估：（对意境、情感和主题的评价）
    用词分析：（对用词的评价和建议）
    艺术性评估：（对艺术性的评价和建议）
    修改指导：（明确的修改方向和古诗形式改进提示，包括新的韵脚或者对仗方式，如果需要。）
    """

    eval_prompt2 = """
    你是一位资深的 AI 导师，你的任务是评估学生的 AI 模型生成的文本，并提供改进建议。
    学生的输出文本如下：
    ---
    {intermediate_output}
    ---
    你需要：
    1.  评估学生模型的输出是否完整、准确地理解了用户的需求。如果学生模型未能完全理解，请指出具体缺失的部分。
    2.  评估学生模型生成的文本的逻辑是否清晰、流畅。如果文本存在逻辑不清晰或者表达不流畅的地方，请指出具体问题，并给出优化建议。
    3. 评估学生模型生成的文本是否简洁明了，避免冗余或含糊不清的表达。 如果文本表达不简洁，请给出修改建议。
    4.  评估学生模型生成的文本是否符合预期格式，例如，如果期望输出JSON，则检查格式是否正确。
    5. 如果学生模型输出了代码，请评估代码是否符合语法、逻辑正确、效率是否可以改进。
    6. 总结以上评估，并给学生模型提供一个具体的改进方向的提示词，以帮助学生模型更好地完成任务。

    请使用以下格式输出你的评估结果和改进建议：

    评估结果：
    1.  （是否完整、准确）
    2.  （逻辑是否清晰、流畅）
    3. (表达是否简洁明了）
    4.  （格式是否正确）
    5.  (代码是否符合语法逻辑和效率要求)

    改进提示词： （具体的、可执行的提示词）
    """
    evaluation_result = teacher_model.generate_response(eval_prompt.format(intermediate_output=intermediate_output))
#    evaluation_result = teacher_model.generate_response(f"用户的输入是：{user_input}\n基于用户输入，指出以下回复的不足：{intermediate_output}")
    print(evaluation_result)

    # 根据评估结果调整和改进模型
    revise_prompt = """
    你是一个正在学习中的AI学生模型，你接收到了老师模型的评估结果，以下是老师的反馈：
    ---
    {evaluation_result}
    ---

    你需要：
    1.  仔细阅读并理解老师模型的所有评估意见，包括指出的问题和改进建议。
    2.  针对老师指出的问题，分析你之前的输出为什么会产生这些问题，并思考如何避免类似问题的发生。
    3.  根据老师的改进建议，修改你的输出策略。
    4.  基于修改后的输出策略，重新生成文本。
    5.  特别注意，请根据老师的反馈来决定输出的内容和格式，老师认为重要的地方请优先处理。
    6. 确保你生成的文本是清晰、流畅，准确的。

    请使用以下格式输出你的改进文本：
    改进后的输出：(改进后的输出文本)
    """
    revised_output = student_model.generate_response(revise_prompt.format(evaluation_result=evaluation_result))
#   revised_output = student_model.generate_response(f"{intermediate_output}\n以上段落有以下不足，请修改：\n{evaluation_result}")
    print("\n最终输出:", revised_output)

if __name__ == "__main__":
    main()


中间输出:  
 南京大学,钟灵毓秀,
百年历史,辉煌不朽。

紫金山下,绿树成荫,
古典建筑,古朴典雅。

学术殿堂,人才辈出,
大师云集,智慧闪耀。

严谨治学,勤奋好学,
学子们,奋发向前。

南京大学,校训“严谨、勤奋、求实、创新”,
百年校庆,庆祝辉煌。

格律审查：
学生的诗歌并非严格意义上的古诗，因为它没有遵循古典诗歌的平仄、押韵和对仗等格律规则。因此，这里不进行格律审查。

意境评估：
诗歌意境较为直接，表达了南京大学的美丽景色和学术氛围。但整体上缺乏深度和层次感，未能充分展现南京大学的历史厚重感和文化底蕴。

用词分析：
用词准确，但较为平淡，缺乏生动性和感染力。例如，“钟灵毓秀”、“辉煌不朽”等词汇虽然常用，但在此处显得有些俗套。

艺术性评估：
诗歌艺术性不足，缺乏想象力和独特的表达方式。整体上较为平铺直叙，未能通过丰富的意象和修辞手法提升诗歌的艺术效果。

修改指导：
为了提升诗歌的艺术性和意境深度，以下是对学生模型进行古诗形式改进的建议：

1. 增加意象的丰富性，运用比喻、拟人等修辞手法。
2. 调整韵脚，使诗歌更具节奏感。
3. 改进对仗方式，使诗句更加工整。

改进后的古诗示例：

钟灵毓秀南京城，
百年学府史辉煌。
紫金山下绿荫浓，
古典建筑古韵长。

学术殿堂人才盛，
大师云集智慧光。
严谨治学勤奋志，
学子奋发勇向前。

校训严谨勤求实，
百年校庆共欢畅。
钟山之巅望未来，
金陵城下谱华章。

新的韵脚：长（ang）、光（ang）、向（iang）、实（i）、畅（ang）、章（ang）
对仗方式：钟灵毓秀南京城 / 百年学府史辉煌
          紫金山下绿荫浓 / 古典建筑古韵长
          学术殿堂人才盛 / 大师云集智慧光
          严谨治学勤奋志 / 学子奋发勇向前
          校训严谨勤求实 / 百年校庆共欢畅
          钟山之巅望未来 / 金陵城下谱华章

最终输出:  
 改进后的输出：

钟灵毓秀南京城，
百年学府史辉煌。
紫金山下绿荫浓，
古典建筑古韵长。

学术殿堂人才盛，
大师云集智慧光。
严谨治学勤奋志，
学子奋发勇向前。
校训严谨勤求实，
百年校庆共欢畅。
钟山之巅望未来，
金陵城下谱华章。
