In [1]:
# 智能体经典范式构建

In [2]:
# 安装依赖库
# openai库用于与OpenAI的API交互
# python-dotenv库用于管理API密钥

# !pip install openai python-dotenv


In [None]:
# 定义封装基础LLM客户端类
import os
from dotenv import load_dotenv
from openai import OpenAI
from typing import List, Dict
import re

# 加载.env文件中的环境变量
load_dotenv()

class HelloAgentsLLM:
    """
    封装基础LLM客户端类，用于调用任何兼容OpenAI API的LLM模型。并默认使用流式响应
    """
    def __init__(self, model: str = None, apiKey: str = None, baseUrl: str = None, timeout: int = None):
        """
        初始化客户端。优先使用传入参数，如果未提供，则从环境变量加载
        """
        self.model = model or os.getenv("LLM_MODEL_ID")
        apiKey = apiKey or os.getenv("LLM_API_KEY")
        baseUrl = baseUrl or os.getenv("LLM_BASE_URL")
        timeout = timeout or int(os.getenv("LLM_TIMEOUT", 60))

        if not all([self.model, apiKey, baseUrl]):
            raise ValueError("模型ID、API密钥和服务地址必须被提供或在.env文件中被定义")
        
        self.client = OpenAI(api_key=apiKey, base_url=baseUrl, timeout=timeout)

    def think(self, messages: List[Dict[str, str]], temperature: float = 0) -> str:
        """
        调用LLM进行思考，并返回其响应
        
        :param self: 说明
        :param messages: 说明
        :type messages: List[Dict[str, str]]
        :param temperature: 说明
        :type temperature: float
        :return: 说明
        :rtype: str
        """
        print(f"正在调用{self.model}模型...")
        try:
            response = self.client.chat.completions.create(
                model=self.model,
                messages=messages,
                temperature=temperature,
                stream=True,
            )

            # 处理流式响应
            print("大语言模型响应成功：")

            collected_content = []
            for chunk in response:
                content = chunk.choices[0].delta.content or ""
                print(content, end="", flush=True)
                collected_content.append(content)
            print() # 在流式输出结束后换行
            return "".join(collected_content)
        
        except Exception as e:
            print(f"调用LLM API时发生错误：{e}")
            return None
        




    

--- 调用LLM ---
正在调用glm-4.7-flash-free模型...
大语言模型响应成功：
这里提供两种常见的快速排序实现：一种是**易于理解（使用辅助数组）**的 Pythonic 写法，另一种是**标准的高效（原地排序）**写法。

### 方法一：Pythonic 写法（易于理解）
这种写法利用 Python 的列表推导式，代码非常简洁，将数组分成三部分（小于基准、等于基准、大于基准），然后递归拼接。它的空间复杂度相对较高（O(N)），但非常适合理解快速排序的原理。

```python
def quicksort(arr):
    # Base case: 如果数组长度小于等于1，直接返回
    if len(arr) <= 1:
        return arr
    
    # 选择中间元素作为基准 (也可以选第一个或最后一个)
    pivot = arr[len(arr) // 2]
    
    # 分区
    left = [x for x in arr if x < pivot]
    middle = [x for x in arr if x == pivot]
    right = [x for x in arr if x > pivot]
    
    # 递归调用并合并
    return quicksort(left) + middle + quicksort(right)

# 测试
my_list = [3, 6, 8, 10, 1, 2, 1]
sorted_list = quicksort(my_list)
print("排序结果:", sorted_list)
```

---

### 方法二：标准原地排序写法（高效）
这是计算机算法竞赛或面试中常用的标准实现。它不需要额外的辅助数组，直接在原数组上进行操作，空间复杂度为 O(log N)（仅栈空间）。

```python
def partition(arr, low, high):
    """
    分区函数：选择最后一个元素作为基准，
    将小于基准的元素放到左边，大于基准的放到右边。
    返回基准值的最终索引位置。
    """
    pivot = arr[high]
    i = low - 1  

In [None]:
# --- 客户端使用示例 ---
if __name__ == '__main__':
    try:
        llmClient = HelloAgentsLLM()

        exampleMessages = [
            {"role": "system", "content": "You are a helpful assistant that writes Python code."},
            {"role": "user", "content": "写一个快速排序算法"}
        ]

        print("--- 调用LLM ---")
        responseText = llmClient.think(exampleMessages)
        if responseText:
            print("\n\n--- 完整模型响应 ---")
            print(responseText)

    except ValueError as e:
        print(e)