# SimpleByzerLLM 测试

In [1]:
import os
from byzerllm.utils.client.simple_byzerllm_client import SimpleByzerLLM

# 初始化客户端
llm = SimpleByzerLLM(default_model_name="deepseek_chat")

In [2]:
# 部署模型
deploy_result = llm.deploy(
    model_path="",
    pretrained_model_type="saas/openai",
    udf_name="deepseek_chat",
    infer_params={
        "saas.base_url": "https://api.deepseek.com/v1",
        "saas.api_key": os.getenv("MODEL_DEEPSEEK_TOKEN"),
        "saas.model": "deepseek-chat"
    }
)
deploy_result

{'model': 'deepseek_chat', 'status': 'deployed'}

In [3]:
# 获取模型元数据
meta = llm.get_meta(model="deepseek_chat")
meta

{'model_name': 'deepseek-chat',
 'backend': 'openai',
 'max_model_len': 4097,
 'support_stream': True,
 'deploy_info': {'model_path': '',
  'pretrained_model_type': 'saas/openai',
  'infer_params': {'saas.base_url': 'https://api.deepseek.com/v1',
   'saas.api_key': 'sk-2abc4f81cd9b4b64990713d8cf1082fd',
   'saas.model': 'deepseek-chat'},
  'sync_client': <openai.OpenAI at 0x13d787b50>,
  'async_client': <openai.AsyncOpenAI at 0x13d7bccd0>,
  'model': 'deepseek-chat',
  'is_reasoning': False},
 'model_deploy_type': 'saas',
 'message_format': True,
 'support_chat_template': True}

In [6]:
# 测试普通聊天
response = llm.chat_oai(
    conversations=[{"role": "user", "content": "你好，介绍一下你自己"}],
    model="deepseek_chat"
)
response[0].output

'你好！我是一个由OpenAI开发的人工智能助手，旨在帮助用户解答问题、提供信息、执行任务和进行对话。我可以处理多种语言，并且能够理解和生成自然语言文本。我的知识库涵盖了广泛的主题，包括科学、技术、历史、文化、日常生活等，并且我会不断更新以保持信息的准确性。\n\n如果你有任何问题或需要帮助，无论是学习、工作还是生活中的问题，我都会尽力提供有用的答案和建议。请随时向我提问！'

In [5]:
# 测试流式聊天
for chunk in llm.stream_chat_oai(
    conversations=[{"role": "user", "content": "写一个Python的快速排序算法"}],
    delta_mode=True
):
    print(chunk[0], end="", flush=True)


快速排序（Quick Sort）是一种高效的排序算法，采用分治法（Divide and Conquer）策略。以下是一个用Python实现的快速排序算法：

```python
def quick_sort(arr):
    # 如果数组长度小于等于1，直接返回
    if len(arr) <= 1:
        return arr
    
    # 选择一个基准元素（通常选择第一个元素）
    pivot = arr[0]
    
    # 分别创建三个列表：小于基准的、等于基准的、大于基准的
    less = [x for x in arr[1:] if x < pivot]
    equal = [x for x in arr if x == pivot]
    greater = [x for x in arr[1:] if x > pivot]
    
    # 递归地对小于和大于基准的部分进行排序，并将结果合并
    return quick_sort(less) + equal + quick_sort(greater)

# 示例用法
arr = [3, 6, 8, 10, 1, 2, 1]
sorted_arr = quick_sort(arr)
print("排序后的数组:", sorted_arr)
```

### 代码说明：
1. **基准选择**：我们选择数组的第一个元素作为基准（`pivot`）。
2. **分区**：将数组分为三个部分：
   - `less`：所有小于基准的元素。
   - `equal`：所有等于基准的元素。
   - `greater`：所有大于基准的元素。
3. **递归排序**：对`less`和`greater`部分递归调用`quick_sort`函数。
4. **合并结果**：将排序后的`less`、`equal`和`greater`部分合并成一个有序数组。

### 示例输出：
```python
排序后的数组: [1, 1, 2, 3, 6, 8, 10]
```

### 时间复杂度：
- **平均情况**：O(n log n)
- **最坏情况**：O(n^2)（当每次选择的基准都是最大或最小元素时）

### 空间复杂度：
- O(n)（由于递归调用栈和额外的列

In [7]:
# 测试prompt装饰器
@llm.prompt(model="deepseek_chat")
def generate_story(theme: str, length: int) -> str:
    """
    根据主题生成一个故事
    主题：{{theme}}
    长度：{{length}}
    """

story = generate_story(theme="科幻", length=200)
print(story)

## 《最后的记忆》

我睁开眼睛，映入眼帘的是一片纯白的天花板。消毒水的气味刺激着我的鼻腔，我意识到自己正躺在医院的病床上。

"你醒了。"一个温和的男声传来。我偏过头，看见一位穿着白大褂的医生正站在床边，他的胸前别着一个金属铭牌，上面写着"记忆修复中心"。

"我...这是在哪里？"我试图坐起来，却发现浑身无力。

"别着急。"医生按住了我的肩膀，"你刚刚经历了一场严重的车祸，我们不得不对你的记忆进行修复和重组。"

我皱起眉头，努力回想，却只能捕捉到一些零碎的片段：刺眼的车灯、刺耳的刹车声、破碎的挡风玻璃......

"你的记忆芯片在事故中受损严重，"医生继续说道，"我们不得不植入新的芯片来替代。现在，我需要你配合做一些测试，确保新芯片运转正常。"

我点点头，任由医生将各种仪器连接到我的太阳穴。突然，一阵剧烈的头痛袭来，我的视野开始扭曲，耳边响起尖锐的蜂鸣声。

"不...不对劲......"我痛苦地捂住头，"这不是我的记忆......"

在意识模糊的边缘，我看到了一个陌生的实验室，无数个"我"躺在培养舱中，等待着被植入虚假的记忆......

"实验体出现异常反应！立即终止测试！"医生的声音变得尖锐而慌乱。

但已经太迟了。随着一声巨响，整个病房陷入黑暗。我知道，真相即将揭晓。


In [3]:
import byzerllm
@byzerllm.prompt()
def generate_story(theme: str, length: int) -> str:
    """
    根据主题生成一个故事
    主题：{{theme}}
    长度：{{length}}
    """

story = generate_story.with_llm(llm).run(theme="科幻", length=200)
print(story)

ValueError: llm should be a lambda function or ByzerLLM instance or a string of model name

In [None]:
# 清理模型
llm.undeploy("test_model")