# SimpleByzerLLM 测试

In [1]:
import os
from byzerllm.utils.client.simple_byzerllm_client import SimpleByzerLLM

# 初始化客户端
llm = SimpleByzerLLM(default_model_name="deepseek_chat")

In [None]:
# 部署模型
deploy_result = llm.deploy(
    model_path="",
    pretrained_model_type="saas/reasoning_openai",
    udf_name="o_deepseek_chat",
    infer_params={
        "saas.base_url": "https://api.deepseek.com/v1",
        "saas.api_key": os.getenv("MODEL_DEEPSEEK_TOKEN"),
        "saas.model": "deepseek-reasoner",
        "saas.is_reasoning": True
    }
)
deploy_result

In [None]:
# 部署模型
deploy_result = llm.deploy(
    model_path="",
    pretrained_model_type="saas/reasoning_openai",
    udf_name="deepseek_chat",
    infer_params={
        "saas.base_url": "http://127.0.0.1:8000/v1",
        "saas.api_key": "xxx",
        "saas.model": "deepseek_r1_chat",
        "saas.is_reasoning": True
    }
)
deploy_result

In [None]:
# 获取模型元数据
meta = llm.get_meta(model="deepseek_chat")
meta

In [None]:
# 测试普通聊天
response = llm.chat_oai(
    conversations=[{"role": "user", "content": "帮我写一个排序算法"}],
    model="o_deepseek_chat"
)
print(response[0].output)
print("="*100)
print(response[0].metadata.get("reasoning_content","=="))

In [None]:
# 测试普通聊天
response = llm.chat_oai(
    conversations=[{"role": "user", "content": "帮我写一个排序算法"}],
    model="deepseek_chat"
)
print(response[0].output)
print("="*100)
print(response[0].metadata.get("reasoning_content","=="))

In [None]:
# 测试流式聊天
for chunk in llm.stream_chat_oai(
    conversations=[{"role": "user", "content": "写一个Python的快速排序算法"}],
    delta_mode=True,
    model="o_deepseek_chat"
):
    print(chunk[0], end="", flush=True)


In [None]:
# 测试prompt装饰器
@llm.prompt(model="deepseek_chat")
def generate_story(theme: str, length: int) -> str:
    """
    根据主题生成一个故事
    主题：{{theme}}
    长度：{{length}}
    """

story = generate_story(theme="科幻", length=200)
print(story)

In [None]:
import byzerllm
@byzerllm.prompt()
def generate_story(theme: str, length: int) -> str:
    """
    根据主题生成一个故事
    主题：{{theme}}
    长度：{{length}}
    """

story = generate_story.with_llm(llm).run(theme="科幻", length=200)
print(story)

In [None]:
# 清理模型
llm.undeploy("test_model")

In [None]:
import openai
client = openai.OpenAI(base_url="https://api.deepseek.com/v1",api_key=os.getenv("MODEL_DEEPSEEK_TOKEN"))
llm_config = {}
response = client.chat.completions.create(
            messages=[{"role": "user", "content": "帮我写一个排序算法"}],
            model="deepseek-reasoner",
            temperature=llm_config.get("temperature", 0.7),
            max_tokens=llm_config.get("max_tokens", 4096),
            top_p=llm_config.get("top_p", 0.9),            
        )
generated_text = response.choices[0].message.content
print(generated_text)
print("="*100)
reasoning_text = ""
if hasattr(response.choices[0].message, "reasoning_content"):
    reasoning_text = response.choices[0].message.reasoning_content or ""
print(reasoning_text)

In [None]:
import openai
client = openai.OpenAI(base_url="http://127.0.0.1:8000/v1",api_key=os.getenv("MODEL_DEEPSEEK_TOKEN"))
llm_config = {}
response = client.chat.completions.create(
            messages=[{"role": "user", "content": "帮我写一个排序算法"}],
            model="deepseek_r1_chat",
            temperature=llm_config.get("temperature", 0.7),
            max_tokens=llm_config.get("max_tokens", 4096),
            top_p=llm_config.get("top_p", 0.9),            
        )
generated_text = response.choices[0].message.content
print(generated_text)
print("="*100)
reasoning_text = ""
if hasattr(response.choices[0].message, "reasoning_content"):
    reasoning_text = response.choices[0].message.reasoning_content or ""
print(reasoning_text)

In [None]:
import openai
client = openai.OpenAI(base_url="https://api.deepseek.com/v1",api_key=os.getenv("MODEL_DEEPSEEK_TOKEN"))
llm_config = {}
response = client.chat.completions.create(
            messages=[{"role": "user", "content": "帮我写一个排序算法"}],
            model="deepseek-reasoner",
            temperature=llm_config.get("temperature", 0.7),
            max_tokens=llm_config.get("max_tokens", 4096),
            top_p=llm_config.get("top_p", 0.9),  
            stream=True,
        )
is_content = False
for chunk in response:
    if not is_content:
        print(chunk.choices[0].delta.reasoning_content, end="", flush=True)
    if chunk.choices[0].delta.content and not is_content:
        is_content = True
    if is_content:
        print(chunk.choices[0].delta.content, end="", flush=True)


In [9]:
import openai
import os
client = openai.OpenAI(base_url="http://127.0.0.1:8000/v1",api_key=os.getenv("MODEL_DEEPSEEK_TOKEN"))
llm_config = {}
response = client.chat.completions.create(
            messages=[{"role": "user", "content": "帮我写一个排序算法"}],
            model="deepseek_r1_chat",
            temperature=llm_config.get("temperature", 0.7),
            max_tokens=llm_config.get("max_tokens", 4096),
            top_p=llm_config.get("top_p", 0.9),  
            stream=True,
        )
is_content = False
for chunk in response:
    if not is_content:
        print(chunk.choices[0].delta.reasoning_content, end="", flush=True)
    if chunk.choices[0].delta.content and not is_content:
        is_content = True
    if is_content:
        print(chunk.choices[0].delta.content, end="", flush=True)


嗯，用户让我帮他写一个排序算法。首先，我需要确定他的需求是什么。排序算法有很多种，比如冒泡排序、快速排序、归并排序等等。每种算法的时间复杂度和空间复杂度不同，适用场景也不一样。用户没有具体说明需要哪种类型的排序算法，所以可能需要进一步询问。不过可能他可能只需要一个基础的例子，或者他可能对算法不太熟悉，想了解常见的实现。

接下来，我需要考虑用户的身份。他可能是学生，正在学习编程，需要完成一个作业或者练习。也可能是刚开始学习算法的开发者，想了解如何实现排序。这种情况下，选择一个简单易懂的算法比较合适，比如冒泡排序或者选择排序。虽然这些算法效率不高，但容易理解，适合教学。

或者，用户可能需要一个高效的排序算法，比如快速排序或归并排序。不过这些算法实现起来稍微复杂一些，特别是快速排序的分区过程，对于新手来说可能有点难度。如果用户没有特别说明，可能默认先给出一个简单实现的例子，再提供更高效的选项。

另外，用户可能不知道不同排序算法的区别，这时候我应该解释一下不同算法的特点，帮助他根据需求选择。比如，如果数据量小，简单的排序算法就可以了；如果数据量大，可能需要更高效的算法。或者，是否需要稳定排序（即相同元素的相对顺序不变），比如归并排序是稳定的，而快速排序不稳定。

也有可能用户对某种编程语言有特定需求，比如Python、Java或JavaScript。不过问题中没有提到，所以可能需要用通用的伪代码，或者选择一种常见的语言，比如Python，因为其语法简洁易懂，适合示例。

假设用户需要一个基础的例子，我可以先给出一个冒泡排序的实现，然后解释其原理和效率。同时，也可以提供更高效的算法，比如快速排序，并说明两者的区别，让用户可以根据自己的情况选择。

不过，用户可能只想要一个简单的答案，所以直接给出代码示例，并简要说明。但为了全面，最好覆盖不同的可能性，这样用户可以根据需要调整。

另外，还要注意代码的正确性，不能有错误，特别是边界条件，比如空数组、重复元素的情况。确保示例代码能够正确处理这些情况。

总结一下，可能的回答结构是：首先询问是否需要特定类型的排序算法，或者直接给出一个简单实现（如冒泡排序），然后介绍其时间和空间复杂度，再提供一个更高效的算法（如快速排序），并比较两者的优缺点。这样既满足了用户的直接需求，又提供了额外信息帮助他做出选择。以下是一个简单的 **快速

In [None]:
import byzerllm
llm = byzerllm.ByzerLLM.from_default_model("deepseek_r1_chat")

v = llm.stream_chat_oai(
    conversations=[{"role": "user", "content": "帮我写一个排序算法"}],
    model="deepseek_r1_chat",
    delta_mode=True
)

is_content = False
for chunk in v:
    metadata = chunk[1]
    text = chunk[0]
    if not is_content:
        print(metadata.reasoning_content, end="", flush=True)
    if text and not is_content:
        is_content = True
        print("=========")
    if is_content:
        print(text, end="", flush=True)