# 延后初始化

深度学习框架无法判断网络的输入维度是什么。 这里的诀窍是框架的延后初始化（defers initialization）， 即直到数据第一次通过模型传递时，框架才会动态地推断出每个层的大小。

当使用卷积神经网络时， 由于输入维度（即图像的分辨率）将影响每个后续层的维数， 有了该技术将更加方便。 现在我们在编写代码时无须知道维度是什么就可以设置参数， 这种能力可以大大简化定义和修改模型的任务。

In [None]:
import tensorflow as tf

net = tf.keras.models.Sequential([
    tf.keras.layers.Dense(256, activation=tf.nn.relu),
    tf.keras.layers.Dense(10),
])

In [None]:
[net.layers[i].get_weights() for i in range(len(net.layers))]

In [None]:
X = tf.random.uniform((2, 20))
net(X)
[w.shape for w in net.get_weights()]

In [None]:
net.get_weights()

In [None]:
# 

# 1-单轮

In [None]:
from openai import OpenAI

client = OpenAI(
    api_key="sk-b09XXwR8nOmrdoXTrylErTOJ0mWQYxKsRZBLMmfCiV2K0grF",  # 替换为你的 Moonshot AI API Key
    # base_url="https://api.moonshot.cn/v1"
    base_url = "http://127.0.0.1:8888/v1"
)

completion = client.chat.completions.create(
    model="moonshot-v1-8k",
    messages=[
        {"role": "system", "content": "你是 Kimi，由 Moonshot AI 提供的人工智能助手，你更擅长中文和英文的对话。你会为用户提供安全，有帮助，准确的回答。同时，你会拒绝一些涉及恐怖主义，种族歧视，黄色暴力等问题的回答。Moonshot AI 为专有名词，不可翻译成其他语言。"},
        {"role": "user", "content": "你好，我叫李雷，1+1 等于多少？"}
    ],
    temperature=0.3,
)

print(completion.choices[0].message.content)

- 单轮对话没有记忆能力

In [None]:
completion = client.chat.completions.create(
    model="moonshot-v1-8k",
    messages=[
        {"role": "user", "content": "我叫什么名字？"}
    ],
    temperature=0.3,
)

print(completion.choices[0].message.content)

# 2-多轮

In [None]:
from openai import OpenAI
import time
import pprint 
client = OpenAI(
    api_key = "sk-b09XXwR8nOmrdoXTrylErTOJ0mWQYxKsRZBLMmfCiV2K0grF", # 在这里将 MOONSHOT_API_KEY 替换为你从 Kimi 开放平台申请的 API Key
    # base_url = "https://api.moonshot.cn/v1",
	base_url = "http://127.0.0.1:8888/v1"
)
 
system_messages = [
	# {"role": "system", "content": "你是 Kimi，由 Moonshot AI 提供的人工智能助手，你更擅长中文和英文的对话。你会为用户提供安全，有帮助，准确的回答。同时，你会拒绝一切涉及恐怖主义，种族歧视，黄色暴力等问题的回答。Moonshot AI 为专有名词，不可翻译成其他语言。"},
	{"role": "system", "content": "你是 Kimi， 你擅长中文。"},
]
# global messages
messages = []
# 限制上下文长度
def make_messages(input: str, n: int = 20):   
	global messages
	messages.append({
		"role": "user",
		"content": input,	
	})
 
	new_messages = []
	new_messages.extend(system_messages)
 
	if len(messages) > n:
		messages = messages[-n:]
 
	new_messages.extend(messages)
	return new_messages
 
 
def chat(input: str) -> str:
	msg = make_messages(input)
	
	completion = client.chat.completions.create(
        model="moonshot-v1-auto",
        messages=msg,
        temperature=0.3,
    )
	assistant_message = completion.choices[0].message
	messages.append(assistant_message)
	print(f"Kimi: {assistant_message.content}")
	# return assistant_message.content

In [None]:
chat("你好，我今年 27 岁。")
time.sleep(1)
chat("你知道我今年几岁吗？")
time.sleep(1)
chat("你脾气如何？")

# Kimi Chat Assistant

In [9]:
from openai.types.chat.chat_completion import Choice
from openai import OpenAI, OpenAIError
from pprint import pprint
from typing import *
import json
import time
import os

class KimiChatAssistant:
    def __init__(self, api_key, base_url, system_content, model, max_context_length=20, Candidates=1, use_stream=False):
        """
        初始化聊天管理器
        :param api_key: OpenAI API 密钥
        :param base_url: API 请求的基础 URL
        :param system_content: 系统消息内容
        :param model: 使用的模型名称
        :param max_context_length: 上下文最大长度，默认为 20
        """
        self.client = OpenAI(
            api_key=api_key,
            base_url=base_url
        )
        self.system_messages = [{"role": "system", "content": system_content}]
        self.messages = []
        self.model = model
        self.max_context_length = max_context_length
        self.max_attempts = 1    # 最大重试次数
        self.use_stream = use_stream
        self.Candidates = Candidates
        self.finish_reason = None

        self.tools = [
            {
                "type": "builtin_function",
                "function": {
                    "name": "$web_search",
                },
            },
        ]


    
    def get_history(self):
        return self.system_messages + self.messages

    def reset_history(self):
        self.messages = []

    def print_context(self):
        print("当前上下文:")
        pprint.pprint(self.get_history())

    def search_impl(self, arguments):
        return arguments
 

    def prepare_messages(self, user_input):
        self.messages.append({"role": "user", "content": user_input})

        new_messages = self.system_messages.copy()
        
        if len(self.messages) > self.max_context_length:
            self.messages = self.messages[-self.max_context_length:]
        new_messages.extend(self.messages)

        return new_messages

    def chat_once(self, msg):
        messages = msg
        for i in range(self.max_attempts):
            try:
                completion = self.client.chat.completions.create(
                    model=self.model,
                    messages=messages,
                    temperature=0.3,
                    stream=self.use_stream,
                    n=self.Candidates,           # 返回候选
                    tools=self.tools,
                )
                if self.use_stream:
                    return completion
                assistant_message = completion.choices[0]   # 第一个候选
                # self.messages.append(completion.choices[0].message)
                return assistant_message
            except OpenAIError as e:
                print(f"API 调用失败: {e}")
                if i < self.max_attempts - 1:
                    print(f"正在进行第 {i+1} 次重试...")
                    time.sleep(1)
            except Exception as e:
                print(f"发生未知错误: {e}")
                time.sleep(1)
                continue

        return "抱歉，系统无法提供回复，请稍后再试。"

    def chat(self, user_input):
        messages = self.prepare_messages(user_input)
        while self.finish_reason is None or self.finish_reason == "tool_calls":
            # print("Kimi 大模型正在联网思考中...")
            choice = self.chat_once(messages)
            print(type(choice))
            self.finish_reason = choice.finish_reason
            if self.finish_reason == "tool_calls":  # <-- 判断当前返回内容是否包含 tool_calls
                messages.append(choice.message)  # <-- 我们将 Kimi 大模型返回给我们的 assistant 消息也添加到上下文中，以便于下次请求时 Kimi 大模型能理解我们的诉求
                for tool_call in choice.message.tool_calls:  # <-- tool_calls 可能是多个，因此我们使用循环逐个执行
                    tool_call_name = tool_call.function.name
                    tool_call_arguments = json.loads(tool_call.function.arguments)  # <-- arguments 是序列化后的 JSON Object，我们需要使用 json.loads 反序列化一下
                    if tool_call_name == "$web_search":
                        tool_result = self.search_impl(tool_call_arguments)
                    else:
                        tool_result = f"Error: unable to find tool by name '{tool_call_name}'"
    
                    messages.append({
                        "role": "tool",
                        "tool_call_id": tool_call.id,
                        "name": tool_call_name,
                        "content": json.dumps(tool_result),  
                    })
        # print(choice.message.content)
        self.finish_reason = None

In [10]:
if __name__ == "__main__":
    use_stream = False
    chat_manager = KimiChatAssistant(
        api_key="sk-b09XXwR8nOmrdoXTrylErTOJ0mWQYxKsRZBLMmfCiV2K0grF",
        base_url="http://127.0.0.1:8888/v1",
        # base_url = "https://api.moonshot.cn/v1",
        system_content="你是 Kimi， 你只会使用中文进行对话。",
        model="moonshot-v1-auto",
        max_context_length= 20,
        use_stream = use_stream,
        Candidates = 1,
    )

    while True:
        user_input = input("请输入你的问题(输入 'exit' 退出)：\n")
        if user_input.lower() == "exit":
            break
        chat_manager.chat(user_input)

        
        # if use_stream:
        #     for chunk in response:
        #         delta = chunk.choices[0].delta
        #         if delta.content:
        #             print(delta.content, end="", flush=True)
        #     print("\n")
        #     continue
        # print(f"Kimi: {response}")

<class 'openai.types.chat.chat_completion.Choice'>
<class 'openai.types.chat.chat_completion.Choice'>
<class 'openai.types.chat.chat_completion.Choice'>


In [8]:
from typing import *
 
import os
import json
 
from openai import OpenAI
from openai.types.chat.chat_completion import Choice
 
client = OpenAI(
    # base_url="https://api.moonshot.cn/v1",
    base_url="http://127.0.0.1:8888/v1",
    api_key="sk-b09XXwR8nOmrdoXTrylErTOJ0mWQYxKsRZBLMmfCiV2K0grF",
)
 
 
# search 工具的具体实现，这里我们只需要返回参数即可
def search_impl(arguments: Dict[str, Any]) -> Any:
    """
    在使用 Moonshot AI 提供的 search 工具的场合，只需要原封不动返回 arguments 即可，
    不需要额外的处理逻辑。
 
    但如果你想使用其他模型，并保留联网搜索的功能，那你只需要修改这里的实现（例如调用搜索
    和获取网页内容等），函数签名不变，依然是 work 的。
 
    这最大程度保证了兼容性，允许你在不同的模型间切换，并且不需要对代码有破坏性的修改。
    """
    return arguments
 
 
def chat(messages) -> Choice:
    completion = client.chat.completions.create(
        model="moonshot-v1-128k",
        messages=messages,
        temperature=0.3,
        tools=[
            {
                "type": "builtin_function",  # <-- 使用 builtin_function 声明 $web_search 函数，请在每次请求都完整地带上 tools 声明
                "function": {
                    "name": "$web_search",
                },
            }
        ]
    )
    return completion.choices[0]
 
 
def main():
    messages = [
        {"role": "system", "content": "你是 Kimi。"},
    ]
 
    # 初始提问
    messages.append({
        "role": "user",
        "content": "联网搜索哪吒2。"
    })
 
    finish_reason = None
    while finish_reason is None or finish_reason == "tool_calls":
        print("Kimi联网思考 ")
        choice = chat(messages)
        print(choice)
        finish_reason = choice.finish_reason
        if finish_reason == "tool_calls":  # <-- 判断当前返回内容是否包含 tool_calls
            messages.append(choice.message)  # <-- 我们将 Kimi 大模型返回给我们的 assistant 消息也添加到上下文中，以便于下次请求时 Kimi 大模型能理解我们的诉求
            for tool_call in choice.message.tool_calls:  # <-- tool_calls 可能是多个，因此我们使用循环逐个执行
                tool_call_name = tool_call.function.name
                tool_call_arguments = json.loads(tool_call.function.arguments)  # <-- arguments 是序列化后的 JSON Object，我们需要使用 json.loads 反序列化一下
                if tool_call_name == "$web_search":
                    tool_result = search_impl(tool_call_arguments)
                else:
                    tool_result = f"Error: unable to find tool by name '{tool_call_name}'"
 
                # 使用函数执行结果构造一个 role=tool 的 message，以此来向模型展示工具调用的结果；
                # 注意，我们需要在 message 中提供 tool_call_id 和 name 字段，以便 Kimi 大模型
                # 能正确匹配到对应的 tool_call。
                messages.append({
                    "role": "tool",
                    "tool_call_id": tool_call.id,
                    "name": tool_call_name,
                    "content": json.dumps(tool_result),  # <-- 我们约定使用字符串格式向 Kimi 大模型提交工具调用结果，因此在这里使用 json.dumps 将执行结果序列化成字符串
                })
        # else:
        #     break
 
    print(choice.message.content)  # <-- 在这里，我们才将模型生成的回复返回给用户
 
 
if __name__ == '__main__':
    main()

Kimi联网思考 
Choice(finish_reason='tool_calls', index=0, logprobs=None, message=ChatCompletionMessage(content='', refusal=None, role='assistant', audio=None, function_call=None, tool_calls=[ChatCompletionMessageToolCall(id='t-web_search-67b00b0198a6', function=Function(arguments='{"search_result":{"search_id":"94c9db3467b00b0164481b0001012198"},"usage":{"total_tokens":7299}}', name='$web_search'), type='builtin_function')]))
Kimi联网思考 
Choice(finish_reason='stop', index=0, logprobs=None, message=ChatCompletionMessage(content='以下是关于“哪吒2”的一些信息汇总：\n\n1. **电影《哪吒2之魔童闹海》**：这是国产动画电影《哪吒之魔童降世》的续作，由饺子导演，已定档2025年大年初一（2025年1月29日）上映。《哪吒之魔童降世》于2019年上映后，拿下了超50亿票房，当前位列中国电影票房总榜第四。《哪吒2》讲述了天劫之后，哪吒、敖丙的灵魂虽保住了，但肉身很快会魂飞魄散。太乙真人打算用七色宝莲给二人重塑肉身，但在重塑肉身的过程中却遇到重重困难，哪吒、敖丙的命运将走向何方？[来源](https://www.ithome.com/0/822/841.htm)\n\n2. **票房成绩**：《哪吒之魔童闹海》累计票房（含预售及海外票房）破100亿元，成为中国电影史上首部票房过百亿的影片，同时创造全球单一电影市场最高票房纪录。[来源](https://news.sina.com.cn/zx/2025-02-14/doc-inekmyqz0804477.shtml)\n\n3. **海外上映**：《哪吒2》将在北美地区开启特别制式点映，2月14日正式上映。目前

# 3-工具调用

In [None]:
from openai import OpenAI
 
client = OpenAI(
    api_key = "sk-b09XXwR8nOmrdoXTrylErTOJ0mWQYxKsRZBLMmfCiV2K0grF",
    base_url = "https://api.moonshot.cn/v1",
)

tool = [
    {
      "type": "function",
      "function": {
        "name": "CodeRunner",
        "description": "代码执行器，支持运行 python 和 javascript 代码",
        "parameters": {
          "properties": {
            "language": {
              "type": "string",
              "enum": ["python", "javascript"]
            },
            "code": {
              "type": "string",
              "description": "代码写在这里"
            }
          },
          "type": "object"
        }
      }
    }
  ]

In [None]:
completion = client.chat.completions.create(
    model="moonshot-v1-8k",
    messages=[
        {"role": "system", "content": "你是 Kimi，由 Moonshot AI 提供的人工智能助手，你更擅长中文和英文的对话。你会为用户提供安全，有帮助，准确的回答。同时，你会拒绝一些涉及恐怖主义，种族歧视，黄色暴力等问题的回答。Moonshot AI 为专有名词，不可翻译成其他语言。"},
        {"role": "user", "content": "编程判断 3214567 是否是素数。"}
    ],
    tools = tool,
    temperature=0.3,
)
print(completion.choices[0].message.tool_calls[0].function.arguments)

In [None]:
completion.choices[0].message.tool_calls[0].function.arguments["code"]