#### **1. 导入模块**

导入 Python 标准库和本项目自定义库

In [1]:
# 标准库
import os
import sys

# 将上级目录加入系统路径
# 以便导入项目自定义库
sys.path.append(os.path.abspath('..'))

# 自定义库
from src.llm_client import LLMClient

#### **2. 加载模型**

加载大模型 API 接口

In [2]:
# 模型名称
# 可选模型：
# 大模型：kimi-k2.5 | glm-5 | deepseek-v3.2 | qwen3-max

model = 'kimi-k2.5'

# 采样温度系数
# 控制生成结果的多样性
# 取值越高，生成结果更多样
# 反之，生成结果更确定
# 取值范围：[0, 2)
# 默认系数：0.1

temperature = 0.1

# 是否开启思考模式
# 若开启：enable_thinking =True
# 模型会输出完整推理过程
# 生成更长文本，消耗更多 Token
# 默认模式：不开启

enable_thinking = False

# 初始化大模型 API 接口
# 登录阿里云百炼平台：https://bailian.console.aliyun.com/
# 申请调用大模型服务的 API-Key
# 并在 config 文件中设置 LLM_API_KEY=sk-********
# 新注册用户可免费调用部分模型的 API
# 登录后在模型服务页面查看免费模型列表

client = LLMClient(
    model=model,
    temperature=temperature,
    enable_thinking=enable_thinking,
)
print('LLM API 接口加载完毕！')

LLM API 接口加载完毕！


#### **3. 汉语分词**

大模型汉语分词：文本格式输出

In [3]:
# === 汉语分词提示词：文本格式输出 ===

# 可替换提示词中的中文文本
# 测试中文分词效果

prompt = """
You are a professional corpus linguist specialized in Chinese tokenization.

Your task is to tokenize the given text.

Text: 北风如刀，满地冰霜。
"""

In [4]:
# === 调用大模型 API：开始分词 ===

# --- 注意 ---
# 为节省 API 调用成本
# 大模型生成内容保存于本地缓存 data/llm_cache
# 完成首次调用后，再次调用只需从本地数据库读取生成结果

# 若需测试 API 连接是否正常
# 可修改提示词后，重新标注

# 输出文本格式的分词结果

client.get_response(prompt=prompt)

'I\'ll tokenize this classical Chinese text, analyzing it linguistically.\n\n## Tokenization Result\n\n| Token | POS/Category | Notes |\n|-------|-------------|-------|\n| 北风 | Noun (NP) | Compound noun: "north wind" |\n| 如 | Verb/Simile marker | "like, as" — comparative verb |\n| 刀 | Noun | "knife/blade" — object of simile |\n| ， | Punctuation | Comma |\n| 满地 | Adverbial phrase (Loc+NP) | "full ground" = everywhere on the ground |\n| 冰霜 | Noun (NP) | Compound noun: "frost and ice" |\n| 。 | Punctuation | Period |\n\n---\n\n## Analysis\n\n**Sentence structure:**\n- **Clause 1:** 北风如刀 — Subject-Predicate with simile (明喻)\n  - [NP 北风] + [V 如] + [NP 刀]\n  - "The north wind is like a knife"\n\n- **Clause 2:** 满地冰霜 — Locative-topic construction\n  - [AdvP 满地] + [NP 冰霜]\n  - "(There is) frost and ice all over the ground"\n\n**Poetic features:** Parallel 4-character clauses (四字句), typical of classical Chinese regulated verse. The comma splits two imagistic descriptions forming a couplet-like s