In [1]:
import os 
workspace="/Users/tr/Documents/GitHub/Learning-Agents"
os.chdir(workspace)

In [2]:
# Please install OpenAI SDK first: `pip3 install openai`

from openai import OpenAI

client = OpenAI(
    api_key=os.getenv('DEEPSEEK_API_KEY', ''), 
    base_url="https://api.deepseek.com"
)

In [3]:
markdown_path=os.path.join(workspace,"assets","test_notes.md")
with open(markdown_path,'r',encoding='utf-8') as f:
    markdown_content=f.read()
markdown_content


"## Machine Learning Notes\n\n### Total Energy Conservation Property [cite: 1]\n\n* Idea of Hill: Add the momentum variable for each dimension of x (Auxiliary variable)[cite: 1, 2].\n* Update $(x, r)$ together with helping move rapidly through the target[cite: 2].\n* Assume: $n$ is index $x$, and $m$. [cite: 2]\n* HMC uses Met framework to sample $(x, r)$ with acceptance/rejection possibilities, and then at samples marginally[cite: 2].\n\n### Hamiltonian Monte Carlo (HMC) [cite: 3]\n\n* (Neal, 1996) Review by Neal 2011[cite: 3].\n* Hybrid MC (Duane, 1987)[cite: 3].\n* Primary: position $(x)$[cite: 3].\n* Auxiliary: momentum $(r)$[cite: 3].\n* Hamiltonian dynamics $H(x, r)$[cite: 3].\n    * $U(x)$: potential (energy)[cite: 3].\n    * $K(r)$: kinetic (energy) (e.g., $\\frac{1}{2}M^{-1}r^2$)[cite: 3].\n* Hamiltonian: $H(x, r) = U(x) + K(r)$[cite: 3].\n* Frictionless[cite: 3].\n* Continuous dynamics:\n    * $\\frac{dx}{dt} = \\frac{\\partial H}{\\partial r}$ [cite: 3]\n    * $\\frac{dr}{dt

In [4]:
prompt = \
    """
    你是一个专业的数学和机器学习教育专家。请将以下Markdown笔记内容转换为FlashCards格式。

    要求：
    1. 识别并保留所有LaTeX数学公式，确保其格式正确
    2. 根据知识点的重要性和考试出现概率进行拆分
    3. 每个知识点应该是完整的概念，包含必要的上下文
    4. 对于数学证明或推导，应该将过程拆分为合理的步骤
    5. 每个FlashCard包含：
       - question: 问题（可以是概念解释、证明步骤、公式推导等）
       - answer: 详细答案（包含完整的解释和相关公式）
       - importance: 重要性 (1-5，5最重要)
       - probability: 考试概率 (1-5，5最可能)
    6. 返回JSON数组格式，确保所有LaTeX公式都正确保留

    示例输出格式：
    [
        {{
            "question": "什么是高斯过程(GP)的定义？",
            "answer": "高斯过程(GP)是一个随机过程，其任何有限次实现集合都具有联合多元正态分布。数学表示为：$f(x) \\sim GP(\\mu(x), k(x, x'))$，其中：\\n- $\\mu(x)$ 是均值函数\\n- $k(x, x')$ 是协方差函数",
            "importance": 5,
            "probability": 4
        }}
    ]

    笔记内容：
    {content}
    """.format(content=markdown_content)


In [5]:
response = client.chat.completions.create(
            model="deepseek-chat",
            messages=[
                {
                    "role": "system",
                    "content": "你是一个专业的数学和机器学习教育专家，精通将复杂的数学概念转换为清晰的FlashCards。请确保保留所有LaTeX公式，并确保输出格式严格符合JSON规范。"
                },
                {
                    "role": "user",
                    "content": prompt
                }
            ],
            temperature=0.3,  # 降低温度以获得更确定性的输出
            max_tokens=4000,  # 增加最大token以处理长文本
            stream=False
        )

In [16]:
content=response.choices[0].message.content

In [20]:
print(content)

```json
[
    {
        "question": "什么是哈密顿蒙特卡洛(HMC)中的总能量守恒性质？",
        "answer": "HMC通过引入动量变量$r$作为辅助变量，与位置变量$x$一起更新，帮助快速遍历目标分布。假设$n$是$x$的索引，$m$是动量维度。HMC使用Metropolis框架对$(x, r)$进行采样，通过接受/拒绝机制，最终边际化获得$x$的样本。",
        "importance": 4,
        "probability": 3
    },
    {
        "question": "哈密顿蒙特卡洛(HMC)的基本组成是什么？",
        "answer": "HMC由两部分组成：\n1. 主变量：位置变量$(x)$\n2. 辅助变量：动量变量$(r)$\n系统由哈密顿量$H(x, r)$描述，其中：\n- $U(x)$是势能（与目标分布相关）\n- $K(r)$是动能（例如$\frac{1}{2}M^{-1}r^2$）\n总哈密顿量：$H(x, r) = U(x) + K(r)$",
        "importance": 5,
        "probability": 4
    },
    {
        "question": "哈密顿动力学的基本方程是什么？",
        "answer": "无摩擦的哈密顿动力学方程为：\n$\frac{dx}{dt} = \frac{\partial H}{\partial r}$\n$\frac{dr}{dt} = -\frac{\partial H}{\partial x}$\n这些方程描述了系统在相空间中的连续演化。",
        "importance": 5,
        "probability": 5
    },
    {
        "question": "如何将连续的哈密顿动力学离散化？",
        "answer": "通过欧拉离散化将连续时间转化为离散时间步长：\n$(x(t), r(t)) \rightarrow (x(t+\epsilon), r(t+\epsilon))$\n虽然形式简单，但误差控制较困难。",
        "import

In [30]:
content = content.strip()
if content.startswith("```json"):
    content = content[len("```json"):].strip()
if content.endswith("```"):
    content = content[:-len("```")].strip()
content = content.lstrip('\ufeff')
content = content.replace('\\', '\\\\')

In [31]:
print(content)

[
    {
        "question": "什么是哈密顿蒙特卡洛(HMC)中的总能量守恒性质？",
        "answer": "HMC通过引入动量变量$r$作为辅助变量，与位置变量$x$一起更新，帮助快速遍历目标分布。假设$n$是$x$的索引，$m$是动量维度。HMC使用Metropolis框架对$(x, r)$进行采样，通过接受/拒绝机制，最终边际化获得$x$的样本。",
        "importance": 4,
        "probability": 3
    },
    {
        "question": "哈密顿蒙特卡洛(HMC)的基本组成是什么？",
        "answer": "HMC由两部分组成：\\n1. 主变量：位置变量$(x)$\\n2. 辅助变量：动量变量$(r)$\\n系统由哈密顿量$H(x, r)$描述，其中：\\n- $U(x)$是势能（与目标分布相关）\\n- $K(r)$是动能（例如$\\frac{1}{2}M^{-1}r^2$）\\n总哈密顿量：$H(x, r) = U(x) + K(r)$",
        "importance": 5,
        "probability": 4
    },
    {
        "question": "哈密顿动力学的基本方程是什么？",
        "answer": "无摩擦的哈密顿动力学方程为：\\n$\\frac{dx}{dt} = \\frac{\\partial H}{\\partial r}$\\n$\\frac{dr}{dt} = -\\frac{\\partial H}{\\partial x}$\\n这些方程描述了系统在相空间中的连续演化。",
        "importance": 5,
        "probability": 5
    },
    {
        "question": "如何将连续的哈密顿动力学离散化？",
        "answer": "通过欧拉离散化将连续时间转化为离散时间步长：\\n$(x(t), r(t)) \\rightarrow (x(t+\\epsilon), r(t+\\epsilon))$\\n虽然形式简单，但误差控制较困难。",


In [32]:
import json 
json_content=json.loads(content)
json_content

[{'question': '什么是哈密顿蒙特卡洛(HMC)中的总能量守恒性质？',
  'answer': 'HMC通过引入动量变量$r$作为辅助变量，与位置变量$x$一起更新，帮助快速遍历目标分布。假设$n$是$x$的索引，$m$是动量维度。HMC使用Metropolis框架对$(x, r)$进行采样，通过接受/拒绝机制，最终边际化获得$x$的样本。',
  'importance': 4,
  'probability': 3},
 {'question': '哈密顿蒙特卡洛(HMC)的基本组成是什么？',
  'answer': 'HMC由两部分组成：\\n1. 主变量：位置变量$(x)$\\n2. 辅助变量：动量变量$(r)$\\n系统由哈密顿量$H(x, r)$描述，其中：\\n- $U(x)$是势能（与目标分布相关）\\n- $K(r)$是动能（例如$\\frac{1}{2}M^{-1}r^2$）\\n总哈密顿量：$H(x, r) = U(x) + K(r)$',
  'importance': 5,
  'probability': 4},
 {'question': '哈密顿动力学的基本方程是什么？',
  'answer': '无摩擦的哈密顿动力学方程为：\\n$\\frac{dx}{dt} = \\frac{\\partial H}{\\partial r}$\\n$\\frac{dr}{dt} = -\\frac{\\partial H}{\\partial x}$\\n这些方程描述了系统在相空间中的连续演化。',
  'importance': 5,
  'probability': 5},
 {'question': '如何将连续的哈密顿动力学离散化？',
  'answer': '通过欧拉离散化将连续时间转化为离散时间步长：\\n$(x(t), r(t)) \\rightarrow (x(t+\\epsilon), r(t+\\epsilon))$\\n虽然形式简单，但误差控制较困难。',
  'importance': 4,
  'probability': 3},
 {'question': '请解释一维情况下哈密顿量的例子及其解',
  'answer': '例子：$H(x,r) = \\\\frac{r^2}{2} + \\\\

In [14]:
content=content.encode().decode('unicode_escape')

  content=content.encode().decode('unicode_escape')


'```json\n[\n    {\n        "question": "ä»\x80ä¹\x88æ\x98¯å\x93\x88å¯\x86é¡¿è\x92\x99ç\x89¹å\x8d¡æ´\x9b(HMC)ä¸\xadç\x9a\x84æ\x80»è\x83½é\x87\x8få®\x88æ\x81\x92æ\x80§è´¨ï¼\x9f",\n        "answer": "HMCé\x80\x9aè¿\x87å¼\x95å\x85¥å\x8a¨é\x87\x8få\x8f\x98é\x87\x8f$r$ä½\x9cä¸ºè¾\x85å\x8a©å\x8f\x98é\x87\x8fï¼\x8cä¸\x8eä½\x8dç½®å\x8f\x98é\x87\x8f$x$ä¸\x80èµ·æ\x9b´æ\x96°ï¼\x8cå¸®å\x8a©å¿«é\x80\x9fé\x81\x8då\x8e\x86ç\x9b®æ\xa0\x87å\x88\x86å¸\x83ã\x80\x82å\x81\x87è®¾$n$æ\x98¯$x$ç\x9a\x84ç´¢å¼\x95ï¼\x8c$m$æ\x98¯å\x8a¨é\x87\x8fç»´åº¦ã\x80\x82HMCä½¿ç\x94¨Metropolisæ¡\x86æ\x9e¶å¯¹$(x, r)$è¿\x9bè¡\x8cé\x87\x87æ\xa0·ï¼\x8cé\x80\x9aè¿\x87æ\x8e¥å\x8f\x97/æ\x8b\x92ç»\x9dæ\x9cºå\x88¶ï¼\x8cæ\x9c\x80ç»\x88è¾¹é\x99\x85å\x8c\x96è\x8e·å¾\x97$x$ç\x9a\x84æ\xa0·æ\x9c¬ã\x80\x82",\n        "importance": 4,\n        "probability": 3\n    },\n    {\n        "question": "å\x93\x88å¯\x86é¡¿è\x92\x99ç\x89¹å\x8d¡æ´\x9b(HMC)ç\x9a\x84å\x9fºæ\x9c¬ç»\x84æ\x88\x90æ\x98¯ä»\x80ä¹\x88ï¼\x9f",\n        "answer": "HMCç\x94±ä¸¤é\x

In [11]:
import json 
content = content.strip()
if content.startswith('```json'):
    content = content[7:]
if content.endswith('```'):
    content = content[:-3]
content = content.strip()

print(content)

[
    {
        "question": "ä»ä¹æ¯åå¯é¡¿èç¹å¡æ´(HMC)ä¸­çæ»è½éå®ææ§è´¨ï¼",
        "answer": "HMCéè¿å¼å¥å¨éåé$r$ä½ä¸ºè¾å©åéï¼ä¸ä½ç½®åé$x$ä¸èµ·æ´æ°ï¼å¸®å©å¿«ééåç®æ åå¸ãåè®¾$n$æ¯$x$çç´¢å¼ï¼$m$æ¯å¨éç»´åº¦ãHMCä½¿ç¨Metropolisæ¡æ¶å¯¹$(x, r)$è¿è¡éæ ·ï¼éè¿æ¥å/æç»æºå¶ï¼æç»è¾¹éåè·å¾$x$çæ ·æ¬ã",
        "importance": 4,
        "probability": 3
    },
    {
        "question": "åå¯é¡¿èç¹å¡æ´(HMC)çåºæ¬ç»ææ¯ä»ä¹ï¼",
        "answer": "HMCç±ä¸¤é¨åç»æï¼
1. ä¸»åéï¼ä½ç½®åé$(x)$
2. è¾å©åéï¼å¨éåé$(r)$
ç³»ç»ç±åå¯é¡¿é$H(x, r)$æè¿°ï¼å¶ä¸­ï¼
- $U(x)$æ¯å¿è½ï¼ä¸ç®æ åå¸ç¸å³ï¼
- $K(r)$æ¯å¨è½ï¼ä¾å¦$rac{1}{2}M^{-1}r^2$ï¼
æ»åå¯é¡¿éï¼$H(x, r) = U(x) + K(r)$",
        "importance": 5,
        "probability": 4
    },
    {
        "question": "åå¯é¡¿å¨åå­¦çåºæ¬æ¹ç¨æ¯ä»ä¹ï¼",
        "answer": "æ æ©æ