## 提取文本

### 截取：extract_final_answer

In [1]:
from illufly.utils import extract_final_answer

extract_final_answer("""
**最终答案**
This is final answer.
""", final_answer_prompt="最终答案")

'**最终答案**\nThis is final answer.'

In [2]:
from illufly.utils import extract_final_answer

extract_final_answer("""
### 最终答案
This is final answer.
""", final_answer_prompt="最终答案")

'### 最终答案\nThis is final answer.'

In [3]:
from illufly.utils import extract_final_answer

extract_final_answer("""
### 最终答案
This is final answer.
""", final_answer_prompt="**最终答案**")

'### 最终答案\nThis is final answer.'

In [4]:
from illufly.utils import extract_final_answer

extract_final_answer("""
### 最终答案
This is final answer.
""", final_answer_prompt="答案")

''

### 提取包裹内容：extract_segments / extract_text

In [3]:
from illufly.utils import extract_text, extract_segments

text = """
**思考**  
当前任务是要比较两个数字：9.11和9.9，确定哪一个更大。这个问题的关键概念是“数字比较”。已经明确的取值有：
- 数字1: 9.11
- 数字2: 9.9

将任务中的关键概念拆解为一系列待查询的子要素：
- 数字比较
- 比较规则
- 数字的大小

观察以前的执行记录：在这个简单的数学比较任务中，概念拆解已经足够明确。
我们了解数字比较的基本规则，即先比较整数部分，如果相同，则比较小数部分。因此，我们可以直接进行比较。

**行动**  
根据数字比较的规则，首先比较两个数字的整数部分。
9.11和9.9的整数部分都是9，所以接下来比较它们的小数部分。
9.11的小数部分是0.11，而9.9的小数部分是0.9。显然，0.11小于0.9，因此9.11小于9.9。

**最终答案**
<final_answer>
我是第一个答案：9.9更大。
</final_answer>

**最终答案**
<final_answer>
我是第二个答案：9.9更大。
</final_answer>
"""

extract_segments(text, ("<final_answer>", "</final_answer>"))

['我是第一个答案：9.9更大。\n', '我是第二个答案：9.9更大。\n']

In [4]:
extract_segments(text, ("<final_answer>", "</final_answer>"), include_markers=True)

['<final_answer>\n我是第一个答案：9.9更大。\n</final_answer>',
 '<final_answer>\n我是第二个答案：9.9更大。\n</final_answer>']

In [5]:
extract_segments(text, ("<final_answer>", "</final_answer>"), mode="first_last")

['我是第一个答案：9.9更大。\n</final_answer>\n\n**最终答案**\n<final_answer>\n我是第二个答案：9.9更大。']

In [6]:
extract_segments(text, ("<final_answer>", "</final_answer>"), mode="first_last", include_markers=True)

['<final_answer>\n我是第一个答案：9.9更大。\n</final_answer>\n\n**最终答案**\n<final_answer>\n我是第二个答案：9.9更大。\n</final_answer>']

In [7]:
extract_text(text, ("<final_answer>", "</final_answer>"))

'我是第一个答案：9.9更大。\n\n我是第二个答案：9.9更大。\n'

### 截取时的开始和结束标记相同

In [1]:
from illufly.utils import extract_text, extract_segments

text = """
**思考**  
当前任务是要比较两个数字：9.11和9.9，确定哪一个更大。这个问题的关键概念是“数字比较”。已经明确的取值有：
- 数字1: 9.11
- 数字2: 9.9

将任务中的关键概念拆解为一系列待查询的子要素：
- 数字比较
- 比较规则
- 数字的大小

观察以前的执行记录：在这个简单的数学比较任务中，概念拆解已经足够明确。
我们了解数字比较的基本规则，即先比较整数部分，如果相同，则比较小数部分。因此，我们可以直接进行比较。

**行动**  
根据数字比较的规则，首先比较两个数字的整数部分。
9.11和9.9的整数部分都是9，所以接下来比较它们的小数部分。
9.11的小数部分是0.11，而9.9的小数部分是0.9。显然，0.11小于0.9，因此9.11小于9.9。

**最终答案**
```我是第一个答案：9.9更大。```

**最终答案**
```
我是第二个答案：9.9更大。
```
"""

extract_segments(text, ("```", "```"))

['我是第一个答案：9.9更大。', '我是第二个答案：9.9更大。']

In [2]:
extract_segments(text, ("```", "```"), mode="first_last")

['我是第一个答案：9.9更大。```\n\n**最终答案**\n```\n我是第二个答案：9.9更大。']

### start必须是行的开头，end可以是行内任何位置

In [1]:
from illufly.utils import extract_text, extract_segments

text = """
**思考**  
当前任务是要比较两个数字：9.11和9.9，确定哪一个更大。这个问题的关键概念是“数字比较”。已经明确的取值有：
- 数字1: 9.11
- 数字2: 9.9

将任务中的关键概念拆解为一系列待查询的子要素：
- 数字比较
- 比较规则
- 数字的大小

观察以前的执行记录：在这个简单的数学比较任务中，概念拆解已经足够明确。
我们了解数字比较的基本规则，即先比较整数部分，如果相同，则比较小数部分。因此，我们可以直接进行比较。

**行动**  
根据数字比较的规则，首先比较两个数字的整数部分。
9.11和9.9的整数部分都是9，所以接下来比较它们的小数部分。
9.11的小数部分是0.11，而9.9的小数部分是0.9。显然，0.11小于0.9，因此9.11小于9.9。

**最终答案**
<final_answer>我是第一个答案：9.9更大。</final_answer>

**最终答案**
<final_answer>
我是第二个答案：9.9更大。
</final_answer>
"""

extract_segments(text, ("<final_answer>", "</final_answer>"))

['我是第一个答案：9.9更大。</final_answer>\n\n**最终答案**\n<final_answer>\n我是第二个答案：9.9更大。']

In [2]:
extract_segments(text, ("<final_answer>", "</final_answer>"), mode="single")

['我是第一个答案：9.9更大。</final_answer>\n\n**最终答案**\n<final_answer>\n我是第二个答案：9.9更大。']

### 如果不匹配，就全部返回

In [3]:
extract_segments(text, ("<no_final_answer>", "</final_answer>"), mode="multiple")

[]

In [4]:
extract_segments(text, ("<no_final_answer>", "</final_answer>"), mode="single")

['\n**思考**  \n当前任务是要比较两个数字：9.11和9.9，确定哪一个更大。这个问题的关键概念是“数字比较”。已经明确的取值有：\n- 数字1: 9.11\n- 数字2: 9.9\n\n将任务中的关键概念拆解为一系列待查询的子要素：\n- 数字比较\n- 比较规则\n- 数字的大小\n\n观察以前的执行记录：在这个简单的数学比较任务中，概念拆解已经足够明确。\n我们了解数字比较的基本规则，即先比较整数部分，如果相同，则比较小数部分。因此，我们可以直接进行比较。\n\n**行动**  \n根据数字比较的规则，首先比较两个数字的整数部分。\n9.11和9.9的整数部分都是9，所以接下来比较它们的小数部分。\n9.11的小数部分是0.11，而9.9的小数部分是0.9。显然，0.11小于0.9，因此9.11小于9.9。\n\n**最终答案**\n<final_answer>我是第一个答案：9.9更大。</final_answer>\n\n**最终答案**\n<final_answer>\n我是第二个答案：9.9更大。\n</final_answer>\n']