# 基本知识补充

## 1. `functools.partial`

Python中的`functools.partial`是一个高阶函数,它的作用是基于一个原函数创建一个新的可调用对象(函数),并将原函数的某些参数固定(冻结)为指定的值。这个新函数在调用时需要较少的参数,从而简化了函数的使用。[1][2][3][4]

## 使用方式

`partial`函数的语法如下:

```python
functools.partial(func, *args, **kwargs)
```

- `func`是要包装的原函数
- `*args`是要固定的位置参数
- `**kwargs`是要固定的关键字参数

它返回一个新的`partial`对象,这个对象是一个可调用的函数,在调用时会先将固定的参数传入原函数,然后再传入剩余的参数。[1][4]

## 应用场景

`partial`函数常用于以下几种情况:

1. **固定函数的部分参数值**,以简化函数的调用。比如将`int(x, base=2)`转换为`int2 = partial(int, base=2)`后,`int2(x)`就相当于`int(x, base=2)`。[1][3][4]

2. **为回调函数提供参数**,避免使用`lambda`或者`def`语句。[2]

3. **创建单例对象**,通过固定`__new__`或`__init__`方法的参数来实现。[2]

4. **在函数式编程中组合高阶函数**,比如`functools.partial(map, operator.mul, [1][2][3], repeat(4))`相当于`[x*4 for x in [1][2][3]]`。[2]

## 注意事项

使用`partial`时需要注意:

1. 它不会保留原函数的元数据(如`__doc__`、`__annotations__`等),需要手动复制。[4]
2. 在调用新函数时,仍然可以显式传入与固定参数同名的参数,这将覆盖固定的参数值。[1][4]
3. `partial`对象有`func`、`args`和`keywords`三个只读属性,分别表示原函数、固定的位置参数和关键字参数。[4]

总之,`functools.partial`是一个强大而灵活的工具,可以简化函数的使用,提高代码的可读性和可维护性。

Citations:
[1] https://blog.csdn.net/leo0308/article/details/125277212
[2] http://dengqs.com/posts/python_functools_partial
[3] https://www.runoob.com/w3cnote/python-partial.html
[4] https://www.cnblogs.com/f-ck-need-u/p/10198013.html
[5] https://www.cnblogs.com/taosiyu/p/11546660.html

## 2. `langchain_core.prompts.base.format_document`

`langchain_core.prompts.base.format_document` 是一个函数,用于根据提示模板将文档格式化为字符串。它执行以下操作:

1. 从文档中提取两个信息源:
   - `page_content`: 文档的实际内容
   - `metadata`: 文档的元数据

2. 将这些信息赋值给同名变量。

3. 将这些变量传递给提示模板,生成最终的格式化字符串。

函数签名如下:

```python
def format_document(doc, prompt):
    ...
```

- `doc` (Document): 要格式化的文档对象,其 `page_content` 和 `metadata` 将被用于生成最终字符串。
- `prompt` (BasePromptTemplate): 用于格式化 `page_content` 和 `metadata` 为最终字符串的提示模板。

返回值是格式化后的字符串。

例如:

```python
from langchain_core.documents import Document
from langchain_core.prompts import PromptTemplate

doc = Document(page_content="This is a joke", metadata={"page": "1"})
prompt = PromptTemplate.from_template("Page {page}: {page_content}")
formatted_string = format_document(doc, prompt)
print(formatted_string) # 输出: "Page 1: This is a joke"
```

这个函数通常用于将文档格式化为可以输入到语言模型中的字符串,以便进行问答、摘要等任务。[1]

Citations:
[1] https://api.python.langchain.com/en/latest/prompts/langchain_core.prompts.base.format_document.html
[2] https://blog.csdn.net/zjkpy_5/article/details/137656785
[3] http://www.bimant.com/blog/langchain-vs-llamaindex/
[4] https://ningto.com/post/ea28c23ed2324bd28ff0d4a1a3de5672
[5] https://blog.csdn.net/zjkpy_5/article/details/137615382

In [None]:
# MapReduce策略
# Map 并行处理文档
# Reduce 合并处理结果

from functools import partial

