Python 函数合并

合并函数，降低函数调用成本。仅支持 Python 3.11。

背景

继续下去前，需要了解一些前置知识：

对Python的编译和解释，函数栈帧的创建和执行过程有基础概念
types.FunctionType 函数类型
types.CodeType 代码类型
dis 模块
The bytecode interpreter of Python3.11

可行性

types.FunctionType 的实例含有函数在运行时需要的所有信息。将多个函数合并，也就是把它们的函数对象以一定规则合并，使用合并后的数据，新建 types.FunctionType 实例，创建出一个新的函数实例。需要合并的属性有：

__code__
__globals__
__defaults__
__closure__

具体的合并细节在下一节详细讨论。

合并函数

合并全局环境

__globals__ 全局环境的字典。合并策略：key,value都相同，排重；当有相同key，但不同value时，重命名 key。

合并参数环境

__defaults__，默认参数元组。合并策略：依次连接，不排重。

合并闭包

__closure__，胞体元组。合并策略：依次连接，不排重。

合并 code

变量名合并

co_names，代码内的所有变量名。不排重，直接合并，另外还要增加合并 globals 时造成的重命名名字。

常量合并

co_consts，常量元组，直接合并。

字节码合并

合并，修正 co_code, co_codelen

重要的变化

3.6 变更，每条指令使用 2 个字节，使用前置的 EXTENDED_ARG(ext) 支持超过一个字节的数据，最多允许三个。
3.10 变更：跳转、异常处理和循环指令的参数为指令偏移量，而不是字节偏移量
3.11 变更：有些指令带有一个或多个CACHE指令
LOAD_GLOBAL(namei)，如果设置了 namei 的最低位，则会在全局变量前，将一个 NULL 推入栈
异常处理增加了 co_exceptiontable ，
生成式使用闭包实现
闭包和CELL相关的指令，参数不再是 co_varnames 的长度偏移量，而是 "fast locals" 存储的 i 号槽位。

合并指令时，原则是不删指令，尽量替换为 NOP，或者增加指令。

无参指令

CACHE: 每个指令拥有的 CACHE 数的数据在 opcode.py _inline_cache_entries 中，直接合并。
RESUME: 只是一个标志，可以直接合入。
RETURN_VALUE: 对于不是最后一个函数，如果在函数尾部，替换为 NOP；对于所有函数，如果在中部，替换为 JUMP_FORWARD(delta)，跳到下一个函数头部，如果前个指令是 LOAD_CONST(namei)，则把它替换为 NOP。
默认合并其他无参指令。

操作数

对于有参数的指令，在合并时，操作数可能发生变化。当参数超出原操作数的上限时，需要插入 EXTENDED_ARG。

跳转

考虑到有参指令的修改可能插入指令，如果插入位置被跳转范围覆盖，需要增加跳转指令。需要注意，增加跳转指令的参数，可能造成新的 EXTENDED_ARG 指令插入。

异常处理

处理 co_exceptiontable，合并所有 entry, 因为有插入指令，需要修正其中的数据。

闭包

因为函数的局部变量，可能在别的函数中会被 MAKE_CELL(i) 指令变为 CELL。面对这种情况，做以下修改：

在合并所有函数前，先合并 co_varnames, co_cellvars
使用合并后的 co_varnames，co_cellvars 生成新的 MAKE_CELL(i) 放在合并函数的最前面
将原函数的 MAKE_CELL(i) 替换为 (NOP, 0)
修正 closure 相关的指令的操作数
修正 XXXX_FAST 相关指令的操作数
如果 XXXX_FAST 指向的变量被 CELL 化了，修改操作码为 XXXX_DEREF
异常处理的合并需要考虑 MAKE_CELL(i) 的插入

栈帧大小

合并时会有压栈指令没有没对应的弹出，简单取最大值可能会造成溢出。由于计算准确的栈帧大小成本太高，现在只是取最大值再加10。

Locations Table

3.11 使用 co_linetable 表达每条指令的所在的代码行数。co_linetable 是被编码过的数据，详细内容见 Objects/locations.md。

合并需要考虑：

由于插入 EXTENDED_ARG 的行为，合并时需要纠正 length 数据
当塞入 NOP 作为填充指令时，需要插入新的数据，以保持和有效指令数量一致
因为合并后的行数对于Debug已经没有意义，所以不考虑行数的正确性。只保证 tracy 可以正确显示调用栈。

Name		Name	Last commit message	Last commit date
Latest commit History 19 Commits
.gitignore		.gitignore
README.md		README.md
merge_fun.py		merge_fun.py
testcase.py		testcase.py

Provide feedback

Saved searches

Use saved searches to filter your results more quickly

Uh oh!

Repository files navigation

Python 函数合并

背景

可行性

合并函数

合并全局环境

合并参数环境

合并闭包

合并 code

变量名合并

常量合并

字节码合并

无参指令

操作数

跳转

异常处理

闭包

栈帧大小

Locations Table

About

Uh oh!

Releases

Packages

Languages

HengHuH/pycode

Folders and files

Latest commit

History

Repository files navigation

Python 函数合并

背景

可行性

合并函数

合并全局环境

合并参数环境

合并闭包

合并 __code__

变量名合并

常量合并

字节码合并

无参指令

操作数

跳转

异常处理

闭包

栈帧大小

Locations Table

About

Resources

Uh oh!

Stars

Watchers

Forks

Releases

Packages 0

Languages

合并 code

Packages