# 分析一下哪些定理使用最频繁

In [1]:
import json
import os


def read_thm_file(thmname, base = "tests/follow/set.mm/json"):
    with open(os.path.join(base, thmname+".json"), "r") as f:
        block = json.load(f)
    return block 

with open("tests/follow/set.mm/json/thms.txt", "r") as thms_f:
    thms = [
        line.strip() for line in thms_f.readlines()
    ]  # 使用 strip() 去掉每行的换行符

cnt_map: dict[str, int] = {}
for thm in thms:
    thm_info = read_thm_file(thm)
    operators = thm_info['operators']
    for label, _ in operators:
        if label in cnt_map:
            cnt_map[label] += 1
        else:
            cnt_map[label] = 1

usage_count_map: dict[int, int] = {}
for count in cnt_map.values():
    if count in usage_count_map:
        usage_count_map[count] += 1
    else:
        usage_count_map[count] = 1

print(len(usage_count_map))

100


In [2]:
# 打印使用次数最多的100个thm
sorted_thms = sorted(cnt_map.items(), key=lambda item: item[1], reverse=True)[:20]
print("使用次数最多的100个定理:")
for thm, count in sorted_thms:
    print(f"{thm}: {count} 次使用")

使用次数最多的100个定理:
ax-mp: 540 次使用
bitri: 478 次使用
syl: 384 次使用
nfv: 288 次使用
a1i: 263 次使用
id: 245 次使用
3bitr4i: 237 次使用
ex: 193 次使用
albii: 177 次使用
bitr4i: 174 次使用
imp: 142 次使用
df-ral: 137 次使用
nfcv: 134 次使用
sylbi: 133 次使用
sylibr: 125 次使用
impbii: 121 次使用
exbii: 121 次使用
adantl: 119 次使用
bicomi: 116 次使用
3bitr4g: 111 次使用


# 生成更多的数据

In [3]:
def get_thm(thmname, base="./tests/follow/set.mm/json"):
    with open(os.path.join(base, thmname + ".json"), "r") as f:
        thm = json.load(f)
    if thm["type"] != "thm":
        return None
    return thm

In [6]:
from metamath_to_follow.generate_recursive_data import translate_operators

idx = 200
thm = get_thm(thms[idx])
if thm:
    print(thm["operators"])

for label, input_args in thm['operators']:
    memory = translate_operators(label, input_args, base="./tests/follow/set.mm/json")
    print(memory)


[['expi', ['wi ( vw0 , vw1 )', 'wi ( vw1 , vw0 )', 'wb ( vw0 , vw1 )']], ['ax-mp', ['wi ( wn ( wi ( wi ( vw0 , vw1 ) , wn ( wi ( vw1 , vw0 ) ) ) ) , wb ( vw0 , vw1 ) )', 'wn ( wi ( wi ( wb ( vw0 , vw1 ) , wn ( wi ( wi ( vw0 , vw1 ) , wn ( wi ( vw1 , vw0 ) ) ) ) ) , wn ( wi ( wn ( wi ( wi ( vw0 , vw1 ) , wn ( wi ( vw1 , vw0 ) ) ) ) , wb ( vw0 , vw1 ) ) ) ) )']], ['simprim', ['wi ( wb ( vw0 , vw1 ) , wn ( wi ( wi ( vw0 , vw1 ) , wn ( wi ( vw1 , vw0 ) ) ) ) )', 'wi ( wn ( wi ( wi ( vw0 , vw1 ) , wn ( wi ( vw1 , vw0 ) ) ) ) , wb ( vw0 , vw1 ) )']], ['df-bi', ['vw0', 'vw1']]]
['|- wi ( wi ( vw0 , vw1 ) , wi ( wi ( vw1 , vw0 ) , wb ( vw0 , vw1 ) ) ) -| wi ( wn ( wi ( wi ( vw0 , vw1 ) , wn ( wi ( vw1 , vw0 ) ) ) ) , wb ( vw0 , vw1 ) ) <end> |- wi ( wi ( vw0 , vw1 ) , wi ( wi ( vw1 , vw0 ) , wb ( vw0 , vw1 ) ) ) -| wi ( wi ( vw0 , vw1 ) , wi ( wi ( vw1 , vw0 ) , wn ( wi ( wi ( vw0 , vw1 ) , wn ( wi ( vw1 , vw0 ) ) ) ) ) ) -| wi ( wn ( wi ( wi ( vw0 , vw1 ) , wn ( wi ( vw1 , vw0 ) ) ) ) , wb ( 