In [4]:
import json
def get_json_structure(json_data, parent_key="", structure=None, level=0):
    """递归提取JSON嵌套结构，记录每个key的父key和层级"""
    if structure is None:
        structure = []  # 存储结构：每个元素是 (层级, 父key, 当前key)
    
    indent = "  " * level  # 用缩进表示层级（视觉更清晰）
    
    if isinstance(json_data, dict):  # 字典结构（键值对）
        for key, value in json_data.items():
            current_key_path = f"{parent_key}→{key}" if parent_key else key  # 记录完整路径（比如 task→question→content）
            structure.append((level, parent_key, key, current_key_path))  # 存储层级、父key、当前key、完整路径
            # 递归处理子层级
            get_json_structure(value, parent_key=key, structure=structure, level=level+1)
    elif isinstance(json_data, list):  # 列表结构（数组）
        # 列表本身无key，记录列表的父key和类型
        list_note = f"[列表] 元素类型：{type(json_data[0]).__name__}" if json_data else "[空列表]"
        structure.append((level, parent_key, list_note, f"{parent_key}→{list_note}"))
        # 递归处理列表中的第一个元素（默认列表元素结构一致，如需遍历所有元素可修改）
        if json_data and (isinstance(json_data[0], dict) or isinstance(json_data[0], list)):
            get_json_structure(json_data[0], parent_key=parent_key, structure=structure, level=level+1)
    
    return structure

In [5]:
with open('./RAG.json', "r", encoding="utf-8") as f:
    data = json.load(f)
structure = get_json_structure(data)

In [8]:
 
# 输出结构化报告
print("JSON嵌套结构报告（层级→父key→当前key→完整路径）：")
print("=" * 80)
for level, parent, key, full_path in structure:
    indent = "  " * level  # 层级缩进
    print(f"{indent}层级{level} | 父key：{parent or '无'} | 当前key：{key} | 完整路径：{full_path}")
print("=" * 80)

# 额外生成：按完整路径排序的key列表（方便查找）
print("\n按完整路径排序的所有key（含嵌套关系）：")
print("-" * 50)
for _, _, _, full_path in sorted(structure, key=lambda x: x[3]):
    print(full_path)

JSON嵌套结构报告（层级→父key→当前key→完整路径）：
层级0 | 父key：无 | 当前key：name | 完整路径：name
层级0 | 父key：无 | 当前key：models | 完整路径：models
  层级1 | 父key：models | 当前key：[列表] 元素类型：dict | 完整路径：models→[列表] 元素类型：dict
    层级2 | 父key：models | 当前key：model_id | 完整路径：models→model_id
    层级2 | 父key：models | 当前key：name | 完整路径：models→name
    层级2 | 父key：models | 当前key：owner | 完整路径：models→owner
层级0 | 父key：无 | 当前key：metrics | 完整路径：metrics
  层级1 | 父key：metrics | 当前key：[列表] 元素类型：dict | 完整路径：metrics→[列表] 元素类型：dict
    层级2 | 父key：metrics | 当前key：name | 完整路径：metrics→name
    层级2 | 父key：metrics | 当前key：display_name | 完整路径：metrics→display_name
    层级2 | 父key：metrics | 当前key：description | 完整路径：metrics→description
    层级2 | 父key：metrics | 当前key：author | 完整路径：metrics→author
    层级2 | 父key：metrics | 当前key：type | 完整路径：metrics→type
    层级2 | 父key：metrics | 当前key：aggregator | 完整路径：metrics→aggregator
    层级2 | 父key：metrics | 当前key：range | 完整路径：metrics→range
      层级3 | 父key：range | 当前key：[列表] 元素类型：int | 完整路径：range→[列表] 元素类型：int
层级0 | 父key：无 |