
### **Python `json` 库深入学习参考目录**

#### **一、 核心基石：官方文档**

1.  **Python 官方文档 (`json` — JSON encoder and decoder)**
    *   **链接**: https://docs.python.org/3/library/json.html
    *   **必读内容**：
        *   **基本用法**: 快速了解 `dumps`, `loads`, `dump`, `load` 四大函数。
        *   **编码器和解码器**: 详细阅读 `JSONEncoder` 和 `JSONDecoder` 类的说明。
        *   **参数详解**: 仔细研究 `json.dumps()` 和 `json.loads()` 的所有参数，如 `skipkeys`, `ensure_ascii`, `check_circular`, `allow_nan`, `cls`, `indent`, `separators`, `default`, `sort_keys`, `object_hook`, `parse_float`, `parse_int`, `object_pairs_hook`。**这是进阶的关键**。

#### **二、 标准教程与指南**

1.  **Real Python 教程**
    *   **内容**: 以非常清晰和实用的方式讲解 JSON 在 Python 中的使用，涵盖了从基础到高级主题（如自定义序列化）。
    *   **链接**: https://realpython.com/python-json/
    *   **特点**: 强烈推荐，讲解透彻，例子丰富。

2.  **W3Schools Python JSON 教程**
    *   **内容**: 非常基础的入门教程，适合快速上手和查找简单示例。
    *   **链接**: https://www.w3schools.com/python/python_json.asp
    *   **特点**: 适合纯初学者，互动性强。

3.  **GeeksforGeeks Python JSON 教程**
    *   **内容**: 包含多篇关于特定操作的文章，例如读写文件、美化打印等。
    *   **链接**: https://www.geeksforgeeks.org/python-json/
    *   **特点**: 以具体代码片段为主，适合快速查找特定功能的实现方法。

#### **三、 实践与深入理解**

通过实际项目和常见问题来巩固知识。

1.  **常见任务实现参考**：
    *   **序列化复杂对象（如 `datetime`）**： 搜索 "Python json serialize datetime"。
        *   **参考方案**: 使用 `json.dumps()` 的 `default` 参数或自定义 `JSONEncoder`。
    *   **反序列化为对象（而非字典）**： 搜索 "Python json deserialize to object"。
        *   **参考方案**: 使用 `json.loads()` 的 `object_hook` 参数。
    *   **处理 JSON 文件**： 重点掌握 `with open(...) as f:` 配合 `json.load(f)`/`json.dump(data, f)` 的范式。

2.  **常见错误与调试**：
    *   **`JSONDecodeError: Expecting value: line 1 column 1 (char 0)`**： 通常是响应内容为空或不是JSON（如404 HTML页面）。
    *   **`TypeError: Object of type ... is not JSON serializable`**： 尝试序列化不支持的类型。
    *   **中文字符显示为 `\uXXXX`**： 忘记设置 `ensure_ascii=False`。
    *   **调试工具**: 使用 https://jsonlint.com/ 等在线验证器来验证你生成或获取的JSON字符串格式是否正确。

#### **四、 性能与进阶**

当你需要处理大量JSON数据或对性能有要求时，可以探索以下领域。

1.  **替代库（Performance-focused substitutes）**:
    *   **`orjson`**: 极其快速且符合标准的JSON库，直接支持 `datetime` 和 `UUID` 等类型。
        *   **链接**: https://github.com/ijl/orjson
    *   **`ujson`** (UltraJSON): 一个快速的JSON编码/解码器，C语言实现。
        *   **链接**: https://github.com/ultrajson/ultrajson
    *   **`msgspec`**: 一个非常快速且高效的序列化库，支持JSON、MessagePack等。
        *   **链接**: https://github.com/jcrist/msgspec
    *   **学习建议**: 先精通标准库 `json`，再根据项目需求评估是否需要引入这些第三方库。它们的API通常与标准库相似但可能有细微差别。

2.  **相关数据格式**:
    *   **JSON Lines (`.jsonl`)**: 每行是一个有效的JSON对象，用于处理流式大数据。
        *   **链接**: https://jsonlines.org/
    *   **MessagePack**: 一种高效的二进制序列化格式，类似于JSON但更快更小。
        *   **链接**: https://msgpack.org/

#### **五、 综合练习项目想法**

1.  **配置文件管理器**: 编写一个类，用于读取、修改和保存程序的JSON配置。
2.  **API 数据消费器**:
    *   使用 `requests` 库从 https://jsonplaceholder.typicode.com/ 这类免费的测试API获取数据。
    *   解析返回的JSON，并将特定信息（如用户帖子）保存到本地JSON文件。
3.  **数据转换器**: 编写一个脚本，从CSV或XML文件读取数据，将其转换为JSON格式并保存。
4.  **实现一个自定义编码器/解码器**: 尝试序列化和反序列化一个包含 `datetime` 对象和自定义类实例的复杂数据结构。


**什么是 JSON？**
JSON（JavaScript Object Notation）是一种轻量级的数据交换格式。它采用完全独立于编程语言的文本格式，但使用了类似于 C 语言家族的约定（包括 C, C++, C#, Java, JavaScript, Python 等）。这些特性使 JSON 成为理想的数据交换语言。

*   **易于人类阅读和编写**
*   **易于机器解析和生成**
*   **本质是一个字符串**，只是遵循了一种特殊的格式。

**JSON 的语法规则**
JSON 语法是 JavaScript 对象表示语法的子集，但它是独立的。

*   **数据是以 `键值对` 的形式存在**，例如：`"name": "张三"`
*   **数据之间用 `逗号 ,` 分隔**
*   **花括号 `{}` 保存 `对象`** （对应 Python 字典）
*   **方括号 `[]` 保存 `数组`** （对应 Python 列表）
*   **键名** 必须用 **双引号 `""`** 包裹

**JSON 数据类型：**

| JSON       | 示例                | 说明 |
| :--------- | :------------------ | :--- |
| 字符串     | `"hello"`           | 必须使用双引号 |
| 数字       | `123`, `-1.23`      |      |
| 布尔值     | `true`, `false`     | 小写 |
| 数组       | `[1, 2, "three"]`   |      |
| 对象       | `{"key": "value"}`  |      |
| null       | `null`              | 表示空值 |

**JSON 的常见用途：**
*   **Web API**： 几乎所有的现代 API（如 Twitter、GitHub、天气API）都使用 JSON 作为数据发送和接收的标准格式。
*   **配置文件**： 许多软件（如 VS Code、npm）使用 `.json` 文件来存储配置设置。Python 的 `package.json` 也是一个例子。
*   **数据存储**： 可以作为一种简单的格式来存储结构化数据。

#### **2. Python 标准库：`json` 模块**

Python 提供了一个名为 `json` 的内置模块，专门用于处理 JSON 数据。你需要做的第一件事就是导入它。

In [1]:
import json

### `dump` 单词释义
**v.**
丢弃，扔掉；乱堆，乱放；丢下，抛弃；分手，甩掉；倾销，抛售；`转储，转存（计算机数据）`；`（尤指系统发生故障后内存的）打印输出，卸出`

**n.**
垃圾场；废料堆场；（金矿开采作业堆积而成的）矿山废石堆；<非正式>脏地方；军需品临时存放处；转存；<美，非正式>拉屎

该模块的两个核心功能是 **序列化** 和 **反序列化**，对应两个核心函数。

*   **`json.dumps()` — 序列化（Encoding）**
    *   **功能**： 将 **Python对象** 转换为 **JSON格式字符串**。
    *   **名称由来**： **d**ump **s**tring

In [2]:
data = {
    "name": "张三",
    "age": 30,
    "is_student": False,
    "hobbies": ["reading", "swimming"]
}

In [12]:
json_string = json.dumps(data, ensure_ascii=False)

In [13]:
print(json_string)

{"name": "张三", "age": 30, "is_student": false, "hobbies": ["reading", "swimming"]}



### **`.dump或.dumps` 文件写入时的中文与特殊字符处理（重点！）**

#### **问题核心：`ensure_ascii` 参数**
*   **默认行为**：`json.dump()` 和 `json.dumps()` 的 `ensure_ascii` 参数默认为 `True`。
*   **后果**：所有**非 ASCII 字符**（如中文、日文、俄文、Emoji 等）会被自动转义为 `\uXXXX` 形式的 Unicode 转义序列。

In [11]:
json_string = json.dumps(data)
print(json_string)

{"name": "\u5f20\u4e09", "age": 30, "is_student": false, "hobbies": ["reading", "swimming"]}


*   **`json.loads()` — 反序列化（Decoding）**
    *   **功能**： 将 **JSON格式字符串** 解码为 **Python对象**。
    *   **名称由来**： **l**oad **s**tring
    *   **示例**：

In [17]:

import json
json_str = '{"name": "张三", "age": 30, "is_student": false}'
python_data = json.loads(json_str)
print(python_data)
print(type(python_data))


{'name': '张三', 'age': 30, 'is_student': False}
<class 'dict'>


#### **3. Python 与 JSON 的数据类型映射**

当使用 `json.dumps()` 和 `json.loads()` 时，数据会在 Python 和 JSON 格式之间自动转换。了解它们之间的映射关系至关重要，可以避免很多错误。

| JSON          | Python            | 注意事项 & 常见陷阱                                  |
| :------------ | :---------------- | :--------------------------------------------------- |
| `object`      | `dict`            | 这是最常用的映射关系。                               |
| `array`       | `list`            | JSON 数组会变成 Python 列表。                        |
| `string`      | `str`             | JSON 字符串总是用 `""`，Python 字符串可以用 `''` 或 `""`。 |
| `number`      | `int` 或 `float`  | JSON 不区分整型和浮点型，Python 会根据数字自动判断。 |
| `true` / `false` | `True` / `False` | **注意大小写！** JSON 是小写，Python 是首字母大写。  |

In [25]:
with open('data.json', 'r', encoding='utf-8') as f:  # 'r' 表示读取模式
    # 2. 使用 json.load() 从文件对象 f 加载数据
    python_data = json.load(f)

In [26]:
print(python_data)

{'name': '王小明', 'age': 25, 'isStudent': True, 'courses': ['数学', '英语', '编程']}


In [27]:
print(type(python_data))

<class 'dict'>


In [28]:
print(python_data['name'])

王小明


#### **2. 将 JSON 写入文件 (`json.dump()`)**

**功能**： 将一个 Python 对象序列化为 JSON 格式，并将该 JSON 字符串写入指定的文件。

**步骤**：
1.  准备要写入的 Python 数据（字典、列表等）。
2.  使用 `open()` 函数以 **写入模式 (`'w'`)** 打开文件。如果文件不存在则创建；如果存在则**覆盖**原有内容。
3.  **极其重要**：
    *   指定文件编码：`encoding='utf-8'`
    *   设置 `ensure_ascii=False`：确保中文等字符正常显示（不再显示为 `\uXXXX`）。
    *   （可选）设置 `indent=4`：让生成的 JSON 文件有缩进，便于阅读。
4.  将 Python 数据和打开的文件对象传递给 `json.dump()`。

In [29]:
student_data = {
    "姓名": "李华",  # 包含中文
    "年级": 3,
    "成绩": {
        "语文": 90,
        "数学": 85,
        "英语": 92
    },
    "兴趣班": ["绘画", "篮球"]
}

In [30]:
with open('student_info.json', 'w', encoding='utf-8') as f:
    json.dump(
        student_data,
        f,
        ensure_ascii=False,
        indent=4
    )

In [32]:
import json
file_path = 'config.json'
with open(file_path,'r',encoding='utf-8' )as file:
    global data
    data = json.load(file)  

In [None]:
print(type(data))
print(data)

<class 'dict'>
{'app_name': '我的学习助手', 'language': 'zh-CN', 'max_items': 10, 'debug_mode': False}


In [40]:
import json
from datetime import datetime
user_info = {
    "username":"张三",
    "email":"zhangsan@example.com",
    "registration_time":datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
    "permissions": ["read", "write", "comment", "share"]
}

In [41]:
with open("user_profile.json",'w',encoding="utf-8")as file:
    json.dump(user_info, file, ensure_ascii=False, indent=4)


 **第三部分：进阶技巧与参数详解**  
 #### **1. 美化输出 (Pretty Printing)**  
让JSON更易读，适合配置文件或调试场景。

**核心参数：**
- **`indent`**：缩进空格数（整数）
- **`sort_keys`**：按键名字母排序（布尔值）


In [43]:
import json
data ={
    "name": "张三",
    "age": 30,
    "skills": ["Python", "数据分析"],
    "projects": {"2023": "AI系统", "2024": "区块链"}
}
compact = json.dumps(data,ensure_ascii=False)
print(compact)
print(type(compact))

{"name": "张三", "age": 30, "skills": ["Python", "数据分析"], "projects": {"2023": "AI系统", "2024": "区块链"}}
<class 'str'>


In [47]:
pretty = json.dumps(data,
                    indent=4,
                    sort_keys=True,
                    ensure_ascii=False)

In [48]:
print(pretty)

{
    "age": 30,
    "name": "张三",
    "projects": {
        "2023": "AI系统",
        "2024": "区块链"
    },
    "skills": [
        "Python",
        "数据分析"
    ]
}


#### **2. 处理复杂对象（编码器进阶）**  
解决 `datetime`、自定义类等非标准类型的序列化问题。

**方法一：`default` 参数 + 自定义函数**

In [49]:
import json
import datetime
from uuid import UUID
class User:
    def __init__(self,name,user_id):
        self.name =name
        self.id = user_id
data = {
    "user": User("李四", UUID('123e4567-e89b-12d3-a456-426614174000')),
    "timestamp": datetime.datetime.now()
}

def custom_serializer(obj):
    """处理无法直接序列化的类型"""
    if isinstance(obj, datetime.datetime):
        return obj.isoformat()  # 转为ISO8601字符串
    elif isinstance(obj, UUID):
        return str(obj)  # UUID转为字符串
    elif isinstance(obj, User):
        return {"name": obj.name, "id": str(obj.id)}  # 自定义类转字典
    raise TypeError(f"无法序列化类型: {type(obj)}")

json_str = json.dumps(data, 
                     default=custom_serializer,
                     ensure_ascii=False,
                     indent=2)
print(json_str)

{
  "user": {
    "name": "李四",
    "id": "123e4567-e89b-12d3-a456-426614174000"
  },
  "timestamp": "2025-09-11T02:33:38.521054"
}


**方法二：自定义编码器类（更优雅）**

In [51]:
class CustomEncoder(json.JSONEncoder):
    def default(self, obj):
        if isinstance(obj, datetime.datetime):
            return obj.strftime("%Y年%m月%d日 %H:%M")
        elif isinstance(obj, User):
            return {"username": obj.name, "user_id": obj.id.hex}
        return super().default(obj)
# 使用自定义编码器
json_str = json.dumps(data, 
                     cls=CustomEncoder,
                     ensure_ascii=False,
                     indent=2)
print(json_str)

{
  "user": {
    "username": "李四",
    "user_id": "123e4567e89b12d3a456426614174000"
  },
  "timestamp": "2025年09月11日 02:33"
}


#### **3. 解析进阶（解码器进阶）**  
将JSON字典转为自定义类实例。

In [52]:
class Product:
    def __init__(self, name, price, in_stock):
        self.name = name
        self.price = price
        self.in_stock = in_stock
    def __repr__(self):
        return f"<Product {self.name} ¥{self.price}>"
json_str = '''
{
    "name": "无线耳机",
    "price": 299.0,
    "in_stock": true
}
'''
def dict_to_product(d):
    if "name" in d and "price" in d:
        return Product(d['name'], d['price'], d.get('in_stock', False))
    return d  # 非目标字典保持原样
product = json.loads(json_str, object_hook=dict_to_product)
print(product)  # 输出: <Product 无线耳机 ¥299.0>
print(type(product))  # 输出: <class '__main__.Product'>

<Product 无线耳机 ¥299.0>
<class '__main__.Product'>


**嵌套对象处理：**

In [53]:
order_json = '''
{
    "order_id": "ORD123",
    "products": [
        {"name": "鼠标", "price": 89},
        {"name": "键盘", "price": 199}
    ]
}
'''
class Order:
    def __init__(self, order_id, products):
        self.id = order_id
        self.products = products
def complex_decoder(d):
    if "order_id" in d and "products" in d:
        # 递归处理嵌套的products列表
        products = [dict_to_product(p) for p in d["products"]]
        return Order(d["order_id"], products)
    return d
order = json.loads(order_json, object_hook=complex_decoder)
print(order.products[0])  # 输出: <Product 鼠标 ¥89>

<Product 鼠标 ¥89>


#### **4. 其他实用参数详解**

**1. `ensure_ascii`（中文字符处理）**

**2. `separators`（控制JSON体积）**

In [55]:
# 默认行为（中文转Unicode转义）
print(json.dumps({"city": "北京"})) 
# 输出: {"city": "\u5317\u4eac"}
# 正确显示中文
print(json.dumps({"city": "北京"}, ensure_ascii=False)) 
# 输出: {"city": "北京"}

{"city": "\u5317\u4eac"}
{"city": "北京"}


In [56]:
data = {"a": 1, "b": 2, "c": 3}
# 默认分隔符：(", ", ": ") → 带空格
default = json.dumps(data)  # {"a": 1, "b": 2, "c": 3}
# 紧凑模式：去掉所有空格
compact = json.dumps(data, separators=(',', ':'))  # {"a":1,"b":2,"c":3}
print(f"默认长度: {len(default)} 字符")
print(f"紧凑长度: {len(compact)} 字符")

默认长度: 24 字符
紧凑长度: 19 字符


**3. `skipkeys`（处理非法键名）**

In [57]:
data = {
    "正常键": "value",
    123: "数字键",  # 非字符串键
    (1,2): "元组键" # 非基本类型键
}
# 默认会报错：TypeError: keys must be str, int, float, bool or None
# 跳过非法键
result = json.dumps(data, skipkeys=True)  
# 输出: {"正常键": "value"}

### **实战技巧总结表**

| **场景**               | **解决方案**                              | **关键参数/方法**               |
|------------------------|------------------------------------------|--------------------------------|
| **美化输出**           | 添加缩进和排序                           | `indent=4`, `sort_keys=True`   |
| **中文显示问题**       | 禁用ASCII转义                            | `ensure_ascii=False`           |
| **序列化日期对象**     | 自定义转换函数                           | `default=` + ISO格式转换       |
| **序列化自定义类**     | 实现`__dict__`或自定义编码器             | 继承`JSONEncoder`              |
| **反序列化为对象**     | 使用object_hook映射                      | `object_hook=` + 构造函数      |
| **最小化JSON体积**     | 压缩分隔符                               | `separators=(',', ':')`        |
| **处理特殊键名**       | 跳过非法键                               | `skipkeys=True`                |
| **精确控制浮点数**     | 指定精度                                 | `parse_float=decimal.Decimal`  |


---

下面的可以跳过了

### **第四部分：实战应用与常见问题**

#### **1. 实战场景一：与 Web API 交互**

**场景 1A: 获取 API 数据 (GET 请求)**

In [None]:
import requests
import json
# 示例：从免费的公共API获取一条笑话
url = "https://official-joke-api.appspot.com/random_joke"
try:
    # 发送 GET 请求
    response = requests.get(url)
    # 检查请求是否成功 (HTTP 状态码 200)
    response.raise_for_status() 
    # 🚀 关键一步：直接使用 .json() 方法将响应内容解析为 Python 字典
    joke_data = response.json()
    # 现在可以像操作普通字典一样操作数据
    print(f"类型：{type(joke_data)}")  # <class 'dict'>
    print(f"笑话：{joke_data['setup']}")
    print(f" punchline：{joke_data['punchline']}")
except requests.exceptions.RequestException as e:
    print(f"网络请求错误: {e}")
except json.JSONDecodeError as e:
    print(f"JSON 解析错误: {e}")

网络请求错误: Expecting value: line 1 column 1 (char 0)
