# Python IO 编程学习指南

本 Jupyter Notebook 旨在帮助你学习和实践 Python 中常见的输入/输出 (IO) 操作。我们将涵盖文件读写、内存中的文本和字节流 (`StringIO`, `BytesIO`)、文件和目录操作，以及对象的序列化与反序列化。

请确保在运行代码前，你已经理解了每个示例的上下文，并注意文件路径和权限问题。

In [3]:
# 导入必要的库
import os
import io
import json
import pickle

## 1. 文件读写 (File Read/Write)

In [2]:
import os
# --- 1.1 基本写入和读取 ---
filename = 'example.txt'

# 写入文本到文件
with open(filename, 'w', encoding='utf-8') as f:
    f.write('Hello, Python IO!\nThis is the second line.\nThis is the third line.')

# 读取文件内容
with open(filename, 'r', encoding='utf-8') as f:
    content = f.read()
    print("读取到的内容:")
    print(content)

# 删除示例文件
os.remove(filename)

读取到的内容:
Hello, Python IO!
This is the second line.
This is the third line.


In [None]:
# --- 1.2 逐行读取 ---
filename = 'example_lines.txt'

# 写入多行
lines_to_write = ['第一行\n', '第二行\n', '第三行']
with open(filename, 'w', encoding='utf-8') as f:
    f.writelines(lines_to_write)

# 逐行读取
print("逐行读取:")
with open(filename, 'r', encoding='utf-8') as f:
    for line in f:
        print(repr(line)) # 使用 repr 显示换行符

# 删除示例文件
os.remove(filename)

## 2. StringIO 和 BytesIO

In [None]:
# --- 2.1 StringIO: 在内存中读写 str ---
print("--- StringIO 示例 ---")
s_io = io.StringIO()
s_io.write('Hello')
s_io.write(' ') 
s_io.write('StringIO!')
# 获取写入的值
print(s_io.getvalue())
s_io.close() # 关闭 StringIO 对象

# 也可以用字符串初始化
s_io2 = io.StringIO('Initial data\nSecond line')
print(s_io2.readline())
s_io2.close()

In [None]:
# --- 2.2 BytesIO: 在内存中读写 bytes ---
print("\n--- BytesIO 示例 ---")
b_io = io.BytesIO()
# 写入字节数据
b_io.write('你好'.encode('utf-8')) # str -> bytes
b_io.write(b' Hello BytesIO!') # 直接写入 bytes
# 获取写入的值
print(b_io.getvalue()) # bytes
print(b_io.getvalue().decode('utf-8')) # bytes -> str
b_io.close() # 关闭 BytesIO 对象

# 也可以用字节数据初始化
b_io2 = io.BytesIO(b'Initial bytes\nSecond line')
print(b_io2.readline())
b_io2.close()

## 3. 操作文件和目录 (os, os.path, pathlib)

In [None]:
# --- 3.1 获取路径信息 ---
print("--- 获取路径信息 ---")
current_file = 'io_tutorial.ipynb'
print(f"当前文件名: {current_file}")
print(f"绝对路径: {os.path.abspath(current_file)}")
print(f"所在目录: {os.path.dirname(os.path.abspath(current_file))}")
print(f"文件名(不含路径): {os.path.basename(os.path.abspath(current_file))}")
print(f"文件名和扩展名: {os.path.splitext(current_file)}")

In [None]:
# --- 3.2 检查文件/目录是否存在 ---
print("\n--- 检查文件/目录是否存在 ---")
print(f"当前文件 '{current_file}' 存在吗? {os.path.exists(current_file)}")
print(f"目录 'non_existent_dir' 存在吗? {os.path.exists('non_existent_dir')} ")
print(f"当前文件是文件吗? {os.path.isfile(current_file)}")
print(f"当前文件是目录吗? {os.path.isdir(current_file)}")

In [None]:
# --- 3.3 创建和删除目录 (请谨慎操作) ---
print("\n--- 创建和删除目录 ---")
test_dir = 'temp_test_dir'
if not os.path.exists(test_dir):
    os.mkdir(test_dir)
    print(f"已创建目录: {test_dir}")
else:
    print(f"目录 {test_dir} 已存在")

# 列出目录内容
print(f"目录 '{test_dir}' 的内容: {os.listdir(test_dir)}")

# 删除空目录
os.rmdir(test_dir)
print(f"已删除目录: {test_dir}")

## 4. 序列化 (Serialization)
将内存中的对象转换成可以存储或传输的格式（如字节流、文本），以及其反向过程。

In [None]:
# --- 4.1 JSON 序列化 (文本格式) ---
print("--- JSON 序列化 ---")
data = {
    'name': 'Alice',
    'age': 30,
    'city': 'New York',
    'hobbies': ['reading', 'swimming']
}

# 序列化为 JSON 字符串
json_str = json.dumps(data, ensure_ascii=False, indent=2) # ensure_ascii=False 以支持中文
print("序列化后的 JSON 字符串:")
print(json_str)

# 反序列化 (从字符串)
data_loaded_from_str = json.loads(json_str)
print("\n从字符串反序列化后的对象:")
print(data_loaded_from_str)
print(f"类型: {type(data_loaded_from_str)}, 姓名: {data_loaded_from_str['name']}")

# 序列化到文件
json_filename = 'data.json'
with open(json_filename, 'w', encoding='utf-8') as f:
    json.dump(data, f, ensure_ascii=False, indent=2)
print(f"\n数据已保存到 {json_filename}")

# 从文件反序列化
with open(json_filename, 'r', encoding='utf-8') as f:
    data_loaded_from_file = json.load(f)
print("\n从文件反序列化后的对象:")
print(data_loaded_from_file)

# 清理文件
os.remove(json_filename)

In [None]:
# --- 4.2 Pickle 序列化 (Python 特定的二进制格式) ---
print("\n--- Pickle 序列化 ---")
class Person:
    def __init__(self, name, age):
        self.name = name
        self.age = age
    def __repr__(self):
        return f"Person(name='{self.name}', age={self.age})"

person_obj = Person('Bob', 25)
print(f"原始对象: {person_obj}")

# 序列化到字节流 (BytesIO)
bytes_io = io.BytesIO()
pickle.dump(person_obj, bytes_io)
pickled_data = bytes_io.getvalue()
print(f"\n序列化后的字节数据: {pickled_data}")
bytes_io.close()

# 从字节流反序列化
bytes_io_for_load = io.BytesIO(pickled_data)
person_obj_loaded = pickle.load(bytes_io_for_load)
print(f"\n从字节流反序列化后的对象: {person_obj_loaded}")
print(f"类型: {type(person_obj_loaded)}, 姓名: {person_obj_loaded.name}")
bytes_io_for_load.close()

# 序列化到文件
pkl_filename = 'person.pkl'
with open(pkl_filename, 'wb') as f: # 注意是 'wb' 模式
    pickle.dump(person_obj, f)
print(f"\n对象已保存到 {pkl_filename}")

# 从文件反序列化
with open(pkl_filename, 'rb') as f: # 注意是 'rb' 模式
    person_obj_loaded_from_file = pickle.load(f)
print(f"\n从文件反序列化后的对象: {person_obj_loaded_from_file}")

# 清理文件
os.remove(pkl_filename)

## 总结

本 Notebook 涵盖了 Python IO 编程的几个核心方面：
- **文件读写**: 使用 `open()` 和 `with` 语句安全地操作文件。
- **StringIO/BytesIO**: 在内存中模拟文件操作，处理文本或二进制数据流。
- **文件和目录操作**: 使用 `os` 和 `os.path` 模块进行路径处理、检查存在性、创建/删除目录。
- **序列化**: 使用 `json` 进行跨语言兼容的文本序列化，使用 `pickle` 进行 Python 特定的二进制序列化。

掌握这些操作是进行文件处理、数据持久化和网络通信等任务的基础。