# 关于 pathlib 模块的用法

`pathlib` 是 Python 3.4+ 引入的现代路径操作模块，提供了面向对象的路径处理方式，是 `os.path` 的现代化替代方案。


In [None]:
from pathlib import Path, PurePath, WindowsPath, PosixPath

## 1. Path 类基础

### 创建 Path 对象
- `Path(path)` - 创建路径对象
- `Path.cwd()` - 当前工作目录
- `Path.home()` - 用户主目录
- `Path(*args)` - 连接多个路径部分

### 路径信息属性
- `.name` - 文件名（包含扩展名）
- `.stem` - 文件名（不含扩展名）
- `.suffix` - 文件扩展名
- `.suffixes` - 所有扩展名（列表）
- `.parent` - 父目录
- `.parents` - 所有祖先目录
- `.anchor` - 锚点（根目录）
- `.parts` - 路径组成部分（元组）


In [None]:
# Path 类基础示例
p = Path("practices/知识点/python模块/pathlib/关于pathlib的用法.ipynb")

print("完整路径:", p)
print("文件名:", p.name)
print("文件名（无扩展名）:", p.stem)
print("扩展名:", p.suffix)
print("所有扩展名:", p.suffixes)
print("父目录:", p.parent)
print("路径组成:", p.parts)

# 创建路径对象的不同方式
print("\n当前目录:", Path.cwd())
print("用户主目录:", Path.home())
print("连接路径:", Path("practices", "知识点", "test.py"))


## 2. 路径操作方法

### 路径连接和解析
- `/` 运算符 - 路径连接（推荐）
- `.joinpath(*args)` - 连接路径
- `.resolve()` - 解析为绝对路径
- `.absolute()` - 转换为绝对路径
- `.relative_to(other)` - 相对于其他路径

### 路径变换
- `.with_name(name)` - 改变文件名
- `.with_stem(stem)` - 改变文件名主体
- `.with_suffix(suffix)` - 改变扩展名
- `.as_posix()` - 转换为 POSIX 格式
- `.as_uri()` - 转换为 URI


In [None]:
# 路径操作方法示例
base_path = Path("practices")
file_path = Path("test.txt")

# 路径连接（推荐使用 / 运算符）
full_path = base_path / "知识点" / "python模块"
print("使用 / 连接:", full_path)

# 传统方法连接
full_path2 = base_path.joinpath("知识点", "python模块")
print("使用 joinpath:", full_path2)

# 路径变换
p = Path("example.txt")
print("原路径:", p)
print("改名:", p.with_name("new_example.txt"))
print("改扩展名:", p.with_suffix(".py"))
print("POSIX格式:", p.as_posix())

# 绝对路径
print("绝对路径:", Path("README.md").resolve())


## 3. 文件系统操作

### 存在性检查
- `.exists()` - 路径是否存在
- `.is_file()` - 是否为文件
- `.is_dir()` - 是否为目录
- `.is_symlink()` - 是否为符号链接
- `.is_socket()` - 是否为套接字
- `.is_fifo()` - 是否为 FIFO

### 文件信息
- `.stat()` - 文件统计信息
- `.lstat()` - 符号链接统计信息
- `.owner()` - 文件所有者
- `.group()` - 文件组
- `.is_mount()` - 是否为挂载点


In [None]:
# 文件系统操作示例
readme_path = Path("README.md")

print("文件存在:", readme_path.exists())
print("是文件:", readme_path.is_file())
print("是目录:", readme_path.is_dir())

practices_path = Path("practices")
print("practices 存在:", practices_path.exists())
print("practices 是目录:", practices_path.is_dir())

# 获取文件信息
if readme_path.exists():
    stat_info = readme_path.stat()
    print("文件大小:", stat_info.st_size, "字节")
    print("修改时间:", stat_info.st_mtime)


## 4. 目录操作

### 目录创建和删除
- `.mkdir(mode=0o777, parents=False, exist_ok=False)` - 创建目录
- `.rmdir()` - 删除空目录
- `.unlink(missing_ok=False)` - 删除文件

### 目录遍历
- `.iterdir()` - 迭代目录内容
- `.glob(pattern)` - 通配符匹配
- `.rglob(pattern)` - 递归通配符匹配


In [None]:
# 目录操作示例
practices_dir = Path("practices")

# 遍历目录内容
print("practices 目录内容:")
for item in practices_dir.iterdir():
    print(f"  {'[DIR]' if item.is_dir() else '[FILE]'} {item.name}")

# 使用 glob 查找文件
print("\n查找所有 .ipynb 文件:")
for notebook in Path(".").rglob("*.ipynb"):
    print(f"  {notebook}")

# 查找 Python 文件
print("\n查找所有 .py 文件:")
python_files = list(Path(".").rglob("*.py"))
print(f"  找到 {len(python_files)} 个 Python 文件")
for py_file in python_files[:3]:  # 只显示前3个
    print(f"  {py_file}")


## 5. 文件读写操作

### 文本文件操作
- `.read_text(encoding=None, errors=None)` - 读取文本文件
- `.write_text(data, encoding=None, errors=None)` - 写入文本文件
- `.open(mode='r', buffering=-1, encoding=None)` - 打开文件

### 二进制文件操作
- `.read_bytes()` - 读取二进制文件
- `.write_bytes(data)` - 写入二进制文件


In [None]:
# 文件读写操作示例
# 读取文本文件
readme_path = Path("README.md")
if readme_path.exists():
    content = readme_path.read_text(encoding='utf-8')
    print("README.md 内容长度:", len(content))
    print("前100个字符:", content[:100])

# 写入文本文件示例（注释掉以免创建文件）
# temp_file = Path("temp.txt")
# temp_file.write_text("这是测试内容", encoding='utf-8')
# print("文件已写入")

# 使用 open 方法
# with readme_path.open('r', encoding='utf-8') as f:
#     first_line = f.readline()
#     print("第一行:", first_line.strip())

print("文件读写示例完成")


## 6. pathlib vs os.path 对比

| 功能 | os.path | pathlib |
|------|---------|---------|
| 路径连接 | `os.path.join(a, b)` | `Path(a) / b` |
| 获取文件名 | `os.path.basename(path)` | `Path(path).name` |
| 获取目录 | `os.path.dirname(path)` | `Path(path).parent` |
| 检查存在 | `os.path.exists(path)` | `Path(path).exists()` |
| 是否为文件 | `os.path.isfile(path)` | `Path(path).is_file()` |
| 绝对路径 | `os.path.abspath(path)` | `Path(path).resolve()` |
| 读取文件 | `open(path).read()` | `Path(path).read_text()` |

## 7. 实际开发中的最佳实践

### 推荐使用场景
- **现代项目**：优先使用 pathlib
- **跨平台**：pathlib 自动处理路径分隔符
- **链式操作**：pathlib 支持方法链
- **类型提示**：pathlib 与类型检查工具配合更好

### 注意事项
- pathlib 是 Python 3.4+ 的功能
- 某些第三方库可能需要字符串路径，使用 `str(path)` 转换
- 性能敏感场景下，os.path 可能更快


In [None]:
# pathlib 最佳实践示例
def organize_files_by_extension(source_dir):
    """按文件扩展名整理文件"""
    source_path = Path(source_dir)
    
    if not source_path.exists() or not source_path.is_dir():
        print(f"目录不存在或不是目录: {source_dir}")
        return
    
    # 统计文件类型
    file_types = {}
    for file_path in source_path.rglob("*"):
        if file_path.is_file():
            extension = file_path.suffix.lower()
            if extension:
                file_types[extension] = file_types.get(extension, 0) + 1
    
    print("文件类型统计:")
    for ext, count in sorted(file_types.items()):
        print(f"  {ext}: {count} 个文件")

# 演示使用
organize_files_by_extension("practices")

# pathlib 的链式操作示例
config_path = Path.home() / ".config" / "myapp" / "config.json"
print(f"配置文件路径: {config_path}")
print(f"配置目录: {config_path.parent}")

# 转换为字符串（兼容老API）
print(f"字符串格式: {str(config_path)}")
