# Python os 标准库学习指南

## 目录
1. [简介](#简介)
2. [路径操作](#路径操作)
3. [文件和目录操作](#文件和目录操作)
4. [环境变量](#环境变量)
5. [进程管理](#进程管理)
6. [系统信息](#系统信息)
7. [实践练习](#实践练习)
8. [总结](#总结)


## 简介

`os` 模块是Python标准库中用于与操作系统交互的核心模块。它提供了许多函数来操作文件系统、环境变量、进程管理等。

### 主要功能
- **路径操作**：处理文件路径和目录路径
- **文件和目录操作**：创建、删除、重命名文件和目录
- **环境变量**：读取和设置系统环境变量
- **进程管理**：执行系统命令、管理进程
- **系统信息**：获取操作系统相关信息


In [None]:
# 导入os模块
import os

# 查看os模块的文档
print("os模块已导入成功！")
print(f"当前工作目录: {os.getcwd()}")


os模块已导入成功！
当前工作目录: c:\Users\Administrator\Desktop\cursor_python_learn\库


## 路径操作

### 1. 获取当前工作目录
- `os.getcwd()`: 返回当前工作目录的路径

### 2. 改变工作目录
- `os.chdir(path)`: 改变当前工作目录到指定路径

### 3. 路径拼接
- `os.path.join(path1, path2, ...)`: 智能拼接路径，自动处理不同操作系统的路径分隔符

### 4. 路径分解
- `os.path.split(path)`: 将路径分割为目录和文件名
- `os.path.dirname(path)`: 获取路径的目录部分
- `os.path.basename(path)`: 获取路径的文件名部分
- `os.path.splitext(path)`: 分割文件名和扩展名

### 5. 路径判断
- `os.path.exists(path)`: 判断路径是否存在
- `os.path.isdir(path)`: 判断是否为目录
- `os.path.isfile(path)`: 判断是否为文件
- `os.path.isabs(path)`: 判断是否为绝对路径

### 6. 路径规范化
- `os.path.abspath(path)`: 返回绝对路径
- `os.path.normpath(path)`: 规范化路径字符串


In [None]:
# ========== 路径操作示例 ==========

# 1. 获取当前工作目录
current_dir = os.getcwd()
print(f"当前工作目录: {current_dir}")

# 2. 路径拼接（推荐使用os.path.join，自动处理不同操作系统的路径分隔符）
# Windows使用反斜杠\，Linux/Mac使用正斜杠/
path1 = os.path.join("folder1", "folder2", "file.txt")
print(f"拼接后的路径: {path1}")

# 3. 路径分解
example_path = "/home/user/documents/file.txt"
dir_part, file_part = os.path.split(example_path)
print(f"目录部分: {dir_part}")
print(f"文件名部分: {file_part}")

# 获取目录名和文件名
dirname = os.path.dirname(example_path)
basename = os.path.basename(example_path)
print(f"目录名: {dirname}")
print(f"文件名: {basename}")

# 分割文件名和扩展名
name, ext = os.path.splitext(example_path)
print(f"文件名（不含扩展名）: {name}")
print(f"扩展名: {ext}")

# 4. 路径判断
test_path = os.getcwd()
print(f"\n路径判断示例:")
print(f"路径是否存在: {os.path.exists(test_path)}")
print(f"是否为目录: {os.path.isdir(test_path)}")
print(f"是否为文件: {os.path.isfile(test_path)}")
print(f"是否为绝对路径: {os.path.isabs(test_path)}")

# 5. 路径规范化
relative_path = ".././folder/../file.txt"
abs_path = os.path.abspath(relative_path)
norm_path = os.path.normpath(relative_path)
print(f"\n相对路径: {relative_path}")
print(f"绝对路径: {abs_path}")
print(f"规范化路径: {norm_path}")


## 文件和目录操作

### 1. 目录操作
- `os.mkdir(path)`: 创建单个目录
- `os.makedirs(path)`: 递归创建多级目录
- `os.rmdir(path)`: 删除空目录
- `os.removedirs(path)`: 递归删除空目录
- `os.listdir(path)`: 列出目录内容
- `os.walk(path)`: 遍历目录树

### 2. 文件操作
- `os.remove(path)`: 删除文件
- `os.rename(old, new)`: 重命名文件或目录
- `os.stat(path)`: 获取文件/目录的状态信息

### 3. 路径信息
- `os.path.getsize(path)`: 获取文件大小（字节）
- `os.path.getmtime(path)`: 获取文件最后修改时间
- `os.path.getatime(path)`: 获取文件最后访问时间


In [None]:
# ========== 文件和目录操作示例 ==========

# 1. 列出当前目录内容
print("当前目录内容:")
for item in os.listdir('.'):
    print(f"  - {item}")

# 2. 创建目录（如果不存在）
test_dir = "test_folder"
if not os.path.exists(test_dir):
    os.mkdir(test_dir)
    print(f"\n已创建目录: {test_dir}")
else:
    print(f"\n目录已存在: {test_dir}")

# 3. 创建多级目录
nested_dir = os.path.join("test_folder", "sub_folder", "deep_folder")
if not os.path.exists(nested_dir):
    os.makedirs(nested_dir)
    print(f"已创建多级目录: {nested_dir}")

# 4. 创建测试文件
test_file = os.path.join(test_dir, "test.txt")
with open(test_file, 'w', encoding='utf-8') as f:
    f.write("这是一个测试文件\n用于演示os模块的功能")
print(f"已创建测试文件: {test_file}")

# 5. 获取文件信息
if os.path.exists(test_file):
    file_size = os.path.getsize(test_file)
    print(f"\n文件信息:")
    print(f"  文件大小: {file_size} 字节")
    
    # 获取文件状态
    stat_info = os.stat(test_file)
    print(f"  文件模式: {stat_info.st_mode}")
    print(f"  最后修改时间: {stat_info.st_mtime}")
    print(f"  最后访问时间: {stat_info.st_atime}")

# 6. 遍历目录树（os.walk非常强大）
print(f"\n遍历目录树 '{test_dir}':")
for root, dirs, files in os.walk(test_dir):
    level = root.replace(test_dir, '').count(os.sep)
    indent = ' ' * 2 * level
    print(f"{indent}{os.path.basename(root)}/")
    sub_indent = ' ' * 2 * (level + 1)
    for file in files:
        print(f"{sub_indent}{file}")


## 环境变量

### 常用函数
- `os.environ`: 包含所有环境变量的字典
- `os.getenv(key, default=None)`: 获取环境变量的值
- `os.putenv(key, value)`: 设置环境变量（不推荐，使用os.environ）
- `os.environ[key] = value`: 设置环境变量（推荐方式）

### 常用环境变量
- `PATH`: 系统路径
- `HOME` / `USERPROFILE`: 用户主目录
- `TEMP` / `TMP`: 临时目录
- `USERNAME`: 当前用户名


In [None]:
# ========== 环境变量操作示例 ==========

# 1. 获取环境变量（推荐使用os.getenv，可以设置默认值）
path_env = os.getenv('PATH', '未找到')
print(f"PATH环境变量（前100个字符）: {path_env[:100]}...")

# 2. 获取用户主目录
# Windows使用USERPROFILE，Linux/Mac使用HOME
home_dir = os.getenv('USERPROFILE') or os.getenv('HOME')
print(f"用户主目录: {home_dir}")

# 3. 获取临时目录
temp_dir = os.getenv('TEMP') or os.getenv('TMP')
print(f"临时目录: {temp_dir}")

# 4. 获取用户名
username = os.getenv('USERNAME') or os.getenv('USER')
print(f"当前用户名: {username}")

# 5. 查看所有环境变量（只显示前5个作为示例）
print(f"\n环境变量示例（前5个）:")
for i, (key, value) in enumerate(os.environ.items()):
    if i < 5:
        print(f"  {key} = {value[:50] if len(value) > 50 else value}...")
    else:
        break

# 6. 设置环境变量（仅在当前进程有效）
os.environ['MY_TEST_VAR'] = 'test_value'
print(f"\n设置的环境变量: MY_TEST_VAR = {os.getenv('MY_TEST_VAR')}")

# 注意：os.putenv()不推荐使用，因为某些系统上可能不会立即生效
# 推荐使用 os.environ[key] = value


## 进程管理

### 常用函数
- `os.system(command)`: 执行系统命令，返回退出状态码
- `os.popen(command)`: 执行命令并返回文件对象（已废弃，推荐使用subprocess）
- `os.getpid()`: 获取当前进程ID
- `os.getppid()`: 获取父进程ID
- `os.kill(pid, signal)`: 向进程发送信号

### 注意
- `os.system()` 和 `os.popen()` 已不推荐使用，建议使用 `subprocess` 模块
- 这里仅作演示，实际开发中应使用 `subprocess` 模块


In [None]:
# ========== 进程管理示例 ==========

# 1. 获取当前进程ID
current_pid = os.getpid()
print(f"当前进程ID: {current_pid}")

# 2. 获取父进程ID
parent_pid = os.getppid()
print(f"父进程ID: {parent_pid}")

# 3. 执行系统命令（不推荐，仅作演示）
# Windows系统
if os.name == 'nt':
    # 列出当前目录文件
    result = os.system('dir')
    print(f"\n命令执行返回码: {result}")
else:
    # Linux/Mac系统
    result = os.system('ls -l')
    print(f"\n命令执行返回码: {result}")

# 注意：实际开发中应使用subprocess模块
# import subprocess
# result = subprocess.run(['ls', '-l'], capture_output=True, text=True)
# print(result.stdout)


## 系统信息

### 常用函数和属性
- `os.name`: 操作系统名称（'nt'表示Windows，'posix'表示Linux/Unix/Mac）
- `os.sep`: 路径分隔符（Windows: '\\'，Linux/Mac: '/'）
- `os.pathsep`: 路径列表分隔符（Windows: ';'，Linux/Mac: ':'）
- `os.linesep`: 行分隔符（Windows: '\\r\\n'，Linux/Mac: '\\n'）
- `os.curdir`: 当前目录表示符（'.'）
- `os.pardir`: 父目录表示符（'..'）

### 其他有用函数
- `os.cpu_count()`: 获取CPU核心数
- `os.urandom(n)`: 生成n字节的随机字节串


In [None]:
# ========== 系统信息示例 ==========

# 1. 操作系统名称
print(f"操作系统名称: {os.name}")
if os.name == 'nt':
    print("  这是Windows系统")
elif os.name == 'posix':
    print("  这是Linux/Unix/Mac系统")

# 2. 路径相关常量
print(f"\n路径分隔符: '{os.sep}'")
print(f"路径列表分隔符: '{os.pathsep}'")
print(f"行分隔符: {repr(os.linesep)}")
print(f"当前目录表示符: '{os.curdir}'")
print(f"父目录表示符: '{os.pardir}'")

# 3. CPU核心数
cpu_count = os.cpu_count()
print(f"\nCPU核心数: {cpu_count}")

# 4. 生成随机字节
random_bytes = os.urandom(16)
print(f"\n随机字节（16字节）: {random_bytes.hex()}")

# 5. 跨平台路径处理示例
print(f"\n跨平台路径处理:")
# 使用os.path.join可以自动处理不同操作系统的路径分隔符
path1 = os.path.join("folder1", "folder2", "file.txt")
path2 = os.path.join(os.getcwd(), "data", "output.txt")
print(f"  路径1: {path1}")
print(f"  路径2: {path2}")


## 实践练习

### 练习1：目录扫描器
创建一个函数，扫描指定目录，统计文件和文件夹的数量，并列出所有文件。


In [None]:
# ========== 练习1：目录扫描器 ==========

def scan_directory(directory_path):
    """
    扫描指定目录，统计文件和文件夹数量
    
    参数:
        directory_path: 要扫描的目录路径
    
    返回:
        dict: 包含文件数、文件夹数和文件列表的字典
    """
    if not os.path.exists(directory_path):
        return {"error": "目录不存在"}
    
    if not os.path.isdir(directory_path):
        return {"error": "路径不是目录"}
    
    file_count = 0
    dir_count = 0
    file_list = []
    
    # 遍历目录
    for item in os.listdir(directory_path):
        item_path = os.path.join(directory_path, item)
        
        if os.path.isfile(item_path):
            file_count += 1
            file_list.append(item)
        elif os.path.isdir(item_path):
            dir_count += 1
    
    return {
        "目录路径": directory_path,
        "文件数量": file_count,
        "文件夹数量": dir_count,
        "文件列表": sorted(file_list)
    }

# 测试函数
result = scan_directory('.')
print("目录扫描结果:")
for key, value in result.items():
    if key == "文件列表":
        print(f"{key}:")
        for file in value[:10]:  # 只显示前10个文件
            print(f"  - {file}")
        if len(value) > 10:
            print(f"  ... 还有 {len(value) - 10} 个文件")
    else:
        print(f"{key}: {value}")


### 练习2：文件大小统计
创建一个函数，计算指定目录下所有文件的总大小。


In [None]:
# ========== 练习2：文件大小统计 ==========

def get_directory_size(directory_path):
    """
    计算目录下所有文件的总大小（递归）
    
    参数:
        directory_path: 目录路径
    
    返回:
        int: 总大小（字节）
    """
    total_size = 0
    
    if not os.path.exists(directory_path):
        return 0
    
    # 使用os.walk递归遍历所有文件和目录
    for dirpath, dirnames, filenames in os.walk(directory_path):
        for filename in filenames:
            file_path = os.path.join(dirpath, filename)
            try:
                # 获取文件大小并累加
                total_size += os.path.getsize(file_path)
            except (OSError, FileNotFoundError):
                # 如果文件被删除或无法访问，跳过
                pass
    
    return total_size

def format_size(size_bytes):
    """
    将字节数转换为人类可读的格式
    
    参数:
        size_bytes: 字节数
    
    返回:
        str: 格式化后的字符串
    """
    for unit in ['B', 'KB', 'MB', 'GB', 'TB']:
        if size_bytes < 1024.0:
            return f"{size_bytes:.2f} {unit}"
        size_bytes /= 1024.0
    return f"{size_bytes:.2f} PB"

# 测试函数
test_dir = "test_folder" if os.path.exists("test_folder") else "."
dir_size = get_directory_size(test_dir)
print(f"目录 '{test_dir}' 的总大小: {format_size(dir_size)}")


### 练习3：查找特定类型的文件
创建一个函数，在指定目录中查找特定扩展名的文件。


In [None]:
# ========== 练习3：查找特定类型的文件 ==========

def find_files_by_extension(directory_path, extension):
    """
    在指定目录中查找特定扩展名的文件（递归）
    
    参数:
        directory_path: 要搜索的目录路径
        extension: 文件扩展名（如 '.txt', '.py'），不区分大小写
    
    返回:
        list: 找到的文件路径列表
    """
    found_files = []
    extension = extension.lower()  # 转换为小写以便比较
    
    if not os.path.exists(directory_path):
        return found_files
    
    # 递归遍历目录
    for dirpath, dirnames, filenames in os.walk(directory_path):
        for filename in filenames:
            # 获取文件扩展名并比较（不区分大小写）
            file_ext = os.path.splitext(filename)[1].lower()
            if file_ext == extension:
                full_path = os.path.join(dirpath, filename)
                found_files.append(full_path)
    
    return found_files

# 测试函数
print("查找 .txt 文件:")
txt_files = find_files_by_extension('.', '.txt')
if txt_files:
    for file in txt_files:
        print(f"  - {file}")
else:
    print("  未找到 .txt 文件")

print("\n查找 .ipynb 文件:")
ipynb_files = find_files_by_extension('.', '.ipynb')
if ipynb_files:
    for file in ipynb_files:
        print(f"  - {file}")
else:
    print("  未找到 .ipynb 文件")


### 练习4：创建备份目录结构
创建一个函数，复制目录结构（不复制文件内容，只创建目录）。


In [None]:
# ========== 练习4：创建备份目录结构 ==========

def copy_directory_structure(source_dir, target_dir):
    """
    复制目录结构（只创建目录，不复制文件）
    
    参数:
        source_dir: 源目录路径
        target_dir: 目标目录路径
    
    返回:
        int: 创建的目录数量
    """
    if not os.path.exists(source_dir):
        print(f"错误: 源目录 '{source_dir}' 不存在")
        return 0
    
    if not os.path.isdir(source_dir):
        print(f"错误: '{source_dir}' 不是目录")
        return 0
    
    created_count = 0
    
    # 创建目标根目录
    if not os.path.exists(target_dir):
        os.makedirs(target_dir)
        created_count += 1
    
    # 使用os.walk遍历源目录
    for dirpath, dirnames, filenames in os.walk(source_dir):
        # 计算相对路径
        rel_path = os.path.relpath(dirpath, source_dir)
        
        # 构建目标路径
        if rel_path == '.':
            target_path = target_dir
        else:
            target_path = os.path.join(target_dir, rel_path)
        
        # 创建目录（如果不存在）
        if not os.path.exists(target_path):
            os.makedirs(target_path)
            created_count += 1
    
    return created_count

# 测试函数
source = "test_folder" if os.path.exists("test_folder") else "."
target = "backup_structure"

if os.path.exists(target):
    print(f"目标目录 '{target}' 已存在，跳过测试")
else:
    created = copy_directory_structure(source, target)
    print(f"已创建 {created} 个目录")
    print(f"源目录: {source}")
    print(f"目标目录: {target}")
    
    # 显示创建的目录结构
    if os.path.exists(target):
        print("\n创建的目录结构:")
        for root, dirs, files in os.walk(target):
            level = root.replace(target, '').count(os.sep)
            indent = ' ' * 2 * level
            print(f"{indent}{os.path.basename(root)}/")


### 练习5：清理临时文件
创建一个函数，删除指定目录中超过指定天数的文件。


In [None]:
# ========== 练习5：清理临时文件 ==========
import time

def clean_old_files(directory_path, days=7):
    """
    删除指定目录中超过指定天数的文件
    
    参数:
        directory_path: 要清理的目录路径
        days: 文件保留天数（默认7天）
    
    返回:
        dict: 包含删除文件数和总大小的统计信息
    """
    if not os.path.exists(directory_path):
        return {"error": "目录不存在"}
    
    current_time = time.time()
    days_in_seconds = days * 24 * 60 * 60
    deleted_count = 0
    total_size = 0
    
    # 遍历目录中的所有文件
    for dirpath, dirnames, filenames in os.walk(directory_path):
        for filename in filenames:
            file_path = os.path.join(dirpath, filename)
            
            try:
                # 获取文件最后修改时间
                file_mtime = os.path.getmtime(file_path)
                file_age = current_time - file_mtime
                
                # 如果文件超过指定天数，删除它
                if file_age > days_in_seconds:
                    file_size = os.path.getsize(file_path)
                    os.remove(file_path)
                    deleted_count += 1
                    total_size += file_size
                    print(f"已删除: {file_path} (年龄: {file_age / (24*60*60):.1f} 天)")
            except (OSError, FileNotFoundError) as e:
                print(f"无法删除 {file_path}: {e}")
    
    return {
        "删除文件数": deleted_count,
        "释放空间": format_size(total_size)
    }

# 注意：这个函数会实际删除文件，请谨慎使用！
# 这里只演示逻辑，不实际执行删除操作
print("清理旧文件函数已定义")
print("注意：实际使用时请谨慎，建议先备份重要文件！")
print("\n函数使用示例（不执行）:")
print("result = clean_old_files('temp_folder', days=30)")
print("# 删除temp_folder目录中超过30天的文件")


## 总结

### os模块核心要点

1. **路径操作**
   - 始终使用 `os.path.join()` 进行路径拼接，保证跨平台兼容性
   - 使用 `os.path.exists()` 检查路径是否存在
   - 使用 `os.path.isdir()` 和 `os.path.isfile()` 区分目录和文件

2. **文件和目录操作**
   - `os.makedirs()` 可以递归创建多级目录
   - `os.walk()` 是遍历目录树的最佳方式
   - 删除操作前务必检查文件/目录是否存在

3. **环境变量**
   - 使用 `os.getenv()` 获取环境变量，可以设置默认值
   - 使用 `os.environ[key] = value` 设置环境变量

4. **跨平台兼容性**
   - 使用 `os.path.join()` 而不是硬编码路径分隔符
   - 注意 `os.name` 可以判断操作系统类型
   - 使用 `os.sep`、`os.pathsep` 等常量而不是硬编码字符

5. **最佳实践**
   - 文件操作时使用异常处理（try-except）
   - 操作前检查路径是否存在
   - 对于复杂操作，考虑使用 `pathlib` 模块（Python 3.4+）

### 相关模块推荐

- **pathlib**: Python 3.4+ 引入的面向对象的路径操作模块（更现代）
- **shutil**: 高级文件操作（复制、移动、删除等）
- **subprocess**: 进程管理（替代os.system和os.popen）
- **tempfile**: 临时文件和目录管理

### 学习建议

1. 多实践：在实际项目中尝试使用os模块的各种功能
2. 注意异常处理：文件操作可能失败，要做好错误处理
3. 考虑跨平台：编写代码时考虑不同操作系统的差异
4. 探索pathlib：Python 3.4+推荐使用pathlib进行路径操作


In [None]:
# ========== 清理测试文件（可选） ==========
# 如果需要清理之前创建的测试文件，可以取消下面的注释

# import shutil
# 
# # 清理测试目录
# test_dirs = ["test_folder", "backup_structure"]
# for dir_name in test_dirs:
#     if os.path.exists(dir_name):
#         try:
#             shutil.rmtree(dir_name)
#             print(f"已删除: {dir_name}")
#         except Exception as e:
#             print(f"删除 {dir_name} 时出错: {e}")

print("学习完成！")
print("\n提示：")
print("1. 可以尝试修改上面的练习代码")
print("2. 在实际项目中应用这些知识")
print("3. 探索os模块的其他功能")
print("4. 学习pathlib模块作为os.path的现代替代")
