In [None]:
PEP 8 核心规则速查
1️⃣ 命名规则（Naming Conventions）

# ✅ 正确的命名
class UserAccount:              # 类名：CapWords (大驼峰)
    pass

def calculate_total_price():   # 函数：lowercase_with_underscores (蛇形)
    pass

MAXIMUM_CONNECTIONS = 100       # 常量：UPPER_CASE_WITH_UNDERSCORES

user_name = "Alice"             # 变量：lowercase_with_underscores
_internal_value = 42            # 内部变量：前缀单下划线
__private_attr = "secret"       # 私有属性：前缀双下划线

# ❌ 错误的命名
class user_account:             # 类名不应该用蛇形
    pass

def CalculateTotalPrice():      # 函数不应该用大驼峰
    pass

UserName = "Alice"              # 变量不应该用大驼峰
2️⃣ 缩进（Indentation）

# ✅ 使用 4 个空格
def example_function():
    if True:
        print("Hello")
        for i in range(10):
            print(i)

# ❌ 不要使用 Tab 或 2 空格
def bad_function():
  print("Bad")  # 只有 2 空格
	print("Bad")  # 使用了 Tab
3️⃣ 每行最大长度

# ✅ 每行 ≤ 79 字符（代码）
# ✅ 每行 ≤ 72 字符（注释和文档字符串）

# 长行需要折行
result = some_function(
    argument1,
    argument2,
    argument3
)

# 或者
result = some_function(argument1, argument2,
                       argument3, argument4)

# 长字符串
message = (
    "这是一个很长的字符串，"
    "需要分成多行来保持每行长度不超过 79 个字符"
)
4️⃣ 空格使用规则

# ✅ 运算符两边加空格
x = 1 + 2
result = x * 2 + y / 3

# ✅ 逗号后面加空格
my_list = [1, 2, 3, 4]
my_dict = {'name': 'Alice', 'age': 30}

# ✅ 函数参数
def function(arg1, arg2, arg3):
    pass

# ❌ 以下情况不加空格
# 括号内侧
spam(ham[1], {eggs: 2})  # ✅
spam( ham[ 1 ], { eggs: 2 } )  # ❌

# 关键字参数的 = 两边不加空格
function(arg1=value1, arg2=value2)  # ✅
function(arg1 = value1, arg2 = value2)  # ❌

# 切片操作
my_list[1:3]  # ✅
my_list[1 : 3]  # ❌
5️⃣ 空行规则

# 顶层函数/类之间：2 个空行
def function1():
    pass


def function2():
    pass


class MyClass:
    pass


# 类内方法之间：1 个空行
class MyClass:
    def method1(self):
        pass
    
    def method2(self):
        pass


# 函数内逻辑分组：可以用 1 个空行
def complex_function():
    # 第一部分
    x = 1
    y = 2
    
    # 第二部分
    result = x + y
    return result
6️⃣ 导入（Imports）

# ✅ 正确的导入顺序
# 1. 标准库
import os
import sys

# 2. 第三方库
import numpy as np
import pandas as pd

# 3. 本地模块
from myproject import mymodule


# ✅ 每个导入单独一行
import os
import sys

# ❌ 不要这样
import os, sys


# ✅ 但 from 可以这样
from subprocess import Popen, PIPE
7️⃣ 字符串引号

# 单引号和双引号都可以，保持一致即可
name = 'Alice'    # ✅
name = "Alice"    # ✅

# 包含引号的字符串
message = "It's a beautiful day"  # ✅ 用双引号包含单引号
message = 'He said "Hello"'       # ✅ 用单引号包含双引号

# 多行字符串用三引号
docstring = """
这是一个多行字符串
可以跨越多行
"""
8️⃣ 注释

# ✅ 单行注释：# 后面加一个空格
x = 1  # 这是行尾注释（与代码间隔至少 2 个空格）

# ✅ 文档字符串（Docstring）
def calculate_price(quantity, unit_price):
    """
    计算总价格。
    
    Args:
        quantity: 数量
        unit_price: 单价
    
    Returns:
        总价格
    """
    return quantity * unit_price
PEP 8 完整示例
让我写一个完整的符合 PEP 8 的示例：

Write pep8_example.py
150 lines


In [None]:
"""
PEP 8 代码风格完整示例。

这个模块演示了符合 PEP 8 规范的 Python 代码写法。
"""

import os
import sys
from typing import List, Dict, Optional

import numpy as np
import pandas as pd


# 常量使用全大写
MAX_CONNECTIONS = 100
DEFAULT_TIMEOUT = 30


class UserAccount:
    """
    用户账户类。

    这个类管理用户的基本信息和操作。
    """

    def __init__(self, username: str, email: str, age: int):
        """
        初始化用户账户。

        Args:
            username: 用户名
            email: 邮箱地址
            age: 年龄
        """
        self.username = username
        self.email = email
        self.age = age
        self._balance = 0.0  # 内部属性

    def deposit(self, amount: float) -> bool:
        """
        存款操作。

        Args:
            amount: 存款金额

        Returns:
            操作是否成功
        """
        if amount <= 0:
            return False

        self._balance += amount
        return True

    def get_balance(self) -> float:
        """获取账户余额。"""
        return self._balance

    def __str__(self) -> str:
        """返回用户账户的字符串表示。"""
        return f"UserAccount(username={self.username}, email={self.email})"


def calculate_total_price(
    items: List[Dict[str, float]],
    tax_rate: float = 0.1,
    discount: Optional[float] = None
) -> float:
    """
    计算商品总价（含税和折扣）。

    Args:
        items: 商品列表，每个商品包含 'price' 和 'quantity'
        tax_rate: 税率，默认 10%
        discount: 折扣金额（可选）

    Returns:
        最终总价

    Examples:
        >>> items = [{'price': 10.0, 'quantity': 2}]
        >>> calculate_total_price(items)
        22.0
    """
    # 计算小计
    subtotal = sum(item['price'] * item['quantity'] for item in items)

    # 应用折扣
    if discount is not None and discount > 0:
        subtotal -= discount

    # 计算税后总价
    total = subtotal * (1 + tax_rate)

    return round(total, 2)


def process_data(data: pd.DataFrame) -> pd.DataFrame:
    """
    处理数据框。

    这是一个较长的函数，演示如何组织代码块。
    """
    # 第一步：数据清洗
    cleaned_data = data.dropna()
    cleaned_data = cleaned_data[cleaned_data['age'] > 0]

    # 第二步：数据转换
    cleaned_data['age_group'] = pd.cut(
        cleaned_data['age'],
        bins=[0, 18, 35, 60, 100],
        labels=['未成年', '青年', '中年', '老年']
    )

    # 第三步：聚合统计
    result = cleaned_data.groupby('age_group').agg({
        'salary': 'mean',
        'experience': 'sum'
    })

    return result


def main():
    """主函数入口。"""
    # 创建用户账户
    user = UserAccount(
        username="alice",
        email="alice@example.com",
        age=28
    )

    # 执行操作
    user.deposit(1000.0)
    print(f"账户余额: {user.get_balance()}")

    # 计算价格
    items = [
        {'price': 10.0, 'quantity': 2},
        {'price': 15.5, 'quantity': 1}
    ]
    total = calculate_total_price(items, tax_rate=0.1, discount=5.0)
    print(f"总价: {total}")


if __name__ == "__main__":
    main()

In [None]:

自动检查 PEP 8 的工具
1️⃣ flake8（最流行）

# 安装
pip install flake8

# 检查文件
flake8 pep8_example.py

# 检查整个目录
flake8 .
2️⃣ autopep8（自动修复）

# 安装
pip install autopep8

# 自动修复文件
autopep8 --in-place --aggressive --aggressive pep8_example.py
3️⃣ black（自动格式化，更严格）

# 安装
pip install black

# 格式化文件
black pep8_example.py
4️⃣ VSCode 配置
在 VSCode 中启用自动检查：

安装 Python 扩展
设置中搜索 "Python Linting"
启用 Flake8 或 Pylint
PEP 8 快速记忆口诀

类名大驼峰，函数蛇形命
常量全大写，变量蛇形名
缩进四空格，Tab 键不要碰
每行七九字，注释七二停
运算两边空，括号内别空
导入分三组，每行一导入
空行要规范，顶层留两行
注释要清晰，井号后有空
在你的 PySpark Notebook 中应用
让我检查一下你的 Notebook 是否符合 PEP 8：

Bash 检查并安装 flake8
IN
pip install flake8 --quiet 2>/dev/null && echo "flake8 已安装" || echo "flake8 安装失败"

OUT
flake8 已安装
/Users/zhengzhang/.zprofile:1: no such file or directory: /opt/homebrew/bin/brew
太好了！现在你可以用 flake8 检查任何 Python 文件的代码风格：


# 检查示例文件
flake8 pep8_example.py

# 检查 PySpark 脚本（如果有）
flake8 pyspark_examples.py
需要我帮你创建一个 PEP 8 学习笔记或者检查你现有代码的风格吗？