# 信息导论课 Lecture 11: 面向对象编程 (OOP) 学习笔记

这份笔记根据 Ana Bell of MIT 的幻灯片内容进行整理、讲解和代码实战，旨在深入理解 Python 中面向对象编程的核心概念。

## 1. 核心世界观：万物皆对象

**幻灯片核心内容 (Slides 3-5):**

*   **万物皆对象 (Everything in Python is an Object):** 在 Python 中，无论是数字、字符串、列表，还是函数，它们本质上都是“对象”。
*   **对象 = 状态 + 行为 (Object = States + Behaviors):** 这是 OOP 最核心的思想。
    *   **状态 (States / Data Attributes):** 对象内部的数据，描述了对象“是什么”。比如，一辆“汽车”对象有它的颜色、当前速度、油量等状态。
    *   **行为 (Behaviors / Methods):** 对象能执行的动作，描述了对象“能做什么”。比如，“汽车”对象可以启动引擎、加速、刹车。
*   **封装 (Encapsulation) 与抽象 (Abstraction):** OOP 的一个重要原则是，将对象的内部状态（如何存储数据）隐藏起来，只对外暴露一组明确的接口（方法）来与之交互。我们作为用户，只需要知道如何“踩油门”（调用 `accelerate()` 方法），而不需要关心引擎内部的活塞是如何运动的。

**拓展理解：**
想象一下你使用手机。你通过点击屏幕上的图标（接口/方法）来发微信、拍照。你并不需要知道 CPU 的电路是如何处理这些指令的（内部实现）。这就是封装和抽象的威力，它极大地降低了复杂系统的使用难度。

## 2. 蓝图与实体：类 (Class) 与实例 (Instance)

**幻灯片核心内容 (Slides 7-10):**

*   **类 (Class):** 对象的“蓝图”或“模板”。它定义了一类对象共同拥有的属性和方法。`class` 关键字就是用来定义一个新的类型的。
*   **实例 (Instance):** 根据“蓝图”创建出来的具体的、独一无二的对象。

**重难点精讲：**
这是 OOP 的第一个思想门槛，必须彻底弄明白。

*   **`class Coordinate` (类):** 
    *   它是一张**“坐标点设计蓝图”**。
    *   蓝图上规定了：所有“坐标点”都必须有两个数据（x 和 y），并且都具备一种能力（计算与其他点的距离）。
    *   **蓝图本身不是一个具体的坐标点**，你不能问“这张蓝图在坐标系的哪个位置？”

*   **`c = Coordinate(3, 4)` (实例):**
    *   这行代码是说：“**Python！请按照 `Coordinate` 这张蓝图，给我盖一栋新房子，并且把它的 x 门牌号设为 3，y 门牌号设为 4。**”
    *   变量 `c` 就是这栋盖好的、独一无二的**房子的地址**。
    *   `origin = Coordinate(0, 0)` 则是用同一张蓝图盖的**另一栋房子**。
    *   这两栋房子（`c` 和 `origin`）都遵循同一张蓝图，所以它们都有 x 和 y，但它们的具体门牌号是不同的。

**一句话总结：`class` 是模板，`instance` 是用这个模板创造出来的具体实体。**

## 3. 实现一个类：以 `Coordinate` 为例

现在，我们开始动手编写第一个类。

### 3.1. `__init__` 方法：对象的诞生

**幻灯片核心内容 (Slide 11):**

`__init__` 是一个特殊的“构造方法”（或者叫“初始化方法”）。它有以下特点：
*   以双下划线开头和结尾。
*   在创建一个新的实例时，由 Python **自动调用**。
*   它的主要任务是，为这个新生的实例设置初始的**数据属性**。

### 3.2. `self` 参数：方法内部的“我”

**幻灯片核心内容 (Slides 11, 17, 18):**

`self` 是初学者最容易感到困惑的地方。

*   **为什么定义方法时总要写 `self`？**
    *   类中定义的方法是所有实例共享的“技能说明书”。当一个**具体的实例**（比如 `c`）调用这个方法时（`c.distance(origin)`），Python 需要知道是“谁”在调用这个技能。
    *   Python 会自动地、悄悄地把调用者 `c` 作为**第一个参数**传递给方法。在方法内部，这个调用者 `c`，就被命名为 `self`。
    *   所以，在方法内部，`self.x` 就等同于 `c.x`。

*   **为什么调用方法时不用写 `self`？**
    *   因为 Python 已经替你做了！当你写 `c.distance(origin)` 时，Python 解释器在后台实际执行的是类似 `Coordinate.distance(c, origin)` 的操作。调用者 `c` 已经通过点操作符 `.` 表明了身份，所以它被自动作为第一个参数 `self` 传入。

**一句话总结：`self` 是实例在调用方法时，向方法内部传递的“自我指代”。**

In [None]:
# 导入 math 库以使用开方功能
import math

class Coordinate(object):
    """
    一个二维坐标点类 (Class)。
    这是创建具体坐标点的“蓝图”。
    """
    def __init__(self, x, y):
        """
        构造函数: 初始化一个新的 Coordinate 实例。
        当我们写 c = Coordinate(3, 4) 时，这个方法会被自动调用。
        
        - self: 指代被创建的实例本身（即 c），由 Python 自动传入。
        - x: 传入的 x 坐标值 (3)。
        - y: 传入的 y 坐标值 (4)。
        """
        # self.x = x 的意思是: "将这个实例 c 的数据属性 x 赋值为传入的 x 值"
        self.x = x
        self.y = y

    def distance(self, other):
        """
        计算当前点 (self) 与另一个点 (other) 之间的欧几里得距离。
        这是一个方法 (Method)，定义了 Coordinate 对象的“行为”。
        
        - self: 调用这个方法的实例（比如 c）。
        - other: 传入的另一个 Coordinate 实例（比如 origin）。
        """
        x_diff_sq = (self.x - other.x)**2
        y_diff_sq = (self.y - other.y)**2
        return math.sqrt(x_diff_sq + y_diff_sq)

# --- 使用我们定义的 Coordinate 类 ---

# 1. 创建两个实例 (Instances)
#    这行代码会触发 __init__ 方法的调用
c = Coordinate(3, 4)
origin = Coordinate(0, 0)

# 2. 检查类型
print(f"变量 c 的类型是: {type(c)}")

# 3. 访问数据属性 (Data Attributes)
#    使用点操作符 "." 来访问实例内部的数据
print(f"点 c 的 x 坐标是: {c.x}")
print(f"原点 origin 的 y 坐标是: {origin.y}")

# 4. 调用方法 (Methods)
#    使用点操作符 "." 来调用实例的行为
#    当我们写 c.distance(origin) 时, Python 实际做的是:
#    - 把 c 作为第一个参数 (self) 传入 distance 方法
#    - 把 origin 作为第二个参数 (other) 传入
dist = c.distance(origin)
print(f"点 c 到原点的距离是: {dist}")
print(f"点 c 到自身的距离是: {c.distance(c)}")

## 4. 让对象“说人话”：Dunder Methods

**幻灯片核心内容 (Slides 34-40):**

我们注意到，如果直接 `print(c)`，输出会是一串难懂的内存地址，比如 `<__main__.Coordinate object at 0x7f....>`。这很不友好。

为了让我们的自定义对象能像 Python 内置类型一样自然地工作（比如被 `print`，或者使用 `+`, `*` 等运算符），我们需要实现一套特殊的“魔法方法”——**Dunder Methods (Double Underscore Methods)**。

*   **`__str__(self)`**: 当你 `print(obj)` 或 `str(obj)` 时，Python 会自动调用这个方法。你必须在这个方法里 `return` 一个字符串。
*   **`__add__(self, other)`**: 当你执行 `obj1 + obj2` 时，Python 会自动调用 `obj1.__add__(obj2)`。
*   **`__mul__(self, other)`**: 对应 `*` 乘法运算符。

这些操作符（`+`, `*`）也被称为“语法糖”(Syntactic Sugar)，它们让代码更简洁易读，但其背后都是方法调用。

我们来为 `Coordinate` 类添加 `__str__` 方法。

In [None]:
# 重新定义 Coordinate 类，这次加入 __str__ 方法
class Coordinate(object):
    def __init__(self, x, y):
        self.x = x
        self.y = y

    def distance(self, other):
        x_diff_sq = (self.x - other.x)**2
        y_diff_sq = (self.y - other.y)**2
        return math.sqrt(x_diff_sq + y_diff_sq)

    def __str__(self):
        """
        定义当 print() 这个对象时，应该显示什么。
        必须返回一个字符串。
        """
        return f"<{self.x},{self.y}>"

# --- 再次测试 ---
c = Coordinate(3, 4)
origin = Coordinate(0, 0)

# 现在 print 的输出变得非常友好！
print(f"点 c 的字符串表示: {c}")
print(f"原点 origin 的字符串表示: {origin}")

## 5. 综合实战：构建一个完整的分数 (Fraction) 类

这个例子将更深入地展示 Dunder Methods 的强大之处，让我们自定义的分数可以进行加减乘除，并且能自动约分。

**设计思路 (Slides 28, 41):**
*   **数据属性 (Internal representation):** 需要两个整数，`num` (分子) 和 `den` (分母)。
*   **方法 (Interface):**
    *   加、减、乘、除 (`+`, `-`, `*`, `/`)
    *   漂亮的打印输出
    *   (拓展) 约分
    *   (拓展) 相等判断 (`==`)

In [None]:
# 这是一个辅助函数，放在类的外部或内部都可以。放在外部更通用。
def gcd(m, n):
    """
    使用欧几里得算法计算两个整数的最大公约数 (Greatest Common Divisor)。
    """
    while n != 0:
        m, n = n, m % n
    return m

class Fraction:
    """
    一个功能更完整的分数类。
    """
    def __init__(self, num, den):
        if not isinstance(num, int) or not isinstance(den, int):
            raise TypeError("分子和分母必须是整数")
        if den == 0:
            raise ZeroDivisionError("分母不能为零")
        
        # 存储时就自动约分，保证分母为正
        common = gcd(num, den)
        self.num = num // common
        self.den = den // common
        if self.den < 0:
            self.num = -self.num
            self.den = -self.den

    def __str__(self):
        # 根据幻灯片要求，如果分母为1，只显示分子
        if self.den == 1:
            return str(self.num)
        else:
            return f"{self.num}/{self.den}"

    def __add__(self, other_fraction):
        new_num = self.num * other_fraction.den + self.den * other_fraction.num
        new_den = self.den * other_fraction.den
        return Fraction(new_num, new_den)

    def __sub__(self, other_fraction):
        new_num = self.num * other_fraction.den - self.den * other_fraction.num
        new_den = self.den * other_fraction.den
        return Fraction(new_num, new_den)

    def __mul__(self, other_fraction):
        new_num = self.num * other_fraction.num
        new_den = self.den * other_fraction.den
        return Fraction(new_num, new_den)

    def __truediv__(self, other_fraction):
        new_num = self.num * other_fraction.den
        new_den = self.den * other_fraction.num
        return Fraction(new_num, new_den)
        
    def __eq__(self, other):
        # 因为我们在初始化时已经约分，所以可以直接比较
        return self.num == other.num and self.den == other.den

# --- 使用我们定义的高级 Fraction 类 ---

f1 = Fraction(1, 4)
f2 = Fraction(2, 4)  # 初始化时会自动约分为 1/2

print(f"f1 = {f1}")
print(f"f2 = {f2}") # 注意这里会打印 1/2

# 测试运算
sum_frac = f1 + f2
print(f"{f1} + {f2} = {sum_frac}") # 1/4 + 1/2 = 3/4

# 级联操作
result = (Fraction(1, 2) + Fraction(1, 3)) * Fraction(3, 5)
print(f"(1/2 + 1/3) * 3/5 = {result}") # (5/6) * 3/5 = 15/30, 约分后为 1/2

# 测试相等
f3 = Fraction(3, 6)
print(f"f2 ({f2}) 和 f3 ({f3}) 相等吗? {f2 == f3}")

## 6. 总结：OOP 的大思想

**幻灯片核心内容 (Slides 22-24, 56):**

1.  **点操作符 (`.`) 是关键:** 它既可以访问**数据属性** (`c.x`)，也可以调用**方法** (`c.distance()`)。
2.  **模块化 (Modularity):** 将相关的数据和行为封装在类中，使得代码更有条理，易于维护和测试。你可以独立地完善 `Fraction` 类，而不用担心会影响到程序的其他部分。
3.  **抽象 (Abstraction):** 类的使用者无需关心内部细节。当你使用 `f1 + f2` 时，你不需要知道通分和约分的具体算法，你只需要相信它能正确地完成加法。类隐藏了复杂性。
4.  **代码复用与组合 (Composition):** 我们可以用简单的类来构建更复杂的类。例如，PPT中提到的 `Circle` 类，它的中心点就可以直接使用我们写好的 `Coordinate` 类的一个实例来表示，而无需重复发明轮子。

面向对象编程是一种强大的思维方式，它鼓励我们将复杂的问题分解成一个个独立的、可交互的“对象”，从而更好地管理和组织我们的代码。