# Lesson 26.类的方法和继承

&emsp;&emsp;本节，我们将围绕数据技术的使用场景创建一些常用的类，并据此进一步探讨类的方法和继承。

### 1.数据结构类

&emsp;&emsp;在数据技术领域，无论是数据分析还是深度学习，我们往往都需要围绕实际问题创建一些能够便于进行数据表示的类，例如：二维空间坐标中的点，或者决策树中的点等等。为方便后续内容讲解，我们再创建一个类，用于表示二维平面坐标中的点。将其命名为Point类，并且给出在创建过程中可以调整横纵坐标的接口。

#### 1.1 类的创建

In [2]:
class Point:
    def __init__(self, x = 0, y = 0):               # x和y都能在创建过程中修改
        self.x = x
        self.y = y

In [3]:
a = Point(1, 2)

In [4]:
a.x, a.y

(1, 2)

In [5]:
z = Point()

In [6]:
z.x, z.y

(0, 0)

为类的对象添加可用于计算点和点之间距离的方法（欧式距离）

In [7]:
class Point:
    def __init__(self, x = 0, y = 0):               
        self.x = x
        self.y = y
    def dis(self, p):
        return ((self.x - p.x) ** 2 + (self.y - p.y) ** 2) ** 0.5

In [8]:
a = Point(1, 2)

In [9]:
b = Point(2, 1)

In [10]:
a.dis(b)

1.4142135623730951

In [11]:
b.dis(a)

1.4142135623730951

In [12]:
z = Point()

In [13]:
a.dis(z)                            # a到原点的距离

2.23606797749979

当然，我们也可以定义一个单独的函数，来计算刚才定义的类的两点之间距离。

In [14]:
def dis1(p1, p2):
    return ((p1.x - p2.x) ** 2 + (p1.y - p2.y) ** 2) ** 0.5

In [15]:
dis1(a, b)

1.4142135623730951

注：围绕自定义的类创建函数，也是一种常用的组合操作。

#### 1.2类的继承

&emsp;&emsp;此处我们考虑创建一个新的类，具体的实例仍然表示二维平面空间中的点，但点和点之间的距离计算方法改为计算曼哈顿距离（街道距离），而非欧式距离。此时我们可以考虑使用类的继承，也就是围绕某一类创建一个新的子类。      
&emsp;&emsp;具体继承的方法，就是在创建类的过程中，在类名称之后，添加父类的名称即可。而实际继承关系上，子类将继承父类的全部属性和方法，当然，在继承的过程中，最重要的还是对父类的属性和方法，进行有选择的修改。

In [39]:
class Point1(Point):                              # 继承自Point类
    def dis(self, p):
        return (abs(self.x - p.x) + abs(self.y - p.y))

In [17]:
a = Point1()

In [18]:
a.x, a.y

(0, 0)

In [19]:
x1 = Point1(1, 1)

In [20]:
y1 = Point1(2, 2)

In [40]:
x1.dis(y1)                                       # 计算街道距离

2

### 1.3 由二维至多维

&emsp;&emsp;当然，在实际的数据运算处理过程中，多维数组的计算才是更为一般的状态，那如何才能将二维数组的类拓展至多维呢？当然，可以考虑使用可变长参数*args。

In [41]:
class Point2:
    def __init__(self, *args):                  # 定义一个可变长数组，并将其转化为列表对象
        self.l = list(args)

In [42]:
a = Point2(1, 2, 3)

In [43]:
a

<__main__.Point2 at 0x2963d554388>

In [44]:
a.l

[1, 2, 3]

In [45]:
len(a.l)                                       # 回顾len函数

3

In [47]:
sum(a.l)                                      # 回顾sum函数

6

接下来了，就能进一步完善Point2的方法，仍然是考虑计算欧式距离。

In [48]:
class Point2:
    def __init__(self, *args):               
        self.l = list(args)
    def dis(self, p):
        t = []
        for i in range(len(self.l)):
            t.append((self.l[i] - p.l[i]) ** 2)
        return sum(t) ** 0.5

In [49]:
x2 = Point2(1, 2, 3)
y2 = Point2(2, 2, 1)

In [50]:
x2.l

[1, 2, 3]

In [51]:
y2.l

[2, 2, 1]

In [52]:
x2.dis(y2)

2.23606797749979

至此，我们就定义了一类非常实用的对象，那就是可变长的数组，并且可以通过调用方法来自动执行欧式距离的计算。不过，在实际的数据分析中，由于数组之间的计算是非常基本且常用的一类计算，因此Python当中有一类非常强大的包可以完成相关运算——NumPy。此处我们先简单尝试下NumPy的运算，在下一节，我们将详细介绍NumPy的基本使用方法。

In [53]:
import numpy as np

In [59]:
x = np.array([1, 2, 3])                    # NumPy数组的表示方法
y = np.array([2, 2, 1])

In [60]:
np.array([1, 2, 3]) - np.array([2, 2, 1])  # 执行矢量计算

array([-1,  0,  2])

In [61]:
sum((np.array([1, 2, 3]) - np.array([2, 2, 1])) ** 2) ** 0.5            # Python中的sum函数和科学计算符也可适用

2.23606797749979

In [63]:
def dis2(x, y):
    return (sum((x - y) ** 2)) ** 0.5                                  # 定义函数来进行距离计算，表示方法非常简单

In [64]:
dis2(x, y)

2.23606797749979

能够看出，NumPy中的array对象是一类非常实用的对象类型，而在实际的数据技术中，NumPy也是随处可见的、最常用的一类数据结构，下一节开始，我们将详细介绍NumPy相关内容。