# 04 - Python basics D

- 类(class)与实例(instance)
- 继承(inheritance)
- 实例的初始化
- 脚本编写(scripting)

## 学习目标

- 如何根据自己的需求创建新的合适的数据类型
- 如何编写可以提供参数的命令行脚本

## 类与类的实例

类是一个抽象的模板或蓝图，用于描述具有相同属性（数据）和行为（方法）的一组对象。它定义了对象的结构，包括属性(property)，即对象的状态信息，比如手机的内存大小、存储、电池容量；也包括方法(method)，即对象可以执行的操作，比如手机大都可以拍照、打电话。

实例是根据某个类创建出来的具体对象。每个实例都有类所定义的属性和方法，但每个实例的属性值可以是不同的。例如某个型号的手机设计方案与相关的技术规格是class，但具体生产出来的手机（instance）的存储有256G的，有512G的，还有1T的。

`class`关键字用来创建类对象，并赋予其类名；在class定义内部的赋值会成为class的特性，这些特性可以是这一类对象的状态（属性，property）或者可以执行的操作（方法，method）。类创建时定义的函数通过self来访问或修改实例的信息，因此这些函数的第一个参数一般都是`self`，运行时用来指代具体实例自身。

实例通过调用类对象来创建，每个实例对象会继承这一类对象的属性，并获得自己的命名空间。如果类对象定义的某个函数能够修改self的属性，那么调用这个函数时，这个实例的属性会被修改，但类对象的属性不会变化。

In [None]:
class SmartPhone: # class name, CamelCase (驼峰命名法)
    brand = None  # class property
    model= None   # class property
    def set_brand(self, value):  # class method
        self.brand = value         # set the instance property
    def set_model(self, value):  # class method
        self.model = value         # set the instance property
    def display(self):           # class method
        # print instance properties if set; otherwise class properties;
        print(f'{self.brand} {self.model}')

In [None]:
SmartPhone

In [None]:
x = SmartPhone()

In [None]:
type(x)

In [None]:
x.set_brand('Huawei')
x.set_model('P10')

In [None]:
print(dir(x))

In [None]:
x.model

In [None]:
x.brand

In [None]:
# 使用实例的方法
x.display()

In [None]:
# 等价于
SmartPhone.display(x)

In [None]:
# 通过类对象的方法对self的修改影响的是实例x的品牌与型号；
# 新创建的实例的品牌与型号还未设定，如果我们尝试访问的话会有什么样的结果呢？
y = SmartPhone()
y.display()

Python中的类更像是变量空间（namespace），实例是这个空间绑定特定对象后的变量空间。

```mermaid
classDiagram
SmartPhone <|-- x: is a
SmartPhone <|-- y: is a

class SmartPhone{
    + brand = None
    + model = None
    + set_brand(self, value)
    + set_model(self, value)
    + display(self)
}

class x{
    + brand = "Huawei"
    + model = "P10"
    + set_brand(value)
    + set_model(value)
    + display()
}

class y{
    + set_brand(value)
    + set_model(value)
    + display()
}
```

In [None]:
# 当我们尝试获取实例的某个属性，但这个属性还没创建，该实例的命名空间还不存在这个属性时，
# Python会从类对象的命名空间尝试获取这个属性的值；
id(SmartPhone.brand), id(x.brand), id(y.brand)

In [None]:
# 类对象定义时，声明的函数是普通的函数
# 对于创建的实例，函数变成了与这个实例绑定的方法
SmartPhone.set_brand, x.set_brand

In [None]:
# 对于实例的绑定的（bound）方法，可以通过__self__属性获取到这个方法绑定的实例对象
x.set_brand.__self__, y.set_brand.__self__

In [None]:
x, y

------------
🙋**练习**

`id(SmartPhone.set_brand), id(x.set_brand), id(y.set_brand)`三者是否相同，为什么？

-------------

In [None]:
y.set_brand('Huawei')
y.set_model('Nova 14 Ultra')
y.display()

```mermaid
classDiagram
SmartPhone <|-- x: is a
SmartPhone <|-- y: is a

class SmartPhone{
    + brand = None
    + model = None
    + set_brand(self, value)
    + set_model(self, value)
    + display(self)
}

class x{
    + brand = "Huawei"
    + model = "P10"
    + set_brand(value)
    + set_model(value)
    + display(self)
}

class y{
    + brand = "Huawei"
    + model = "Nova 14 Ultra"
    + set_brand(value)
    + set_model(value)
    + display(self)
}
```

In [None]:
# 我们也可以通过在创建后，在这些命名空间里添加新的变量成为实例的属性
y.battery = 5500
print(y.battery)

```mermaid
classDiagram
SmartPhone <|-- x: is a
SmartPhone <|-- y: is a

class SmartPhone{
    + brand = None
    + model = None
    + set_brand(self, value)
    + set_model(self, value)
    + display(self)
}

class x{
    + brand = "Huawei"
    + model = "P10"
    + set_brand(value)
    + set_model(value)
    + display()
}

class y{
    + brand = "Huawei"
    + model = "Nova 14 Ultra"
    + battery = 5500
    + set_brand(value)
    + set_model(value)
    + display()
}
```

In [None]:
# 可以用实例或类对象自身的.__dict__属性查看命名空间中的内容
y.__dict__

In [None]:
SmartPhone.__dict__

In [None]:
y.__dict__

In [None]:
# 给实例的命名空间添加新的函数只会是普通的函数，不会自动成为绑定的函数
def display2(self):
    print(f'{self.brand} {self.model} with a {self.battery} mAh battery')

y.display2 = display2

y.display2()

In [None]:
del y.display2

In [None]:
y.__dict__

In [None]:
# 给类对象添加的新函数会成为所有同属于此类的实例的绑定函数；
# 被绑定的对象自动成为函数的第一个参数；
def display2(self):
    print(f'{self.brand} {self.model} with a {self.battery} mAh battery')

SmartPhone.display2 = display2

y.display2()

------------
🙋**练习**

1. 定义class时，其中的函数第一个参数必须叫self吗？不叫self会有什么后果？自己定义一个类试试。
2. 如果非要给某个实例而非类对象添加新的绑定的方法，是否能够实现？如果可以，如何实现？如果不可以，为什么？
   
------------

In [None]:
del SmartPhone.display2
y.display2()

------------
🙋**练习**

下面的代码会报错吗，不报错的话会输出什么呢？
```python
SmartPhone.year = 2025

x = SmartPhone()
print(x.year)
```

-------------

## 继承（Inheritance）

In [None]:
class HuaweiPhone(SmartPhone):
    def huawei_style_display(self):
        print(f'{self.brand} {self.model} - a smartphone far ahead of its peers.')

# 仅作为例子展示继承的语法，不对产品的实际表现做任何保证或评价，本课程也没有受到任何厂商的赞助或支持。

In [None]:
x = HuaweiPhone()
x.set_brand('Huawei')
x.set_model('Nova 14 Ultra')
x.display()

In [None]:
x.huawei_style_display()

- 继承机制允许我们从已有的类基础上创建新的类，新创建的类叫子类（subclass），被继承的叫父类、超类（superclass）；
- 定义子类时，被继承的父类列在子类名称后面的括号中；
- 子类继承父类的所有特性；实例继承子类以及子类的父类的特性；
- Python搜索实例的属性时，先搜索实例自身的命名空间，没找到的话再搜索类的命名空间，最后再搜索类的父类的命名空间；

In [None]:
# 方法重载（overloading）：当子类的方法与父类的方法名称相同时，按照Python的搜索顺序，
# 先找到子类定义的方法，因而父类的方法看起来像是被覆盖了。
class HuaweiPhone(SmartPhone):
    def display(self):
        print(f'{self.brand} {self.model} - a smartphone far ahead of its peers.')

In [None]:
x = HuaweiPhone()
x.set_brand('Huawei')
x.set_model('Nova 14 Ultra')
x.display()

In [None]:
print(x)

```mermaid
classDiagram
SmartPhone <|-- HuaweiPhone: inherits

class SmartPhone{
    + brand = None
    + model = None
    + set_brand(self, value)
    + set_model(self, value)
    + display(self)
}

class HuaweiPhone{
    + display*(self)
}
```

- `__`括起来的特性是特殊的特性，某些内置函数在运行时会自动使用这些特性；
- 在定义类时可以重载内置的特性；
- 如果某个类对于一个运算符没有定义或者继承默认的操作，那么这个运算符不支持这个类；

In [None]:
class HuaweiPhone(SmartPhone):
    def display(self):
        print(f'{self.brand} {self.model} - a smartphone far ahead of its peers.')
    def __str__(self):
        return f'{self.brand} {self.model} - a smartphone far ahead of its peers.'

x = HuaweiPhone()
x.set_brand('Huawei')
x.set_model('Nova 14 Ultra')

print(x)

In [None]:
class MyList(list):
    def __add__(self, another_list):
        return [self, another_list]

In [None]:
x = list('abc')
y = list('de')
x + y

In [None]:
x = MyList('abc')
y = MyList('de')
x, y

In [None]:
x + y

In [None]:
# 可以从多个类继承
class Camera():
    def set_focal_length(self, value):
        self.focal_length = value
    def get_focal_length(self):
        return f'{self.focal_length}mm'

class HuaweiPhone(SmartPhone, Camera):
    def display(self):
        print(f'{self.brand} {self.model} - a smartphone far ahead of its peers.')

In [None]:
x = HuaweiPhone()
x.set_focal_length(50)
x.get_focal_length()

In [None]:
print(x.brand)

In [None]:
x.__dict__

```mermaid
classDiagram
SmartPhone <|-- HuaweiPhone: inherits
Camera <|-- HuaweiPhone: inherits
HuaweiPhone <|-- x: is a

class SmartPhone{
    + brand = None
    + model = None
    + set_brand(self, value)
    + set_model(self, value)
    + display(self)
}

class Camera{
    + set_focal_length(self, value)
    + get_focal_length(self)
}

class HuaweiPhone{
    + display*(self)
}

class x{
    + focal_length = 50
    + set_brand(value)
    + set_model(value)
    + set_focal_length(value)
    + get_focal_length()
    + display*()
}
```

## 实例的初始化

In [None]:
class X: pass

y = X()
z = X()
y, z

In [None]:
# 类的属性是共享的属性，会影响所有实例；如果属性是每个实例私有的，则不会互相干扰
X.name = 'Tom'
y.name, z.name

In [None]:
# 可以在实例创建时定义必要的属于实例自己的属性
class SmartPhone:
    def __init__(self, brand=None, model=None):
        self.brand = brand
        self.model = model
    def display(self):
        print(f'{self.brand} {self.model}')

In [None]:
my_phone = SmartPhone('Huawei', 'P10')
my_phone.display()

In [None]:
SmartPhone.brand

In [None]:
# 怎么用父类的方法初始化
class HuaweiPhone(SmartPhone):
    def __init__(self, model=None):
        super().__init__("Huawei", model)
    def display(self):
        print(f'{self.brand} {self.model} - a smartphone far ahead of its peers.')

In [None]:
my_phone = HuaweiPhone('P10')
my_phone.display()

In [None]:
# 怎么用父类的方法初始化
class HuaweiPhone(SmartPhone, Camera):
    def __init__(self, model=None):
        SmartPhone.__init__(self, "Huawei", model)  # 注意需要提供self参数
    def display(self):
        print(f'{self.brand} {self.model} - a smartphone far ahead of its peers.')

In [None]:
my_phone = HuaweiPhone('Nova 14 Ultra')
my_phone.display()

```mermaid
classDiagram
SmartPhone <|-- HuaweiPhone: inherits
HuaweiPhone <|-- my_phone: is a

class SmartPhone{
    + __init__(self, brand=None, model=None)
    + display(self)
}

class HuaweiPhone{
    + __init__(self, model=None)
    + display*(self)
}

class my_phone{
    + brand = 'Huawei'
    + model = 'P10'
    + __init__(model=None)
    + display*()
}
```

## 脚本编写

脚本是用来在终端/命令行执行的.py文件

```bash
python /path/to/your/script.py
```

In [None]:
! ls src

In [None]:
! readlink -f src/hello_world.py  # absolute path to the file

In [None]:
! cat src/hello_world.py

In [None]:
! python src/hello_world.py

`.py`文件是Python中的模块（module），当被导入到其他文件中使用时，该模块的内置属性`__name__`是模块的名字；当`.py`文件作为主文件被Python直接执行时，`__name__`的值是`__main__`。

利用这个性质，我们可以定义一些只有当文件直接被执行时才会运行的指令，而当文件被导入到其他文件时，这些指令不会被执行。只提供一些可以重复使用的函数、变量等。

In [None]:
! python src/hello_world2.py

In [None]:
from src.hello_world2 import print_hello_world

In [None]:
print_hello_world()

### 解析命令行参数

In [None]:
import sys

sys.argv

In [None]:
! python src/print_args.py Zihan

In [None]:
! python src/print_args.py -p Zihan -f lanzhou

使用`sys.argv`传递命令行参数：

In [None]:
! python src/hello.py Zihan lanzhou

怎么检验参数传递是否正确？

In [None]:
! python src/hello2.py Zihan lanzhou

In [None]:
! python src/hello2.py Zihan

In [None]:
! python src/hello2.py Zihan Lanzhou LZU

怎么实现更灵活更实用的参数传递呢？

### argparse (from standard library)

In [None]:
! python src/hello3.py -h

In [None]:
! python src/hello3.py Zihan

In [None]:
! python src/hello3.py -l Guangzhou Zihan

In [None]:
! python src/hello3.py --loc Guangzhou Zihan

In [None]:
! python src/hello3.py --loc Guangzhou

有没有更方便一些的写法？

### click (third party)

In [None]:
! python src/hello4.py

In [None]:
! python src/hello4.py -h

In [None]:
! python src/hello4.py -l Guangzhou Zihan

In [None]:
! python src/hello4.py Zihan

In [None]:
! python src/hello4.py Zihan --location Guangzhou

In [None]:
! python src/hello4.py Zihan -r Guangzhou

## 作业

1. 创建一个`fasta.py`模块，其中定义一个DNA序列类叫做`Seq`，初始化时会给每个实例创建`id`与`seq`两个属性，`id`与`seq`都是字符串；`Seq`类有一个`revcomp`方法，执行之后会把实例的序列变为其反向互补序列，还有一个`__str__`方法，能够根据实例的`id`与`seq`生成一个用于打印的fasta格式的字符串，例如`">id\nAACCT\n"`。

2. 编写一个叫做`fasta_revcomp.py`的脚本，其中包含两个函数：
   - 第一个函数叫`read_fasta`，用于读取`fasta`格式的文件，返回`Seq`类型实例的生成器函数；
   - 第二个函数叫`main`，有两个参数：
       - 第一个叫`input_path`，是已知`fasta`文件的路径；
       - 第二个叫`output_path`，是将要输出的新fasta文件的路径。
   
   `main`函数将调用`read_fasta`函数读取`fasta`文件中每条记录，然后利用`Seq`类的`revcomp`方法将其序列变为反向互补序列，再利用`str`函数得到实例的`fasta`格式字符串，将其写入到`output_path`所指定的文件。

3. 当`fasta_revcomp.py`被直接运行时，使用`argparse`包解析命令行的参数，以此调用`main`函数。执行以下命令后，应能将homework文件夹中的fasta文件反向互补并存储在tmp文件夹下：

```bash
python fasta_revcomp.py -i homework/seqs.fasta -o tmp/output.fasta
```

4. (*) 在`fasta_revcomp.py`的基础上，创建一个新文件`fasta_revcomp2.py`，使用`click`包而非`argparse`解析命令行的参数。

## dataclass & namedtuple

In [None]:
from collections import namedtuple

# Define a named tuple for a Point
Point = namedtuple('Point', ['x', 'y'])

# Create an instance of the Point named tuple
p = Point(x=10, y=20)

# Access elements by name
print(p.x, p.y)

# Access elements by index (still possible)
print(p[0], p[1])

In [None]:
from dataclasses import dataclass


@dataclass  # decorator
class Point:
    x: float
    y: float = 0

In [None]:
p = Point(10)
# Access instance propoerty
print(p.x, p.y)

In [None]:
p.__dict__

In [None]:
type(p.x)

In [None]:
# equivalent class
class Point:
    def __init__(self, x: float, y: float=0):
        self.x = x
        self.y = y

p = Point(10)
print(p.x, p.y)