# Introduction

数据科学工作日常中，离不开代码，为了编写出可靠、稳定、结构良好的代码，我们需要学习一些软件工程方面的知识。

本章内容包括：
- 软件工程基础
- 面向对象编程
- Web应用开发

# 软件工程基础

## 整洁&模块化的代码

整洁的定义：
- 可读性（readable），比如变量、函数名称等，需要有意义，如使用`age_list`表示年龄列表，使用`is_male`表示判断是否为男性等；
- 简洁（simple）
- 精炼（concise）

模块化的定义：
- 在逻辑上分解为不同的函数（functions）&模块（modules，在python中可以是一个文件）
- 核心思想为：`DRY`（Don't Repeat Yourself）

代码重构：
- 在项目刚开始时，我们更注重代码的功能性，所以代码组织上稍乱也没关系；
- 之后需要专门拿出时间，来对代码进行重构，也就是改善代码结构，而不该变其功能。

## 提高代码效率

- 减少代码运行时间
- 减少代码运行所占内存

## 有效的文档注释

帮助快速理清复杂代码与代码思路。

- 单行注释
- 函数文档

```python
# 单行注释
def population_density(population, land_area):
    """Calculate the population density of an area."""
    return population / land_area
```

```python
# 完整多行注释
def population_density(population, land_area):
    """Calculate the population density of an area.

    Args:
    population: int. The population of the area
    land_area: int or float. This function is unit-agnostic, if you pass in values in terms of square km or square miles the function will return a density in those units.

    Returns:
    population_density: population/land_area. The population density of a 
    particular area.
    """
    return population / land_area
```

- 项目文档(README)
    - 项目背景
    - 项目依赖环境及拓展包、版本
    - 简洁的文件组成及功能
    - 如何使用


## 版本控制

使用Git进行版本控制。

**非常有用的两个教程**：
- [Learn Git](https://learngitbranching.js.org/?locale=zh_CN)
- 

## 测试

在上线前，做好代码测试。

## 日志记录

运行代码时，可以使用print或者txt文档，储存运行过程，当出现问题时，我们便可以查看日志，来进行Debug。

## 代码审查

即对上面的所有内容，进行回顾审查。

# 面向对象编程

面向对象编程，可以让代码更具模块化与组织性。

## 顺序编程与面向对象编程

- 顺序编程：即代码从上至下依次执行的编码；
- 面向对象编程：即基于对象的编程，对象具有
    - 特征（Characteristics）：如狗的毛发颜色、身高、体重等（类似于名词）；——更专业的术语叫做**属性（attributes）**
    - 行为（Actions）：如狗叫、跑、挖洞等（类似于动词）。——更专业的术语叫做**方法（methods）**

- 对象：具体的实例，比如说田园犬与泰迪犬；
- 类：由方法与属性组成的蓝图，可以理解为*模板*，比如 犬类中的所有犬都具有颜色、身高、体重等属性，具有叫、跑、挖洞等方法。

## 语法


> Method与Function有点类似，都使用def定义，具有输入与输出；区别在于，Method是在类里面；而Function是在类外面。

In [2]:
# 如下是犬类的定义
# 类的名称要首字母大写，保持良好的编码风格
class Dogs: 
    # __init__函数是python内置函数，用来初始化
    # self可以帮助python定义属性在内存中的位置，以此可以在整个类中进行调用
    # 可以把self理解为一个字典
    def __init__(self,color,weight,height): 
        self.color = color
        self.weight = weight
        self.height = height
    
    # 定义method：跑步
    def run(self,distance):
        return(f'Dog has run for {distance}m.')

In [3]:
# 实例化类，即定义对象
tianyuan_dog = Dogs('yellow',30,50)

In [4]:
# 查看对象的属性
tianyuan_dog.color

'yellow'

In [5]:
# 执行对象的方法
tianyuan_dog.run(10)

'Dog has run for 10m.'

## 类的注释

```python
class Pants:
    """The Pants class represents an article of clothing sold in a store
    """

    def __init__(self, color, waist_size, length, price):
        """Method for initializing a Pants object

        Args: 
            color (str)
            waist_size (int)
            length (int)
            price (float)

        Attributes:
            color (str): color of a pants object
            waist_size (str): waist size of a pants object
            length (str): length of a pants object
            price (float): price of a pants object
        """

        self.color = color
        self.waist_size = waist_size
        self.length = length
        self.price = price

    def change_price(self, new_price):
        """The change_price method changes the price attribute of a pants object

        Args: 
            new_price (float): the new price of the pants object

        Returns: None

        """
        self.price = new_price

    def discount(self, percentage):
        """The discount method outputs a discounted price of a pants object

        Args:
            percentage (float): a decimal representing the amount to discount

        Returns:
            float: the discounted price
        """
        return self.price * (1 - percentage)
```

## 继承

继承，即我们编写类时，可以从更广泛的类中获得一些基础属性与方法，然后再添加上更个性化的属性与方法。可以把他理解为从父类继承子类，比如说从 宠物类 继承 犬类，如下所示：

In [6]:
# 宠物类
class Pets: 
    # 宠物类中都具有颜色、体重、身高属性，以及跑步的方法
    def __init__(self,color,weight,height): 
        self.color = color
        self.weight = weight
        self.height = height
    
    # 定义method：跑步
    def run(self,distance):
        return(f'Dog has run for {distance}m.')

In [7]:
# 定义犬类，继承自宠物类
class Dogs(Pets):
    # 除了宠物类中的基础属性外，还添加了尾巴长度属性
    def __init__(self,color,weight,height,tail_length):
        Pets.__init__(self,color,weight,height)
        self.tail_length = tail_length
    # 添加汪汪叫的方法    
    def bark(self,times):
        return ('Wong! ' * times)

In [8]:
tianyuan_dog = Dogs('Yellow',20,50,30)

In [10]:
# 测试继承的基础属性，与新添加的属性
tianyuan_dog.color, tianyuan_dog.tail_length

('Yellow', 30)

In [11]:
# 继承的方法
tianyuan_dog.run(10)

'Dog has run for 10m.'

In [12]:
# 新添加的方法
tianyuan_dog.bark(3)

'Wong! Wong! Wong! '