## Ch1. Python Fundamentals 

### 0. 本章内容
本章介绍Python的基础知识，以帮助大家快速掌握一门效率极佳的编程工具。本章我们将会关注于Python最基本的用法，来时大家能够快速上手这一编程语言。如果你是一名编程新手，那么本章的一些知识点可能需要你慢慢消化，建议在阅读本教程的同时搭配推荐的学习资料进行进一步的学习；而如果你已经是一名具有一定编程经验的“老手”，本章的内容依然可以带你快速浏览Python中最常用的基础语法概念，以帮助你快速概览并使用这门语言。

本章会从Python的基础数据结构类型开始逐步向数据结构等Python的核心概念深入，然后我们会介绍注入控制流语句等Python的语法结构，最后我们将学习如何组织与架构代码，最后的最后我们会向大家介绍Python开发者应该遵守的一些代码规范。


### 1. 基础数据类型
在实际中，我们会遇到诸如数字、文本、布尔值等各种类型的数据（data），与其他编程语言纸样，Python在处理各类数据的过程中会将他们进行区别对待。Python的做法就是将这些数据赋予不同的数据类型。在Python中常用的数据类型包括整型（int）、浮点型（float）、布尔值（bool）与字符串（string）。这些数据类型在Python都是对象（Object）。

#### 1.1 对象
在Python中，万物皆对象。我们在编程中见到的诸如数据类型、数据结构等等概念在Python中皆为对象。利用对象的概念，Python可以让复杂的东西变得更为简洁易懂。变量、函数、属性与方法是理解对象的重要概念。

##### 1. 变量
在python中，变量（variable）是我们赋予对象的一个名字。我们通过等号（=）来将变量赋予给对象。在python中，我们可以直接通过将一个新的对象赋予一个变量来改变变量的类型，python的这种特性被称为动态类型。
需要我们注意的是Python是大小写敏感的，也就是说在python中我们需要区分大小写，“A”与“a”是不同的变量。当我们在为变量命名时，也应当遵循一些规则，在python中变量名必须遵守以下规范：
   - 必须以字母或者下划线开头
   - 只能由字母、数字、下划线组成

In [1]:
a = 1
A = 2
b = 3

In [2]:
print(a)
print(A)

1
2


In [3]:
print(a + b)
a = 'three'
print(a)

4
three


##### 2. 函数
在本章的后面会详细介绍函数，在这里只介绍python中函数的基本形式。python中函数由函数名与参数以及函数体组成，调用函数只需要在函数名的后面中跟上一对圆括号，并在其中填入参数即可：
``` python
function_name(argument_1, argument_2, ..., argument_n)
```

##### 3. 属性与方法
在面像对象的过程中，变量被称为属性，而函数则被称为方法。我们可以通过属性来访问对象的数据，也可以通过方法来执行某种操作。在python中我们可以通过点号“.”来访问对象的属性与方法。例如：`object.attribute`，`object.method()`。
在python中对象的类型及其行为是由类（class）定义的，从类构造对象的过程叫做实例化，因此对象也被称为类的实例。

#### 1.2 数值类型
在python中主要有两种数值类型——整数（int）与浮点数（float）。我们可以通过python内置的`type()`函数可以获取到我们指定的对象的数据类型。

In [4]:
print(type(1))
print(type(1.0))

<class 'int'>
<class 'float'>


我们可以通过字面量的方法来定义数值类型，也可以使用构造器的方法来构造数值类型。数值类型之间的转换也是同理，我们可以用在整数后面直接添加小数点的方式来吧int类型的数据强制转化为float类型的数据，也可以使用`int()`、`float()`的构造器来进行强制类型转换。但需要注意的是，在从浮点型向整型强制转换的过程中，python会直接舍去浮点型数据不为零的小数部分。

In [5]:
a = 1
print(type(a))
a = 1.
print(type(a))
print(type(float(1)))
print(int(1.25))

<class 'int'>
<class 'float'>
<class 'float'>
1


除了最常见的int与float类型外，python中还有一些诸如decimal、fraction与complex等数据类型。一般来说如果float的精度不够，那么我们就可以选用decimal以获得准确的结果。
在python中我们可以使用算术运算符来对数值进行计算，python中的算术运算符与数学中的概念类似，与许多其他编程语言中的算术运算符都极为相似。

In [6]:
print(3 + 4)
print(4 - 2)
print(3 / 4)
print(3 * 4)
print(3 ** 4)
print(3 * (3 + 4))

7
2
0.75
12
81
21


#### 1.3 布尔值
在python中，布尔类型只有True与False两种取值。在python中我们可以通过布尔运算符与相等和不等运算符，来组成布尔表达式或者进行不二运算。

In [7]:
print(3 == 4)
print(3 != 4)
print(3 < 4)
print(3 >= 4)
print(not True)
print(True or False)
print(True and False)

False
True
True
False
False
True
False


每个python对象都可以视作True或False，其中除了0，False，None外的对象被视作True，而0，False，None以及空字符串会被视作False。None是python中一个内置的特殊常量，他代表“没有值”，如果一个函数没有显式的返回一个值，那么它实际上返回的就是None。此外，我们可以使用bool构造器来判断一个对象究竟是True还是False。

In [8]:
print(bool(0))
print(bool(None))
print(bool(""))
print(bool(None))
print(bool(1))

False
False
False
False
True


#### 1.4 字符串
在python中我们使用字符串类型来表示文本类型的数据。在python中字符串既可以用`""`也可以用`''`来表示。Python在处理字符串方面十分强大。我们可以使用+来拼接字符串，也可以直接使用*来重复字符串的内容。
在python中灵活的使用双引号或单引号可以让我们轻松的按照原样打印引号，而不需要使用转义字符。如果字符内容仍然需要转义，可以使用反斜杠“\”来转义字符。当字符中包含变化的变量时，我们可以通过使用f-string（格式化字符串字面量）来处理。
字符串在python中也是对象，我们可以通过执行相关的方法来对字符串进行一些操作

In [9]:
print('hello' + 'world')
print("I'm Li Hua")
print("I'm \"Li Jiang\"")
counter = 1
print(f'count is {counter}')
print('python'.upper())
print('PYTHON'.lower())

helloworld
I'm Li Hua
I'm "Li Jiang"
count is 1
PYTHON
python


### 2. 数据结构
Python中提供了一些强大的数据结构以便于处理对象的集合。接下来我们会介绍列表、字典、元组以及集合，一系列基础的python数据结构。虽然每种数据结构都有各自的特点，但他们都有一个共同的特点，那就是他们都能储存多个对象。

#### 2.1 列表
列表是python中最常见的一种数据结构，他可以储存不同数据类型的多个对象。列表用途广泛，我们可以通过以下的字面量方法，字面量方法就是会被python识别为特定类型对象的语法，来创建列表：
```python
[element_1, element_2, ..., element_n]
```
与字符串一致，我们可以使用+来对列表进行拼接。列表还有一个重要的特性就是他可以储存不同类型的对象，同时由于列表也是对象也可以包含其他列表作为自己的元素，我们将列表的这种用法称为嵌套列表。我们可以把嵌套列表写成多行，可以发现，这种嵌套列表可以很好的用来表示矩阵或者数据框。

In [10]:
file_names = ['a.csv', 'b.csv', 'c.csv']
numbers = [1, 2, 3]
comb_list = file_names + numbers
print(comb_list)

['a.csv', 'b.csv', 'c.csv', 1, 2, 3]


In [11]:
mat_ls = [[1, 2, 3],
          [5, 4, 6],
          [7, 8, 9]]

我们可以使用“跨行”的格式来表示这种嵌套列表。列表的方括号，支持“隐式”的代码跨行。同时我们可以通过索引与切片来访问列表中的元素。在文章后续我们会详细介绍索引与切片的用法，在这里大家先简要了解一下即可。

In [12]:
print(mat_ls[1])
print(mat_ls[1][:1])

[5, 4, 6]
[5]


- **跨行**：
    在这里为大家介绍一下python代码的跨行。在我们编写代码的过程中，代码可能过长，在这种情况下我们就可能需要将代码分成两行或者多行才能保证代码的可读性。在具体的操作上，我们可以通过圆括号或者反斜杠来把代码分成几行。例如：
  ```python
  mat_ls = (1 + 2 
            + 3)
  mat_ls = 1 + 2 \ 
            + 3
  ```
    而根据python的代码风格指南希望我们尽可能使用隐式跨行（implicit line break）。在python中，当我们在使用包括圆括号、方括号、花括号的表达式时，这些括号可以支持我们进行隐式跨行而无需添加其他字符。

我们可以通过`.append()`，`.insert()`方法来向列表中添加元素；`.append()`方法通常用来向列表的末尾追加元素，`.insert()`方法通常用来在索引处插入元素。我们可以通过`pop`，`del`来删除列表中的元素；`pop`是一个方法，而`del`是一个python的语法；`pop`在默认情况下用来移除并返回最后一个元素，而`del`则用来移除指定索引处的元素。

In [13]:
usr = ['John', 'Tom', 'Linda']
print(usr.append('Brian'))
print(usr)
print(usr.insert(1, 'Kim'))
print(usr)

None
['John', 'Tom', 'Linda', 'Brian']
None
['John', 'Kim', 'Tom', 'Linda', 'Brian']


In [14]:
print(usr.pop())
print(usr)
del usr[0]
print(usr)

Brian
['John', 'Kim', 'Tom', 'Linda']
['Kim', 'Tom', 'Linda']


除更改列表中的元素外，我们还可以使用`len()`与`sort()`、`sorted()`，方法来获取列表的长度或者对列表进行排序。`len()`用来获取列表的长度；`sort()`、`sorted()`用来对列表进行排序，而他们的区别在于`sorted()`返回一个排序好的新列表而保持原列表不变，而`sort()`则是直接对原列表进行修改。

In [15]:
print(len(usr))
print('Linda' in usr)
print(sorted(usr))
print(usr)
print(usr.sort())
print(usr)

3
True
['Kim', 'Linda', 'Tom']
['Kim', 'Tom', 'Linda']
None
['Kim', 'Linda', 'Tom']


要访问列表中的元素，可以通过元素的索引来引用一个元素，但在实际中我们不可能知道每一个元素的位置。那么我们可以通过字典这种数据结构来更好的对元素进行访问，字典可以让我们通过“键”来访问元素。

#### 2.2 字典
字典（dictionary）是键到值（key-value）的映射。字典是键值对的数据结构，我们可以通过以下的字面量方法来创建字典：
```python
{
    'key_1': value_1,
    'key_2': value_2,
    'key_n': value_n,
}
```
列表通过索引来访问，而字典通过见来访问元素。与索引类似，字典将键放在方括号中来访问字典元素。同时我们也可以通过简单的字面量方法来修改集群的值以及添加新的键值对。除了直接在方括号中引用键外，我们还可以使用`get()`方法来访问字典中的元素，同时`get()`方法可以在见不存在的情况下返回一个默认值。

In [16]:
exchange_rate = {
    'EURUSD': 1.1152,
    'GBPUSD': 1.2454,
    'AUDUSD': 0.6161,
}

print(exchange_rate['EURUSD'])
exchange_rate['EURUSD'] = 1.2
print(exchange_rate)
exchange_rate['CADUSD'] = 0.714
print(exchange_rate)

1.1152
{'EURUSD': 1.2, 'GBPUSD': 1.2454, 'AUDUSD': 0.6161}
{'EURUSD': 1.2, 'GBPUSD': 1.2454, 'AUDUSD': 0.6161, 'CADUSD': 0.714}


我们可以通过解包（unpack）的方法来合并两个或多个字典，然后再合并到一个新的字典中。在字典前加上两个星号（**）就可以进行解包。在合并字典的过程中，如果第二个字典中的键包含第一个字典中的键，那么第一个字典中对应键的值会被相应的覆盖。此外Python 3.9中引入了管道符号（|）来作为专门的字典合并运算符。除了字符串，很多对象诸如整数都可以当键。

In [17]:
exchange_rate = {
    1: 1.1152,
    2: 1.2454,
    3: 0.6161,
}

currency = {
    1: 6,
    2: 5,
    5: 8,
}

print(exchange_rate.get(1))
print(exchange_rate.get(100, 'N/A'))

print({**exchange_rate, **currency})
print(exchange_rate | currency)


1.1152
N/A
{1: 6, 2: 5, 3: 0.6161, 5: 8}
{1: 6, 2: 5, 3: 0.6161, 5: 8}


#### 2.3 元组

元组与列表类型十分相似，不过元组与列表之间有一个重大区别，那就是元组是不可变的（immutable）（我们会在后面面为大家详细讲解可变与不可变的概念，大家在此先记住元组是不可变的即可）。一旦被创建，那么元组中的元素就是不可改变的。在很多情况下元组与列表都可以互换使用，但是对于在整个程序中都不会发生改变的集合中，使用元组无疑是更安全的选择。我们可以通过使用多个逗号分隔值的方法来创建元组：
```python
usr_tuple = element_1, element_2, ..., element_n
# 通常使用圆括号来时程序更易于阅读
usr_tuple = (element_1, element_2, ..., element_n)
```
我们可以通过访问数组的方法来访问元组，但是不能改变元组的元素。而拼接元组会创建一个新的元组，并把这个元组绑定在原来的变量上。

In [18]:
currencies = ('EUR', 'CNY', 'JPY',)
currencies += ('USD',)
print(currencies)

('EUR', 'CNY', 'JPY', 'USD')


#### 2.4 集合

在python中集合与数学中的概念一致，集合是一种没有重复元素的集合。我们可以将集合应用到集合论的运算中，但是在实践中，我们通常将集合应用于列表去重或者元组去重。我们通过使用花括号的字面量方法来创建集合：
```python
{element_1, element_2, ..., element_n}
```
在对列表或元组进行去重的过程中，我们使用set构造器的方法来构造集合。除此之外，我们还可以对集合进行交集与并集的集合间的运算。

In [19]:
usr_ls = ['USD', 'USD', 'CNY', 'CNY', 'EUR']
usr_set = set(usr_ls)
print(usr_set)

usr_set1 = {1, 2, 3, 4}
usr_set2 = {3, 4, 5, 7}

print(usr_set1.union(usr_set2))
print(usr_set1.intersection(usr_set2))

{'EUR', 'CNY', 'USD'}
{1, 2, 3, 4, 5, 7}
{3, 4}


#### 2.5 索引与切片

索引与切片可以让我们访问一个序列的指定元素。我们可以通过索引来访问序列中的某一个元素，可以通过切片来访问序列中的某一段元素。在python中类似元组、列表、字符串等的序列结构都支持索引与切片。

##### 1. 索引

Python的索引从0开始，也就是说序列的第一个元素使用0来引用；负索引从-1开始，我们可以使用负索引来从序列末尾引用元素。在python中，我们使用方括号来使用索引。具体索引的语法如下所示：
```python
sequence[index]
```
当我们希望提取多个元素时，就应该使用切片了。

In [20]:
py_str = 'python'

print(py_str[0])
print(py_str[-1])
print(py_str[1])
print(py_str[-2])

p
n
y
o


##### 2. 切片

我们可以使用切片语法来从一个序列中获取一个以上的元素。切片的语法如下所示：
```python
sequence[start:stop:step]
```
Python使用左闭右开区间，切片区间包含start，但不包含stop。如果省略了start或stop。python会默认包含从开头到末尾的所有元素。step决定了切片的方向与步长，默认步长为1；如果步长为正，那么切片的方向为从左到右，若步长为负，那么切片的方向就为从右到左。

In [21]:
print(py_str[:3])
print(py_str[1:3])
print(py_str[-3:])
print(py_str[-3:-1])
print(py_str[::2])
print(py_str[-1:-4:-1])

pyt
yt
hon
ho
pto
noh


我们除了向上面使用单词的索引与切片操作，我们也可以使用多个索引与切片操作串联的方法来进行对序列元素的访问。

In [22]:
print(py_str[-3:][1])

o


在实际中，在切片与索引列表的时候，使用连续索引显然会更有条理一些。

### 3. 控制流语句

接下来我们会像大家介绍python的控制流语句，python中的主要语法结构包括if语句、for循环以及while循环，我们首先会介绍这些基础的控制流语句，最后会向大家介绍列表表达式的内容。

#### 3.1 代码块与pass语句

代码块（code block），是python中的一个重要概念。代码块界定了一个源代码，这段代码会被用于一些特定的目的。例如：在python中使用代码块来界定循环体、函数体等重要的语法概念，这些部分在python中通过缩进来体现。python使用四个空格的缩进，这是python有别于其它语言的区别，不像其他的大多数语言使用花括号开表示代码块，其实用有特殊含义的空白来表示代码块。

在python中，代码块的前一行总是以冒号结尾。一旦某一行没有缩进，那么代码块就自动结束了。因此，我们可以使用`pass`语句来创建一个空代码块。

In [23]:
if True:
    pass  # Do nothing 

#### 3.2 if语句与条件表达式

我么可以使用如下cell中所示的方法来定义python中的if结构与条件表达式：

In [24]:
i = 5

if i < 5:
    print('i is smaller than 5')
elif i <= 10:
    print('i is between 5 and 10')
else:
    print('i is bigger than 10')

i is between 5 and 10


Python不允许代码文本与逻辑不在同一缩进级别上，否则python就会产生SyntaxError异常。在pythonic的编程风格中，if语句本身不需要任何的圆括号，而要检查检查一个值是否为True，我们甚至不需要显式的去写这样一个表达式。

In [25]:
ls = []

if ls:
    print('True')
else:
    print('False')

False


条件表达式或者三目运算符可以让我们以一种更紧凑的方式来编写if/else语句。

In [26]:
print('True') if ls else print('False')

False


#### 3.3 for循环与while循环

在python中，我们可以使用循环语句来进行迭代，或者来执行一种反复的操作。

In [27]:
ls = [1, 2, 3, 4]
for i in ls:
    print(i)

1
2
3
4


在python中，如果我们在for循环中需要一个计数器变量，那么，我们可以使用内置的range函数与enumerate函数。 range函数会为我们提供李哥数字序列，我们可以只提供一个stop参数、同时提供stop与start参数、含可以提供一个可选的step参数。与切片类似，range产生的区间包括start但不包含stop，step决定了步长，默认为1；此外，range会延迟求值，即只要我们不明确的要求求值，那么range就不会产生指定的序列，但是我们可以将range转换为一个列表来解决这个问题，不过在大部分的时候我们没有必要把range包装成一个列表。

In [28]:
for i in range(0, 5):
    print(i)

print(list(range(0, 5)))
print(list(range(5)))
print(list(range(0, 5, 2)))

0
1
2
3
4
[0, 1, 2, 3, 4]
[0, 1, 2, 3, 4]
[0, 2, 4]


当我们切实的在迭代序列中需要一个计时器变量，我们可以使用enumerate。enumerate会返回一系列(index, element)元组。在默认情况下，索引从0开始，每循环一次加1。

In [29]:
str_ls = ['a', 'b', 'c', 'd']

for i, s in enumerate(str_ls):
    print(i, s)

0 a
1 b
2 c
3 d


在元组与集合中进行循环与在列表中进行循环类似。在字典中进行循环时，python会按照键进行循环，`items()`方法可以以元组的形式同时获得键与和其相对应的值。

In [30]:
dict_py = {
    'a': 1,
    'b': 2,
    'c': 3,
}

for i in dict_py:
    print(i)

for i, s in dict_py.items():
    print(i, s)

a
b
c
a 1
b 2
c 3


在python中我们可以使用break语句来跳出循环，而可以使用continue来跳过本次循环并继续下次的循环：

In [31]:
for i in range(10):
    if i == 2:
        break
    else:
        print(i)

for i in range(10):
    if i == 2:
        continue
    else:
        print(i)

0
1
0
1
3
4
5
6
7
8
9


除for循环外，我们在python中也可以使用while循环。while循环在达到某种条件后会自动结束循环，其余for循环不同的地方在于，for循环可以一次都不执行而while循环至少会执行一次。

In [32]:
n = 0

while n <= 0:
    print(n)
    n += 2

0


我们在python中可以使用增强赋值的写法，如：n += 1，其与n = n + 1的写法是一致的，其他的所有算数运算符均可采用增强赋值的写法。

#### 3.4 列表、字典与集合推导式

列表、字典、元组推导式在技术上是一种快速创建对应数据结构的方法，不过在实际中也有许多人用他们来代替for循环。推导式是一种更为简洁的创建列表、字典与集合的方式，它让我们为难可以减少在程序中大量的运用for循环，时我们的代码更加简洁。

In [33]:
currency_pairs = ['USDJPY', 'EURUSD', 'JPYEUR', 'CNYUSD', 'USDCNY']

usd_quote = []
for p in currency_pairs:
    if p[3:] == 'USD':
        usd_quote.append(p[:3])
print(usd_quote)

['EUR', 'CNY']


In [34]:
[p[:3] for p in currency_pairs if p[3:] == 'USD']

['EUR', 'CNY']

In [35]:
[p[3:] + p[:3] for p in currency_pairs]

['JPYUSD', 'USDEUR', 'EURJPY', 'USDCNY', 'CNYUSD']

In [36]:
dict_num = {
    1: 0.23,
    2: 0.45,
    3: 0.78,
}
{k: v * 100 for (k, v) in dict_num.items()}

{1: 23.0, 2: 45.0, 3: 78.0}

In [37]:
{s + 'USD' for s in ['EUR', 'CNY', 'JPY']}

{'CNYUSD', 'EURUSD', 'JPYUSD'}

### 4. 组织代码

在python中当脚本越来越复杂时，我们应该组织代码以保持其代码的可维护性。我们在本节首先介绍如何让代码形成可维护的结构，首先介绍函数的基本知识，然后如何将代码拆分成不同的模块。

#### 4.1 函数

函数pyhton中最重要的结构，它可以使我们在程序的任何地方重用同样的代码。首先我们为您先了解一下如何定义一个函数。

在python中我们使用def关键字来定义一个函数，def代表函数定义。在python中并不区分单纯的函数与子程序，在python中合作子程序对应的就是一段没有返回值的函数。python中的函数遵循和代码块同样的语法，即函数的定义的第一行以冒号结束，函数的主题需要缩进。
```python
def function_name(required_argument, optional_argument=default_value, ....):
    return value1, value2, ...
```
在python的函数定义中：
**必须参数**没有默认值，参数之间以逗号隔开。为参数提供默认值之后它就变成了**可选参数**，如果没有有意义的默认值，我们通常用None作为可选参数的默认值。return语句定义了函数的**返回值**，如果省略了返回值，那么函数自动返回None，同时python允许我们使用逗号隔开的多个返回值。

In [38]:
def convert_str(str_name, c_arg):
    if c_arg == 'lower':
        return str_name.lower()
    elif c_arg == 'upper':
        return str_name.upper()
    else:
        print('Error')

在定义一个函数后，我们来看一下如何调用我们已经定义好的函数。我们可以通过如下的方式调用函数：
```python
value_1, value_2, ...,value_n = function_name(positional_arg, arg_name=value, ...)
```
在调用函数的过程中，如果将一个值作为位置参数进行传递，那么该值将会被传递给对应位置上的参数，如果以`arg_name=value`的这种方式传递参数，那么就是关键字参数，使用关键字参数方法传递参数最大的好处就是可以以任意顺序传递参数。

In [39]:
convert_str('hello', c_arg='upper')

'HELLO'

#### 4.2 模块与import语句

当我们在为大型项目编写文件的时候，在一定的时候会需要将代码分成不同的文件，从而保持一种可维护的结构。Python的拓展名为.py，通常我们会把主要的文件称为脚本，当我们想在主脚本中获取来自其他文件的概念时，就需要先导入包含这一功能的文件。在这种情况下，被导入的python文件被称为模块。在导入模块使，我们需要先确保模块与我们的脚本位于同一目录下，然后我们可以使用import语句来导入相应的模块，之后便可以是同点号来访问模块中的相应的功能。

在python中，我们需要理解的一种行为是，模块只会被导入一次。如果我们导入的模块发生了更改，那么我们就需要重启python解释器才能让更改体现出来。在编写模块的时候，我们通常把类与函数放在模块中，同时在一般墙宽下，我们不会在模块中输出任何东西。此外再导入模块的时候，未了未来引用方便，我们通常会给所引用的模块起一个别名，这样使用起来会更加方便。


In [40]:
import pandas as pd

df = pd.DataFrame([1, 2, 3])
print(df)

   0
0  1
1  2
2  3


在有些时候，我们只希望使用模块中的某一个方法或功能，此时我们可以使用import x from y这样的语法，我们只导入了指定的对象。这些对象被直接导入主脚本的命名空间（namespace）中，也就是说，如果看不见这些import语句，那么我们就说不清这些导入的对象是在我们的脚本中定义的还是在另一个模块中定义的，这就可能会造成冲突。此外，我们在编写脚本的时候，也要注意不要让我们的脚本和已经存在的包重名。

In [41]:
from pandas import DataFrame

df = DataFrame([1, 2, 3])
print(df)

   0
0  1
1  2
2  3


### 5. 高级Python概念

接下来我们会介绍一些更为高级的python概念，本节将会主要介绍三个主题：类和对象以及可变与不可变对象。

#### 5.1 类和对象

本节介绍有关雷雨对象的概念。类定义了一类新的对象，类类似于一个模板，它反映了这一类对象的属性与方法。举一个现实中的例子：赛车可以看作是一个类，赛车有颜色这个属性，那么红色的赛车就是赛车这个类的一个具体的实例即对象。类（class）可以让我们定义自己的数据结构，这些数据类型将数据（属性）与函数（方法）放在了一起，因而可以帮助我们万宁快速的架构与组织代码。首先，我们来看一下如何在python中定义一个类：

In [42]:
class Car:
    def __init__(self, color, speed=0):
        self.color = color
        self.speed = speed
        
    def accelerate(self,mph):
        self.speed += mph

这是一个简单的汽车类，类中包含一个特殊的初始化方法——`__init__()`，类似于C++中构造函数的概念，每当我们实例化一个对象时，该方法都被首先调用来创建一个类，该方法的第一个参数是被命名为self的类实例。每调用一次类，实际上就是调用的__init__方法。

In [43]:
car1 = Car('red')
car2 = Car('blue', 1)

In [44]:
print(car1)
print(car2)

<__main__.Car object at 0x0000028A25A5C490>
<__main__.Car object at 0x0000028A25ABFFA0>


在默认情况下，我们直接打印对象，python输出的是对象的内存位置，我们可以看到——这两个对象是相互独立的。python也允许我们直接修改对象而无需调用对象。

In [45]:
print(car1.color)
print(car2.speed)
car1.accelerate(12)
print(car1.speed)
car1.color = 'green'
print(car1.color)
print(car2.color)

red
1
12
green
blue


类定义了对象的属性与方法，将数据与函数组合到一起，从而是我们五年可以方便的通过点号语法访问。`myobject.attribute`，`myobject.method()`。

#### 5.2 可变与不可变的Python对象

在python中，可以修改值的对象是可变的（mutable），而不能修改的就称为不可变的（immutable）。可变的数据类型包括——列表、字典、集合；不可变的数据类型包括——整数、浮点数、布尔值、字符串、日期时间、元组。

In [46]:
a = [1, 2, 3]
b = a
a[1] = 5
print(a)
print(b)

[1, 5, 3]
[1, 5, 3]


在python中，变量是我们赋予给对象的名称，在上面的代码中，我们让两个变量都指向了同一个对象`list[1, 2, 2]`，因此直线该列表的两个变量都会体现出变化。如果我们将对象替换为不可变对象，那么修改两个变量将不会对其彼此产生影响。如果想让可变对象互相之间不产生影响，我们就必须显式的复制可变对象。

In [47]:
a = [1, 2, 3]
b = a.copy()

a[1] = 5
print(a)
print(b)

[1, 5, 3]
[1, 2, 3]


python的`copy()`方法创建的是一份浅拷贝，我们为您确实会得到一份副本，但是如果可变对象中包含有可变元素，那么这些元素仍然是共享的。如果我们我你想要复制所有的可变元素，那么我们为你就需要使用copy标准库中的`deepcopy()`来进行深拷贝。

In [48]:
import copy
b = copy.deepcopy(a)

#### 5.3 可变对象作为参数

在python中，当我们把变量到处传递时，我们实际上传递的是指向对象的一个名称。也就是说具体行为是取决于对象是可变的还是不可变的。如果对象是可变的，为了保持元对象不变，那么我们就需要传递对象的副本。
还有一种情况就是我们在定义函数时默认参数对可变对象的使用。在编写函数时，一般来说我们不应该使用可变对象来作为默认参数，这是因为默认参数的值是函数定义的一部分，他只会被求值一次，而不应在每次调用函数时都被求值，因此对可变参数的默认参数使用通常会导致出人意料的结果。

### 6. Python编程风格指南——PEP8

在大型项目中，通常是由很多不同的人开发同一个项目，此时遵守一致的代码风格就显得尤为重要。如果使用相同的代码风格，那么我们写出的代码可读性就会更高，团队之间协作的效率也会大大提高。在这一部分我们将为大家介绍python官方给出的一些规范的编程风格惯例。

#### 6.1 PEP8

在这里我们将学习python官方的代码风格指南。Python使用通常的Python改进提案（Python Enhancement Proposals, PEP）来讨论语言新特性的引入，而我们再次讨论的python语言风格指南就是其中之一，代码风格指南的代码为8，因此我们一般也将此提案称之为PEP8。PEP8为我们提供了一个可供参考的风格手册，一些重要的风格指南如下：

1. 在文件顶部使用文档字符串（docstring）来解释这个脚本（script）或者模块（module）做了什么。文档字符串是一种特殊的字符串，我们也称之为“文档注释”，它用三个引号“""" """”来表示引用。除了作为代码的文档，它还可以用来编写跨越多行的字符串，如果字符串中有很多双引号或者单引号，我们也可以使用文档字符串来避免转义。

2. 所有的导入语句都应该在文件顶部，一行一个的导入。从标准库导入的内容放在最前，然后是第三方包，最后才应该是我们自己编写的模块。

3. 用大写字母与下划线表示常量。

4. 每行代码的长度不应该超过79个字符，并且应尽可能的利用圆括号、方括号或花括号进行隐式跨行。

5. 自己编写的类应该使用首字母大写（CapitalizedWords）的名称。

6. 行内注释应该和代码至少相隔两个空格。代码块应该用4个空格进行缩进。

7. 在能够提高可读性的情况下，函数和参数应该使用小写字母和下划线命名。不要在参数名和默认值之间使用空格。

8. 函数的文档字符串应当列出函数参数并解释其意义。

9. 冒号前后不要使用空格。

10. 可以在算术运算符前后使用空格。如果同时使用了优先级不同的运算符，则应当考虑在优先级最低的运算符前后添加空格。

11. 变量名称使用小写字母。在可以提升可读性的前提下使用下划线。为变量赋值时，在等号前后添加空格。不过在调用函数时，不要在关键字参数前后使用空格。

12. 在进行索引与切片时，不要在方括号前后使用空格。

以上是对PEP8的一个简要介绍，推荐大家在使用python之后去看一下PEP8的[原文](https://peps.python.org/pep-0008/)。PEP8明确指出，该指南只是建议，我们应当首先考虑自己的编程风格，毕竟统一性的编程风格才是重要的。这里我们推荐大家去学习阅读一下[Google开源项目风格指南](https://zh-google-styleguide.readthedocs.io/en/latest/google-python-styleguide/python_language_rules.html)。该指南和PEP8比较接近。

#### 6.2 类型提示

Python在3.5版本之后引入了类型提示（type hint），以进一步增强语言的静态分析的能力。类型提示也称为类型标注，该特性允许我们像C++一样声明变量的数据类型。在python中类型提示不是强制性的，他也不会影响python解释器执行代码（不过会有类似pydantic这种在运行时强制使用类型标注的第三方包），类型标注的主要目的是让编辑器在代码执行前可以捕获更多的错误，该特性也可以增强编辑器的自动补全功能。一般来说，类型提示在较大型的项目中才更加有用。

一下是一段没有使用类型提示的代码：

In [49]:
def hello_name(name):
    return f'hello {name}!'


x = 1
print(hello_name(x))

hello 1!


现在我们为其添加上类型标注：

In [50]:
x: int = 1
s: str = 'John'


def hello_name(name: str) -> str:
    return f'hello {name}!'


print(hello_name(s))

print(hello_name(x))

hello John!
hello 1!


可以看到，在添加类型标注之后，编辑器在运行代码之前为我们捕捉到了更多的异常。

### 7. 总结

本章我们带大家快速回顾了python的基础知识，主要介绍了一些基础的数值类型，常见的基础数据结构。然后介绍了一些简单的控制流语句，最后介绍了在python中如何组织代码的一些方法，简要的介绍了类与对象等高级python概念，最后为大家介绍了python的编码规范。在掌握了这些基础概念的前提下，我们已经可以完成一些较为简易的工作。希望在快速浏览本章内容后，我们可以掌握Python中最常用的基础语法概念并使用这门语言。