# Python基础第三课：基础结构

前面已经讲了notebook的基础使用，python的基础语法及常用的数据结构及其运算，包括:

- 整型: int
- 浮点型: float
- 布尔型: bool
- 字符串: str
- 元组: tuple
- 列表: list
- 集合: set
- 字典: dict

其中，前五种类型是不可变类型，后三种是可变类型，而不可变类型才能作为集合的元素或者字典的键。

python的语法除了赋值语句，还有一些基础的结构，这是这次课的主体内容，包括：

- 打印语句的高级用法
- 条件语句
- 循环语句
- 函数
- 类
- 包

在学习python的基础结构时，可以多多使用 http://pythontutor.com/visualize.html 这个工具去理解python时怎么进行的。

## 1. 打印语句

前面已经讲了print的基础用法，这里再讲一下怎么使用print语句来进行格式化输出。

In [None]:
# 定义变量
name = "张三"
age = 18
is_boy = True

print('一个叫%s的人，今年%d岁，TA是一个男孩吗？%s' % (name, age, is_boy))

格式化有几种常用的形式：

- %d: 格式化成整数
- %f：格式化成浮点数
- %s: 格式化成字符串

对于浮点数，可能还有一个是大家比较常用的，就是控制小数点后的位数。

In [None]:
pi = 3.1415926
print('PI的近似值是：%.2f' % pi)

当然，格式化还有很多很复杂的写法，需要用到的时候，大家可以再去深入学习。

这个格式化字符串，其实也可以用于定义字符串：

In [None]:
pi = 3.1415926
s = 'PI的近似值是：%.2f' % pi
print(s)

## 2. 条件语句

条件语句（也称为分支语句，都是一样的意思）通常是这样模式：

- 如果什么（条件） ，就做什么
- 如果什么（条件），就做什么；否则做什么

这是我们组织语言的常用结构，对于的python中：

```python
# 第一种：
if 条件:
    do some things ...
    
# 第二种：
if 条件:
    do some things ...
else:
    do other things ...
```

上面的只是伪代码，并不能实际运行。

- 条件：就是布尔值，或者是一个能得到布尔值的运算。条件的后面需要由一个冒号
- 动作（do some things）：这是if语句的嵌套子语句，必须通过缩进，通常缩进是4个空格

条件语句的图示，如下图:

![image.png](attachment:image.png)

### 2.1 if结构

In [None]:
# 一个叫张三的人，考试成绩82分，是班干部，父母是医生
name = '张三'
score = 82
parent = 'doctor'
is_cadre = True      # 是否是班干部
print('加分之后，%s的分数是：%d' % (name, score))

# 定义可以加分的类型
# 这里使用集合，其实还可以使用元组，列表等。
point_types = {'doctor'}

# 判断是否可以加分
# parent in point_types 这个就是判断条件
if parent in point_types:
    score += 10
    
print('加分之后，%s的分数是：%d' % (name, score))

### 2.2 if...else结构

如果我们把上面if的地方改成如下:

In [None]:
# 判断是否可以加分
# 如果满足我们的加分条件，则加10分，否则加5分
if parent in point_types:
    score += 10
else:
    score += 5

### 2.3 if...elif...else结构

我们的加分条件进一步复杂，如果父母满足条件，且是班干部，则加10分；如果只满足其中一个条件，则加5分；如果都不满足，则加2分。实现如下:

In [None]:
if parent in point_types and is_cadre:
    score += 10
elif parent in point_types or is_cadre:
    score += 5
else:
    score += 2

当然elif之后不一定需要else的。

## 3. 循环语句

例如，如果我们需要将1到10的数字逐一打印出来，当然我们可以写10个print，那就有10行代码，非常啰嗦。这时，我们就有必要引入循环语句了。

说明：python的循环除了有for循环，其实也有while循环，但是实际上基本能用while实现的，都可以使用for进行实现，自己在使用python的过程中，几乎很少用到while，所以并不准备讲while，感兴趣的可以自己去学习。

For循环：

```python
for 循环变量 in 可循环变量:
    循环体
```

- 循环体需要进行缩进，通常时4个空格
- 在循环体中可以使用循环变量
- 可循环变量，例如元组，列表等

### 3.1 对值进行循环

把1到10打印出来：

In [None]:
a = (1,2,3,4,5,6,7,8,9,10)
# 依次从元组a中取出一个值，赋值给val
for val in a:     # val是循环变量
    print(val)     # 循环体
    
print("The last value: ", val)    # 注意：这个变量在循环体的外部是可以使用的

不过就这个问题而言，最简单的还不是这样，后面会讲到另一个函数。

对值进行循环适用于字符串，元组，列表，集合等。现在我们一步一步来看其执行过程：

第一次执行到for循环时，取出元组的第一个值：

![image.png](attachment:image.png)

执行完循环体之后，因为元组还有元素，继续取出一个元素：

![image.png](attachment:image.png)

以此类推，直到遍历完元组所有的元素。

### 3.2 对键进行循环

如果需要对键进行循环，则需要使用一个range的函数，该函数会生成一个类似元组的结构，可以进行循环。

range(n)生成的是从0到n-1的整数的元组（暂时可以理解为元组，但是并不是元组）。

In [None]:
for k in range(len(a)):
    print(a[k])

对键进行循环适合于字符串，元组和列表等，但不能用于集合（因为集合是无序的）。

为了能看清楚range的作用，我们把range的结果赋值给data变量：

![image.png](attachment:image.png)

range(n)可以暂时简单理解为返回一个0到n-1的整数元组。

### 3.3 对字典进行循环

字典本身是无序的，好像并不应该进行循环，不过事实上，字典是可以循环的。在python中，字典三个函数是可以用来循环的：

- d.keys(): 这样可以得到字典d的键的列表
- d.values(): 这样可以得到字典d的值的列表
- d.items(): 这样可以得到字典d的键值对的列表

我们看一下这三个内置函数的作用：

![image.png](attachment:image.png)

可见，这三个函数返回的都是元组或者列表一样的结构。

In [None]:
# 定义一个字典
d = {
    'a': 1,
    'b': 2,
    'c': 3,
}

for k in d.keys():
    print(k)

for v in d.values():
    print(v)

for k, v in d.items():
    print("键: %s, 值: %d" % (k, v))

### 3.4 打印九九乘法表

九九乘法表大家都见过，我们尝试将它用python打印出来：

In [None]:
for i in range(1, 10):
    # 子循环
    for j in range(1, i+1):
        print("%d * %d = %d" % (i, j, i*j))

range函数只有一个参数的时候，前面已经介绍过了，如果有两个参数：

range(start, end): 会生成一个从start到end-1的整数元组（同样，这里说元组只是方便理解）。

### 3.5 循环中的几个常用的函数

#### 3.5.1 zip函数

如果我们有一个姓名的列表，也有一个对应的成绩的列表，如果现在要将姓名和成绩对应起来，这时使用zip函数就很方便：

In [None]:
names = ['张三', '李四', '王五']
scores = [66, 89, 59]

# 循环打印出来
# name对应names
# score对应scores
for name, score in zip(names, scores):
    print('%s的成绩是：%d' % (name, score))
    
# 我们也可以使用一个字典来保持姓名和成绩的对应起来
name_scores = {}    # 先定义一个字典
for name, score in zip(names, scores):
    name_scores[name] = score

print(name_scores)

#### 3.5.2 enumerate函数

上面我们已经有了对键的循环，也有对值的循环，那么能不能同时对键值进行循环呢？例如：如果我们需要打印列表的偶数下标对应的值：

In [None]:
a = [1,2,3,4,5,6,7,8,9,10]

# 按照前面，我们可以使用对键的循环来实现
for i in range(len(a)):
    if i % 2 == 0:     # 取余运算
        print(a[i])
        
# 但是如果使用enumerate函数，则会简单很多
for k, v in enumerate(a):
    if k % 2 == 0:
        print(v)

显然，enumerate函数返回一个键值对，类似字典的items函数。这个对于元组也是一样的。

## 4. 函数

函数的调用方式：`value = function_name(param)`，通过函数名去调用，前面我们已经用过不少了，如print, len等，都是函数。

### 4.1 内置函数

前面已经讲到的内置函数：

- print
- int
- rount
- abs
- len
- min
- max
- range
- zip
- enumerate

还有几个可以用于类型转换的函数：

- float
- bool
- tuple
- list
- set

这几个暂时没涉及到，后面可能需要用到的。

像for, in, and, or, not等，这些并不是函数。

python的常用的内置函数基本就在这里的，我们需要大概掌握它们的用法。如果一时不记得这些函数有哪些参数，我们也需要知道怎么找到说明，一种方式是直接通过搜索引擎查找，第二种当然是找人问，而在notebook中，还有一种常用的方式，如下：

In [2]:
# 函数名的后面，加一个问号，然后运行单元格
# 以range函数为例：
range?

其输出结果：

```
Init signature: range(self, /, *args, **kwargs)
Docstring:     
range(stop) -> range object
range(start, stop[, step]) -> range object

Return an object that produces a sequence of integers from start (inclusive)
to stop (exclusive) by step.  range(i, j) produces i, i+1, i+2, ..., j-1.
start defaults to 0, and stop is omitted!  range(4) produces 0, 1, 2, 3.
These are exactly the valid indices for a list of 4 elements.
When step is given, it specifies the increment (or decrement).
Type:           type
Subclasses:     
```

我们需要学会看这样的帮助文档。关于该函数的调用，关键的说明信息是：

```
range(stop) -> range object
range(start, stop[, step]) -> range object
```

该函数可以接受的参数个数是3个：

- 如果只是传一个参数：range(stop)
- 如果传入两个参数：range(start, stop)
- 如果传入三个参数：range(start, stop, step)

前面两种调用形式前面已经涉及过，我们分别来看看：

In [None]:
data1 = range(10)
data2 = range(5, 10)
data3 = range(5, 10, 2)

# 我们将这3个结果转成列表来观察结果
print(list(data1))
print(list(data2))
print(list(data3))

显然，step这个参数的作用是步长的意思。

### 4.2 数据变量的常用函数

对于字符串，元组，列表，集合和字典等，python都提供了很多内置的函数，而每个函数又有不同的参数，我们很难去记住它们。最重要的是，我们需要大概知道每种类型大概能实现什么功能，然后去哪里可以查到这些方法，及其使用的方式。这是我们学习编程最重要的技能之一。

例如，如果我们需要知道字符串有哪些内置函数则可以在cell中输入：`str.`之后，然后按Tab键，就会出来该类型所有的方法列表：

![image.png](attachment:image.png)

包含的函数很多很丰富，我们往下拉滚动条，就能看到我们之前用过的replace，接着我们可以继续查看该函数的用法：

输入：`str.replace?`，然后运行单元格，结果如下：

```
Signature: str.replace(self, old, new, count=-1, /)
Docstring:
Return a copy with all occurrences of substring old replaced by new.

  count
    Maximum number of occurrences to replace.
    -1 (the default value) means replace all occurrences.

If the optional argument count is given, only the first count occurrences are
replaced.
Type:      method_descriptor
```

该函数的使用方式是`str.replace(self, old, new, count=-1, /)`，作用是讲字符串中的old字符串替换成new字符串，说明中还有特别说明count参数的作用，还有返回值的说明。这里的self是类本身，这里暂时不用管，在类的部分会讲到。

在前面我们使用如下：

In [None]:
s = 'This is a string.'
new_s = s.replace('string', '字符串')
print(new_w)

In [3]:
str.replace?

对于list, set, dict都是类似的。

### 4.3  自定义函数

### 4. 

### 查看函数帮助

## 5. 类：class

对于做数据分析来说，类并不是那么重要，不过我们得掌握其基础的用法，因为很多场景下，我们会接触到类的对象。

## 6. 包：package

## 7. 斐波那契数列

## 8. 杨辉三角