# Python Basic

JCBioinformatics - 2019 - HZAU


## 组合与抽象

<img src="./img/sicp_0.png" alt="Drawing" style="width: 800px;"/>

## Contents

1. 如何组合
    + 内置数据结构
        - list / tuple / set / dict
    + 控制流
        - 循环 for / while
        - 分支
2. 如何抽象
    + 函数
    + 类与对象
    + 选择一种编程范式


## 如何组合

<img src="https://upload.wikimedia.org/wikipedia/commons/0/0f/2_duplo_lego_bricks.jpg" alt="Drawing" style="width: 200px;"/>


#### 1. 数据结构（对数据的组合）

+ list
+ tuple
+ dict
+ set
+ 其他常用数据结构，collections

#### 2. 控制流（对程序行为的组合）

+ 循环：for、while
+ 分支： if else
+ 异常处理：try except、raise

## 列表

列表应该是一种 Python 中十分常用的数据结构，用来表示具有**顺序**的一系列元素(item)。

In [1]:
l1 = [1,2,3,4,5]
type(l1)

list

还记得字符串吗？list 在某种程度上与字符串很相似，比如说，你可以用下标语法从列表中取元素出来：

In [2]:
l1[0]

1

In [3]:
l1[-1]

5

也可以向字符串切片那样从一个列表中取出一个子列表：

In [4]:
l1[1:4]

[2, 3, 4]

In [5]:
l1[::-1] # 步长为 -1 ，对列表进行反转

[5, 4, 3, 2, 1]

也可以用 `+` 连接两个 list：

In [21]:
l1 = [1,2,3]
l2 = [3,2,1]
l1 + l2

[1, 2, 3, 3, 2, 1]

虽然和字符串有些相似，但与字符串不同，首先，列表元素可以是任意类型的：

In [6]:
l1 = [1, "this is a str", 1.114, True]

列表还可以嵌套，也就是说列表的元素也可以是一个列表：

In [7]:
animals = [["dog", "cat"], ["fish", "tutle"], ["bird"]]

并且，字符串是一种不可变(immutable)的数据类型，而列表是可变的，也就是说我们可以对一个列表中增添、删除、修改元素：

In [8]:
names = ["JoJo", "Dio", "Caesar"]
names.append("Zeppeli")  # 向列表末尾增加元素
names

['JoJo', 'Dio', 'Caesar', 'Zeppeli']

In [9]:
names.insert(0, "Wamuu")  # 在列表开头（0号位置）插入元素
print(names)
names.insert(1, "Kars") # 在索引值为 1 的位置 插入元素
print(names)

['Wamuu', 'JoJo', 'Dio', 'Caesar', 'Zeppeli']
['Wamuu', 'Kars', 'JoJo', 'Dio', 'Caesar', 'Zeppeli']


In [10]:
names.pop() # append 的逆向操作，从末尾移出一个值

'Zeppeli'

In [11]:
names

['Wamuu', 'Kars', 'JoJo', 'Dio', 'Caesar']

In [12]:
# 也可以从 列表 中间 pop
names.pop(2)

'JoJo'

In [13]:
names

['Wamuu', 'Kars', 'Dio', 'Caesar']

要对列表特定位置的元素进行修改时，只需要联合使用下标语法和赋值语句即可：

In [14]:
names[-1] = 'Caesar!!!!!'  # 修改最后一个元素

In [15]:
names

['Wamuu', 'Kars', 'Dio', 'Caesar!!!!!']

#### in 语句

`in` 是一个用来判断一个元素是否存在于一个数据结构之中的谓词，我们可以用它来判断一个元素是否位于 list 之中：

In [16]:
print(names)
"JoJo" in names

['Wamuu', 'Kars', 'Dio', 'Caesar!!!!!']


False

In [17]:
"Zeppeli" in names

False

其实之前讲字符串时没有提到，`in` 也可以用来判断一个字符串是否是另一个字符串的子字符串。

In [18]:
"foo" in "foobar"

True

## for 循环

学习完一个常用的数据结构，接着再来学习一种常用的基本控制流：for 循环。

In [19]:
for i in names:
    print(i)

Wamuu
Kars
Dio
Caesar!!!!!


上面的代码运行了一个 for 循环，展示了它的语法。它表示的意思是 对 names 这个列表进行迭代，
每轮迭代中将 其中的一个元素赋值给 i ，然后执行下方的 "缩进块" 中的代码。

众所周知，Python 是一种考虑缩进(indentation)的语言，Python中使用缩进来组织代码，位于同一缩进层级的代码可以看作成一个整体。
一般而言，我们使用4个空格进行缩进，虽然你也可以用一个`tab`键表示缩进但不建议这样做，4个空格的缩进是 Python 程序员之间的一个共识。 

循环可以嵌套，让我们来打印一个乘法表：

In [25]:
for i in range(1, 10):
    for j in range(1, 10):
        print(i*j, end="\t")
    print("")

1	2	3	4	5	6	7	8	9	
2	4	6	8	10	12	14	16	18	
3	6	9	12	15	18	21	24	27	
4	8	12	16	20	24	28	32	36	
5	10	15	20	25	30	35	40	45	
6	12	18	24	30	36	42	48	54	
7	14	21	28	35	42	49	56	63	
8	16	24	32	40	48	56	64	72	
9	18	27	36	45	54	63	72	81	


#### range
这里使用了`range`函数，它用来创建表示一个内范围数字的可迭代(iterable)对象。可迭代意味着这个对象是可以被 for 循环访问的，我们上面学的 list 也是一个可迭代的对象，但需要注意的是这里`range`创建的并不是一个 `list`：

In [26]:
type(range(1, 10))

range

但我们可以用 `list` 函数将它转换为 列表：

In [27]:
list(range(1, 10))

[1, 2, 3, 4, 5, 6, 7, 8, 9]

像 range 这样的迭代器在处理很大的范围的时候，比直接使用一个列表要更有优势，因为一个很大的 list 会占用掉很多内存，而 `range` 只有在
迭代到某一位的时候这一位的数字才会产生。

In [28]:
for i in range(10):  # 对 0 - 9 进行迭代
    print(i, end=" ")

0 1 2 3 4 5 6 7 8 9 

In [29]:
for i in range(5, 11):  # 对 5 - 10 进行迭代
    print(i, end=" ")

5 6 7 8 9 10 

In [30]:
for i in range(0, 20, 2):  # 可以设置步长，步长为 2
    print(i, end=" ")

0 2 4 6 8 10 12 14 16 18 

## 条件分支

![](https://upload.wikimedia.org/wikipedia/commons/thumb/c/c5/If-Then-Else-diagram.svg/330px-If-Then-Else-diagram.svg.png)

条件分支使得程序具有根据某一条件是否满足来确定一段代码是否执行的能力，这对于编写程序来说是非常重要的。我们之前学过的谓词能够在此发挥作用，
我们可以根据谓词产生的结果来决定走代码分支中的那一条路径，或者是否执行一段代码，比如说：

我们根据变量 a 是否能够整除 2 来判断它是否是一个偶数，然后使程序产生不同的打印结果

In [34]:
a = 5

if a % 2 == 0:
    print("a 是一个偶数")
else:
    print("a 是一个奇数")


a 是一个奇数


if 语句，后方也可以不跟随 else，这样使用将不再表示分支，而是确定一段代码是否执行。比如:

In [37]:
a = 101

if a > 0:
    print("a 是一个正数")

if a > 100:
    print("a 比100要大")
    
if a > 1000:
    print("a 大于1000")

a 是一个正数
a 比100要大


还有一种情况，程序分支的个数有可能大于两个，这时候该怎么办呢？一种方案是使用嵌套的 if ... else ...

比如，
我们根据一个人的身高与体重，计算BMI，然后让程序根据BMI给他一些评价：

In [42]:
weight = 70
height = 1.70

bmi = weight / (height)**2

if bmi < 18.5:
    print("你实在是太瘦了，多吃点好的。")
else:
    if bmi < 24:
        print("不错，挺好。")
    else:
        if bmi < 28:
            print("稍微有点重了，要注意啊。")
        else:
            print("你太重了，需要减肥。")

稍微有点重了，要注意啊。


但使用嵌套的 if else 使得代码嵌套层次过多，影响了可读性，显然违背了 The Zen of Python 中的 "Flat is better than nested."。
好在你不必这样，因为有 elif 语句可以让我们创建更多的条件分支：

In [44]:
weight = 70
height = 1.70

bmi = weight / (height)**2

if bmi < 18.5:
    print("你实在是太瘦了，多吃点好的。")
elif bmi < 24:
    print("不错，挺好。")
elif bmi < 28:
    print("稍微有点重了，要注意啊。")
else:
    print("你太重了，需要减肥。")

稍微有点重了，要注意啊。


#### break

有了 if 语句，我们可以在合适的时候打断一个 循环，如果需要这么做，我们要用到 `break` 语句，比如：

In [47]:
# 寻找第一个 同时被 3， 5 整除的数字
for i in range(1, 100):
    if i % 3 == 0 and i % 5 == 0:
        print(i)
        break

15


目前为止，我们已经有了一个基本的数据结构 list，已经两个让我们能够组合程序行为的控制流 for-loop 与 if-else。
实际上我们已经掌握了很强大的组合能力，可以做很多在这之前根本无法做到的事情。

比如，我们可以看看 1000 以内有多少个素数：

In [51]:
primes = []
for possiblePrime in range(2, 1000):
    
    isPrime = True
    for num in range(2, possiblePrime):
        if possiblePrime % num == 0:
            isPrime = False
            break
      
    if isPrime:
        primes.append(possiblePrime)

print(f"1000 以内找到了 {len(primes)} 个素数")

1000 以内找到了 168 个素数


再比如说，我们可以将一段 DNA 序列进行反向互补(reverse complement)：

In [58]:
seq = "AGTCCGAAACCCTTA"
seq_ = []

for base in seq[::-1]:
    if base == 'A':
        seq_.append('T')
    elif base == 'T':
        seq_.append('A')
    elif base == 'C':
        seq_.append('G')
    else:
        seq_.append('C')

seq_rc = "".join(seq_)  # 将字符连接成一个字符串

print("original sequence:\t", seq)
print("reverse complement:\t", seq_rc)

original sequence:	 AGTCCGAAACCCTTA
reverse complement:	 TAAGGGTTTCGGACT


至此为止，我们总算是能写一点像程序的东西了。