# Python 入门

## 数值类型和计算

Python是一门非常简单易懂的语言，绝大多数Python程序都非常符合人类语言的直觉。比如，如果需要计算两个数字相加，可以直接输入：

In [1]:
3+4

7

或者乘除法：

In [2]:
30/4

7.5

In [3]:
3*4

12

如果需要整除运算，可以使用两个斜杠：

In [4]:
30//4

7

以及取余运算：

In [5]:
30%4

2

与其他编程语言稍微有点区别的是幂运算，在Python中需要使用两个\*号代表幂运算，比如如果需要计算$2^{10}$，可以：

In [6]:
2**10

1024

以上我们计算了很多整数的加减乘除，这种不带有小数点的整数，在Python中一般使用**int**整型表示，可以使用**type\()**函数查看其类型：

In [7]:
type(10)

int

而带有小数点的称为浮点型**float**，其用法与int类似

In [8]:
type(3.5)

float

浮点型也有以上所有的运算：

In [9]:
3.5+2

5.5

In [10]:
3.5-1.0

2.5

In [11]:
3.5**2

12.25

In [12]:
3.5**0.5

1.8708286933869707

## 逻辑运算与比较

同理，我们可以使用大于号、小于号、大于等于、小于等于等符号判断大小：

In [13]:
1>2

False

In [14]:
2>=2

True

In [15]:
3<5

True

注意以上程序的结果返回的是**True**和**False**，这两个值在Python中分别代表逻辑真、逻辑假。逻辑真、假之间可以有与、或、非的运算：

In [16]:
True and True

True

In [17]:
True and False

False

In [18]:
False and False

False

In [19]:
True or True

True

In [20]:
True or False

True

In [21]:
False or False

False

In [22]:
not True

False

In [23]:
not False

True

In [24]:
1>2 and 3>2

False

此外，判断是否相等需要用两个连在一起的等号“==”，判断不相等可以使用“!=”，否则会报错：

In [25]:
3==3

True

In [26]:
4!=3

True

In [27]:
3!=3

False

## 运算优先级

以上我们介绍了几种常见的运算，包括：

* 算数运算
    - +
    - -
    - \*
    - /
    - //
    - %
    - \*\*
* 比较运算
    - ==
    - !=
    - \<
    - \<=
    - \>
    - \>=
* 逻辑运算
    - and
    - or
    - not

等等。这些运算符号并不是从左到右依次执行的，而是具有优先级顺序，比如：

```python
3+5*7-2
```

计算的结果应该是先将5\*7计算出来得到35，再加3、减2，得到36，而不是3+5得到8,8\*7=56，再减2得到54：

In [28]:
3+5*7-2

36

在Python中优先级从高到低依次为：

1. \*\*
2. +x、-x：正负号
3. \*、/、%
4. +、-
5. ==、!=、\<、\>、、\<=、\>=
6. not
7. and
8. or

因而，按照以上规则，我们上面的表达式：
```python
1>2 and 3>2
```

应该时先计算1>2的值得到False，再计算3>2的值得到True，最后计算False and True，得到False。

此外，需要注意幂运算的等级比正负号要高，所以如果计算：

In [29]:
-2**2

-4

其计算顺序为先计算$2^2$，再取负，得到了-4。

为了改变运算顺序，我们需要加小括号，比如如果我们想要计算$(-2)^2$，需要使用：

In [30]:
(-2)**2

4

才能得到正确的答案。

当对运算优先级没有信心时，多加括号是非常好的习惯。

## 变量

**变量**（**variable**）是几乎所有编程语言都具有的特性。变量实质上时内存中的一个区域，其中存储着某一些值。在Python中，由于不用像C、Java一样显示地指明变量类型，因而用起来非常简单，直接使用等号“=”赋值即可。比如，我们可以使用以下语句将3这个值保存在变量x中，并在后面引用这个变量：

In [31]:
x=3
print(x)

3


变量命名需要一些规则

* 变量名不能以数字开头
* 变量名不能是python的保留字符，比如is、in等
* 不能含有+、-、\*、空格等特殊字符，但是下划线允许
* 变量名区分大小写

其他字符都可以使用。由于Python3支持Unicode，因而即使中文也可以做变量名：

In [32]:
三=3
print(三)
_a=4
print(_a)
_A=5
print(_a,"-",_A)

3
4
4 - 5


虽然Python的变量名要求相对比较宽松，但是还是有一些良好的习惯需要注意：

* 尽量不要使用中文做变量名
* 变量名要有意义，方便阅读
* 尽量不要使用下划线开头，因为下划线开头的变量在Python中可能有特殊含义
* 命名时，如果变量名包含几个单词，可以使用下划线区分，或者使用驼峰规则，每个单词第一个字母大写，比如：cat_weight，或者CatWeight

除了简单的使用等号赋值之外，Python还有其他几个比较方便的赋值语句，比如：

* +=：a+=b等价于a=a+b
* -=：a-=b等价于a=a-b
* \*=：a\*=b等价于a=a\*b
* /=：a/=b等价于a=a/b
* \*\*=：a\*\*=b等价于a=a\*\*b
* //=：a//=b等价于a=a//b
* %=：a%=b等价于a=a%b

In [33]:
a=2
a+=1
print(a)
a-=1
print(a)
a*=2
print(a)
a/=2
print(a)
a**=2
print(a)

3
2
4
2.0
4.0


## 字符串

以上介绍了Python中的数值类型，而在程序设计中，另外一个基础的数据类型就是字符串。

与其他大多数语言一样，Python中使用单引号“''”和双引号“""”表示字符串，以上两种表示方法是等价的：

In [34]:
a="Hello,"
b='Python!'
print(a,b)


Hello, Python!


为什么有两种表示字符串的方式呢？比如，如果我们需要“Let's go”这样一个字符串，如果使用单引号：
```python
'Let's go'
```

我们会发现Python自动将Let前后的单引号作为一个字符串，而其后面的“s go”含义不明，从而报错。为了解决这个问题，可以使用双引号：
```python
"Let's go"
```
就避免了这个问题。同理，如果字符串中存在双引号，就使用单引号声明字符串：
```python
'"Python" is a programming language.'
```

此外，也有的时候字符串中会同时出现单引号和双引号，此时我们可是使用转义字符解决这个问题，比如：
```python
"\"Python\" is a programming language, let\'s learn it."
```

在上面的代码中，我们使用“\"”代表了“"”，使用“\'”代表“'”，从而解决了单引号、双引号与字符串命名冲突的问题：

In [35]:
a="\"Python\" is a programming language, let\'s learn it."
print(a)

"Python" is a programming language, let's learn it.


除了单引号之外，还有一些其他的字符需要转义，比如，斜杠“\”本身就需要转义，因为如果不对“\”转义，解释器并不知道这个斜杠就是一个斜杠，还是与后面的字符链接起来的转义字符，比如：

In [36]:
a="'\' is a special character in Python"
print(a)

'' is a special character in Python


可以发现，Python将斜杠和后面的单引号视为一体，因而没有将斜杠打印出来，正确的写法应该是：

In [37]:
a="'\\' is a special character in Python"
print(a)

'\' is a special character in Python


除此之外，Python3中还有其他转义字符：

* 每一行结尾处的\\：续行符
* \\\\：反斜杠
* \\'：单引号
* \\"：单引号
* \\b：退格
* \\v：纵向制表符
* \\t：横向制表符
* \\r：回车
* \\n：换行
* \\f：换页
* ......

这里值得注意的是，换行符\\n和回车符号\\r是两个不同的符号，这点我们在介绍文件时会特别强调。

除了使用单引号和双引号表示字符串之外，Python还支持长字符串、原始字符串两种表示方法。

其中，长字符串使用三个单引号或者三个双引号包裹，可以用来表示跨越多行的字符串。比如：

In [38]:
a="""这是一个可以跨行的字符串
使用三个单引号
或者三个双引号包裹
"""
print(a)

这是一个可以跨行的字符串
使用三个单引号
或者三个双引号包裹



而原始字符串即不对反斜杠进行转义，比如一个路径可能为：
```python
a="C:\network"
```

然而注意到，由于“\\n”有转义，所以Python解释器在碰到“\\n”时将其解释为回车：

In [39]:
a="C:\network"
print(a)

C:
etwork


如果需要声明该字符串为原始字符串，可以直接在字符串前面加一个“r”，即：

In [40]:
a=r"C:\network"
print(a)

C:\network


此时，Python解释器就不会将“\\n”进行转义了。

此外，Python3中所有的字符串都是以Unicode进行编码的，因而极大地规避了在Python2以及其他语言中可能碰到的乱码问题，因而使用Python3是非常方便的。也正因为如此，我们可以很方便的使用Unicode字符，并使用“\\N{unicode_name}”来表示Unicode字符，比如：

In [41]:
a="This is a cat: \N{cat}"
print(a)

This is a cat: 🐈


Unicode字符可以从 http://unicode-table.com 中找到。

如果需要拼接两个字符串，可以简单的使用加号：

In [42]:
a="This is a cat: "
b="\N{cat}"
c=a+b
print(c)

This is a cat: 🐈


最后需要额外注意的是，作为字符串的"3"和作为整型数据的3是完全不一样的，因而我们不能使用：
```python
"3"+2
```

这样的表达式，正确的做法应该是先使用int()函数将字符串"3"转化为数值类型，再进行计算：

In [43]:
a=int("3")+2
print(a)

5


同理，如果希望将一个数值型数字处理为字符串，也需要使用str()函数先将数字转化为字符串：

In [44]:
a=3
b="There are "+str(a)+" cats."
print(b)

There are 3 cats.


## 列表和元组

以上我们初步介绍了Python的三种基本数据类型：整型、浮点型以及字符串。接下来我们引入Python中的两种最基本也是最常用的数据结构：**列表**（**list**）和**元组**（**tuple**）。

列表和元组都是序列（sequence）的一种，可以看成是一些元素的集合，每个元素都有其位置编号，编号从0开始。列表使用方括号“\[\]”进行声明，而元组使用小括号“()”进行声明，或者不用括号直接声明。列表和元组所包含的内容可以是任何Python允许的数据类型、对象等等。

### 元组

最简单也是最基本的是元组。元组不可更改，一旦创建，只能读取而不能写入，比如：

In [45]:
name_list = "Messi",10
print(name_list)

('Messi', 10)


以上就创建了一个元组，我们可以读取其某一个分量，但是不能对其进行更改。我们可以使用元组名后面加一个方括号读取相应编号位的元素：

In [46]:
print(name_list[0])
print(name_list[1])
## 以下语句会报错：
# name_list[1]=7

Messi
10


由于编号从0开始，因而name_list\[0\]代表的是元组中的第一个元素，而name_list\[1\]代表第二个元素。方括号中也可以是负数，代表倒数第几个元素：

In [47]:
print(name_list[-1])
print(name_list[-2])

10
Messi


此外，如果需要声明只有一个元素的元组，需要额外加一个逗号，否则解释器无法判断需要声明的是一个值还是一个元组：

In [48]:
name='Messi',
print(name)
name1='Messi'
print(name1)

('Messi',)
Messi


当然，在声明元组时，一个良好的习惯是加上括号，使得程序更具有可读性。

由于元组也是Python中的对象，因而元组的成员也可以是元组，并可以使用两个方括号对作为元组成员的元组中的元素进行读取操作：

In [49]:
name_list=(('Messi',10),
           ('Xavi',6),
           ('Iniesta',8),
           ('Puyol',5)
          )
print(name_list[0][0])
print(name_list[1][0],":",name_list[1][1])

Messi
Xavi : 6


元组虽然不能修改，但是支持**切片**（**slicing**）操作：即从中取出一个子集。切片操作同样使用元组名称后面跟一个方括号，在方括号中使用冒号“:”代表起始位置和终点位置（注意是左闭右开区间）：

In [50]:
print(name_list[0:2])
print(name_list[-3:-1])
print(name_list[-3:])
print(name_list[2:])

(('Messi', 10), ('Xavi', 6))
(('Xavi', 6), ('Iniesta', 8))
(('Xavi', 6), ('Iniesta', 8), ('Puyol', 5))
(('Iniesta', 8), ('Puyol', 5))


### 列表

列表的很多操作跟元组类似，但是列表允许被修改，因而更加灵活，也有更多的操作。

我们可以很方便的使用方括号定义一个列表：

In [51]:
player_list=[('Messi',10),
           ('Xavi',6),
           ('Iniesta',8),
           ('Puyol',5)
          ]
print(player_list)

[('Messi', 10), ('Xavi', 6), ('Iniesta', 8), ('Puyol', 5)]


注意以上声明的过程中，与元组唯一的不同是我们在最外面使用了方括号而非圆括号。

或者，我们可以使用list()将一个**可迭代**（**iterable**）的对象（包括字符串、元组、列表等）转化为一个列表，比如：

In [52]:
print(name_list)
name_list_list=list(name_list)
print(name_list_list)
messi=list('Messi')
print(messi)

(('Messi', 10), ('Xavi', 6), ('Iniesta', 8), ('Puyol', 5))
[('Messi', 10), ('Xavi', 6), ('Iniesta', 8), ('Puyol', 5)]
['M', 'e', 's', 's', 'i']


与列表不同的是，我们可以对列表进行修改操作：

In [53]:
print(player_list)
player_list[3]=('ter Stegen',1)
print(player_list)

[('Messi', 10), ('Xavi', 6), ('Iniesta', 8), ('Puyol', 5)]
[('Messi', 10), ('Xavi', 6), ('Iniesta', 8), ('ter Stegen', 1)]


以及使用del语句进行删除操作：

In [54]:
del player_list[2]
print(player_list)

[('Messi', 10), ('Xavi', 6), ('ter Stegen', 1)]


当然，也可以进行新增，使用列表的append()方法可以在列表最后添加一个元素，比如：

In [55]:
player_list.append(('Busquets',5))
print(player_list)

[('Messi', 10), ('Xavi', 6), ('ter Stegen', 1), ('Busquets', 5)]


如果需要添加的元素比较多，可以使用extend()方法，比如：

In [56]:
player_list_new=[('Pique',3),('Suárez',9)]
player_list.extend(player_list_new)
print(player_list)

[('Messi', 10), ('Xavi', 6), ('ter Stegen', 1), ('Busquets', 5), ('Pique', 3), ('Suárez', 9)]


如果需要在某一个位置插入元素，可以使用insert()方法：

In [57]:
player_list.insert(1,('Alba',18))
print(player_list)

[('Messi', 10), ('Alba', 18), ('Xavi', 6), ('ter Stegen', 1), ('Busquets', 5), ('Pique', 3), ('Suárez', 9)]


还可以使用count()方法计算某个元素出现的次数、使用index()方法找到某个元素第一次出现的位置，比如：

In [58]:
messi=list('Messi')
count_s=messi.count('s')
first_s=messi.index('s')
print(count_s)
print(first_s)

2
2


需要特别注意的是，在Python中，使用等号将一个对象赋值给另一个对象，并不会导致对象的拷贝，而仅仅是给了一个别名，比如：

In [59]:
another_play_list=player_list
print(player_list)
del another_play_list[1]
print(player_list)

[('Messi', 10), ('Alba', 18), ('Xavi', 6), ('ter Stegen', 1), ('Busquets', 5), ('Pique', 3), ('Suárez', 9)]
[('Messi', 10), ('Xavi', 6), ('ter Stegen', 1), ('Busquets', 5), ('Pique', 3), ('Suárez', 9)]


在以上程序中，我们会发现，虽然我们删除的是another_play_list的第2个元素，但是实际上，another_player_list和play_list只是同一个变量的不同别名而已，并没有重新复制一个新的list。

如果我们需要的是list的一个新的拷贝，需要使用list的copy()方法：

In [60]:
another_play_list=player_list.copy()
print(player_list)
del another_play_list[1]
print(player_list)
print(another_play_list)

[('Messi', 10), ('Xavi', 6), ('ter Stegen', 1), ('Busquets', 5), ('Pique', 3), ('Suárez', 9)]
[('Messi', 10), ('Xavi', 6), ('ter Stegen', 1), ('Busquets', 5), ('Pique', 3), ('Suárez', 9)]
[('Messi', 10), ('ter Stegen', 1), ('Busquets', 5), ('Pique', 3), ('Suárez', 9)]


最后，列表、元组、字符串还支持in操作符，该操作符判断in之前的元素是否属于之后的列表、元组或者字符串，比如：

In [61]:
print('Messi' in player_list[0][0])
print('Messi' in player_list[1][0])
print(('Pique', 3) in player_list)
print('d' in 'Messi')

True
False
True
False


如果要判断in之前的元素“不属于”之后的列表、元组或字符串，可以使用“not in”:

In [62]:
print('Messi' not in player_list[0][0])
print('Messi' not in player_list[1][0])
print(('Pique', 3) not in player_list)
print('d' not in 'Messi')

False
True
False
True


## 集合

无论是列表还是元组，都允许有重复的元素存在，但是有时我们可能需要不重复的元素，此时可以使用**集合**（**set**）类。

集合的声明与列表类似，区别在于集合使用大括号{}，而非中括号。

与list()类似，可以使用使用set()构建集合：

In [63]:
letters=set("Messi")
print(letters)

{'e', 'M', 'i', 's'}


以上可以看到，set()构建了一个不重复元素组成的集合。可以使用add()方法以及update()方法为集合新增元素，比如：

In [64]:
letters.add('a')
print(letters)
letters.add(('a',))
print(letters)
letters.update({'c','d'})
print(letters)

{'i', 's', 'a', 'e', 'M'}
{'i', 's', 'a', 'e', ('a',), 'M'}
{'d', 'i', 's', 'a', 'e', ('a',), 'c', 'M'}


值得注意的是，在上面的程序中，我们添加了字符串'a'，以及一个元组('a',)，两者一个是字符串，一个是元组，是不同的，因而在集合中两者并不冲突。

如果需要删除，可以使用remove()方法以及discard()方法，两者的区别在于：remove()方法不能删除不存在的元素，否则报错；而discard()方法如果要删除的元素不存在，不会报错。

In [65]:
letters.remove(('a',))
print(letters)
letters.discard('z')
print(letters)

{'d', 'i', 's', 'a', 'e', 'c', 'M'}
{'d', 'i', 's', 'a', 'e', 'c', 'M'}


最后，作为集合，还可以使用issubset()和issuperset()方法判断某一个集合是不是另外一个集合的子集或者超集：

In [66]:
print(letters.issuperset({'a','b'}))
print(letters.issuperset({'a','d'}))
print({'a','d'}.issubset(letters))
print({'a','d'}.issuperset(letters))

False
True
True
False


## 控制语句：循环

有时我们需要重复一条类似的命令很多次，此时我们可以使用循环命令。

在Python中有两个循环语句：while和for，两者很大程度上是等价的，但是在不同情况下方便程度时不一样的。

for作为关键字，其基本语法为：
```python
for var in iterable_obj:
    ## code
```

其中var为一个变量，iterable_obj为一个可迭代对象，如列表、元组或者字符串，其后面紧接着跟着一个冒号。

在这里需要注意的是，不像C或者Java使用大括号区分代码块，在Python中，主要靠缩进区分代码块，因而需要循环执行的代码，要写在for语句的下一行，并使用Tab键或者几个（一般为4/8个）空格进行缩进。

比如，以下语句把字符串中的每个字符都分别打印出来：

In [67]:
name='Messi'
for n in name:
    print(n)

M
e
s
s
i


而以下代码将player_list中所有的人名及号码打印出来：

In [68]:
for player in player_list:
    print(player[0],end='')
    print(" : ",end='')
    print(player[1])
print("---the end---")

Messi : 10
Xavi : 6
ter Stegen : 1
Busquets : 5
Pique : 3
Suárez : 9
---the end---


注意到最后一行并没有被缩进，因而不属于需要循环执行的代码块，因而只执行了一次。

此外，经常遇到的一个情形是对数字进行循环，此时可以使用range()函数。如果使用range(N)，将会返回一个可迭代的对象，其值为0,...,N-1。比如：

In [69]:
list(range(10))

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

也可以使用range(N,M)的形式，此时返回迭代对象的值为N,N+1,...,M-1，比如：

In [70]:
list(range(1,11))

[1, 2, 3, 4, 5, 6, 7, 8, 9, 10]

使用以上特性，我们可以方便的使用range()函数来写for 循环，比如：

In [71]:
name='Messi'
for i in range(len(name)):
    print(name[i])

M
e
s
s
i


其中len()函数取得name中元素的个数，由于len(name)的值为5，因而range(len(name))就产生了一个可以迭代的、值为0,1,2,3,4的对象。

以下程序计算了从1到101的所有奇数的和：

In [72]:
sum_odd=0
for i in range(0,51):
    odd=2*i+1
    sum_odd+=odd
print(sum_odd)

2601


而while循环的语法为：
```python
while logic_expression:
    ## code
```

同样，while循环的代码块也需要用缩进表示，而logic_expression是一个逻辑判断语句，只有当logic_expression值为真时，循环才继续执行，否则跳出循环。比如刚刚从1到101的所有奇数的和的代码也可以写为：

In [73]:
sum_odd=0
odd=1
while odd<=101:
    sum_odd+=odd
    odd+=2
print(sum_odd)

2601


特别需要注意的是一定不要忘了及时更新odd，否则很容易造成无限循环。

## 控制语句：条件

条件语句用于判断某一个逻辑表达式，如果为真，则执行某个代码块。其最基本的形式如下：
```python
if logic_expression:
    ## code
```

同样，代码块也需要用缩进表示，其中的代码块只有当logic_expression的值为真时才执行，否则不执行。

比如，如下的代码中，首先判断球员姓名是否为Messi或者Suárez，如果是，则打印其位置：

In [74]:
for p in player_list:
    if p[0]=='Messi' or p[0]=='Suárez':
        print(p[0],":前锋")

Messi :前锋
Suárez :前锋


此外，if 后面还可以跟elif语句：
```python
if logic_expression1:
    ## code1
elif logic_expression2:
    ## code2
elif  logic_expression3:
    ## code3
....
```

即“else if”，如果logic_expression1满足，则执行code1，如果不满足，则继续判断logic_expression2是否满足，若满足，则执行code2，以此类推。比如：

In [75]:
for p in player_list:
    if p[0] in ('Messi', 'Suárez'):
        print(p[0],"：前锋")
    elif p[0] in ('Xavi', 'Arthur','Busquets'):
        print(p[0],"：中场")
    elif p[0] in ('Pique'):
        print(p[0],"：后卫")

Messi ：前锋
Xavi ：中场
Busquets ：中场
Pique ：后卫
Suárez ：前锋


最后，还可以加else语句，用于所有的if或者elif的逻辑表达式都不满足时执行

In [76]:
for p in player_list:
    if p[0] in ('Messi', 'Suárez'):
        print(p[0],"：前锋")
    elif p[0] in ('Xavi', 'Iniesta','Busquets'):
        print(p[0],"：中场")
    elif p[0] in ('Pique'):
        print(p[0],"：后卫")
    else:
        print(p[0],"守门员")

Messi ：前锋
Xavi ：中场
ter Stegen 守门员
Busquets ：中场
Pique ：后卫
Suárez ：前锋


此外，if语句可以与break、continue、pass等一起控制循环。其中：

* break：跳出循环不再执行
* countinue：跳出本次循环后面的代码，但是循环继续执行
* pass：什么都不做，继续执行

比如，计算从1到101的所有奇数的和的代码也可以写为：

In [77]:
sum_odd=0
odd=1
while True:
    sum_odd+=odd
    odd+=2
    if odd>101:
        break
print(sum_odd)

2601


在以上代码中，while True代表循环会一直执行，但是if语句会判断odd是否大于了101，如果odd一旦大于101，就会使用break退出循环。

如果我们需要计算从1到101的所有不能被5整除的奇数的和，可以使用pass语句：

In [79]:
sum_odd=0
odd=1
while odd<=101:
    if odd%5==0:
        pass
    else:
        sum_odd+=odd
    odd+=2
print(sum_odd)

2101


以下代码我们使用continue语句将一个字符串中所有的's'都给去掉

In [81]:
a='Messi'
b=''
for s in a:
    if s=='s':
        continue
    b+=s
print(b)

Mei


在以上代码中，当碰到's'时，循环跳过了b+=s这一句，而是继续执行循环，直到循环结束。与之相比的是break命令直接跳出了循环：

In [82]:
a='Messi'
b=''
for s in a:
    if s=='s':
        break
    b+=s
print(b)

Me


## 控制语句：异常