## Python

### 1. 如何运行的

>Python 的标准实现包括一个解释器和一套支持库。执行程序时，Python 内部会将源代码编译（翻译）成平台无关的字节码形式，（Python3.2 + 将其保存在 \__pycache__ 目录下，文件为 .pyc 格式。
>
>一旦程序编译成字节码，会交由 __PVM (Python Virtual Machine)__ 来执行。它本质上是一个迭代运行字节码指令的大循环，是所谓解释器的最后一步。
>
>因为不是采用二进制机器码，所以 Python 无法运行的像 C++ 之类一样快，因为 PVM 仍需解释字节码至机器指令。
>
>因此，Python 是一门动态语言，一切都在运行时发生，即我们只有 RunTime。

### 2. 常见数据类型及其操作

#### 2.1 动态类型和共享引用

Python 数据类型为动态类型，其核心类型分为可变类型和不可变类型。

不可变类型不能进行原地修改操作，有：

1. str
2. tuple
3. number

而：

1. set
2. dict
3. list

属于可变类型。

例如：

In [1]:
a = 3 # 1
a = 5 # 2
b = a # 3

Python 实际上:
1. 先创建了一个 number 类型的对象，代表值 3，然后创建了一个变量 a，最后将这个变量和对象 3 进行连接。

2. 当我们修改 a 的值时，实际上，python 重新创建了一个对象 5 然后和变量 a 进行连接。所以，__类型实际上是属于对象而不是变量，变量名本身并没有类型。__

3. 运行 b = a 以后，两个变量就共享了引用，而如果对 b 重新赋值并不会影响到 变量 a，因为 number 不属于可变类型，会创建新的对象并连接到 b。

所以，__对于可变类型的共享引用要谨慎，因为会在原位置进行修改，从而影响到所有共享引用的变量。__

因此，对于判断两个变量相等：

1. ‘==’ 判断的是两个被引用的对象的值是否相同。
2. ‘is’ 判断的是是否引用同一个对象。

In [2]:
b is a

In [3]:
b == a

#### 2.2 str

In [4]:
string = 'abcde'

In [5]:
len(string) # 获取字符串长度

In [6]:
string + 'fg' # 字符串拼接

In [7]:
string * 2 # 字符串自拼接

In [8]:
for c in string: print(c, end=', ') # 遍历字符

In [9]:
'ab' in string # 子串检查

In [10]:
'f' in string

In [11]:
string[0] # 索引

In [12]:
string[0:3] # 分片

In [13]:
string[0::2] # 分片（带步长）

In [14]:
ord('a') # 获取字符 ascii 编码

In [15]:
chr(97) # ascii 编码转字符

In [16]:
string[0] = '0' # 不能原地修改

TypeError: 'str' object does not support item assignment

In [17]:
string.capitalize() # 首字母大写

'Abcde'

In [18]:
string.count('a', 0, -1) # 查找子串并计算出现次数 （‘子串’，‘起始查找位置’，‘结束查找位置’）

1

In [19]:
string.endswith('f', 0, -1) # 是否以特定子串结尾

False

In [20]:
string.startswith('a', 0, -1) # 是否以特定子串开头

True

In [21]:
'abcabc'.find('abc', 0, -1) # 是否找到子串，并返回索引，找不到则返回 -1

0

In [22]:
'abcd'.index('abc', 0, -1) # 是否找到子串，并返回索引，找不到则引发异常

0

In [23]:
' string \n'.strip() #  消除两端的指定的字符（默认为空格或换行符）或字符序列

'string'

In [24]:
' string \n'.lstrip() # 消除左端的

'string \n'

In [25]:
' string \n'.rstrip() # 消除右端的

' string'

In [26]:
'string replace string'.replace('str', 'do') # 子串查找并替换

'doing replace doing'

In [27]:
'a, b, c'.split(',') # 以指定子串对字符串进行分割 (默认)

['a', ' b', ' c']

In [28]:
','.join(['1', '2', '3']) # 以此字符串连接序列每个元素

'1,2,3'

In [29]:
'%d...%-6d...%06d...%.4f...%+06.1f' % (12, 123, 123, 1.23456, 1.23456) # 字符串格式化

'12...123   ...000123...1.2346...+001.2'

#### 2.3 set

set 是一个包含唯一的、不可变的对象的一个无序集合体，支持绝大多数 list 的操作。

In [30]:
set1 = set() # 调用式创建集合并添加值
set1.add(1)
set1

{1}

In [31]:
set2 = {1, 2, 3} # 查找（比list更快）
1 in set2

True

In [32]:
set1.intersection(set2) # 交集

{1}

In [33]:
set1.union(set2) # 并集

{1, 2, 3}

In [34]:
{c for c in 'string'} # 集合推导表达式

{'g', 'i', 'n', 'r', 's', 't'}

#### 2.4 list

list 是一个任意对象引用（存的是引用不是对象本身）的有序集合，长度可变，任意嵌套。

In [35]:
thelist = [] # 调用式创建
thelist.append(1) # 尾部添加值
thelist[0] # 索引

1

In [36]:
matrix = [[0, 1], [2, 3]] # list嵌套
matrix[0][0]

0

In [37]:
len(matrix) # 获取长度

2

In [38]:
thelist + thelist # 拼接

[1, 1]

In [39]:
thelist * 2 # 自拼接

[1, 1]

In [40]:
[0, 1, 2, 3][0::2] # 分片

[0, 2]

In [41]:
thelist.extend([2, 3, 4]) # 尾部扩展
thelist

[1, 2, 3, 4]

In [42]:
thelist.insert(0, 0) # 插入
thelist

[0, 1, 2, 3, 4]

In [43]:
thelist.index(0) # 索引

0

In [44]:
thelist.count(2) # 统计元素出现次数

1

In [45]:
thelist.sort() # 排序
thelist

[0, 1, 2, 3, 4]

In [46]:
thelist.reverse() # 反转
thelist

[4, 3, 2, 1, 0]

In [47]:
l1 = [1, 2, [3, 4]]
l2 = l1.copy() # 复制（浅复制）
l2[2][0] = 4
l1 # l1 对子数组内元素进行修改，会影响到 l1（因为存的是子数组的引用而不是子数组本身）

[1, 2, [4, 4]]

In [48]:
thelist.pop() #  删除该位置元素并返回，默认 -1

0

In [49]:
thelist.pop(0)

4

In [50]:
thelist.remove(1)  # 删除该元素，找不到则引发异常

In [51]:
thelist[0] = '!'
thelist

['!', 2]

In [52]:
thelist[0:2] = [1, 2]
thelist

[1, 2]

In [53]:
thelist.clear() # 清空
thelist

[]

In [54]:
[x ** 2 for x in range(9)] # 列表推导，比等价 for 循环更快

[0, 1, 4, 9, 16, 25, 36, 49, 64]

In [55]:
list(map(ord, 'abcdefg'))

[97, 98, 99, 100, 101, 102, 103]

In [56]:
# 自定义类型进行排序
from functools import cmp_to_key
class MyNum:
    def __init__(self, val):
        self.val = val
        
    def __repr__(self):
        return str(self.val)

def mycmp(x, y):
    return x.val - y.val

my_nums = [MyNum(0), MyNum(5), MyNum(2)]

my_nums.sort(key=cmp_to_key(mycmp), reverse=True)

my_nums

[5, 2, 0]

#### 2.5 dict

dict 是通过键读取任意对应对象的无序集合，本质上是一个对象引用哈希表。

In [57]:
squares = {k: k**2 for k in range(9)} # 字典推导表达式
squares

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64}

In [58]:
2 in squares

True

In [59]:
squares.update({k: k**2 for k in range(11)}) # 合并
squares

{0: 0, 1: 1, 2: 4, 3: 9, 4: 16, 5: 25, 6: 36, 7: 49, 8: 64, 9: 81, 10: 100}

In [60]:
squares.get(0) # 通过键删除，没有则默认返回None

0

In [61]:
squares.get(-1, 'NotExists')

'NotExists'

In [62]:
squares.pop(10, 'NotExists') # 通过键删除，如果则默认返回None
squares.pop(10, 'NotExists') # 通过键删除，如果则默认返回None

'NotExists'

In [63]:
squares.setdefault(-1, float('+inf')) # 通过键获取，没有则设置为默认值

inf

In [64]:
squares.popitem() # 返回并删除字典中的最后一对键和值

(-1, inf)

In [65]:
squares.keys() # 所有键

dict_keys([0, 1, 2, 3, 4, 5, 6, 7, 8, 9])

In [66]:
squares.items() # 所有键值对

dict_items([(0, 0), (1, 1), (2, 4), (3, 9), (4, 16), (5, 25), (6, 36), (7, 49), (8, 64), (9, 81)])

#### 2.6 tuple

tuple 是一个基于位置的有序的对象引用集合，不可变，长度固定，支持所有基于偏移量的操作例如索引和分片。

In [67]:
thetuple = tuple(i for i in range(9)) # 创建元祖
thetuple

(0, 1, 2, 3, 4, 5, 6, 7, 8)

In [68]:
sorted(thetuple, reverse=True)

[8, 7, 6, 5, 4, 3, 2, 1, 0]

In [69]:
thetuple = (1, [9, 2])
thetuple

(1, [9, 2])

In [70]:
thetuple[1][1] = 4 # 不可变指的是元祖本身顶层而不是其内容
thetuple

(1, [9, 4])

In [71]:
from collections import namedtuple # 具名元祖
Person = namedtuple('Person', ['name', 'age'])
jade = Person('jade', age=24)
jade.name

'jade'

#### 2.7 file

file 是进行文件处理的类型。

常见用法有：

```python

outfile = open(r'Desktop\code', 'w') # w: 写入
infile = open(r'Desktop\code', 'r') # r: 读取（默认）+: 同时支持写入写出 b: 以二进制模式打开

infile.read() # 把文件整个读取进一个字符串
infile.read(N) # 读取接下来N个字符到一个字符串
infile.readline() # 读取下一行
infile.readlines() # 读取所有行到一个字符串列表

outfile.write(thestring) # 写入该字符串
outfile.writelines(thestrlist) #写入该字符串列表
outfile.flush() # 将输出缓冲区刷入到硬盘中但不关闭文件

file.seek(N) # 将文件光标位置移动偏移量N处

for line in open('file'): pass # 用文件迭代器逐行读取（最佳实践）
```

### 3. 循环

#### 3.1 for

In [72]:
for k, v in squares.items(): print(k, v, sep=': ', end='\t')

0: 0	1: 1	2: 4	3: 9	4: 16	5: 25	6: 36	7: 49	8: 64	9: 81	

In [73]:
for i, n in enumerate([0, 1, 2, 3, 4]): print(i, n, sep=': ', end='\t')

0: 0	1: 1	2: 2	3: 3	4: 4	

__for 循环中的 else 用于没有执行 break 语句__

In [74]:
for i in range(3):
    if i < 5: break
else:
    print('not break')

for i in range(3):
    if i > 5: break
else:
    print('not break')

not break


#### 3.2 while

一般来说，while 速度要比 for 循环慢，因为 Python 是以 C 来执行 for 循环的，而 while 是字节码形式。
同样，__while 循环中的 else 用于没有执行 break 语句。__

In [75]:
a = 0
while a < 9:
    a += 1
    if a > 15:
        break
else:
    print('not break')

not break
