## 2.4 切片

在切片和区间操作里不包含区间范围的最后一个元素是 Python 的风格

In [1]:
l = [10, 20, 30, 40, 50, 60]
l[:2] #在下标2的地方分割

[10, 20]

In [2]:
l[2:]

[30, 40, 50, 60]

以用 s[a:b:c] 的形式对 s 在 a 和 b 之间以 c 为间隔取值。

In [3]:
s = 'bicycle'
s[::3]

'bye'

In [4]:
s[::-1]

'elcycib'

In [7]:
s[::-2]

'eccb'

slice()申明切片对象

In [4]:
invoice = """
0.....6................................40........52...55........
1909  Pimoroni PiBrella                    $17.50    3    $52.50
1489  6mm Tactile Switch x20                $4.95    2     $9.90
1510  Panavise Jr. - PV-201                $28.00    1    $28.00
1601  PiTFT Mini Kit 320x240               $34.95    1    $34.95
"""
SKU = slice(0, 6)
DESCRIPTION = slice(6, 40)
UNIT_PRICE = slice(40, 52)
QUANTITY = slice(52, 55)
ITEM_TOTAL = slice(55, None) #最后用None表示
line_items = invoice.split('\n')[2:]
for item in line_items:
    print(item[UNIT_PRICE], item[DESCRIPTION])

   $17.50    Pimoroni PiBrella                 
    $4.95    6mm Tactile Switch x20            
   $28.00    Panavise Jr. - PV-201             
   $34.95    PiTFT Mini Kit 320x240            
 


In [6]:
invoice.split('\n')

['',
 '0.....6................................40........52...55........',
 '1909  Pimoroni PiBrella                    $17.50    3    $52.50',
 '1489  6mm Tactile Switch x20                $4.95    2     $9.90',
 '1510  Panavise Jr. - PV-201                $28.00    1    $28.00',
 '1601  PiTFT Mini Kit 320x240               $34.95    1    $34.95',
 '']

### 2.4.4 给切片赋值

In [12]:
l = list(range(10))
l

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [13]:
l[2:5] = [20,50] # [2,3,4]
l

[0, 1, 20, 50, 5, 6, 7, 8, 9]

In [14]:
l[3::2]

[50, 6, 8]

In [15]:
del l[5:7]
l

[0, 1, 20, 50, 5, 8, 9]

In [16]:
l[3::2] = [11, 22]
l

[0, 1, 20, 11, 5, 22, 9]

如果赋值的对象是一个切片，那么赋值语句的右侧必须是个可迭代对象。即便只有单独一个值，也要把它转换成可迭代的序列。

In [17]:
l[2:5] = [100] # l[2:5] = 100 会报错
l

[0, 1, 100, 22, 9]

## 2.5 对序列使用+和*

In [18]:
l = [1, 2, 3]
l+l

[1, 2, 3, 1, 2, 3]

In [19]:
l*5

[1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3, 1, 2, 3]

In [20]:
'abcd' * 5

'abcdabcdabcdabcdabcd'

生成列表的列表的正确方法

In [21]:
board = [['_']*3 for i in range(3)]
board

[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]

In [22]:
board[1][2] = 'X'
board

[['_', '_', '_'], ['_', '_', 'X'], ['_', '_', '_']]

错误方法

In [23]:
weird_board = [['_']*3] * 3
weird_board

[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]

In [24]:
weird_board[1][2] = 'O'
weird_board

[['_', '_', 'O'], ['_', '_', 'O'], ['_', '_', 'O']]

上述列表中三个引用都指向同一个对象

错误方法的代码等价于：

In [8]:
row=['_'] * 3
board = []
for i in range(3):
    board.append(row) # 放入的始终是对row的引用

board

[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]

In [9]:
board[1][2] = 'X'
board

[['_', '_', 'X'], ['_', '_', 'X'], ['_', '_', 'X']]

正确方法的代码等价于：

In [10]:
board = []
for i in range(3):
    row=['_'] * 3 # 每次放入的row是生成的新对象
    board.append(row)
    
board

[['_', '_', '_'], ['_', '_', '_'], ['_', '_', '_']]

In [11]:
board[1][2] = 'X'
board

[['_', '_', '_'], ['_', '_', 'X'], ['_', '_', '_']]

## 2.6 序列的增量赋值

+= 背后的特殊方法是 \_\_iadd\_\_ （用于“就地加法”）

In [12]:
l = [1, 2, 3]
id(l)

2079921675840

In [13]:
l *= 2
l

[1, 2, 3, 1, 2, 3]

In [14]:
id(l) # id没有改变

2079921675840

In [15]:
t = (1, 2, 3)
id(t)

2079931222016

In [16]:
t *= 2
id(t) # id改变了，因为元组属于不可变序列，会调用__add__生成新的元组，因此二者所指的对象不同

2079884607296

一个关于+=的谜题  
当不可变序列包含可变序列时，对可变序列进行修改会发生什么呢？

In [17]:
t = (1, 2, [30, 40])
t[2] += [50, 60]

TypeError: 'tuple' object does not support item assignment

虽然有异常抛出，但是元组的内容依旧被改变了

In [45]:
t

(1, 2, [30, 40, 50, 60])

In [46]:
t = (1, 2, [30, 40])
t[2].extend([50, 60])  # 使用extend可以避免这个异常
t

(1, 2, [30, 40, 50, 60])

dis.dis 显示函数背后的字节码

In [49]:
import dis
dis.dis('s[a]+=b')

  1           0 LOAD_NAME                0 (s)
              2 LOAD_NAME                1 (a)
              4 DUP_TOP_TWO
              6 BINARY_SUBSCR
              8 LOAD_NAME                2 (b)
             10 INPLACE_ADD
             12 ROT_THREE
             14 STORE_SUBSCR
             16 LOAD_CONST               0 (None)
             18 RETURN_VALUE


## 2.7 list.sort方法和内置函数sorted

list.sort 方法会就地排序列表，也就是说不会把原列表复制一份  

在这种情况下返回 None其实是 Python 的一个惯例：如果一个函数或者方法对对象进行的是就地改动，那它就应该返回 None，好让调用者知道传入的参数发生了变动，而且并未产生新的对象。

In [51]:
fruits = ['grape', 'raspberry', 'apple', 'banana']
list.sort(fruits)  # 就地排序，无返回对象，没有生成新的对象
fruits

['apple', 'banana', 'grape', 'raspberry']

In [61]:
fruits = ['grape', 'raspberry', 'apple', 'banana']
fruits.sort()  # 相同的调用方法
fruits

['apple', 'banana', 'grape', 'raspberry']

In [52]:
fruits = ['grape', 'raspberry', 'apple', 'banana']
sorted(fruits)  # 有返回值，生成了新的对象

['apple', 'banana', 'grape', 'raspberry']

In [53]:
fruits  # 并未改变变量内部的值

['grape', 'raspberry', 'apple', 'banana']

In [62]:
sorted(fruits,  reverse= True)

['raspberry', 'grape', 'banana', 'apple']

In [63]:
sorted(fruits, key=len) # key的意思是比较对象按照len()函数对每个对象的返回值，如果不设置，则默认为恒等函数，即比较自身

['apple', 'grape', 'banana', 'raspberry']

有意思的一点是，如果二者的比较值相等，则排序后二者的相对顺序和原顺序中二者的相对顺序一致

In [64]:
sorted(fruits, key=len, reverse=True)

['raspberry', 'banana', 'apple', 'grape']

注意结果并不是上者结果的完全反转，排序算法是稳定的，因此排序的结果中二者的相对顺序不会改变

## 2.8 用bisect来管理已排序的序列

bisect 模块包含两个主要函数，bisect 和 insort，两个函数都利用二分查找算法来在有序序列中查找或插入元素。

### 2.8.1 用bisect来搜索

bisect(haystack, needle) 在 haystack（干草垛）里搜索 needle（针）的位置，该位置满足的条件是，把 needle 插入这个位置之后，haystack 还能保持升序。  

在有序序列中用 bisect 查找某个元素的插入位置

In [18]:
import bisect
import sys


HAYSTACK = [1, 4, 5, 6, 8, 12, 15, 20, 21, 23, 23, 26, 29, 30]
NEEDLES = [0, 1, 2, 5, 8, 10, 22, 23, 29, 30, 31]

ROW_FMT = '{0:2d} @ {1:2d}    {2}{0:<2d}'


def demo(bisect_fn):
    for needle in reversed(NEEDLES):
        position = bisect_fn(HAYSTACK, needle) # 找出插入的位置
        offset = position * '  |'
        print(ROW_FMT.format(needle, position, offset))



if __name__ == '__main__':
    
    if sys.argv[-1] == 'left':
        bisect_fn = bisect.bisect_left
    else:
        bisect_fn = bisect.bisect
    print('DEMO:', bisect_fn.__name__)
    
    print('haystack ->', ' '.join('%2d' % n for n in HAYSTACK)) # 注意此处字符串的拼接，列表推导是直接作为参数传进去的
    demo(bisect_fn)

DEMO: bisect_right
haystack ->  1  4  5  6  8 12 15 20 21 23 23 26 29 30
31 @ 14      |  |  |  |  |  |  |  |  |  |  |  |  |  |31
30 @ 14      |  |  |  |  |  |  |  |  |  |  |  |  |  |30
29 @ 13      |  |  |  |  |  |  |  |  |  |  |  |  |29
23 @ 11      |  |  |  |  |  |  |  |  |  |  |23
22 @  9      |  |  |  |  |  |  |  |  |22
10 @  5      |  |  |  |  |10
 8 @  5      |  |  |  |  |8 
 5 @  3      |  |  |5 
 2 @  1      |2 
 1 @  1      |1 
 0 @  0    0 


bisect是bisect_right的简称  
bisect和bisect_left的区别是  
bisect_left 返回的插入位置是原序列中跟被插入元素相等的元素的位置，也就是新元素会被放置于它相等的元素的前面，  
而 bisect_right 返回的则是跟它相等的元素之后的位置

In [19]:
if __name__ == '__main__':
    
    if sys.argv[-1] == 'left':
        bisect_fn = bisect.bisect
    else:
        bisect_fn = bisect.bisect_left
    print('DEMO:', bisect_fn.__name__)
    
    print('haystack ->', ' '.join('%2d' % n for n in HAYSTACK)) # 注意此处字符串的拼接，是直接作为参数传进去的
    demo(bisect_fn)

DEMO: bisect_left
haystack ->  1  4  5  6  8 12 15 20 21 23 23 26 29 30
31 @ 14      |  |  |  |  |  |  |  |  |  |  |  |  |  |31
30 @ 13      |  |  |  |  |  |  |  |  |  |  |  |  |30
29 @ 12      |  |  |  |  |  |  |  |  |  |  |  |29
23 @  9      |  |  |  |  |  |  |  |  |23
22 @  9      |  |  |  |  |  |  |  |  |22
10 @  5      |  |  |  |  |10
 8 @  4      |  |  |  |8 
 5 @  2      |  |5 
 2 @  1      |2 
 1 @  0    1 
 0 @  0    0 


根据一个分数，找到它所对应的成绩

In [3]:
def grade(score, breakpoints=[60, 70, 80, 90], grades='FDCBA'):
    i = bisect.bisect(breakpoints, score) # 根据breakpoints找出score的位置
    return grades[i]  # 再根据位置返回对应的grade

[grade(score) for score in [33, 99, 77, 70, 89, 90, 100]]

['F', 'A', 'C', 'C', 'B', 'A', 'A']

### 2.8.2 用bisect.insort插入新元素

insort(seq, item) 把变量 item 插入到序列 seq 中，并能保持 seq 的升序顺序

In [22]:
import bisect
import random

SIZE = 7

random.seed(1789)

my_list = []
for i in range(SIZE):
    new_item = random.randrange(SIZE * 2)
    bisect.insort(my_list,new_item) # 注意该函数没有返回值，因此是对参数直接进行了修改
    print('%2d ->'%new_item, my_list)

11 -> [11]
11 -> [11, 11]
 9 -> [9, 11, 11]
 0 -> [0, 9, 11, 11]
10 -> [0, 9, 10, 11, 11]
 7 -> [0, 7, 9, 10, 11, 11]
 0 -> [0, 0, 7, 9, 10, 11, 11]


note: randrange() 方法返回指定递增基数集合中的一个随机数，基数默认值为1。  
函数用法：  
random.randrange ([start,] stop [,step])  

start -- 指定范围内的开始值，包含在范围内。  
stop -- 指定范围内的结束值，不包含在范围内。  
step -- 指定递增基数。  
即返回一个随机数ran = start + n* step（n为随机生成的），且保证 start<= ran <= stop

In [23]:
print("randrange(100, 1000, 2) : ", random.randrange(100, 1000, 2))
print("randrange(100, 1000, 2) : ", random.randrange(100, 1000, 3))

randrange(100, 1000, 2) :  562
randrange(100, 1000, 2) :  151
