# `list` (列表)

## 创建列表

列表类型是一个容器，它里面可以存放任意数量、任意类型的数据。

例如下面的几个列表中，有存储数值的、字符串的、内嵌列表的。不仅如此，还可以存储其他任意类型。

### 中括号`[]`

In [1]:
L = [1, 2, 3, 4]

In [2]:
L = ["a", "b", "c", "d"]

In [3]:
L = [1, 2, "c", "d"]

In [4]:
L = [[1, 2, 3], "a", "b", [4, "c"]]

### `list()`

In [5]:
list('abcde')

['a', 'b', 'c', 'd', 'e']

In [6]:
list(range(0, 4))

[0, 1, 2, 3]

## 操作列表

python中的列表是一个序列，其内元素是按索引顺序进行存储的，可以进行索引取值、切片等操作。

### 索引切片

**列表元素不是直接存在列表范围内的，而是以地址的形式保存在列表中。**

![](files/list_m1.png)

分片操作用于从序列中取出子序列，它会创建新的内存块来保存取出来的序列对象。

- `S[i:j]`：从索引位i取到索引位j，不包括j
- `S[i:]`：从索引位i开始取到最结尾
- `S[:j]`：从最开头取到索引位j，不包括j
- `S[:]`：从头取到尾，相当于拷贝了序列，但得到的是新序列
- `S[i:j:k]`：k表示取元素时的步进间隔，默认为1，表示每个元素都取，如果为2，则表示取一个跳过一个

分片的区间是左闭右开的，所以不会包括j的索引位。i和j可以是负数，负数表示从尾部开始计算索引位。例如，-1表示最后一个元素，-2表示倒数第二个元素。

列表是序列，序列类型的每个元素都是按索引位置进行存放的，所以可以通过索引的方式取得列表元素：

In [7]:
L = [1,2,3,4,5]

In [8]:
L[0]

1

In [50]:
L.__getitem__(0)

1

In [9]:
L[1:4]

[2, 3, 4]

In [51]:
L.__getitem__(slice(1, 4))

[2, 3, 4]

### 常见序列操作

**测试元素是否存在**

`x in S`和`x not in S`，返回True或False。


In [10]:
'a' in "abcd"

True

In [11]:
'aa' in "abcd"

False

**加法和乘法符号**

`S1 + S2`或`S * N`或`N * S`，其中`S1`和`S2`是同一种序列类型，N表示序列的重复次数。

In [12]:
[1,2] + [3,4]

[1, 2, 3, 4]

In [13]:
[1,2] * 3

[1, 2, 1, 2, 1, 2]

In [14]:
3 * [1, 2]

[1, 2, 1, 2, 1, 2]

**len()、max()和min()函数**

`len()`返回序列的元素个数，也就是序列的长度。

`min()`和`max()`分别返回序列中最小、最大的元素。

In [55]:
len(L)

5

In [52]:
L.__len__()

5

In [54]:
min(L), max(L)

(1, 5)

### 可变序列操作

**替换元素**

In [16]:
s = list(range(10))

s

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

- `s[i] = x`、`s[i:j] = t`将序列中的元素替换成x或可迭代对象t

In [17]:
s[0] = -1

s

[-1, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [56]:
s.__setitem__(0, -2)

s

[-2, -100, 0, 0, 0, 0, 0, 0, 0, 0, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8]

In [18]:
s[0: 3] = [-3, -2, -1]

s

[-3, -2, -1, 3, 4, 5, 6, 7, 8, 9]

- `s[i:j:K] = t`将序列中的元素替换成可迭代对象t，t的长度必须和`s[i:j:k]`的长度一样

In [19]:
s[1: 5: 2] = [0, 0]

s

[-3, 0, -1, 0, 4, 5, 6, 7, 8, 9]

**删除元素**

- `del s[i]、del s[i:j]`删除序列中的元素，等价于`s[i:i+1] = []`、`s[i:j] = []`

In [20]:
s[0: 1] = []

s

[0, -1, 0, 4, 5, 6, 7, 8, 9]

- `del s[i:j:k]`删除序列中的某些元素，k为步进值

- `s.remove(x)`：移除第一次出现的元素x

In [21]:
s.remove(0)

s

[-1, 0, 4, 5, 6, 7, 8, 9]

- `s.clear()`表示清空序列中的所有元素，等价于`del s[:]`

In [22]:
s.clear()

s

[]

- `s.pop([i])`表示移除序列s中的第i个元素并返回这个元素，中括号表示可选，如果没有参数，默认移除最后一个元素

In [23]:
s = list(range(10))

s.pop()

9

In [24]:
s.pop(1)

1

In [25]:
s.pop(-1)

8

**添加元素**

- `s.append(x)`向序列的尾部追加元素x，等价于`s[len(s):len(s)] = [x]`

In [26]:
print(s)

s.append(8)

print(s)

[0, 2, 3, 4, 5, 6, 7]
[0, 2, 3, 4, 5, 6, 7, 8]


- `s.extend(t)`或`s += t`表示将t扩展到序列s的尾部，等价于`s[len(s):len(s)] = t`

In [27]:
s1 = s[:]
s1.extend([0, 0, 0])
print(s1)

s[len(s): len(s)] = [0, 0, 0]
print(s)

[0, 2, 3, 4, 5, 6, 7, 8, 0, 0, 0]
[0, 2, 3, 4, 5, 6, 7, 8, 0, 0, 0]


- `s.insert(i,x)`表示将x插入到序列中的i索引位置处，等价于`s[i:i] = [x]`

In [28]:
s.insert(0, -100)

s

[-100, 0, 2, 3, 4, 5, 6, 7, 8, 0, 0, 0]

- `s *= n`表示将序列n的元素重复n次追加到s的尾部

In [29]:
s *= 2

s

[-100, 0, 2, 3, 4, 5, 6, 7, 8, 0, 0, 0, -100, 0, 2, 3, 4, 5, 6, 7, 8, 0, 0, 0]

**其它**

- `s.copy()`表示拷贝序列得到一个新的序列副本，等价于`s[:]`

In [30]:
s.copy()

[-100, 0, 2, 3, 4, 5, 6, 7, 8, 0, 0, 0, -100, 0, 2, 3, 4, 5, 6, 7, 8, 0, 0, 0]

- `s.reverse()`原地反转序列s，为了节约内存空间，所以是原地反转，不会返回反转后的序列

In [31]:
s.reverse()

s

[0, 0, 0, 8, 7, 6, 5, 4, 3, 2, 0, -100, 0, 0, 0, 8, 7, 6, 5, 4, 3, 2, 0, -100]

### 列表排序

In [36]:
help(list.sort)

Help on method_descriptor:

sort(self, /, *, key=None, reverse=False)
    Sort the list in ascending order and return None.
    
    The sort is in-place (i.e. the list itself is modified) and stable (i.e. the
    order of two equal elements is maintained).
    
    If a key function is given, apply it once to each list item and sort them,
    ascending or descending, according to their function values.
    
    The reverse flag can be set to sort in descending order.



In [35]:
s.copy().sort()

s

[-100, -100, 0, 0, 0, 0, 0, 0, 0, 0, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8]

In [37]:
help(sorted)

Help on built-in function sorted in module builtins:

sorted(iterable, /, *, key=None, reverse=False)
    Return a new list containing all items from the iterable in ascending order.
    
    A custom key function can be supplied to customize the sort order, and the
    reverse flag can be set to request the result in descending order.



In [38]:
sorted(s)

[-100, -100, 0, 0, 0, 0, 0, 0, 0, 0, 2, 2, 3, 3, 4, 4, 5, 5, 6, 6, 7, 7, 8, 8]

# `tuple` (元组)

元组和列表一样，都是容器型的数据结构，且都是序列，所以容器中的元素都是按照索引位置有序存放的。

不同的是，元组是不可变序列，无法原处修改，意味着修改元组必须创建新的元组对象。

![](files/tuple_m1.png)

## 创建元组

### 小括号 `()`

In [39]:
T = (1111,2222,3333,4444)

### `tuple()`

In [40]:
T = tuple([1111, 2222, 3333, 4444])

### 其它

需要注意的是，python中很多地方隐式地自动构造元组。它的隐式构造规则是这样的：如果没有指定括号，又有多个值，那么就使用元组作为容器。

In [41]:
1

1

In [42]:
1,2

(1, 2)

In [43]:
1,

(1,)

## 操作元组

元组是不可变对象，所以修改元组数据会报错。也就是说，元组中的保存的引用地址是不可变的。

In [44]:
T[0] = -111

TypeError: 'tuple' object does not support item assignment

序列的通用操作元组都可以使用，不可变序列意味着那些序列的修改行为都不能用

**索引、切片**

In [48]:
T[0]

1111

In [49]:
T[1:]

(2222, 3333, 4444)

**支持`+, *`符号操作**

In [45]:
T1 = ('a','b','c')

In [46]:
T + T1

(1111, 2222, 3333, 4444, 'a', 'b', 'c')

**二元赋值`+=`**

In [47]:
T1 = (1,2,3)
T2 = (4,5,6)

T1 += T2
T1 

(1, 2, 3, 4, 5, 6)

# `dict` (字典)

字典(dict)是存储key/value数据的容器，也就是所谓的map、hash、关联数组。无论是什么称呼，都是键值对存储的方式。

## 创建字典

### 大括号`{}`

In [58]:
D = {"key1": "value1",
     "key2": "value2",
     "key3": "value3"}

D

{'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}

In [60]:
D['key4'] = 'value4'

D

{'key1': 'value1', 'key2': 'value2', 'key3': 'value3', 'key4': 'value4'}

### `dict()`

In [61]:
a = dict(one=1, two=2, three=3)

a

{'one': 1, 'two': 2, 'three': 3}

In [62]:
dict([('two', 2), ('one', 1), ('three', 3)])

{'two': 2, 'one': 1, 'three': 3}

In [63]:
dict({'three': 3, 'one': 1, 'two': 2})

{'three': 3, 'one': 1, 'two': 2}

In [64]:
dict([('two', 2), ('one', 1), ('three', 3)], four=4, five=5)

{'two': 2, 'one': 1, 'three': 3, 'four': 4, 'five': 5}

### `dict.copy()`

In [65]:
d = {'one': 1, 'two': 2, 'three': 3, 'four': 4}

d.copy()

{'one': 1, 'two': 2, 'three': 3, 'four': 4}

## 操作字典

### 检索

In [66]:
d["one"]

1

In [68]:
d["four"] = -4

d

{'one': 1, 'two': 2, 'three': 3, 'four': -4}

In [69]:
d["ten"]

KeyError: 'ten'

对于dict类型，检索不存在的key时会报错。但如果自己去定义dict的子类，那么可以自己重写`__missing__()`方法来决定检索的key不存在时的行为。例如，对于不存在的键总是返回None。

In [70]:
class mydict(dict):
    def __missing__(self, key):
        return None

In [72]:
dd = mydict(d)

dd

{'one': 1, 'two': 2, 'three': 3, 'four': -4}

In [74]:
print(dd["ten"])

None


`get(key,default)`方法检索dict中的元素，如果元素存在，则返回对应的value，否则返回指定的default值，如果没有指定default，且检索的key又不存在，则返回None。这正好是上面自定义dict子类的功能。

In [75]:
d.get("two")

2

In [76]:
d.get("six","not exists")

'not exists'

`len()`函数可以用来查看字典有多少个元素：

In [77]:
len(d)

4

### 删除

`del D[KEY]`可以用来根据key删除字典D中给定的元素，如果元素不存在则报错。

In [78]:
d

{'one': 1, 'two': 2, 'three': 3, 'four': -4}

In [79]:
del d["four"]

d

{'one': 1, 'two': 2, 'three': 3}

In [80]:
del d["five"]

KeyError: 'five'

`pop(key,default)`用来移除给定的元素并返回移除的元素。但如果元素不存在，则返回default，如果不存在且没有给定default，则报错。

In [81]:
d.pop("one")

1

In [83]:
d.pop("five")

KeyError: 'five'

In [82]:
d.pop("five","hello world")

'hello world'

`clear()`方法用来删除字典中所有元素。

In [85]:
d.clear()

d

{}

### 视图

- `keys()`:返回字典中所有的key组成的视图对象；

In [86]:
d = {'three': 3, 'four': 4, 'two': 2, 'one': 1}

In [87]:
d.keys()

dict_keys(['three', 'four', 'two', 'one'])

In [88]:
list(d.keys())

['three', 'four', 'two', 'one']

In [92]:
for i in d.keys():
    print(i)

three
four
two
one


- `values()`: 返回字典中所有value组成的视图对象；

In [89]:
d.values()

dict_values([3, 4, 2, 1])

In [93]:
for i in d.values():
    print(i)

3
4
2
1


- `items()`: 返回字典中所有(key,value)元组对组成的视图对象；

In [91]:
d.items()

dict_items([('three', 3), ('four', 4), ('two', 2), ('one', 1)])

In [94]:
for (key,value) in d.items():
    print(key,"-->",value)

three --> 3
four --> 4
two --> 2
one --> 1
