# Collections
- built-in collections包括：
  - **string**: <font color=orange>**immutable**</font> character <font color=norange>**sequence**</font>
  - **list**: <font color=norange>**sequence**</font> of anything
  - **tuple**: <font color=orange>**immutable**</font> <font color=norange>**sequence**</font> of anything
  - **dictionary**: <font color=purple>**unordered**</font>  mapping table of anything
  - **set**: <font color=green>**unique**</font> <font color=purple>**unordered**</font> collection of <font color=orange>**immutable**</font> elements
## I. collection的性质
### I.1 collections的不同类型
- ordered or not: 
  - ordered,也就是sequence: sequence是positionally ordered collection of other objects.
    - 包括：<font color=orange>**string, list, tuple**</font>
    - 他们都支持sequence操作，都是access by offset
  - unordered: index必须hashable才能进行高效search
    - <font color=orange>**set**</font>：元素本身immutable，所以用元素本身来做hash
    - dictionary：key必须immutable，用key做hash
- mutable or not: 
  - mutable：object value可以发生in-place change
    - <font color=orange>**list，dictionary，set**</font>(注意set本身mutable)
      - 注：dictionary本身mutable，但是每个item中的key必须是immutable object
  - immutable：object value不能发生in-place change，值的变化通过构造新的object来实现。<font color=red>所以这类object的method通常会返回新的object</font>
    - <font color=orange>**string，tuple**</font>
    - set的element必须是immutable类型的object
    - dictionary的key必须是immutable类型的object

### I.2 sequence的operation
- sequence的操作建立在collection elements之间的position ordering关系上，包括：
  - <font color=blue>**length**</font>:<code>len(s)</code>
  - <font color=blue>**indexing and slicing**</font>: <code>s[i], s[i:j]</code>
  - <font color=blue>**concatenation**</font>: <code>s1 + s2</code>
  - <font color=blue>**repetition**</font>: <code>s * 3</code>

## II. Lists
### II.1 基本特征
1. list是ordered collections of arbitrary objects。
2. 本质上是arrays of object references
3. 是sequence，因此适用所有的sequence operation
4. access by offset

### II.2 构造list
1. 用<code>list()</code>function
   - 此时只接受1个string作为argument
   - 如果要构建多个元素的list对象，那么argument要用<code>(),或者[],或者{}</code>合并成一个参数
2. 用<code>[literal, literal, ...]</code>
3. list comprehension

In [3]:
list('hello'), ['hello'] # 注意这两种方式的结果不一样

(['h', 'e', 'l', 'l', 'o'], ['hello'])

In [8]:
# 下面两种情况都会报错！！！ TypeError: list expected at most 1 argument, got 2
# list('span', 'world')  
# list(1, 2, 3)
list(['span', 'world'])  

['span', 'world']

In [10]:
list("'span', 'world'")  

["'", 's', 'p', 'a', 'n', "'", ',', ' ', "'", 'w', 'o', 'r', 'l', 'd', "'"]

### II.3 indexing和slicing
1. indexing略
2. slice assignment
   - 可以简单理解成先delete，再insert，但实际上python implement该操作的方式不是这样
   - <font color=red>尽量不用slice assignment，因为含义很容易混淆</font>
   - <font color=green>如果要调整元素值，最好的方式是用method</font>

In [11]:
x = [1, 2, 3]
x[1:1] = [6, 7] # 实现insert两个元素
x

[1, 6, 7, 2, 3]

In [12]:
x[1:2] = [] # 实现delete
x

[1, 7, 2, 3]

### II.4 list methods
- 基本都执行in-place操作
#### 1. 增加元素：append，extend，insert
- append参数是元素，只接受1个argument
- extend的参数是list，只接受1个argument，处理对象是list参数中的元素
- insert接受两个参数，1个是插入对象的位置，1个是插入的对象。处理的对象是整个argument，而不是其元素

In [36]:
x = ['hello', 'world', 'learn']
x.append('love')
x

['hello', 'world', 'learn', 'love']

In [37]:
x.extend(['element1', 'element2'])
x

['hello', 'world', 'learn', 'love', 'element1', 'element2']

In [38]:
x.insert(1, ['whole', 'list'])
x

['hello', ['whole', 'list'], 'world', 'learn', 'love', 'element1', 'element2']

#### 2. 减少元素：pop，remove
- pop(index)： delete by position
  - 参数是index integar，如果没有参数，默认删除最后一个元素
  - 返回值是被删除的元素
- remove(value)： delete by value
  - 参数是要删除的目标元素值
  - 返回None
- 这两个method都只能删除单个元素，如果要删除多个元素，用built-in function: del

In [39]:
x.pop(), x

('element2',
 ['hello', ['whole', 'list'], 'world', 'learn', 'love', 'element1'])

In [40]:
x.remove('hello'), x

(None, [['whole', 'list'], 'world', 'learn', 'love', 'element1'])

In [41]:
del x[0:2]
x

['learn', 'love', 'element1']

#### 3. 排序：sort，reverse
- sort(key=arg, reverse=True)
  - python中有等价的built-in函数sort(list_name, key=arg, reverse=True)
- reverse()
  - python中有等价的built-in函数reverse(list_name)

In [43]:
x.sort(key=str.lower, reverse=False)
print(x)
x.sort(key=len)
print(x)

['element1', 'learn', 'love']
['love', 'learn', 'element1']


#### 4. 统计
- count(value),统计元素值在list中出现的次数

## III. Dictionaries
### III. 1基本特征
1. list是unordered collections of arbitrary objects。
2. 本质上是unordered tables of object references。在python内部implement dict的方式是用hash table。也因此<font color=blue>key必须是immutable objects</font>。它们的value必须是hashable的，所以不能变化，不然就无法作为fixed keys。
3. 不是sequence，因此不适用sequence operation。<font color=orange>sequence操作（如，concatenation，slicing）要依赖固定的position order来完成。这对于unordered collections就没有意义。</font>
4. access by key，这点和list中不同，list是by offset

### III. 2 构造dictionary的三种方式
1. 用<code>dict()</code>function，有多种形式
   - <code>dict(zip(x, y))</code>
   - <code>dict([(k1,v1), (k2,v2), ...])</code>
2. 用<code>{k1:v1, k2:v2,...}</code>
3. 用dictionary comprehension:<code>{key: v for key, v in zip(x, y)}</code>

In [67]:
x = list('abc')
y = [1, 2, 3]
d1 = dict(zip(x, y))
d2 = {key:v for key, v in zip(x, y)}
print(d1)
print(d2)

{'a': 1, 'b': 2, 'c': 3}
{'a': 1, 'b': 2, 'c': 3}


## IV. Tuples
### IV. 1 基本特征
1. sequence of arbitrary objects.
2. 本质上是arrays of object reference
3. 和string一样，tuple object一旦创建后长度不变，各个元素对应的target object固定。但是和string不一样的是，tuple中的元素可以是任意类型。因此尽管tuple的长度和对应的object都固定，如果object本身是mutable的，那么这个object的value却可以改变。
   - <font color=blue>因为tuple一旦创建后element不变，所以它没有自带的<code>t.sort() </code>method</font>。如果要sort，就用python的built-in function：sort(t)，此时会返回一个新的object

In [53]:
a = [0, 2, 3]
t = (a, 2)     # t的第一个元素和a share reference，这里没有copy发生
print(t)
t[0][1] = 999
print(t)

([0, 2, 3], 2)
([0, 999, 3], 2)


In [54]:
a[2] = 7      # 只要a还refer到原来的object，就会同时改变t中的值
print(t)

([0, 999, 7], 2)


In [55]:
a = 'hello'  # a如果重新refer到了别的object，t中的元素的refer对象不会跟着变化
print(t)

([0, 999, 7], 2)


### IV. 2 构造tuple的三种方式
1. 用<code>tuple()</code>function
2. 用<code>(e1, e2, e3, ...)</code>
3. 用comprehension:<code>(func(i) for i in ...)</code>

In [68]:
a = tuple('hello')  # 和list相似，会切string的element，因为string是sequence
print(a)

('h', 'e', 'l', 'l', 'o')
