# Python中的数据结构（三）
Python中常见的数据结构有六种，包括：Number(数值), String(字符串), List(列表), Tuple(元组), Dictionary(字典), Set(集合)

|      | 有序 | 无序 |
| ---- | ---- | ---- |
| 可变 | List | Dictionary, Set |
| 不可变 | String, Tuple | Number|

## 3.Dictionary 与 Set

In [12]:
# Python3 - Dictionary(字典)：Dictionary(字典)在其他语言中也称为map，使用键-值（key-value）存储，具有极快的查找速度。
# 字典是无序的。字典的键是不可变且唯一的，因此可以使用字符串、整数等不可变的数据类型作为key；字典的值可以是任意类型。
names = {'Michael': 95, "Tracy": 85, "Bob": 75}
print("names['Michael'] = ", names['Michael'])

names['Adam'] = 90
names['Adam'] = 88          # 多次对一个key放入不同的value，后面的值会把前面的值冲掉
print("names['Adam'] = ", names['Adam'])

# dict有以下几个特点：
# 1)查找和插入的速度极快，不会随着key的增加而变慢；
# 2)需要占用大量的内存，内存浪费多。

# list与dict相反：
# 1)查找和插入的时间随着元素的增加而增加；
# 2)占用空间小，浪费内存很少。

names['Michael'] =  95
names['Adam'] =  88


In [6]:
# 字典的常用操作
d = {1:'one',2:'two',3:'three'}
print("dict.get(3) = ", d.get(3))           # 根据键获取值
print("dict.get(3) = ", d.get(7))           # 根据键获取值，键不存在时返回默认值
print("dict.items() = ", d.items())         # 返回一个包含所有（键,值）元组的列表
print("dict.keys() = ", d.keys())           # 返回一个所有键组成的列表
print("dict.values() = ", d.values())       # 返回一个所有值组成的列表
d[4] = 'four'                               # 直接通过赋值的方式增加键值对
print("d = ", d)                            
d[4] = 'IV'                                 # 增加键值对时，如果key已存在，则修改现有key的值
print("d = ", d)                            
d2 = {1:'I',2:'II',3:'III',5:'V'}
d.update(d2)                                # 使用字典d2对字典d进行更新，如果d2中的key不存在，则新增到d中
print("d.update(d2) = ", d)      
d.pop(4)                                    # 删除key及对应的值
print("d.pop(4) = ", d)                     
d.popitem()                                 # 随机删除一个键值对
print("d.popitem() = ", d)
d.clear()                                   # 清空字典。删除字典中的数据，但该字典并未删除。
print("d.clear() = ", d)

# dir：查看对象的内置方法和属性
dir(d)

dict.get(3) =  three
dict.get(3) =  None
dict.items() =  dict_items([(1, 'one'), (2, 'two'), (3, 'three')])
dict.keys() =  dict_keys([1, 2, 3])
dict.values() =  dict_values(['one', 'two', 'three'])
d =  {1: 'one', 2: 'two', 3: 'three', 4: 'four'}
d =  {1: 'one', 2: 'two', 3: 'three', 4: 'IV'}
d.update(d2) =  {1: 'I', 2: 'II', 3: 'III', 4: 'IV', 5: 'V'}
d.pop(4) =  {1: 'I', 2: 'II', 3: 'III', 5: 'V'}
d.popitem() =  {1: 'I', 2: 'II', 3: 'III'}
d.clear() =  {}


['__class__',
 '__contains__',
 '__delattr__',
 '__delitem__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__getitem__',
 '__gt__',
 '__hash__',
 '__init__',
 '__init_subclass__',
 '__iter__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__reversed__',
 '__setattr__',
 '__setitem__',
 '__sizeof__',
 '__str__',
 '__subclasshook__',
 'clear',
 'copy',
 'fromkeys',
 'get',
 'items',
 'keys',
 'pop',
 'popitem',
 'setdefault',
 'update',
 'values']

In [23]:
# Python3 - Set(集合)：集合中的元素是唯一的，重复的元素会被删除。


# 集合可以看成数学意义上的无序和无重复元素的集合，因此可以对两个集合可以做数学意义上的交集、并集等操作
s1 = set([1, 2, 3])
s2 = set([2, 3, 4])
print(s1 & s2)          # 输出两个集合相同的元素，即取s1与s2的交集
print(s1 ^ s2)          # 输出两个集合不同的元素
print(s1 | s2)          # 输出两个集合全部的元素（重复的删除），即取s1与s2的并集
print(s1 - s2)          # 输出集合s1包含，而集合s2中不包含的元素

{2, 3}
{1, 4}
{1, 2, 3, 4}
{1}


In [5]:
# 集合的常用操作
l = [7, 1, 3, 5, 4, 2, 9, 6, 8]     # 列表l是有序排列的
s3 = set(l)                         # 集合s3是无序的
s3.add(7)                           # 添加元素，如果元素已存在，则不会进行任何操作
print("s3.add(7) = ", s3)
s3.add(0)                           # 添加元素后，s3是无序的，自动排序的是其中的列表l
print("s3.add(0) = ", s3)
s3.update({3,10})                   # 添加对象可以是列表、字典等，且可以是多个，用逗号隔开
print("s3.update({3,10}) = ", s3)   
s3.remove(4)                        # 移除元素，如果元素不存在时会报错
print("s3.remove(4) = ", s3)        
s3.discard(2)                       # 删除元素，如果元素不存在时会报错
print("s3.discard(2) = ", s3)
s3.pop()                            # 随机删除一个元素
print("s3.pop() = ", s3)
s3.clear()                          # 清空集合。只清空集合中的数据，但该集合s3并未删除。
print("s3.clear() = ", s3)

# dir：查看对象的内置方法和属性
dir(s3)

# set和dict的唯一区别仅在于没有存储对应的value。
# 但是，set的原理和dict一样，所以，同样不可以放入可变对象，因为无法判断两个可变对象是否相等，也就无法保证set内部“不会有重复元素”。

s3.add(7) =  {1, 2, 3, 4, 5, 6, 7, 8, 9}
s3.add(0) =  {0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
s3.update({3,10}) =  {0, 1, 2, 3, 4, 5, 6, 7, 8, 9, 10}
s3.remove(4) =  {0, 1, 2, 3, 5, 6, 7, 8, 9, 10}
s3.discard(2) =  {0, 1, 3, 5, 6, 7, 8, 9, 10}
s3.pop() =  {1, 3, 5, 6, 7, 8, 9, 10}
s3.clear() =  set()


['__and__',
 '__class__',
 '__contains__',
 '__delattr__',
 '__dir__',
 '__doc__',
 '__eq__',
 '__format__',
 '__ge__',
 '__getattribute__',
 '__gt__',
 '__hash__',
 '__iand__',
 '__init__',
 '__init_subclass__',
 '__ior__',
 '__isub__',
 '__iter__',
 '__ixor__',
 '__le__',
 '__len__',
 '__lt__',
 '__ne__',
 '__new__',
 '__or__',
 '__rand__',
 '__reduce__',
 '__reduce_ex__',
 '__repr__',
 '__ror__',
 '__rsub__',
 '__rxor__',
 '__setattr__',
 '__sizeof__',
 '__str__',
 '__sub__',
 '__subclasshook__',
 '__xor__',
 'add',
 'clear',
 'copy',
 'difference',
 'difference_update',
 'discard',
 'intersection',
 'intersection_update',
 'isdisjoint',
 'issubset',
 'issuperset',
 'pop',
 'remove',
 'symmetric_difference',
 'symmetric_difference_update',
 'union',
 'update']

In [4]:
# 赋值、浅拷贝、深拷贝
a = ['a','b',['c','d']]
b = a                       # 赋值，两个变量通知指向了列表的内存地址
c = a.copy()                # 浅拷贝，复制a中列表数据的表面数据，里面嵌套结构的数据依然只是地址引用
import copy
e = copy.deepcopy(a)        # 深拷贝，完全的数据拷贝