# 字典
通过名称来访问各个值的数据结构，这种数据结构称为映射。字典是Python中唯一的内置映射类型。

## 1.字典的创建和删除

### 创建字典

In [3]:
word = {'che':'车','chen':'尘','cheng':'称','chi':'吃'} #定义一个字典
print(word)

{'che': '车', 'chen': '尘', 'cheng': '称', 'chi': '吃'}


In [None]:
#方法二：从列表转换成字典
key =['che','chen','cheng','chi'] #音节索引列表
value = ['车','尘','称','吃']  #汉字列表
zipl = zip(key,value) #转换为zip对象（将可迭代的对象作为参数，将对象中对应的元素打包成一个个元祖，然后返回由这些元组组成的列表）
word_2 = dict(zipl) #转换为字典
print(word_2)

In [9]:
key_2 = ('che','chen','cheng','chi') #如果键是元祖，也可以创建字典
word_3 = {key_2:value}
print(word_3)

{('che', 'chen', 'cheng', 'chi'): ['车', '尘', '称', '吃']}


In [10]:
# 方法三
word_4 = dict(che='车',chen='尘',cheng='称',chi='吃')
print(word_4)

{'che': '车', 'chen': '尘', 'cheng': '称', 'chi': '吃'}


In [12]:
#创建空字典
word_none = {}
word_none = dict()
print(word_none)

{}


In [17]:
#创建值为空的字典:fromkeys
word_5 = dict.fromkeys(key)
print(word_5)

{'che': None, 'chen': None, 'cheng': None, 'chi': None}


### 删除字典

In [18]:
#del word_5 #删除整个字典
#print(word_5)

In [19]:
word_5.clear() #清空字典里的元素
print(word_5)

{}


## 2.通过键值对访问字典

In [51]:
print(word["che"])  #通过键获取相对应的值

车


In [21]:
print(word["che"] if "che" in word else "我的字典里没有这个字")

车


In [22]:
print(word.get("che")) #dictionary.get(key,[default])

车


In [115]:
print(word.get("ch","查无此字"))

查无此字


In [29]:
English = ['car','dust','call','eat']  #对应的英文
value_dict = dict(zip(value,English)) #转换为字典
print("che对应的中文是",word.get("che")) #获取对应的中文
print("对应的英文是",value_dict.get(word.get("che"))) #输出对应的英文

che对应的中文是 车
对应的英文是 car


## 3.遍历字典

In [30]:
word.items() #输出的是一个列表，元素是元祖

dict_items([('che', '车'), ('chen', '尘'), ('cheng', '称'), ('chi', '吃')])

In [31]:
for item in word.items():
    print(item) #得到元祖

('che', '车')
('chen', '尘')
('cheng', '称')
('chi', '吃')


In [32]:
for key,value in word.items():
    print(key,"的汉字是",value) #得到具体的键和值

che 的汉字是 车
chen 的汉字是 尘
cheng 的汉字是 称
chi 的汉字是 吃


In [33]:
for key in word.keys():
    print(key)   #得到所有键

che
chen
cheng
chi


### 例子：发工资

In [44]:
salary = {'大娃':350,'二娃':300,'三娃':250,'四娃':300}
workday = {'大娃':6,'二娃':4,'三娃':5,'四娃':5}

In [117]:
paid = 0
for i in salary:
    print(salary[i]*workday[i])
    paid = paid + (salary[i]*workday[i])
print(paid)

2100
1200
1250
1500
6050


## 4.添加、修改和删除字典元素

In [35]:
word["cha"] = "差"  #添加一个元素
print(word)

{'che': '车', 'chen': '尘', 'cheng': '称', 'chi': '吃', 'cha': '差'}


In [36]:
word["cha"] = "茶"  #若添加的元素已经存在，就会修改原有元素
print(word)

{'che': '车', 'chen': '尘', 'cheng': '称', 'chi': '吃', 'cha': '茶'}


In [37]:
del word["cha"] #删除元素
print(word)

{'che': '车', 'chen': '尘', 'cheng': '称', 'chi': '吃'}


## 5.字典推导式

In [118]:
#生成随机数
import random
randomdict = {i:random.randint(10,100) for i in range(1,5)}
print(randomdict)

{1: 19, 2: 77, 3: 58, 4: 59}


In [86]:
key =['che','chen','cheng','chi'] #音节索引列表
value = ['车','尘','称','吃']  #汉字列表
word_6 = {i:j for i,j in zip(key,value)} #通过字典推导式生成字典
print(word_6) 

{'che': '车', 'chen': '尘', 'cheng': '称', 'chi': '吃'}


### 实战
有三名候选人分别叫"Li"、"Zhang"、"Sun"，有10名选民，每位选民投一票。
要求：统计每位候选人的票数
输入：Li Li Li Zhang Sun Sun Zhang Zhang Zhang Zhang

In [62]:
dic = {"Li":0,"Zhang":0,"Sun":0}
x = input().split()
for t in x:
    dic[t] += 1
print("Li",dic["Li"])
print("Zhang",dic["Zhang"])
print("Sun",dic["Sun"])

Li Li Li Zhang Sun Sun Zhang Zhang Zhang Zhang
Li 3
Zhang 5
Sun 2


## 6.字典嵌套

### 字典存储在列表中——字典列表

In [93]:
person_1 = {'name':'Zhangsan','age':18}
person_2 = {'name':'lisi','age':19}
person_3 = {'name':'wangwu','age':18}

In [94]:
persons = [person_1,person_2,person_3]  #存储在列表中

In [95]:
for person in persons:  
    print(person)

{'name': 'Zhangsan', 'age': 18}
{'name': 'lisi', 'age': 19}
{'name': 'wangwu', 'age': 18}


### 在字典中存储列表

In [96]:
person = {'name':'lisi','cities':['xian','hefei','fuzhou']}

In [97]:
for city in person['cities']:
    print(city)

xian
hefei
fuzhou


### 在字典中存储字典

In [100]:
users = {'zhangsan':
         {'first':'xian','second':'luoyang'},
         'lisi':
         {'first':'suzhou','second':'wuxi'}
        }

In [101]:
for name, infor in users.items():
    print('name:',name)
    print('cities:',infor['first'])

name: zhangsan
cities: xian
name: lisi
cities: suzhou


# 集合

集合是一个**无序、不重复**的元素序列，一般用于元祖或者列表中的元素去重。
创建集合：
- 1.变量名=set(元素) 字符串/列表/元祖/字典
- 2.变量名={元素，元素，元素，，，} 数字/元祖/字符串

### 集合的创建和数据去重

In [54]:
#字符串
a = set("1234")
print(a)

{'4', '1', '3', '2'}


In [55]:
#列表
b = set([10,20,30])
print(b)

{10, 20, 30}


In [56]:
#元祖
c = set((1,2,3,4))
print(c)

{1, 2, 3, 4}


In [58]:
#用大括号创建集合
aa = {1,2,3,(1,2,3),"123"}
print(aa)

{1, 2, 3, (1, 2, 3), '123'}


In [59]:
bb = {[1,2,3]}
print(bb)  #列表 用大括号创建集合不可行

TypeError: unhashable type: 'list'

In [60]:
cc = {word}
print(cc)   #字典 用大括号创建集合不可行

TypeError: unhashable type: 'dict'

In [102]:
a = {} #是集合还是字典？
print(type(a))  #创建一个空集合必须用set()

<class 'dict'>


### 集合的唯一性

In [103]:
#列表的去重，如果不用集合要怎么操作？
list_1 = set([1,2,3,4,5,6,3,2])
temp = []
for i in list_1:
    if i not in temp:
        temp.append(i)
print(temp)

[1, 2, 3, 4, 5, 6]


In [106]:
#运用集合的唯一性完成列表的去重
temp = list(set(list_1))
print(temp)  

[1, 2, 3, 4, 5, 6]


### 集合的无序性

In [109]:
print(set(list_1)[1])  #不能通过下标索引取值

TypeError: 'set' object is not subscriptable

### 查：访问集合中的元素

In [110]:
# 1.for循环
set_1 = {1,2,3,4,5,6}
for i in set_1:
    print(i)

1
2
3
4
5
6


In [None]:
# 2.运算符：in 和 not in

In [111]:
print(6 in set_1)
print(7 in set_1)

True
False


### 增：集合添加元素
- 1.add()
- 2.update 将集合合并

In [None]:
#add
a = {1,2,3}
a.add((1,2,3))
print(a)

In [65]:
#update
b = {"w","y"}
a.update(b)
print(a) #集合的排列是随机的

{1, 2, 3, 'y', 'w', (1, 2, 3)}


### 删：集合删除元素
- 1.remove：删除集合中的元素，如果元素不存在会报错
- 2.pop：随机删除集合中的元素
- 3.discard：如果元素不存在，不做任何操作

In [66]:
a.remove("w")
print(a)

{1, 2, 3, 'y', (1, 2, 3)}


In [71]:
a.pop()
print(a) #随机删除

{3, 'y', (1, 2, 3)}


In [72]:
a.discard("s")
print(a) #如果删除的元素不存在，不会像remove一样报错

{3, 'y', (1, 2, 3)}


### 集合的运算
- 1.交集：使用“&”连接多个集合，得到相同元素
- 2.并集：使用“｜”连接多个集合，得到集合的全部数据
- 3.差集：使用"-"

In [112]:
s1 = {1,2,3,5}
s2 = {1,2,6,7}
s3 = s1&s2
s4 = s1|s2
print('交集是',s3,"\n",'并集是',s4,"\n",'差集是',s1-s2)

交集是 {1, 2} 
 并集是 {1, 2, 3, 5, 6, 7} 
 差集是 {3, 5}


### 集合生成式

In [90]:
s5={i for i in range(10)}
print(s5)
s6={i for i in range(10) if i%2==0}
print(s6)

{0, 1, 2, 3, 4, 5, 6, 7, 8, 9}
{0, 2, 4, 6, 8}


In [91]:
print(s6.issubset(s5))  #查看一个集合是否为另一个集合的子集

True


### 可变集合和不可变集合
集合分为两类：**可变集合**（set），**不可变集合**（frozenset）。
不可变集合，由于其不可变特性，也可以作为一个元素被其他集合使用，或者作为字典的键。

In [113]:
set_0 = frozenset([1,2,3,4,5,6])
set_0.add(7)
print(set_0) #不可变集合，增加或删除数据，都会报错

AttributeError: 'frozenset' object has no attribute 'add'

### 总结：字典和集合的高效性——内部的哈希表存储结构
字典和集合通常运用在对元素的高效查找、去重等场景。字典和集合能够如此高效，与字典、集合内部的数据结构密不可分。不同于其他数据结构，字典和集合的内部结构都是一张哈希表。

In [114]:
workday = {'大娃':6,'二娃':4,'三娃':5,'四娃':5}

字典的每个key都要先经过hash生成一段固定长度的hash值，这些数字按大小排序好放在一个列表kd里，当我们想查找”大娃”的信息时， 会把“大娃”先hash, 得到对应的值（99），然后拿这个值去到kd列表里找。只要找到了99的位置，就可以定位到大娃对应的value的值了。