# 字典(dict)
 2020.03.04 reviewed,  2020.06.19 reviewed,  

* 在 Python 中， **字典** 是用放在花括号 {} 中的一系列的  **键—值** 对。
* 每个 **键** 都与一个值相关联，你可以使用键来访问与之相关联的值。与键相关联的值可以是数字、字符串、列表乃至字典。事实上，可将任何 Python 对象用作字典中的值。

## 字典的创建  

### 最直接的创建方式是使用花括号将键-值对罗列出来.

In [1]:
p1={'name':'张三','age':'23','gender':'male'}
p1

{'name': '张三', 'age': '23', 'gender': 'male'}

In [2]:
p2={'name':'李四','age':'28','gender':'female'}
p2

{'name': '李四', 'age': '28', 'gender': 'female'}

In [3]:
p3={'name':'王五','age':31,'gender':'male'}
p3

{'name': '王五', 'age': 31, 'gender': 'male'}

* 构造字典时, 字典的键必须是可 hash 的类型          
不能是字典,但字典的值可以是另一个字典--字典可以嵌套,但只能在值处嵌套


In [4]:
# 构造字典时, 字典的键必须是可 hash 的类型,不能是字典,但字典的值可以是另一个字典--字典可以嵌套,但只能在值处嵌套
person={'p1':p1,'p2':p2,'p3':p3}
person

{'p1': {'name': '张三', 'age': '23', 'gender': 'male'},
 'p2': {'name': '李四', 'age': '28', 'gender': 'female'},
 'p3': {'name': '王五', 'age': 31, 'gender': 'male'}}

* 字典的键必须是可哈希的

In [5]:
# dict 不能做为字典的键
{p1:'p1',p2:'p2'} # TypeError: unhashable type: 'dict'

TypeError: unhashable type: 'dict'

In [6]:
# list 不能作为字典的键
{[1,2]:1,[2,3,4]:2} # TypeError: unhashable type: 'list'

TypeError: unhashable type: 'list'

In [7]:
# set 不能作为字典的键
{set([1,2]):1,set([2,3,4]):2} # TypeError: unhashable type: 'set'

TypeError: unhashable type: 'set'

可以看到, set、list、dict 三个类型是不可哈希的.    
关于 unhashable, 可参考 https://www.jianshu.com/p/56e4481da40b    
除了上述三种类型, Python中的 int, float, srt, tuple, object 类型都是可以哈希的.

In [8]:
import sys

def check_hash(x):
    if x.__hash__ is not None:
        print(type(x), 'hashable:', hash(x))
        return True
    else:
        print(type(x), 'unhashable')
        return False

# int
i = 5
check_hash(i)

# float
f = 0.5
check_hash(f)
# string
s = "hello"
check_hash(s)
# unicode
u = u"中国"
check_hash(u)
# tuple
t = (i, f, s, u)
check_hash(t)
# object
o = object()
check_hash(o)

# list
l1 = [i, f, s, u]
check_hash(l1)
# set
s1 = {i, f, s, u}
check_hash(s1)
# dict
d1 = {s: i, u: f}
check_hash(d1)

<class 'int'> hashable: 5
<class 'float'> hashable: 1152921504606846976
<class 'str'> hashable: 1485763911741291028
<class 'str'> hashable: 4535605330420521097
<class 'tuple'> hashable: -3706985089040501555
<class 'object'> hashable: 4359856
<class 'list'> unhashable
<class 'set'> unhashable
<class 'dict'> unhashable


False

### 从tuple/list使用dict函数创建字典
由于字典是由键值对组成的, 所以自然可以从满足某种要求的二元组的序列来创建.

* 使用dict函数从(由二元序列构成的)序列创建字典

In [9]:
# 从 tuple of (二元)tuple 构造字典
temp = dict((('name', 'xiaoming'), ('age', 18)))
temp

{'name': 'xiaoming', 'age': 18}

In [10]:
# 从tuple of (二元)list 构造字典
temp = dict((['name', 'xiaoming'], ['age', 18]))
temp

{'name': 'xiaoming', 'age': 18}

* 从嵌套list 构造 dict

In [11]:
# 从list of (二元)list 构造字典
temp = dict([['name', 'xiaoming'], ['age', 18]])
temp

{'name': 'xiaoming', 'age': 18}

In [12]:
new_list= [['key1','value1'],['key2','value2'],['key3','value3']]
dict(new_list) 

{'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}

* 使用赋值法从嵌套list构造dict

In [13]:
new_list= [['key1','value1'],['key2','value2'],['key3','value3']]
new_dict = {}
for i in new_list:
    new_dict[i[0]] = i[1]    #字典赋值，左边为key，右边为value
new_dict

{'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}

* 使用推导式从list of list构建dict

In [14]:
new_list= [['key1','value1'],['key2','value2'],['key3','value3']]
new_dict = {k:v for k,v in new_list}
new_dict

{'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}

### 使用zip函数从两个list构造dict
 如果是要将两个等长的序列构造成字典,序列一作为字典的键,序列二作为字典的值, 可以使用 zip 函数先将两个序列"捆绑"起来再应用dict函数

In [15]:
k=['a','b','c']
v=[1,2,3]

In [16]:
# 不能从list直接创建字典,# AttributeError: 'dict' object attribute 'keys' is read-only
d={}
d.keys=k
d.values=v
# AttributeError: 'dict' object attribute 'keys' is read-only

AttributeError: 'dict' object attribute 'keys' is read-only

In [17]:
# 使用zip将两个序列绑定在一起, 得到的是一个 zip 对象
zip(k,v)
# 它是可迭代的.

<zip at 0x5424c08>

In [18]:
# 需要使用 zip 函数和 dict 函数
# zip将两个等长的 list 按元素对齐组成等长的 tuple
for item in zip(k,v):
    print(item)

('a', 1)
('b', 2)
('c', 3)


In [19]:
# 使用dict函数将zip函数的作用对象转为dict
dict_from_list = dict(zip(k,v))
dict_from_list

{'a': 1, 'b': 2, 'c': 3}

In [20]:
# 思考以下两行构造方法为什么不成功?
#dict([k,v]) # ValueError: dictionary update sequence element #0 has length 3; 2 is required
#dict([['a','b','c'], [1,2,3]]) # ValueError: dictionary update sequence element #0 has length 3; 2 is required
dict([[k[i],v[i]] for i in range(len(k)) ])
# 注意,从嵌套的列表(或元组)构造 dict 时, 必须保证内层的 list(tuple) 是包含两个元素的, 并且由于第一个元素会被用作键, 所有的第一个元素还必须是可哈希的.

{'a': 1, 'b': 2, 'c': 3}

In [21]:
# 如果zip的两个序列不等长--就按较短的来匹配
for itm in zip([1,2,3,4],['a','b','c']):
    print(itm)

(1, 'a')
(2, 'b')
(3, 'c')


* 注意:zip两个序列的时候,是按位置索引来对齐的

### 读取json文件为dict   
json格式的文件可以直接被读取为字典. 后边会进一步补充学习json的相关操作.

In [22]:
# 读取本地 json 文件
import json
with open(r"D:\Py\note\data\mchar_val.json") as jsonfile:
    json_dict = json.load(jsonfile)

In [23]:
type(json_dict)

dict

In [26]:
# json_dict #原始文件较大
del json_dict

* json 格式被广泛用于web数据交互, 因此也可以直接从web API读取到.

In [31]:
# 使用request库读取json
import requests
url = 'http://api.openweathermap.org/data/2.5/onecall?lat=30.489772&lon=-99.771335&units=metric'
resp = requests.get(url)
data = resp.json()
type(data)

dict

In [33]:
data

{'cod': 401,
 'message': 'Invalid API key. Please see http://openweathermap.org/faq#error401 for more info.'}

* 其他构造字典的方法待补充

## 字典的调用

* 调用字典的键

In [34]:
p1.keys()

dict_keys(['name', 'age', 'gender'])

* 调用字典的值

In [35]:
p1.values()

dict_values(['张三', '23', 'male'])

* 调用字典的键-值对

In [36]:
p1.items()

dict_items([('name', '张三'), ('age', '23'), ('gender', 'male')])

* 通过字典的键调用相应的值.       
注意键为字符串时有引号.

In [37]:
p1['name']

'张三'

In [38]:
p1['age']

'23'

* 注意: 不能通过位置调用字典的键或值或键值对, 因为字典中的键值对是没有顺序的.

In [39]:
p1={'name':'张三','age':'23','gender':'male'}
p2={'name':'张三','gender':'male','age':'23'}

In [40]:
p1==p2
# 字典中的键值对是没有顺序区别的

True

## 修改字典

### 添加键值对
* 不同于不可修改的tuple, dict 是一种动态结构，可随时在其中添加键 — 值对。
* 要添加键-值对，可依次指定字典名、用方括号括起的键和相关联的值。

In [41]:
p1['phone']='13012345678'

In [42]:
p1

{'name': '张三', 'age': '23', 'gender': 'male', 'phone': '13012345678'}

In [43]:
# 添加的键值对,值可以是各种数据类型--但键必须是能够hash的,因此,list和dict不能作为键,但tuple可以作为键
p2={}
p2[1]=[1,2,3]
p2

{1: [1, 2, 3]}

In [45]:
p2[2]=[0,1,2,3]
p2

{1: [1, 2, 3], 2: [0, 1, 2, 3]}

In [47]:
# tuple 因为不可变,因此是可哈希的,因此可以用作字典的键
p2[(1,2)]=[0,1,2,3]
p2

{1: [1, 2, 3], 2: [0, 1, 2, 3], (1, 2): [0, 1, 2, 3]}

### 修改字典中的值
* 字典是可被修改的,不但可以增加键值对,还可以修改现有的键值对
* 修改方法类似于重新给一个变量赋值,通过给字典名和键赋值的方式修改字典中的值.

In [48]:
p1['phone']='85163742'

In [49]:
p1

{'name': '张三', 'age': '23', 'gender': 'male', 'phone': '85163742'}

* 字典中的键必须是唯一的    
如果在构建字典的时候, 键不唯一, 不会报错.

In [50]:
p2={'name':'张三','name':'李四','gender':'male','age':'23'}
p2
# 可以看到,name 键的值被位于后边的键值对修改了

{'name': '李四', 'gender': 'male', 'age': '23'}

In [51]:
p2={'name':'李四','name':'张三','gender':'male','age':'23'}
p2
# 可以看到,name 键的值被位于后边的键值对修改了

{'name': '张三', 'gender': 'male', 'age': '23'}

### 删除字典中的键值对
* 对于字典中不再需要的信息，可使用 del 语句将相应的键-值对彻底删除            
使用 del 语句时，必须指定字典名和要删除的键。

In [52]:
del p1['phone']

In [53]:
p1

{'name': '张三', 'age': '23', 'gender': 'male'}

In [54]:
# 字典的键和值都是一种数据类型
type(p2.values()),type(p2.keys())

(dict_values, dict_keys)

In [55]:
p2.values()

dict_values(['张三', 'male', '23'])

* 使用pop方法删除并使用字典中的键.           
字典也和列表一样,有pop方法. 但由于字典中的键值对没有顺序,因此必须传入一个键作为参数.

In [67]:
p2

{'name': '张三', 'gender': 'male', 'age': '23'}

In [68]:
p2.pop('name')

'张三'

In [69]:
p2

{'gender': 'male', 'age': '23'}

In [70]:
# 恢复p2
p2['name'] = '张三'
p2

{'gender': 'male', 'age': '23', 'name': '张三'}

### update 赋值
update方法既可以给字典添加新的键值对,也可以将原有的键对应的值修改为新的值.

In [56]:
# 创建空字典
#temp = {} #创建空字典方法 1
temp = dict() #创建空字典方法 2
temp

{}

In [57]:
# 通过为键赋值的方法构造字典内容
temp['name'] = 'xiaoming'# 赋值方法 1
temp.update(name= 'xiaoming') # 赋值方法 2--update属性函数 
temp.update({'name': 'xiaoming', 'age': 13}) # 给update方法传入字典
temp

{'name': 'xiaoming', 'age': 13}

In [58]:
# update 还可以用来合并两个字典--如果键有重复,会用参数 dict 更新调用 update 方法的dict
temp.update({'gender':'male','age':'12'}) # 赋值方法 2--update属性函数 
temp

{'name': 'xiaoming', 'age': '12', 'gender': 'male'}

In [59]:
temp.update??

[1;31mDocstring:[0m
D.update([E, ]**F) -> None.  Update D from dict/iterable E and F.
If E is present and has a .keys() method, then does:  for k in E: D[k] = E[k]
If E is present and lacks a .keys() method, then does:  for k, v in E: D[k] = v
In either case, this is followed by: for k in F:  D[k] = F[k]
[1;31mType:[0m      builtin_function_or_method


## 字典的遍历  

* 遍历所有的键 — 值对   
使用字典的items()属性方法,可以返回键值对元组构成的列表.

In [60]:
p2.items()

dict_items([('name', '张三'), ('gender', 'male'), ('age', '23')])

In [61]:
for key,value in p2.items():
    print('键"{0}"对应的值为:{1}'.format(key,value))

键"name"对应的值为:张三
键"gender"对应的值为:male
键"age"对应的值为:23


* 遍历字典中的所有值   
  如果你感兴趣的主要是字典包含的值，可使用方法 values() ，它返回一个值列表，而不包含任何键

In [62]:
p2.values()

dict_values(['张三', 'male', '23'])

In [63]:
for value in p2.values():
    print(value)

张三
male
23


* 遍历字典中的所有键
  类似地,如果你感兴趣的主要是字典的键,可以使用keys()属性方法获取字典的键

In [64]:
p2.keys()

dict_keys(['name', 'gender', 'age'])

In [65]:
for key in p2.keys():
    print(key)

name
gender
age


* 按顺序遍历字典中的所有键     
  字典本身是无序的,如果在输出时需要按键的特定顺序输出,可以使用sorted()方法对字典键排序.

In [76]:
for key in sorted(p2.keys()):
    print('"{0}"键对应的值为"{1}"'.format(key,p2[key]))

"age"键对应的值为"23"
"gender"键对应的值为"male"
"name"键对应的值为"张三"


# 结构化数据JSON     
根据<<python编程快速上手--让繁琐工作自动化>>及其它相关内容进行补充.            
在前边创建dict的方法里我们已经看到了, 可以使用json模块来读取json格式的文件为字典.        
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。JSON采用完全独立于语言的文本格式，但是也使用了类似于C语言家族的习惯（包括C、C++、C#、Java、JavaScript、Perl、Python等）。             
这些特性使JSON成为理想的数据交换语言。 易于人阅读和编写，同时也易于机器解析和生成(一般用于提升网络传输速率)。    

Python 的 json 模块处理了 JSON 数据字符串和 Python 值之间转换的所有细节，得到了 json.loads()和 json.dumps()函数。           
JSON 不能存储每一种 Python 值，它只能包含以下数据类型的值：字符串、整型、浮点型、布尔型、列表、字典和 NoneType。          
JSON 不能表示 Python 特有的对象，如 File 对象、CSV Reader 或 Writer 对象、Regex对象或 Selenium WebElement 对象。       
关于json本身的更多内容, 参见: https://www.w3cschool.cn/json/

In [77]:
import json
print(dir(json))

['JSONDecodeError', 'JSONDecoder', 'JSONEncoder', '__all__', '__author__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '__version__', '_default_decoder', '_default_encoder', 'codecs', 'decoder', 'detect_encoding', 'dump', 'dumps', 'encoder', 'load', 'loads', 'scanner']


## 用 loads()函数读取 JSON

## 用 dumps 函数写出 JSON

# 从字典创建pandas对象      
pandas是用于数据清晰和数据分析的第三方Python库, 它的基本数据类型 Series 和 DataFrame 都可以从字典进行快速的构造.

In [45]:
import pandas as pd

* 从字典构造Series

In [62]:
p1

{'name': '张三', 'age': '23', 'gender': 'male'}

In [63]:
s1 = pd.Series(p1)
s1

name        张三
age         23
gender    male
dtype: object

* 从嵌套字典构造DataFrane

In [64]:
person

{'p1': {'name': '张三', 'age': '23', 'gender': 'male'},
 'p2': {'name': '李四', 'age': '28', 'gender': 'female'}}

In [66]:
# 从嵌套字典构造Series的效果并不理想
pd.Series(person)

p1      {'name': '张三', 'age': '23', 'gender': 'male'}
p2    {'name': '李四', 'age': '28', 'gender': 'female'}
dtype: object

In [68]:
# 希望得到表格类型的数据, 应该使用 DataFrame 
Person = pd.DataFrame(person)
Person

Unnamed: 0,p1,p2
name,张三,李四
age,23,28
gender,male,female


* 注意:          
    * 从嵌套字典构造DataFrame, 如果内层字典的键都一致,才会像上述那样,进行键的对齐.           
        如果字典不一致,会采用字典的并集,并在原先不存在的位置引入缺失值.
    * 本质上, DataFrame是将Series作为列拼接成表格的.        
        如果想得到将Series作为行的表格, 可以使用转置方法.
    * 表格的列,就是原先外层字典的键.