# 字典(dict)
 2020.03.04 reviewed,  2020.06.19 reviewed,  2020.07.29 updated,   

字典是 Python 唯一的一个 **映射类型**，字符串、元组、列表都属于**序列类型**.    
        
       | 序列是以连续的整数为索引，与此不同的是，字典以"关键字"为索引.
       | 字典的"关键字"(键)可以是任意不可变类型，通常用字符串或数值.

* 在 Python 中， **字典** 是用放在花括号 {} 中的一系列的  **键—值** 对。
* 每个 **键** 都与一个值相关联，你可以使用键来访问与之相关联的值。与键相关联的值可以是数字、字符串、列表乃至字典。事实上，可将任何 Python 对象用作字典中的值。

## 字典的创建  

### 使用花括号罗列键值对
最直接的创建方式是使用花括号将键-值对罗列出来.

In [1]:
p1 = {'name':'张三','age':'23','gender':'male'}
p1

{'name': '张三', 'age': '23', 'gender': 'male'}

In [2]:
p2 = {'name':'李四','age':'28','gender':'female'}
p2

{'name': '李四', 'age': '28', 'gender': 'female'}

In [3]:
p3 = {'name':'王五','age':31,'gender':'male'}
p3

{'name': '王五', 'age': 31, 'gender': 'male'}

* 可变类型与不可变类型 
    * 构造字典时, 字典的键必须是可 hash 的类型          
    * 字典的键不能是字典,但字典的值可以是另一个字典--字典可以嵌套,但只能在值处嵌套
    * 关于hash 参考[浅谈hash](https://www.jianshu.com/p/ec7b848f83a7)

In [4]:
# 构造字典时, 字典的键必须是可 hash 的类型,不能是字典,但字典的值可以是另一个字典--字典可以嵌套,但只能在值处嵌套
person = {'p1':p1,'p2':p2,'p3':p3}
person

{'p1': {'name': '张三', 'age': '23', 'gender': 'male'},
 'p2': {'name': '李四', 'age': '28', 'gender': 'female'},
 'p3': {'name': '王五', 'age': 31, 'gender': 'male'}}

* 字典的键必须是可哈希的

In [5]:
# dict 不能做为字典的键
{p1:'p1',p2:'p2'} # TypeError: unhashable type: 'dict'

TypeError: unhashable type: 'dict'

In [6]:
# list 不能作为字典的键
{[1,2]:1,[2,3,4]:2} # TypeError: unhashable type: 'list'

TypeError: unhashable type: 'list'

In [7]:
# set 不能作为字典的键
{set([1,2]):1,set([2,3,4]):2} # TypeError: unhashable type: 'set'

TypeError: unhashable type: 'set'

可以看到, set、list、dict 三个类型是不可哈希的.    
关于 unhashable, 可参考 https://www.jianshu.com/p/56e4481da40b    
除了上述三种类型, Python中的 int, float, srt, tuple, object 类型都是可以哈希的.

In [8]:
import sys

def check_hash(x):
    if x.__hash__ is not None:
        print(type(x), 'hashable:', hash(x))
        return True
    else:
        print(type(x), 'unhashable')
        return False

# int
i = 5
check_hash(i)

# float
f = 0.5
check_hash(f)
# string
s = "hello"
check_hash(s)
# unicode
u = u"中国"
check_hash(u)
# tuple
t = (i, f, s, u)
check_hash(t)
# object
o = object()
check_hash(o)

# list
l1 = [i, f, s, u]
check_hash(l1)
# set
s1 = {i, f, s, u}
check_hash(s1)
# dict
d1 = {s: i, u: f}
check_hash(d1)

<class 'int'> hashable: 5
<class 'float'> hashable: 1152921504606846976
<class 'str'> hashable: -5545044693455847945
<class 'str'> hashable: -8805635441948671089
<class 'tuple'> hashable: 3026221792060955956
<class 'object'> hashable: 4355761
<class 'list'> unhashable
<class 'set'> unhashable
<class 'dict'> unhashable


False

### 从tuple/list使用dict函数创建字典
由于字典是由键值对组成的, 所以自然可以从满足某种要求的二元组的序列来创建.

* 使用dict函数从(由二元序列构成的)序列创建字典

In [9]:
# 从 tuple of (二元)tuple 构造字典
temp = dict((('name', 'xiaoming'), ('age', 18)))
temp

{'name': 'xiaoming', 'age': 18}

In [10]:
# 从tuple of (二元)list 构造字典
temp = dict((['name', 'xiaoming'], ['age', 18]))
temp

{'name': 'xiaoming', 'age': 18}

* 从嵌套list 构造 dict

In [11]:
# 从list of (二元)list 构造字典
temp = dict([['name', 'xiaoming'], ['age', 18]])
temp

{'name': 'xiaoming', 'age': 18}

In [12]:
new_list= [['key1','value1'],['key2','value2'],['key3','value3']]
dict(new_list) 

{'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}

* 使用赋值法从嵌套list构造dict

In [13]:
new_list= [['key1','value1'],['key2','value2'],['key3','value3']]
new_dict = {}
for i in new_list:
    new_dict[i[0]] = i[1]    #字典赋值，左边为key，右边为value
new_dict

{'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}

* 使用推导式从list of list构建dict

In [14]:
new_list= [['key1','value1'],['key2','value2'],['key3','value3']]
new_dict = {k:v for k,v in new_list}
new_dict

{'key1': 'value1', 'key2': 'value2', 'key3': 'value3'}

dict(**kwargs) -> new dictionary initialized with the name=value pairs in the keyword argument list. For example: dict(one=1, two=2)           
【例子】这种情况下，键只能为字符串类型，并且创建的时候字符串不能加引号，加上就会直接报语法错误。  

In [15]:
dict(one=1, two=2)

{'one': 1, 'two': 2}

In [16]:
dic = dict(name='Tom', age=10)
print(dic) # {'name': 'Tom', 'age': 10}
print(type(dic)) # <class 'dict'>

{'name': 'Tom', 'age': 10}
<class 'dict'>


* 上述方法实际上都是在按照映射关系构造字典.     
官方文档中对此方法的描述为: dict(mapping) -> new dictionary initialized from a mapping object's (key, value) pairs

### 使用zip函数从两个list构造dict
 如果是要将两个等长的序列构造成字典,序列一作为字典的键,序列二作为字典的值, 可以使用 zip 函数先将两个序列"捆绑"起来再应用dict函数

In [17]:
k=['a','b','c']
v=[1,2,3]

In [18]:
# 不能从list直接创建字典,# AttributeError: 'dict' object attribute 'keys' is read-only
d={}
d.keys=k
d.values=v
# AttributeError: 'dict' object attribute 'keys' is read-only

AttributeError: 'dict' object attribute 'keys' is read-only

In [19]:
# 使用zip将两个序列绑定在一起, 得到的是一个 zip 对象
zip(k,v)
# 它是可迭代的.

<zip at 0x53d75c8>

In [20]:
# 需要使用 zip 函数和 dict 函数
# zip将两个等长的 list 按元素对齐组成等长的 tuple
for item in zip(k,v):
    print(item)

('a', 1)
('b', 2)
('c', 3)


In [21]:
# 使用dict函数将zip函数的作用对象转为dict
dict_from_list = dict(zip(k,v))
dict_from_list

{'a': 1, 'b': 2, 'c': 3}

In [22]:
# 思考以下两行构造方法为什么不成功?
#dict([k,v]) # ValueError: dictionary update sequence element #0 has length 3; 2 is required
#dict([['a','b','c'], [1,2,3]]) # ValueError: dictionary update sequence element #0 has length 3; 2 is required
dict([[k[i],v[i]] for i in range(len(k)) ])
# 注意,从嵌套的列表(或元组)构造 dict 时, 必须保证内层的 list(tuple) 是包含两个元素的, 并且由于第一个元素会被用作键, 所有的第一个元素还必须是可哈希的.

{'a': 1, 'b': 2, 'c': 3}

In [23]:
# 如果zip的两个序列不等长--就按较短的来匹配
for itm in zip([1,2,3,4],['a','b','c']):
    print(itm)

(1, 'a')
(2, 'b')
(3, 'c')


* 注意:zip两个序列的时候,是按位置索引来对齐的

### dict.fromkeys(seq[, value]) 创建字典 
以序列 seq 中元素做字典的键， value 为字典所有键对应的初始值--如果不传入value,则设置为缺失值.

In [24]:
seq = ('name', 'age', 'sex')
dic1 = dict.fromkeys(seq)
print("新的字典为 : %s" % str(dic1))

新的字典为 : {'name': None, 'age': None, 'sex': None}


In [25]:
dic2 = dict.fromkeys(seq, 10)
print("新的字典为 : %s" % str(dic2))

新的字典为 : {'name': 10, 'age': 10, 'sex': 10}


In [26]:
dic = {'Name': 'lsgogroup', 'Age': 7}
print(dic.keys()) # dict_keys(['Name', 'Age'])
lst = list(dic.keys()) # 转换为列表
print(lst) # ['Name', 'Age']

dict_keys(['Name', 'Age'])
['Name', 'Age']


### 读取json文件为dict   
json格式的文件可以直接被读取为字典. 本章稍后会进一步补充学习json的相关操作.   
使用with语句和open函数打开本地文件的操作,将在后续的文件操作章节进一步进行学习. 

In [27]:
# 读取本地 json 文件
import json
with open(r"D:\Py\note\data\mchar_val.json") as jsonfile:
    json_dict = json.load(jsonfile)

In [28]:
type(json_dict)

dict

In [29]:
# json_dict #原始文件较大
del json_dict

* json 格式被广泛用于web数据交互, 因此也可以直接从web API读取到.

In [30]:
# 使用request库读取json
import requests
url = 'http://api.openweathermap.org/data/2.5/onecall?lat=30.489772&lon=-99.771335&units=metric'
resp = requests.get(url)
data = resp.json()
type(data)

dict

In [31]:
data

{'cod': 401,
 'message': 'Invalid API key. Please see http://openweathermap.org/faq#error401 for more info.'}

* 其他构造字典的方法待补充

## 字典的调用

* 调用字典的键

In [32]:
p1.keys()

dict_keys(['name', 'age', 'gender'])

* 调用字典的值

In [33]:
p1.values()

dict_values(['张三', '23', 'male'])

* 调用字典的键-值对

In [34]:
p1.items()

dict_items([('name', '张三'), ('age', '23'), ('gender', 'male')])

* 通过字典的键调用相应的值.       
注意键为字符串时有引号.

In [35]:
p1['name']

'张三'

In [36]:
p1['age']

'23'

* 注意: 不能通过位置调用字典的键或值或键值对, 因为字典中的键值对是没有顺序的.

In [37]:
p1={'name':'张三','age':'23','gender':'male'}
p2={'name':'张三','gender':'male','age':'23'}

In [38]:
p1==p2
# 字典中的键值对是没有顺序区别的

True

* dict.get(key, default=None) 返回指定键的值，如果值不在字典中返回默认值

In [39]:
dic = {'Name': 'Lsgogroup', 'Age': 27}
print("Age 值为 : %s" % dic.get('Age')) # Age 值为 : 27
print("Sex 值为 : %s" % dic.get('Sex', "NA")) # Sex 值为 : NA

Age 值为 : 27
Sex 值为 : NA


* dict.setdefault(key, default=None) 和 get() 方法 类似, 如果键不存在于字典中，将会添加键并将值设为默认值

In [40]:
dic = {'Name': 'Lsgogroup', 'Age': 7}
print("Age 键的值为 : %s" % dic.setdefault('Age', None)) # Age 键的值为 : 7
print("Sex 键的值为 : %s" % dic.setdefault('Sex', None)) # Sex 键的值为 : None
print("新字典为：", dic) # 新字典为： {'Age': 7, 'Name': 'Lsgogroup', 'Sex': None}

Age 键的值为 : 7
Sex 键的值为 : None
新字典为： {'Name': 'Lsgogroup', 'Age': 7, 'Sex': None}


## 修改字典

### 添加键值对
* 不同于不可修改的tuple, dict 是一种动态结构，可随时在其中添加键 — 值对。
* 要添加键-值对，可依次指定字典名、用方括号括起的键和相关联的值。

In [41]:
p1['phone']='13012345678'

In [42]:
p1

{'name': '张三', 'age': '23', 'gender': 'male', 'phone': '13012345678'}

In [43]:
# 添加的键值对,值可以是各种数据类型--但键必须是能够hash的,因此,list和dict不能作为键,但tuple可以作为键
p2={}
p2[1]=[1,2,3]
p2

{1: [1, 2, 3]}

In [44]:
p2[2]=[0,1,2,3]
p2

{1: [1, 2, 3], 2: [0, 1, 2, 3]}

In [45]:
# tuple 因为不可变,因此是可哈希的,因此可以用作字典的键
p2[(1,2)]=[0,1,2,3]
p2

{1: [1, 2, 3], 2: [0, 1, 2, 3], (1, 2): [0, 1, 2, 3]}

这种方法当然也可以用于创建dict.  
需要注意, 一个 key 只能对应一个 value ，多次对一个 key 放入 value ，后面的值会把前面的值冲掉

### 修改字典中的值
* 字典是可被修改的,不但可以增加键值对,还可以修改现有的键值对
* 修改方法类似于重新给一个变量赋值,通过给字典名和键赋值的方式修改字典中的值.

In [46]:
p1['phone']='85163742'

In [47]:
p1

{'name': '张三', 'age': '23', 'gender': 'male', 'phone': '85163742'}

* 字典中的键必须是唯一的    
如果在构建字典的时候, 键不唯一, 不会报错.

In [48]:
p2={'name':'张三','name':'李四','gender':'male','age':'23'}
p2
# 可以看到,name 键的值被位于后边的键值对修改了

{'name': '李四', 'gender': 'male', 'age': '23'}

In [49]:
p2={'name':'李四','name':'张三','gender':'male','age':'23'}
p2
# 可以看到,name 键的值被位于后边的键值对修改了

{'name': '张三', 'gender': 'male', 'age': '23'}

### 删除字典中的键值对
* 对于字典中不再需要的信息，可使用 del 语句将相应的键-值对彻底删除            
使用 del 语句时，必须指定字典名和要删除的键。

In [50]:
del p1['phone']

In [51]:
p1

{'name': '张三', 'age': '23', 'gender': 'male'}

In [52]:
# 字典的键和值都是一种数据类型
type(p2.values()),type(p2.keys())

(dict_values, dict_keys)

In [53]:
p2.values()

dict_values(['张三', 'male', '23'])

* 使用pop方法删除并使用字典中的键.           
字典也和列表一样,有pop方法. 但由于字典中的键值对没有顺序,因此必须传入一个键作为参数.

In [54]:
p2

{'name': '张三', 'gender': 'male', 'age': '23'}

In [55]:
p2.pop('name')

'张三'

In [56]:
p2

{'gender': 'male', 'age': '23'}

In [57]:
# 恢复p2
p2['name'] = '张三'
p2

{'gender': 'male', 'age': '23', 'name': '张三'}

* dict.clear() 用于删除字典内所有元素

In [58]:
p2.clear()
p2

{}

In [59]:
# 恢复p2
p2={'name':'李四','age':'28','gender':'female'}
p2

{'name': '李四', 'age': '28', 'gender': 'female'}

* dict.popitem() 随机返回并删除字典中的一对键和值.          
如果字典已经为空，却调用了此方法，就报出KeyError异常

In [60]:
dic1 = {1: "a", 2: [1, 2]}
print(dic1.popitem()) # (2, [1, 2])
print(dic1) # {1: 'a'}

(2, [1, 2])
{1: 'a'}


In [61]:
print(dic1.popitem()) # (1, 'a')
print(dic1) # {}

(1, 'a')
{}


In [62]:
print(dic1.popitem()) 
print(dic1) # KeyError: 'popitem(): dictionary is empty'

KeyError: 'popitem(): dictionary is empty'

### update 赋值
update方法既可以给字典添加新的键值对,也可以将原有的键对应的值修改为新的值.

In [63]:
# 创建空字典
#temp = {} #创建空字典方法 1
temp = dict() #创建空字典方法 2
temp

{}

In [64]:
# 通过为键赋值的方法构造字典内容
temp['name'] = 'xiaoming'# 赋值方法 1
temp.update(name= 'xiaoming') # 赋值方法 2--update属性函数 
temp.update({'name': 'xiaoming', 'age': 13}) # 给update方法传入字典
temp

{'name': 'xiaoming', 'age': 13}

In [65]:
# update 还可以用来合并两个字典--如果键有重复,会用参数 dict 更新调用 update 方法的dict
temp.update({'gender':'male','age':'12'}) # 赋值方法 2--update属性函数 
temp

{'name': 'xiaoming', 'age': '12', 'gender': 'male'}

In [66]:
temp.update??

[1;31mDocstring:[0m
D.update([E, ]**F) -> None.  Update D from dict/iterable E and F.
If E is present and has a .keys() method, then does:  for k in E: D[k] = E[k]
If E is present and lacks a .keys() method, then does:  for k, v in E: D[k] = v
In either case, this is followed by: for k in F:  D[k] = F[k]
[1;31mType:[0m      builtin_function_or_method


## 字典的其他操作方法

* len 方法获取字典的长度

In [100]:
len(p1),len(p2),len(person)

(3, 3, 3)

* key in dict        
    in 操作符用于判断 **键** (不是值)是否存在于字典中，如果键在字典 dict 里返回 true ，否则返回 false           
    not in 操作符刚好相反，如果键在字典 dict 里返回 false ，否则返回 true 

In [67]:
dic = {'Name': 'Lsgogroup', 'Age': 7}
# in 检测键 Age 是否存在
if 'Age' in dic:
    print("键 Age 存在")
else:
    print("键 Age 不存在")
# 检测键 Sex 是否存在
if 'Sex' in dic:
    print("键 Sex 存在")
else:
    print("键 Sex 不存在")
# not in 检测键 Age 是否存在
if 'Age' not in dic:
    print("键 Age 不存在")
else:
    print("键 Age 存在")
# 键 Age 存在
# 键 Sex 不存在
# 键 Age 存在

键 Age 存在
键 Sex 不存在
键 Age 存在


* dict.copy() 返回一个字典的浅复制

In [68]:
dic1 = {'Name': 'Lsgogroup', 'Age': 7, 'Class': 'First'}
dic2 = dic1.copy()
print("新复制的字典为 : ", dic2)
# 新复制的字典为 : {'Age': 7, 'Name': 'Lsgogroup', 'Class': 'First'}

新复制的字典为 :  {'Name': 'Lsgogroup', 'Age': 7, 'Class': 'First'}


In [69]:
# 直接赋值和 copy 的区别
dic1 = {'user': 'lsgogroup', 'num': [1, 2, 3]}
# 引用对象
dic2 = dic1
# 深拷贝父对象（一级目录），子对象（二级目录）不拷贝，还是引用
dic3 = dic1.copy()
print(id(dic1)) # 148635574728
print(id(dic2)) # 148635574728
print(id(dic3)) # 148635574344
# 修改 data 数据
dic1['user'] = 'root'
dic1['num'].remove(1)
# 输出结果
print(dic1) # {'user': 'root', 'num': [2, 3]}
print(dic2) # {'user': 'root', 'num': [2, 3]}
print(dic3) # {'user': 'runoob', 'num': [2, 3]}

103477320
103477320
103477720
{'user': 'root', 'num': [2, 3]}
{'user': 'root', 'num': [2, 3]}
{'user': 'lsgogroup', 'num': [2, 3]}


如上所示, 当替换副本中的值时,原件不受影响, 但如果修改副本中的值(就地修改而不是替换),原件也将发生变化,因为原件指向的也是被修改的值.     
为了避免这种问题, 一种办法是执行深复制, 即同时复制值及其所包含的所有值.  为此, 可以使用copy 模块中的deepcopy函数.

In [102]:
dic1 = {'user': 'lsgogroup', 'num': [1, 2, 3]}
# 引用对象
dic2 = dic1
# 深拷贝父对象（一级目录），子对象（二级目录）不拷贝，还是引用
dic3 = dic1.copy()

from copy import deepcopy
dic4 = deepcopy(dic1)

print(id(dic1)) # 148635574728
print(id(dic2)) # 148635574728
print(id(dic3)) # 148635574344
print(id(dic4)) # 148635574344
# 修改 data 数据
dic1['user'] = 'root'
dic1['num'].remove(1)
# 输出结果
print(dic1) # {'user': 'root', 'num': [2, 3]}
print(dic2) # {'user': 'root', 'num': [2, 3]}
print(dic3) # {'user': 'lsgogroup', 'num': [2, 3]}
print(dic4) # {'user': 'lsgogroup', 'num': [1, 2, 3]}



132980968
132980968
132981448
154320472
{'user': 'root', 'num': [2, 3]}
{'user': 'root', 'num': [2, 3]}
{'user': 'lsgogroup', 'num': [2, 3]}
{'user': 'lsgogroup', 'num': [1, 2, 3]}


## 字典的遍历  

* 遍历所有的键 — 值对   
使用字典的items()属性方法,可以返回键值对元组构成的列表.

In [70]:
p2.items()

dict_items([('name', '李四'), ('age', '28'), ('gender', 'female')])

In [71]:
for key,value in p2.items():
    print('键"{0}"对应的值为:{1}'.format(key,value))

键"name"对应的值为:李四
键"age"对应的值为:28
键"gender"对应的值为:female


* 遍历字典中的所有值   
  如果你感兴趣的主要是字典包含的值，可使用方法 values() ，它返回一个值列表，而不包含任何键

In [72]:
p2.values()

dict_values(['李四', '28', 'female'])

In [73]:
for value in p2.values():
    print(value)

李四
28
female


* 遍历字典中的所有键
  类似地,如果你感兴趣的主要是字典的键,可以使用keys()属性方法获取字典的键

In [74]:
p2.keys()

dict_keys(['name', 'age', 'gender'])

In [75]:
for key in p2.keys():
    print(key)

name
age
gender


* 按顺序遍历字典中的所有键     
  字典本身是无序的,如果在输出时需要按键的特定顺序输出,可以使用sorted()方法对字典键排序.

In [76]:
for key in sorted(p2.keys()):
    print('"{0}"键对应的值为"{1}"'.format(key,p2[key]))

"age"键对应的值为"28"
"gender"键对应的值为"female"
"name"键对应的值为"李四"


# 结构化数据与JSON[待补充]     
根据<<python编程快速上手--让繁琐工作自动化>>及其它相关内容进行补充.            
在前边创建dict的方法里我们已经看到了, 可以使用json模块来读取json格式的文件为字典.        
JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。JSON采用完全独立于语言的文本格式，但是也使用了类似于C语言家族的习惯（包括C、C++、C#、Java、JavaScript、Perl、Python等）。             
这些特性使JSON成为理想的数据交换语言。 易于人阅读和编写，同时也易于机器解析和生成(一般用于提升网络传输速率)。    

Python 的 json 模块处理了 JSON 数据字符串和 Python 值之间转换的所有细节，得到了 json.loads()和 json.dumps()函数。           
JSON 不能存储每一种 Python 值，它只能包含以下数据类型的值：字符串、整型、浮点型、布尔型、列表、字典和 NoneType。          
JSON 不能表示 Python 特有的对象，如 File 对象、CSV Reader 或 Writer 对象、Regex对象或 Selenium WebElement 对象。       
关于json本身的更多内容, 参见: https://www.w3cschool.cn/json/

In [77]:
import json
print(dir(json))

['JSONDecodeError', 'JSONDecoder', 'JSONEncoder', '__all__', '__author__', '__builtins__', '__cached__', '__doc__', '__file__', '__loader__', '__name__', '__package__', '__path__', '__spec__', '__version__', '_default_decoder', '_default_encoder', 'codecs', 'decoder', 'detect_encoding', 'dump', 'dumps', 'encoder', 'load', 'loads', 'scanner']


直观上来看, JSON 就是用双引号引起来的dict, 是个字符串. 直接使用 Python 来解析会比较麻烦, 使用python的json模块, 就可以很容易地把这个字符串解析为dict了.

In [88]:
stringOfJsonData = '{"name": "Zophie", "isCat": true, "miceCaught": 0,"felineIQ": null}'
type(stringOfJsonData)

str

## 用 loads()函数读取 JSON

In [89]:
# 使用loads函数将上述字符串解析为dict
jsonDataAsPythonValue = json.loads(stringOfJsonData)
type(jsonDataAsPythonValue),jsonDataAsPythonValue

(dict, {'name': 'Zophie', 'isCat': True, 'miceCaught': 0, 'felineIQ': None})

In [90]:
# 读取本地的 json 文件为dict
with open(r"D:\Py\note\data\mchar_val.json") as jsonfile:
    json_dict = json.load(jsonfile)

In [91]:
type(json_dict)

dict

In [93]:
len(json_dict)

10000

In [97]:
# 存在问题, 需更换url或使用其他api
#! python3
# quickWeather.py - Prints the weather for a location from the command line.
import json, requests, sys
# Compute location from command line arguments.
if len(sys.argv) < 2:
    print('Usage: quickWeather.py location')
    sys.exit()
location = ' '.join(sys.argv[1:])
# TODO: Download the JSON data from OpenWeatherMap.org's API.
# TODO: Load JSON data into a Python variable.
# Download the JSON data from OpenWeatherMap.org's API.
url ='http://api.openweathermap.org/data/2.5/forecast/daily?q=%s&cnt=3' % (location)
response = requests.get(url)
response.raise_for_status()
# TODO: Load JSON data into a Python variable.
#! python3
# quickWeather.py - Prints the weather for a location from the command line.
# Load JSON data into a Python variable.
weatherData = json.loads(response.text)
# Print weather descriptions.
w = weatherData['list']
print('Current weather in %s:' % (location))
print(w[0]['weather'][0]['main'], '-', w[0]['weather'][0]['description'])
print()
print('Tomorrow:')
print(w[1]['weather'][0]['main'], '-', w[1]['weather'][0]['description'])
print()
print('Day after tomorrow:')
print(w[2]['weather'][0]['main'], '-', w[2]['weather'][0]['description'])

HTTPError: 401 Client Error: Unauthorized for url: http://api.openweathermap.org/data/2.5/forecast/daily?q=-f%20C:%5CUsers%5CAdministrator%5CAppData%5CRoaming%5Cjupyter%5Cruntime%5Ckernel-85c6a494-63a5-426a-ae52-2236febc4caf.json&cnt=3

In [99]:
sys.argv

['D:\\ProgramData\\Anaconda3\\lib\\site-packages\\ipykernel_launcher.py',
 '-f',
 'C:\\Users\\Administrator\\AppData\\Roaming\\jupyter\\runtime\\kernel-85c6a494-63a5-426a-ae52-2236febc4caf.json']

## 用 dumps 函数写出 JSON

# 从字典创建pandas对象      
pandas是用于数据清晰和数据分析的第三方Python库, 它的基本数据类型 Series 和 DataFrame 都可以从字典进行快速的构造.

In [78]:
import pandas as pd

## 从字典构造Series

In [79]:
p1

{'name': '张三', 'age': '23', 'gender': 'male'}

In [80]:
s1 = pd.Series(p1)
s1

name        张三
age         23
gender    male
dtype: object

* 一个完整的 Series 对象包含三个组成部分: values, name, index.
    * values 是一个 numpy 的 ndarray 对象.
    * name 和 index 是 Series 区别于 ndarray 的部分. name 是 Series 对象的一个属性, 区别于变量名. name 主要用于从 Series 构造 DataFrame 时, 作为列名出现.
    * index 是索引. pandas 对象有两种类型的索引: 默认整数索引和标签索引--前者类似list的索引,后者类似字典的键(实际上我们看到, 从dict 构造pandas对象时, 就是把字典的键作为索引的.)
* pandas 的索引的更进一步的学习资料, 参见 joyful-pandas 教程的第二章.

In [84]:
s1.values,s1.name,s1.index

(array(['张三', '23', 'male'], dtype=object),
 None,
 Index(['name', 'age', 'gender'], dtype='object'))

pandas的Series不但继承了numpy的ndarray的很多属性和方法, 还额外定义了很多其他便捷的方法. 这里不做太多的介绍, 关于相关方法的具体使用, 可以参见 DataWhale 的joyful-pandas 教程或Wes McKinney的 <pyda>.

## 从嵌套字典构造DataFrane

In [81]:
person

{'p1': {'name': '张三', 'age': '23', 'gender': 'male'},
 'p2': {'name': '李四', 'age': '28', 'gender': 'female'},
 'p3': {'name': '王五', 'age': 31, 'gender': 'male'}}

In [82]:
# 从嵌套字典构造Series的效果并不理想
pd.Series(person)

p1      {'name': '张三', 'age': '23', 'gender': 'male'}
p2    {'name': '李四', 'age': '28', 'gender': 'female'}
p3        {'name': '王五', 'age': 31, 'gender': 'male'}
dtype: object

In [83]:
# 希望得到表格类型的数据, 应该使用 DataFrame 
Person = pd.DataFrame(person)
Person

Unnamed: 0,p1,p2,p3
name,张三,李四,王五
age,23,28,31
gender,male,female,male


* 注意:          
    * 从嵌套字典构造DataFrame, 如果内层字典的键都一致,才会像上述那样,进行键的对齐.           
        如果字典不一致,会采用字典的并集,并在原先不存在的位置引入缺失值.
    * 本质上, DataFrame是将Series作为列拼接成表格的.        
        如果想得到将Series作为行的表格, 可以使用转置方法.
    * 表格的列,就是原先外层字典的键.

In [85]:
Person.T

Unnamed: 0,name,age,gender
p1,张三,23,male
p2,李四,28,female
p3,王五,31,male


In [103]:
import pandas as pd
import matplotlib.pyplot as plt


In [104]:
plt.xticks??

[1;31mSignature:[0m [0mplt[0m[1;33m.[0m[0mxticks[0m[1;33m([0m[0mticks[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m [0mlabels[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m [1;33m**[0m[0mkwargs[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[1;31mSource:[0m   
[1;32mdef[0m [0mxticks[0m[1;33m([0m[0mticks[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m [0mlabels[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m [1;33m**[0m[0mkwargs[0m[1;33m)[0m[1;33m:[0m[1;33m
[0m    [1;34m"""
    Get or set the current tick locations and labels of the x-axis.

    Call signatures::

        locs, labels = xticks()            # Get locations and labels
        xticks(ticks, [labels], **kwargs)  # Set locations and labels

    Parameters
    ----------
    ticks : array_like
        A list of positions at which ticks should be placed. You can pass an
        empty list to disable xticks.

    labels : array_like, optional
        A list of explicit labels to place at the given *locs*.

    **k

In [105]:
import seaborn as sns
import matplotlib.pyplot as plt

In [108]:
pd.corr??

Object `pd.corr` not found.


In [109]:
pd.crosstab??

[1;31mSignature:[0m
[0mpd[0m[1;33m.[0m[0mcrosstab[0m[1;33m([0m[1;33m
[0m    [0mindex[0m[1;33m,[0m[1;33m
[0m    [0mcolumns[0m[1;33m,[0m[1;33m
[0m    [0mvalues[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mrownames[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mcolnames[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0maggfunc[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mmargins[0m[1;33m=[0m[1;32mFalse[0m[1;33m,[0m[1;33m
[0m    [0mmargins_name[0m[1;33m:[0m [0mstr[0m [1;33m=[0m [1;34m'All'[0m[1;33m,[0m[1;33m
[0m    [0mdropna[0m[1;33m:[0m [0mbool[0m [1;33m=[0m [1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mnormalize[0m[1;33m=[0m[1;32mFalse[0m[1;33m,[0m[1;33m
[0m[1;33m)[0m [1;33m->[0m [1;34m'DataFrame'[0m[1;33m[0m[1;33m[0m[0m
[1;31mSource:[0m   
[1;32mdef[0m [0mcrosstab[0m[1;33m([0m[1;33m
[0m    [0mindex[0m[1;33m,[0m[1;33m
[0m    [0mcolumns

In [110]:
pd.cut??

[1;31mSignature:[0m
[0mpd[0m[1;33m.[0m[0mcut[0m[1;33m([0m[1;33m
[0m    [0mx[0m[1;33m,[0m[1;33m
[0m    [0mbins[0m[1;33m,[0m[1;33m
[0m    [0mright[0m[1;33m:[0m [0mbool[0m [1;33m=[0m [1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mlabels[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mretbins[0m[1;33m:[0m [0mbool[0m [1;33m=[0m [1;32mFalse[0m[1;33m,[0m[1;33m
[0m    [0mprecision[0m[1;33m:[0m [0mint[0m [1;33m=[0m [1;36m3[0m[1;33m,[0m[1;33m
[0m    [0minclude_lowest[0m[1;33m:[0m [0mbool[0m [1;33m=[0m [1;32mFalse[0m[1;33m,[0m[1;33m
[0m    [0mduplicates[0m[1;33m:[0m [0mstr[0m [1;33m=[0m [1;34m'raise'[0m[1;33m,[0m[1;33m
[0m[1;33m)[0m[1;33m[0m[1;33m[0m[0m
[1;31mSource:[0m   
[1;32mdef[0m [0mcut[0m[1;33m([0m[1;33m
[0m    [0mx[0m[1;33m,[0m[1;33m
[0m    [0mbins[0m[1;33m,[0m[1;33m
[0m    [0mright[0m[1;33m:[0m [0mbool[0m [1;33m=[0m [1;32mTrue[0m[1;33m,[0m[1;33m


In [111]:
import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

In [112]:
sns.distplot??

[1;31mSignature:[0m
[0msns[0m[1;33m.[0m[0mdistplot[0m[1;33m([0m[1;33m
[0m    [0ma[0m[1;33m,[0m[1;33m
[0m    [0mbins[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mhist[0m[1;33m=[0m[1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mkde[0m[1;33m=[0m[1;32mTrue[0m[1;33m,[0m[1;33m
[0m    [0mrug[0m[1;33m=[0m[1;32mFalse[0m[1;33m,[0m[1;33m
[0m    [0mfit[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mhist_kws[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mkde_kws[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mrug_kws[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mfit_kws[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mcolor[0m[1;33m=[0m[1;32mNone[0m[1;33m,[0m[1;33m
[0m    [0mvertical[0m[1;33m=[0m[1;32mFalse[0m[1;33m,[0m[1;33m
[0m    [0mnorm_hist[0m[1;33m=[0m[1;32mFalse[0m[1;33m,[0m[1;33m
[0m    [0maxlabel[0m[1;33m=[0m[1;32mNone[0m[1;3