### 字典

#### 可变类型与不可变类型

字典以"关键字"key为索引，关键字可以是任意不可变类型，通常用字符串或数值。

字典是 Python 唯一的一个 映射类型，字符串、元组、列表属于序列类型。


那么如何快速判断一个数据类型 X 是不是可变类型的呢？两种方法：

- 麻烦方法：用 id(X) 函数，对 X 进行某种操作，比较操作前后的 id，如果不一样，则 X 不可变，如果一样，则 X 可变。
- 便捷方法：用 hash(X)，只要不报错，证明 X 可被哈希，即不可变，反过来不可被哈希，即可变。

In [1]:
i = 1

In [2]:
print(id(i))

140712063771024


In [3]:
i = i + 2

In [4]:
print(id(i))

140712063771088


整数 i 在加 1 之后的 id 和之前不一样，因此加完之后的这个 i (虽然名字没变)，但不是加之前的那个 i 了，因此整数是不可变类型

In [5]:
l = [1, 2]
print(id(1))

l.append('python')
print(id(1))

140712063771024
140712063771024


In [6]:
l = [1, 2]
print(id(l))  
l.append('Python')
print(id(l))

2104374379912
2104374379912


列表 l 在附加 'Python' 之后的 id 和之前一样，因此列表是可变类型

In [7]:
print(hash('Name'))
print(hash((1, 2, 'Python'))) 

print(hash([1, 2, 'Python']))
print(hash({1, 2, 3}))

-5773944642581181731
7584242293974431945


TypeError: unhashable type: 'list'

数值、字符和元组 都能被哈希，因此它们是不可变类型。
列表、集合、字典不能被哈希，因此它是可变类型

#### 字典的定义
字典 是无序的 键:值（key:value）对集合，键必须是互不相同的（在同一个字典之内）。

dict 内部存放的顺序和 key 放入的顺序是没有关系的。
dict 查找和插入的速度极快，不会随着 key 的增加而增加，但是需要占用大量的内存。
字典 定义语法为 {元素1, 元素2, ..., 元素n}

其中每一个元素是一个「键值对」-- 键:值 (key:value)
关键点是「大括号 {}」,「逗号 ,」和「冒号 :」
大括号 -- 把所有元素绑在一起
逗号 -- 将每个键值对分开
冒号 -- 将键和值分开

通过字符串或数值作为key来创建字典。

注意：如果我们取的键在字典中不存在，会直接报错KeyError。

- dict() 创建一个空的字典。

In [None]:
brand = ['李宁', '耐克', '阿迪达斯']
slogan = ['一切皆有可能', 'Just do it', 'Impossible is nothing']
print('耐克的口号是:', slogan[brand.index('耐克')])  

- dict.fromkeys(seq[, value]) 用于创建一个新字典，以序列 seq 中元素做字典的键，value 为字典所有键对应的初始值。

In [None]:
seq = ('name', 'age', 'sex')
dic1 = dict.fromkeys(seq)
print(dic1)


dic2 = dict.fromkeys(seq, 10)
print(dic2)


dic3 = dict.fromkeys(seq, ('小马', '8', '男'))
print(dic3)

- dict.- keys()返回一个可迭代对象，可以使用 list() 来转换为列表，列表为字典中的所有键。
- dict.values()返回一个迭代器，可以使用 list() 来转换为列表，列表为字典中的所有值。
- dict.items()以列表返回可遍历的 (键, 值) 元组数组。
- dict.get(key, default=None) 返回指定键的值，如果值不在字典中返回默认值.
- dict.setdefault(key, default=None)和get()方法 类似, 如果键不存在于字典中，将会添加键并将值设为默认值。
- key in dict in 操作符用于判断键是否存在于字典中，如果键在字典 dict 里返回true，否则返回false。而not in操作符刚好相反，如果键在字典 dict 里返回false，否则返回true
- dict.pop(key[,default])删除字典给定键 key 所对应的值，返回值为被删除的值。key 值必须给出。若key不存在，则返回 default 值。
- del dict[key] 删除字典给定键 key 所对应的值。
- dict.popitem()随机返回并删除字典中的一对键和值，如果字典已经为空，却调用了此方法，就报出KeyError异常。
- dict.clear()用于删除字典内所有元素。
- dict.copy()返回一个字典的浅复制。
- dict.update(dict2)把字典参数 dict2 的 key:value对 更新到字典 dict 里

In [None]:
dic = {'Name': 'lsgogroup', 'Age': 7}
dic.keys()

In [None]:
if 'Name' in dic:
    print('Name is dic\'s keys')

In [None]:
dic.pop('Name')

In [None]:
dic

In [None]:
del dic['Age']

In [None]:
dic

直接赋值和 copy 的区别

In [None]:
dic1 = {'user': 'lsgogroup', 'num': [1, 2, 3]}

# 引用对象
dic2 = dic1  
# 浅拷贝父对象（一级目录），子对象（二级目录）不拷贝，还是引用
dic3 = dic1.copy()  

print(id(dic1))  # 148635574728
print(id(dic2))  # 148635574728
print(id(dic3))  # 148635574344

# 修改 data 数据
dic1['user'] = 'root'
dic1['num'].remove(1)

# 输出结果
print(dic1)  # {'user': 'root', 'num': [2, 3]}
print(dic2)  # {'user': 'root', 'num': [2, 3]}
print(dic3)  # {'user': 'runoob', 'num': [2, 3]}

#### 字典练习题
1：

In [None]:
dic = {
    'python': 95,
    'java': 99,
    'c': 100
    }


In [None]:
# 字典长度
print(len(dic))

In [None]:
dic['java'] = 98
dic

In [None]:
del dic['c']
dic

In [None]:
dic['php'] = 90
dic

In [None]:
a = list(dic.keys())

In [None]:
a

In [None]:
b = list(dic.values())
b

In [None]:
if 'javascript' in dic:
    print('javascript in idc')
else:
    print('javascript not in idc')

In [None]:
sum = sum(list(dic.values()))

In [None]:
sum

In [None]:
maxv= max(list(dic.values()))
maxv

In [None]:
minv= min(list(dic.values()))
minv

In [None]:
dic1 = {'php':97}
dic.update(dic1)

In [None]:
dic

2：有一个字典，保存的是学生各个编程语言的成绩，内容如下;

各门课程的考试成绩存储方式并不相同，有的用字典，有的用列表，但是分数都是字符串类型，请实现函数transfer_score(score_dict)，将分数修改成int类型

In [None]:
data = {
        'python': {'上学期': '90', '下学期': '95'},
        'c++': ['95', '96', '97'],
        'java': [{'月考':'90', '期中考试': '94', '期末考试': '98'}]
        }
def transfer_score(data):
    for value in list(data.values()):
        if type(value) == dict:
            print('exist value in dict')
            for value in list(value.values()):
                value = int(value)
    return data

In [None]:
a = transfer_score(data)

In [None]:
a

###  集合
Python 中set与dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key。key为不可变类型，即可哈希的值.

- 集合的两个特点：无序 (unordered) 和唯一 (unique)。

由于 set 存储的是无序集合，所以我们不可以为集合创建索引或执行切片(slice)操作，也没有键(keys)可用来获取集合中元素的值，但是可以判断一个元素是否在集合中。

In [None]:
name = {1, 2, 3, 4}
type(name)

In [None]:
s = set()
s.add('apple')
s.add('pear')
s.add('peach')
s

直接把一堆元素用花括号括起来{元素1, 元素2, ..., 元素n}。
重复元素在set中会被自动被过滤

In [None]:
basket = {'apple', 'orange', 'apple', 'pear', 'orange', 'banana'}
print(basket)

In [None]:
b = set(("Google", "Lsgogroup", "Taobao", "Taobao"))
print(b) 

#### 集合内置函数
- set.add(elmnt)用于给集合添加元素，如果添加的元素在集合中已存在，则不执行任何操作。
- set.update(set1)用于修改当前集合，可以添加新的元素或集合到当前集合set中，如果添加的元素在集合中已存在，则该元素只会出现一次，重复的会忽略。
- set.remove(item) 用于移除集合中的指定元素。如果元素不存在，则会发生错误。
- set.discard(value) 用于移除指定的集合元素。**remove() 方法在移除一个不存在的元素时会发生错误，而 discard() 方法不会。**
- set.pop() 用于随机移除一个元素。

由于 set 是无序和无重复元素的集合，所以两个或多个 set 可以做数学意义上的集合操作。

**交集**
- set.intersection(set1, set2) 返回两个集合的交集。
- set1 & set2 返回两个集合的交集。
- set.intersection_update(set1, set2) 交集，在原始的集合上移除不重叠的元素。

In [None]:
a = set('abracadabra')
b = set('alacazam')
print(a)  
print(b)  

c = a.intersection(b)
print(c) 
print(a & b)  
print(a)  

a.intersection_update(b)
print(a)  

**并集**
- set.union(set1, set2) 返回两个集合的并集。
- set1 | set2 返回两个集合的并集。

**差集**
- set.difference(set) 返回集合的差集。
- set1 - set2 返回集合的差集。
- set.difference_update(set) 集合的差集，直接在原来的集合中移除元素，没有返回值。

**异或**
- set.symmetric_difference(set)返回集合的异或。
- set1 ^ set2 返回集合的异或。
- set.symmetric_difference_update(set)移除当前集合中在另外一个指定集合相同的元素，并将另外一个指定集合中不同的元素插入到当前集合中。

**是否被包含**
- set1.issubset(set2)判断集合是不是被其他集合包含，如果是则返回 True，否则返回 False。
- set1 <= set2 判断集合是不是被其他集合包含，如果是则返回 True，否则返回 False。

**是否包含其他集合**
- set1.issuperset(set2)用于判断集合是不是包含其他集合，如果是则返回 True，否则返回 False。
- set1 >= set2 判断集合是不是包含其他集合，如果是则返回 True，否则返回 False。

**是否不相交**
- set.isdisjoint(set) 用于判断两个集合是不是不相交，如果是返回 True，否则返回 False。

#### 不可变集合
- frozenset([iterable]) 返回一个冻结的集合，冻结后集合不能再添加或删除任何元素。

#### 练习题

In [None]:
# 怎么表示只包含⼀个数字1的元组
a = (1,)
type(a)

In [None]:
# 创建一个空集合，增加 {‘x’,‘y’,‘z’} 三个元素。
b = set()
b.add('x')
b.add('y')
b.add('z')
b

### 序列

序列类型包括字符串、列表、元组、集合和字典，这些序列支持一些通用的操作，但比较特殊的是，集合和字典不支持索引、切片、相加和相乘操作。

In [8]:
b = 'I Love LsgoGroup'
b = tuple(b)

In [9]:
b

('I',
 ' ',
 'L',
 'o',
 'v',
 'e',
 ' ',
 'L',
 's',
 'g',
 'o',
 'G',
 'r',
 'o',
 'u',
 'p')

- sorted(iterable, key=None, reverse=False) 对所有可迭代的对象进行排序操作。
   - iterable -- 可迭代对象。
   - key -- 主要是用来进行比较的元素，只有一个参数，具体的函数的参数就是取自于可迭代对象中，指定可迭代对象中的一个元素来进行排序。
   - reverse -- 排序规则，reverse = True 降序 ， reverse = False 升序（默认）。
   - 返回重新排序的列表。

In [10]:
x = [-8, 99, 3, 7, 83]
print(sorted(x, reverse=True))  

[99, 83, 7, 3, -8]


In [11]:
t = ({"age": 20, "name": "a"}, {"age": 25, "name": "b"}, {"age": 10, "name": "c"})
x = sorted(t, key=lambda a: a["age"])
print(x)

[{'age': 10, 'name': 'c'}, {'age': 20, 'name': 'a'}, {'age': 25, 'name': 'b'}]


- reversed(seq) 函数返回一个反转的迭代器。
  - seq -- 要转换的序列，可以是 tuple, string, list 或 range
 
 **可以用list将reversed后的对象转换为list然后输出，否则输出的就是地址**

In [12]:
s = 'lsgogroup' 
x = reversed(s) 
print(x)

<reversed object at 0x000001E9F695B788>


In [13]:
print(list(x))

['p', 'u', 'o', 'r', 'g', 'o', 'g', 's', 'l']


- enumerate(sequence, [start=0])
用于将一个可遍历的数据对象(如列表、元组或字符串)组合为一个索引序列，同时列出数据和数据下标，一般用在 for 循环当中

In [14]:
seasons = ['Spring', 'Summer', 'Fall', 'Winter']
a = list(enumerate(seasons))
print(a)   

[(0, 'Spring'), (1, 'Summer'), (2, 'Fall'), (3, 'Winter')]


In [15]:
b = list(enumerate(seasons, 1))
print(b) 

[(1, 'Spring'), (2, 'Summer'), (3, 'Fall'), (4, 'Winter')]


In [16]:
for i, element in a:
    print('{0},{1}'.format(i, element))

0,Spring
1,Summer
2,Fall
3,Winter


In [17]:
season = ['Spring', 'Summer', 'Fall', 'Winter']
for i, element in list(enumerate(season)):
    print('{0},{1}'.format(i, element))

0,Spring
1,Summer
2,Fall
3,Winter


In [18]:
season = ['Spring', 'Summer', 'Fall', 'Winter']
for i, element in enumerate(season):
    print('{0},{1}'.format(i, element))

0,Spring
1,Summer
2,Fall
3,Winter


- zip(iter1 [,iter2 [...]])
用于将可迭代的对象作为参数，将对象中对应的元素打包成一个个元组，然后返回由这些元组组成的对象，这样做的好处是节约了不少的内存。
我们可以使用 list() 转换来输出列表。
如果各个迭代器的元素个数不一致，则返回列表长度与最短的对象相同，利用 * 号操作符，可以将元组解压为列表。

**可以用list将zip后的对象转换为list然后输出，否则输出的就是地址**

In [19]:
a = [1, 2, 3]
b = [4, 5, 6]
c = [4, 5, 6, 7, 8]

zipped = zip(a, b)

In [20]:
zipped

<zip at 0x1e9f6976a48>

In [21]:
print(list(zipped))

[(1, 4), (2, 5), (3, 6)]


In [22]:
a1, a2 = zip(*zip(a, b)) 

In [23]:
print(list(a1))  
print(list(a2))

[1, 2, 3]
[4, 5, 6]


#### 练习题

In [24]:
# 怎么找出序列中的最⼤、⼩值？
a = [1, 2, 3, 77, -90, 67]
amax= max(a)
amax

77

In [25]:
amin = min(a)
amin

-90

In [26]:
# sort() 和 sorted() 区别
a.sort()
print(a)

[-90, 1, 2, 3, 67, 77]


In [27]:
b = sorted(a)
print(b)

[-90, 1, 2, 3, 67, 77]


In [28]:
sum([ x for x in range(0,101)])

5050

In [29]:
# 怎么快速求 1 到 100 所有整数相加之和？
ssss = sum(range(1, 101))
ssss

5050

In [30]:
print(i for i in range(101))

<generator object <genexpr> at 0x000001E9F69849C8>


In [33]:
a = ['x', 'y', 'z']
b = [1, 2, 3]

In [34]:
c = zip(a, b)

In [36]:
# 将[‘x’,‘y’,‘z’] 和 [1,2,3] 转成 [(‘x’,1),(‘y’,2),(‘z’,3)] 的形式。
print(list(c))

[]
