# 字典排序

**lambda**
  
* 匿名函数 
* 结构：lambda x : f(x)    
  * lambda 引数: 返り値
  * 关键字lambda表示匿名函数
  * 冒号前面的x表示函数参数
  * 参考网站：https://qiita.com/nagataaaas/items/531b1fc5ce42a791c7df
* 不需要特意指定函数   
    比如：def return_twice(n):   
            return n * 2   
    可改写成：    
        lambda n: n * 2

In [None]:
# dict 排序
dic = {'a':4, 'b':3, 'c':2, 'd':1, 'e':0}

# 基于key排序
## 返回key
a = sorted(dic)
a = sorted(dic.keys())
## 返回value
a = sorted(dic)  # 先排key
b = [dic[x] for x in a]
## 返回整体
new = sorted(dic.items(), key = lambda x: x[0])  # [('a', 4), ('b', 3), ('c', 2), ('d', 1), ('e', 0)]

# 基于value排序
## 返回key
a = sorted(dic, key = lambda x:dic[x])
print(a)
## 返回value
a = sorted(dic.values())
## 返回整体
new = sorted(dic.items(), key = lambda x: x[1])  # [('e', 0), ('d', 1), ('c', 2), ('b', 3), ('a', 4)]


## 先根据value值排序，再根据key值排序
new = sorted(dic.items(), key = lambda x : (x[1], x[0]))  # [('e', 0), ('d', 1), ('c', 2), ('b', 3), ('a', 4)]
## 先根据value值逆排序，再根据key值的顺序排序
new = sorted(dic.items(), key = lambda x : (-x[1], x[0]))

# 默认都是从小到大排序
# reverse = True 从大到小

# defaultdict

In [None]:
from collections import defaultdict

l1 = [[0,1], [1,3], [3,4], [2,3], [3,5], [1,4],[1,4]]
graph = defaultdict(set)
for k,v in l1:
    graph[k].add(v)

graph

In [10]:
from collections import defaultdict
words = ['hello', 'world', 'nice', 'world']
#使用lambda来定义简单的函数
counter = defaultdict(lambda: 0) 
for kw in words:
    counter[kw] += 1

counter




defaultdict(<function __main__.<lambda>()>,
            {'hello': 1, 'world': 2, 'nice': 1})

In [13]:
sort = sorted(counter, key = lambda x:counter[x], reverse = True)
sort

['world', 'hello', 'nice']

In [15]:
a = sorted(counter.values())
a

[1, 1, 2]

# 字母比大小

In [1]:
ord('A')  # 65
ord('B')  # 66
ord('a')  # 97

97

# List
## 复制

## 删除

## 范围

In [1]:
l = [1,2,3,4]
l[0:0]

[]

In [2]:
l[4:0]

[]

# 赋值、引用、拷贝、作用域

## 赋值
* https://my.oschina.net/leejun2005/blog/145911
* 可以说 Python 没有赋值，只有引用

In [1]:
values = [0, 1, 2]
values[1] = values  # 预想是[0, [0, 1, 2], 2]
values  # 实际 [0, [...], 2]
        # 相当于创建了一个引用自身的结构，所以导致了无限循环

[0, [...], 2]

**解释**   
* Python 没有「变量」，我们平时所说的变量其实只是「标签」，是引用  
    * 执行values = [0, 1, 2]的时候，Python 做的事情是首先创建一个列表对象 [0, 1, 2]，然后给它贴上名为 values 的标签
    * 如果随后又执行values = [3, 4, 5]，Python 做的事情是创建另一个列表对象 [3, 4, 5]，然后把刚才那张名为 values 的标签从前面的 [0, 1, 2] 对象上撕下来，重新贴到 [3, 4, 5] 这个对象上
    * 至始至终，并没有一个叫做 values 的列表对象容器存在，Python 也没有把任何对象的值复制进 values 去
* 执行values[1] = values的时候，values 标签还是指向原来那个对象，只不过那个对象的结构发生了变化，从之前的列表 [0, 1, 2] 变成了 [0, ?, 2]，而这个 ? 则是指向那个对象本身的一个引用  

![title](img/value.png)

* 得到 [0, [0, 1, 2], 2] 这个对象，需要把[0, 1, 2] 这个对象「复制」一遍，得到一个新对象，再将 values[1] 指向这个复制后的对象
    * values[1] = values[:]
![title](img/value2.png)

In [3]:
values = [0, 1, 2]
values[1] = values[:]›
values

[0, [0, 1, 2], 2]

* values[:] 复制操作是所谓的「浅复制」(shallow copy)，当列表对象有嵌套的时候也会产生出乎意料的错误
![title](img/value3.png)

In [6]:
a = [0, [1, 2], 3]
b = a[:]
a[0] = 8
a[1][1] = 9

In [7]:
a

[8, [1, 9], 3]

In [8]:
b  # 第一层不变，但是第二层发生改变

[0, [1, 9], 3]

* 正确的复制嵌套元素的方法是进行「深复制」(deep copy)
![title](img/value4.png)

In [None]:
import copy

a = [0, [1, 2], 3]
b = copy.deepcopy(a)
a[0] = 8
a[1][1] = 9

## 增强赋值以及共享引用
x = x + y，x 出现两次，必须执行两次，性能不好，合并必须新建对象 x，然后复制两个列表合并

属于复制/拷贝

x += y，x 只出现一次，也只会计算一次，性能好，不生成新对象，只在内存块末尾增加元素。

当 x、y 为list时， += 会自动调用 extend 方法进行合并运算，in-place change。

属于共享引用

**难点/易错点**

In [10]:
L = [1, 2]
M = L
L = L + [3, 4]  # id(L)是发生改变的

In [11]:
L

[1, 2, 3, 4]

In [12]:
M  # M还是最初的L，不变
   # L = L + []，合并时必须新建对象L，然后复制两个列表合并-->属于复制/拷贝

[1, 2]

In [15]:
L = [1, 2]
M = L
L += [3, 4]  # id(L)是不发生改变的

In [16]:
L

[1, 2, 3, 4]

In [17]:
M  # M随着L的改变而改变了
   # L只出现一次，只会计算一次，不生成新的对象
   # 属于共享引用

[1, 2, 3, 4]

## 可变对象 & 不可变对象

* 可变对象: int，float，long，str，tuple等
* 不可变对象: list，set，dict
* 这里说的不可变指的是值的不可变
* 对于不可变类型的变量，如果要更改变量，则会创建一个新值，把变量绑定到新值上，而旧值如果没有被引用就等待垃圾回收
* 不可变的类型可以计算hash值，作为字典的key
* 可变类型数据对对象操作的时候，不需要再在其他地方申请内存，只需要在此对象后面连续申请(+/-)即可，也就是它的内存地址会保持不变，但区域会变长或者变短。

In [18]:
a = 'hello'
id(a)

4559811616

In [19]:
a = 'hi'
id(b)  # 重新赋值之后，变量a的内存地址已经变了
       # 因为str是不可变量，所以重新创建新的str，然后将变量a指向它

4561094856

In [20]:
a_list = [1, 2, 3]
id(a_list)

4559761864

In [22]:
a_list.append(4)
id(a_list)  # 地址不变
            # [1, 2, 3]是可变的，append操作只是改变了其value，变量a_list指向没有变

4559761864

## 函数值传递
* 对于可变对象，对象的操作不会重建对象，而对于不可变对象，每一次操作就重建新的对象。
* func_int中的局部变量"a"其实是全部变量"t"所指向对象的另一个引用，由于整数对象是不可变的，所以当func_int对变量"a"进行修改的时候，实际上是将局部变量"a"指向到了整数对象"1"
* func_list修改的是一个可变的对象，局部变量"a"和全局变量"t_list"指向的还是同一个对象。

In [37]:
def func_int(a):
    a += 4
    return a

t = 0
func_int(t)
print(func_int(t))
t  # t还是0

4


0

In [38]:
def func_int(a):
    a += 4
    return a

t = 0
t = func_int(t)  # t被重新赋值
t

4

In [30]:
def func_list(a_list):
    a_list[0] = 4
    
t_list = [1, 2, 3]
func_list(t_list)
t_list  # t_list发生改变

[4, 2, 3]

In [11]:
a = [1,2]
print('a的ID: ' + str(id(a)))
def func(b):
    print('b的ID: ' + str(id(b)))  # b指向的对象和a是一样的，一个ID
    b = [3,4]  # b重新指向新的对象
    print('b的ID: ' + str(id(b)))

func(a)
print(a)

a的ID: 4371832904
b的ID: 4371832904
b的ID: 4371835144
[1, 2]


##  为什么修改全局的dict变量不用global关键字


In [40]:
s = 'foo'
d = {'a':1}
def f():
    s = 'bar'
    d['b'] = 2
f()
print(s)  # s没有发生改变
print(d)  # 即使不写return，不写d = f(), d也发生了改变

'''
解释：
一个是rebinding（不可变对象）, 一个是mutation（可变对象）

在s = 'bar'这句中，它是“有歧义的“，因为它既可以是表示引用全局变量s，也可以是创建一个新的局部变量，
所以在python中，默认它的行为是创建局部变量，除非显式声明global，global定义的本地变量会变成其对应全局变量的一个别名，即是同一个变量。

在d['b']=2这句中，它是“明确的”，因为如果把d当作是局部变量的话，它会报KeyError，所以它只能是引用全局的d,故不需要多此一举显式声明global。
'''


foo
{'a': 1, 'b': 2}


In [41]:
d = {'a':1}
def f():
    d = {}
    d['b'] = 2
f()
print(d) # {'a': 1} 不变

'''
解释
在d = {}这句，它是”有歧义的“了，所以它是创建了局部变量d，而不是引用全局变量d，所以d['b']=2也是操作的局部变量。

'''

{'a': 1}


"\n解释\n在d = {}这句，它是”有歧义的“了，所以它是创建了局部变量d，而不是引用全局变量d，所以d['b']=2也是操作的局部变量。\n\n"

In [42]:
d = {'a':1}
def f():
    d = {}
    d['b'] = 2
    
d = f()
print(d) # None

None


In [43]:
d = {'a':1}
def f():
    d = {}
    d['b'] = 2
    return d

d = f()
print(d) # {'b': 2} 被重新赋值

{'b': 2}


## 可变对象 list 的 = 和 append/extend 差别在哪？
为什么 语句1 不能改变 list_a 的值，而 语句2 却可以？他们的差别在哪呢？
* 因为 = 创建了局部变量，而 .append() 或者 .extend() 重用了全局变量

* 可变对象，def里面不重新新建的话，可变对象发生改变时，全局的该对象都会发生改变
* 不可变对象，def里面对不可变对象做任何的修饰，只要最后不写return和x=f()就不会发生改变，def里面的不可变对象跟全局的不可变对象是两个对象


In [44]:
list_a = []
def a():
    list_a = [1]      ## 语句1
a()
print(list_a)   # []

[]


In [46]:
list_b = []
def b():
    list_b.append(1)    ## 语句2
b()
print(list_b)   # [1]

[1]


##  陷阱：使用可变的默认参数


In [48]:
def foo(a, b, c=[]):
    c.append(a)
    c.append(b)
    print(c)
foo(1, 1)    # c是会一直累积的

[1, 1]


In [49]:
foo(1, 1)

[1, 1, 1, 1]


In [50]:
foo(1, 1)

[1, 1, 1, 1, 1, 1]


In [51]:
'''
改良
'''
def foo(a, b, c=None):
    if c is None:
        c = []
        c.append(a)
        c.append(b)
        print(c)
foo(1, 1)

[1, 1]


In [52]:
foo(1, 1)

[1, 1]


In [53]:
foo(1, 1)

[1, 1]


# inf表示无限大

In [3]:
float('-inf')

-inf

In [4]:
float('inf')

inf

# sort与sorted
* sort 在原本的list上进行sort
* sorted 形成一个新的list

In [16]:
l = [5,4,3,2]

In [18]:
sorted(l)  # l不变，产生新的列表

[2, 3, 4, 5]

In [19]:
l

[5, 4, 3, 2]

In [20]:
a = sorted(l)
a

[2, 3, 4, 5]

In [21]:
l.sort()  # 在原list上面排序

In [22]:
l

[2, 3, 4, 5]

# range

**range(start, stop[, step])**

* start: 计数从 start 开始。默认是从 0 开始。例如range（5）等价于range（0， 5）;
* stop: 计数到 stop 结束，但不包括 stop。例如：range（0， 5） 是[0, 1, 2, 3, 4]没有5
* step：步长，默认为1。例如：range（0， 5） 等价于 range(0, 5, 1)

In [4]:
for i in range(0, 30, 5):  # [0, 5, 10, 15, 20, 25]
    print(i)

0
5
10
15
20
25


In [5]:
for i in range(8, -1, -1):  # [8,7,6,5,4,3,2,1,0]
    print(i)

8
7
6
5
4
3
2
1
0


# format 格式化函数


In [1]:
"{} {}".format("hello", "world")    # 不设置指定位置，按默认顺序
# "{0} {1}".format("hello", "world")  # 设置指定位置

'hello world'

In [2]:
"{}.{}".format("hello", "world")    # 不设置指定位置，按默认顺序

'hello.world'

In [3]:
"{1} {0} {1}".format("hello", "world")  # 设置指定位置

'world hello world'

In [4]:
# 通过字典设置参数
site = {"name": "菜鸟教程", "url": "www.runoob.com"}
print("网站名：{name}, 地址 {url}".format(**site))

网站名：菜鸟教程, 地址 www.runoob.com


In [5]:
# 通过列表索引设置参数
my_list = ['菜鸟教程', 'www.runoob.com']
print("网站名：{0[0]}, 地址 {0[1]}".format(my_list))  # "0" 是必须的

网站名：菜鸟教程, 地址 www.runoob.com


In [6]:
class AssignValue(object):
    def __init__(self, value):
        self.value = value
my_value = AssignValue(6)
print('value 为: {0.value}'.format(my_value))  # "0" 是可选的

value 为: 6


## 数字格式化
![title](./img/format.png)

In [7]:
"{:.2f}".format(3.1415926)

'3.14'