# 字符串
## 字符编码
ASCII编码: 由于计算机是美国人发明的，因此，最早只有127个字符被编码到计算机里，也就是大小写英文字母、数字和一些符号，这个编码表被称为ASCII编码，比如大写字母A的编码是65，小写字母z的编码是122。

Unicode编码：Unicode把所有语言都统一到一套编码里，最常用的是用两个字节表示一个字符（如果要用到非常偏僻的字符，就需要4个字节）

UTF-8编码：本着节约的原则把Unicode编码转化为“可变长编码”的UTF-8编码。UTF-8编码把一个Unicode字符根据不同的数字大小编码成1-6个字节，常用的英文字母被编码成1个字节，汉字通常是3个字节，只有很生僻的字符才会被编码成4-6个字节。如果你要传输的文本包含大量英文字符，用UTF-8编码就能节省空间。

现在计算机系统通用的字符编码工作方式：

在计算机内存中，统一使用Unicode编码，当需要保存到硬盘或者需要传输的时候，就转换为UTF-8编码。

例如，用记事本编辑的时候，从文件读取的UTF-8字符被转换为Unicode字符到内存里，编辑完成后，保存的时候再把Unicode转换为UTF-8保存到文件

在最新的Python 3版本中，字符串是以Unicode编码的，也就是说，Python的字符串支持多语言，例如：

In [1]:
print('你好abc') #包含中文的字符串

你好abc


对于单个字符的编码，Python提供了ord()函数获取字符的整数表示，chr()函数把编码转换为对应的字符：

In [2]:
ord('王')

29579

In [7]:
chr(34567)

'蜇'

由于Python的字符串类型是str，在内存中以Unicode表示，一个字符对应若干个字节。如果要在网络上传输，或者保存到磁盘上，就需要把str变为以字节为单位的bytes。

Python对bytes类型的数据用带b前缀的单引号或双引号表示：

In [29]:
y='中文'
print(y, len(y), len(y.encode('utf-8')),y.__sizeof__())

#len()函数计算的是str的字符数，如果换成bytes，len()函数就计算字节数：

中文 2 6 78


In [10]:
print('%2d-%02d' % (3, 1))
print('%.2f' % 3.1415926)

 3-01
3.14


In [2]:
# 字符串倒序输出
string = '12345'

print(string[::-1]) # note there are two commas before  - 1

54321


In [3]:
# 用in关键字判断子串
if '34' in '12345':
    print('yes')

yes


In [7]:
# perf_counter() 返回一个CPU级别的精确时间计数器，单位为秒
import time
start = time.perf_counter()
time.sleep(3.3)
end = time.perf_counter()
print(end - start)

3.3007654965537085


In [9]:
import time
scale = 50
print('执行开始'.center(scale//2, '-'))
start = time.perf_counter()
for i in range(scale + 1):
    a = '*' * i
    b = '.' * (scale - i)
    c = (i / scale) * 100
    dur = time.perf_counter() - start
    print('\r{:^3.0f}%[{}->{}]{:.2f}s'.format(c, a, b, dur), end='')
    time.sleep(0.1)
print('\n'+'执行结束'.center(scale//2, '-'))

-----------执行开始----------
100%[**************************************************->]5.05s
-----------执行结束----------


# For else

英文原文

A break statement executed in the first suite terminates the loop without executing the else clause’s suite. A continue statement executed in the first suite skips the rest of the suite and continues with the next item, or with the else clause if there is no next item.

中文译文 
用 break 关键字终止当前循环就不会执行当前的 else 语句，而使用 continue 关键字快速进入下一论循环，或者没有使用其他关键字，循环的正常结束后，就会触发 else 语句

In [1]:
# 触发 else --正常结束循环
list = [1,2,3,4,5]
for x in list:
    print(x)
else:
    print("else")

1
2
3
4
5
else


In [2]:
# 触发 else --使用continue关键字
list = [1,2,3,4,5]
for x in list:
    continue
    print(x)
else:
    print('else')

else


In [3]:
# 不触发 else --使用break关键字
list = [1,2,3,4,5]
for x in list:
    print(x)
    break
else:
    print('else')

1


# List and tuple
## list
Python内置的一种数据类型是列表：list。list是一种有序的集合，可以随时添加和删除其中的元素。

note:list是一个可变的有序表，所以，可以往list中追加元素到末尾：

In [19]:
classmates = ['Bob','Jack']
classmates.append('Tom')
classmates

['Bob', 'Jack', 'Tom']

In [20]:
classmates.insert(1,'Rachel') #插入指定位置, 改用insert
classmates

['Bob', 'Rachel', 'Jack', 'Tom']

In [21]:
classmates.pop() #删除末尾元素
classmates

['Bob', 'Rachel', 'Jack']

In [22]:
classmates.pop(1) # 删除指定元素
classmates

['Bob', 'Jack']

In [24]:
classmates[1] = 'Sarah' #替换某元素，可以直接赋值
classmates

['Bob', 'Sarah']

## tuple
另一种有序列表叫元组：tuple。tuple和list非常类似，但是tuple一旦初始化就不能修改

不可变的tuple有什么意义？因为tuple不可变，所以代码更安全。如果可能，能用tuple代替list就尽量用tuple。

tuple的注意事项：

    1)当你定义一个tuple时，在定义的时候，tuple的元素就必须被确定下来；
    2)多个变量可以同时接收一个tuple，按位置赋给对应的值

In [38]:
x, y=(1,2)
x

1

### 推导式
推导式comprehensions（又称解析式），是Python的一种独有特性。推导式是可以从一个数据序列构建另一个新的数据序列的结构体。 共有三种推导，在Python2和3中都有支持：

列表(list)推导式
字典(dict)推导式
集合(set)推导式

In [4]:
data = ['driver', '2017-07-13', 1827.0, 2058, 978.0, 1636.0, 1863.0, 2537.0, 1061.0]
print([x for x in data if isinstance(x, (float, int)) and x > 2000])
print([int(x) if type(x) == float else x for x in data])

[2058, 2537.0]
['driver', '2017-07-13', 1827, 2058, 978, 1636, 1863, 2537, 1061]


#### 字典推导式
字典推导和列表推导的使用方法是类似的，只不中括号该改成大括号

In [6]:
# 大小写key合并
mcase = {'a': 10, 'b': 34, 'A': 7, 'Z': 3}
mcase_frequency = {
    k.lower(): mcase.get(k.lower(), 0) + mcase.get(k.upper(), 0)
    for k in mcase.keys()
    if k.lower() in ['a', 'b']
}
print(mcase_frequency)

{'a': 17, 'b': 34}


In [8]:
# 快速更换key and value
d = {'a': 17, 'b': 34}
print({v: k for k, v in d.items()})

{17: 'a', 34: 'b'}


#### 集合推导式
它们跟列表推导式也是类似的。 唯一的区别在于它使用大括号{}。

例：

squared = {x**2 for x in [1, 1, 2]}
print(squared)

Output: set([1, 4])

# Dict and Set
Python内置了字典：dict的支持，dict全称dictionary，在其他语言中也称为map，使用键-值（key-value）存储，具有极快的查找速度

In [25]:
 d = {'Michael': 95, 'Bob': 75, 'Tracy': 85}

In [26]:
'Tomas' in d #通过in判断key是否存在

False

In [27]:
d.get('Tomas') #通过dict提供的get()方法，如果key不存在，可以返回None，或者自己指定的value

In [28]:
d.get('Tomas', -1)

-1

set和dict类似，也是一组key的集合，但不存储value。由于key不能重复，所以，在set中，没有重复的key (初始化时重复的key会被自动删除)。

要创建一个set，需要提供一个list作为输入集合：

In [30]:
s=set([1,2,3])
s

{1, 2, 3}

In [31]:
s.add(4) #可以添加元素到set中，可以重复添加，但不会有效果
s

{1, 2, 3, 4}

In [32]:
s.remove(4)
s

{1, 2, 3}

In [35]:
hex(124)

'0x7c'

# 函数
定义函数时，需要确定函数名和参数个数；

如果有必要，可以先对参数的数据类型做检查(isinstance)；

函数体内部可以用return随时返回函数结果；

函数执行完毕也没有return语句时，自动return None。

函数可以同时返回多个值，但其实就是一个tuple。

### 默认参数
定义默认参数要牢记一点：默认参数必须指向不变对象！

In [40]:
def add_end(L=[]):
    L.append('END')
    return L

print(add_end()) # []是可变的list，因此会出现这样的错误
print(add_end())

['END']
['END', 'END']


In [41]:
def add_end(L=None):
    if L is None:
        L = []
    L.append('END')
    return L

print(add_end()) 
print(add_end())

['END']
['END']


### 可变参数
顾名思义，可变参数就是传入的参数个数是可变的，可以是1个、2个到任意个，还可以是0个

定义可变参数和定义一个list或tuple参数相比，仅仅在参数前面加了一个*号。在函数内部，参数numbers接收到的是一个tuple，因此，函数代码完全不变。但是，调用该函数时，可以传入任意个参数，包括0个参数：

In [42]:
def calc(*numbers):
    sum = 0
    for n in numbers:
        sum = sum + n * n
    return sum

calc(1,2,4) #若函数定义时使用list作为传入参数，则需写成 calc([1,2,4])

21

Python允许你在list或tuple前面加一个*号，把list或tuple的元素变成可变参数传进去:

In [45]:
num=[1,2,4]
calc(*num)

21

### 关键字参数
可变参数允许你传入0个或任意个参数，这些可变参数在函数调用时自动组装为一个tuple。而关键字参数允许你传入0个或任意个含参数名的参数，这些关键字参数在函数内部自动组装为一个dict。例如:

In [46]:
def person(name, age, **kw):
    print('name:', name, 'age:', age, 'other:', kw)
    
person('Michael',20)

name: Michael age: 20 other: {}


In [47]:
person('Adam', 45, gender='M', job='Engineer')

name: Adam age: 45 other: {'gender': 'M', 'job': 'Engineer'}


关键字参数有什么用？它可以扩展函数的功能。比如，在person函数里，我们保证能接收到name和age这两个参数，但是，如果调用者愿意提供更多的参数，我们也能收到。

note: **extra表示把extra这个dict的所有key-value用关键字参数传入到函数的**kw参数，kw将获得一个dict，注意kw获得的dict是extra的一份拷贝，对kw的改动不会影响到函数外的extra。

In [48]:
extra={'city':'Beijing', 'job':'Engineer'}
person('Jack', 20, **extra)

name: Jack age: 20 other: {'city': 'Beijing', 'job': 'Engineer'}


### 命名关键字参数
对于关键字参数，函数的调用者可以传入任意不受限制的关键字参数。至于到底传入了哪些，就需要在函数内部通过kw检查。
如果要限制关键字参数的名字，就可以用命名关键字参数，例如，只接收city和job作为关键字参数。这种方式定义的函数如下：

In [50]:
def person(name, age, *, city, job): #和关键字参数**kw不同，命名关键字参数需要一个特殊分隔符*
    print(name, age, city, job)      # *后面的参数被视为命名关键字参数。

In [55]:
person('Jason',18,city='Beijing',job='military')

Jason 18 Beijing military


如果函数定义中已经有了一个可变参数，后面跟着的命名关键字参数就不再需要一个特殊分隔符*了，但如果没有可变参数，就必须加一个*作为特殊分隔符。如果缺少*，Python解释器将无法识别位置参数和命名关键字参数：

In [56]:
def person(name, age, *args, city, job):
    print(name, age, args, city, job)

## 递归
递归函数的优点是定义简单，逻辑清晰。理论上，所有的递归函数都可以写成循环的方式，但循环的逻辑不如递归清晰。

使用递归函数需要注意防止栈溢出。在计算机中，函数调用是通过栈（stack）这种数据结构实现的，每当进入一个函数调用，栈就会加一层栈帧，每当函数返回，栈就会减一层栈帧。由于栈的大小不是无限的，所以，递归调用的次数过多，会导致栈溢出。

解决递归调用栈溢出的方法是通过尾递归优化，事实上尾递归和循环的效果是一样的，所以，把循环看成是一种特殊的尾递归函数也是可以的。

## 尾递归
尾递归是指，在函数返回的时候，调用自身本身，并且，return语句不能包含表达式。这样，编译器或者解释器就可以把尾递归做优化，使递归本身无论调用多少次，都只占用一个栈帧，不会出现栈溢出的情况

In [57]:
def fact(n):
    return fact_iter(n, 1)

def fact_iter(num, product):
    if num == 1:
        return product
    return fact_iter(num - 1, num * product)  # return中不能有表达式，包括乘法，加法等

汉诺塔问题

In [62]:
def move(n,a,b,c):
    if n == 1:
        print(a, '-->', c)
    else:
        move(n-1,a,c,b)
        move(1,a,b,c)
        move(n-1,b,a,c)

move(3, 'A', 'B', 'C')

A --> C
A --> B
C --> B
A --> C
B --> A
B --> C
A --> C


## 切片

In [66]:
L=list(range(100))
L[:10] #前10个数

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]

In [123]:
L[0:3] # L[0:3]表示，从索引0开始取，直到索引3为止，但不包括索引3。即索引0，1，2，正好是3个元素。

[0, 1, 2]

In [67]:
L[-10:] # 后10个数

[90, 91, 92, 93, 94, 95, 96, 97, 98, 99]

In [127]:
def trim(s):  #去除首尾的空格
    if s.isspace() or s == '':
        return ''
    else:
        i=0
        j=-1
        for char in s:
            if char.isspace():
                i=i+1
            else:
                break
        #print('i is %d'%i)
        while s[j].isspace():
            j=j-1    
        #print('j is %d'%j)
        return s[i:j+len(s)+1]

In [128]:
# 测试:
if trim('hello  ') != 'hello':
    print('测试失败1!')
elif trim('  hello') != 'hello':
    print('测试失败2!')
elif trim('  hello  ') != 'hello':
    print('测试失败3!')
elif trim('  hello  world  ') != 'hello  world':
    print('测试失败4!')
elif trim('') != '':
    print('测试失败5!')
elif trim('    ') != '':
    print('测试失败6!')
else:
    print('测试成功!')

测试成功!


## 迭代
Python的for循环不仅可以用在list或tuple上，还可以作用在其他可迭代对象上。
list这种数据类型虽然有下标，但很多其他数据类型是没有下标的，但是，只要是可迭代对象，无论有无下标，都可以迭代，比如dict就可以迭代：

In [130]:
d = {'a':1, 'b':2, 'c':3}
for key in d:
    print(key)

a
b
c


因为dict的存储不是按照list的方式顺序排列，所以，迭代出的结果顺序很可能不一样。

默认情况下，dict迭代的是key。如果要迭代value，可以用for value in d.values()，如果要同时迭代key和value，可以用**<font color=red>for k, v in d.items()</font>**。

In [131]:
for i, value in enumerate(['A','B','C']): #Python内置的enumerate函数可以把一个list变成索引-元素对
    print(i, value)

0 A
1 B
2 C


for循环里，同时引用了两个变量，在Python里是很常见的，比如下面的代码：

In [132]:
for x, y in [(1,2),(3,4),(5,6)]:
    print(x, y)

1 2
3 4
5 6


In [151]:
def findMinAndMax(L):
    if L == []:
        return(None, None)
    else:
        minimum = L[0]
        maximum = L[0]
        for i in L:
            if i < minimum:
                minimum = i
            if i > maximum:
                maximum = i
        return(minimum, maximum)

In [152]:
if findMinAndMax([]) != (None, None):
    print('测试失败!')
elif findMinAndMax([7]) != (7, 7):
    print('测试失败!')
elif findMinAndMax([7, 1]) != (1, 7):
    print('测试失败!')
elif findMinAndMax([7, 1, 3, 9, 5]) != (1, 9):
    print('测试失败!')
else:
    print('测试成功!')

测试成功!


## 列表生成器
列表生成式即List Comprehensions

In [153]:
[x * x for x in range(1,11) if x%2 == 0]

[4, 16, 36, 64, 100]

In [154]:
[m + n for m in 'ABC' for n in 'DEF'] # 使用两层循环，可以生成全排列

['AD', 'AE', 'AF', 'BD', 'BE', 'BF', 'CD', 'CE', 'CF']

In [155]:
d = {'a':'x', 'b':'y', 'c':'z'}
for key, value in d.items():
    print(key + '=' + value)

a=x
b=y
c=z


In [158]:
L1 = ['Hello', 'World', 18, 'Apple', None]
L2 = [ x.lower() for x in L1 if isinstance(x, str)]
L2

['hello', 'world', 'apple']

## 生成器
在Python中，这种一边循环一边计算的机制，称为生成器：generator。
第一种方法很简单，只要把一个列表生成式的[]改成()，就创建了一个generator：

In [165]:
L=[x * x for x in range(10)]
g = (x * x for x in range(10))
print(L)
print(g)

[0, 1, 4, 9, 16, 25, 36, 49, 64, 81]
<generator object <genexpr> at 0x0000017E2D883E08>


generator保存的是算法，每次调用next(g)，就计算出g的下一个元素的值，直到计算到最后一个元素，没有更多的元素时，抛出StopIteration的错误. 但是我们创建了一个generator后，基本上永远不会调用next()，而是通过for循环来迭代它，并且不需要关心StopIteration的错误。

generator的第二种生成方法: 如果一个函数定义中包含yield关键字，那么这个函数就不再是一个普通函数，而是一个generator

In [166]:
for n in g:  # for循环来迭代generator
    print(n, end=' ')

0 1 4 9 16 25 36 49 64 81 

In [2]:
def fib(max):
    n, a, b = 0, 0, 1
    while n < max:   # 故而要给循环设置一个条件来退出循环，不然就会产生一个无限数列出来。
        yield b      # 在循环过程中不断调用yield，就会不断中断。
        a, b = b, a + b
        n = n + 1
    return 'done'

f=fib(6)
f

<generator object fib at 0x0000029534E44D58>

同样的，把函数改成generator后，我们基本上从来不会用next()来获取下一个返回值，而是直接使用for循环来迭代：

In [168]:
for n in fib(6):
    print(n, end=' ')

1 1 2 3 5 8 

但是用for循环调用generator时，发现拿不到generator的return语句的返回值。如果想要拿到返回值，必须捕获StopIteration错误，返回值包含在StopIteration的value中：

In [None]:
g = fib(6)
while True:
    try:
        x = next(g)
        print('g:', x)
    except StopIteration as e:
        print('Generator return value:', e.value)
        break

In [45]:
def triangles(): # 在函数参数传递的时候，Python其实就是把参数里传入的变量对应的对象的引用
                 # 依次赋值给对应的函数内部变量
    L = [1]
    while True:
        yield L
        L=[x+y for x, y in zip([0]+L, L+[0])] #由于list的长度增加了，所以L重新指向新的内存位置
        # t = L  note： 赋值语句总是建立对象的引用值，而不是复制对象
    return 'done'

n = 0
results = []
for t in triangles():
    print(t)
    results.append(t)
    n = n + 1
    if n == 10:
        break
if results == [
    [1],
    [1, 1],
    [1, 2, 1],
    [1, 3, 3, 1],
    [1, 4, 6, 4, 1],
    [1, 5, 10, 10, 5, 1],
    [1, 6, 15, 20, 15, 6, 1],
    [1, 7, 21, 35, 35, 21, 7, 1],
    [1, 8, 28, 56, 70, 56, 28, 8, 1],
    [1, 9, 36, 84, 126, 126, 84, 36, 9, 1]
]:
    print('测试通过!')
else:
    print('测试失败!')

[1]
[1, 1]
[1, 2, 1]
[1, 3, 3, 1]
[1, 4, 6, 4, 1]
[1, 5, 10, 10, 5, 1]
[1, 6, 15, 20, 15, 6, 1]
[1, 7, 21, 35, 35, 21, 7, 1]
[1, 8, 28, 56, 70, 56, 28, 8, 1]
[1, 9, 36, 84, 126, 126, 84, 36, 9, 1]
测试通过!


python 深入理解 赋值、引用、拷贝、作用域：https://www.cnblogs.com/jiangzhaowei/p/5740913.html

引用 VS 拷贝：

（1）没有限制条件的分片表达式（L[:]）能够复制序列，但此法只能浅层复制。

（2）字典 copy 方法，D.copy() 能够复制字典，但此法只能浅层复制

（3）有些内置函数，例如 list，能够生成拷贝 list(L)

（4）copy 标准库模块能够生成完整拷贝：deepcopy 本质上是递归 copy

（5）对于不可变对象和可变对象来说，浅复制都是复制的引用，只是因为复制不变对象和复制不变对象的引用是等效的（因为对象不可变，当改变时会新建对象重新赋值）。所以看起来浅复制只复制不可变对象（整数，实数，字符串等），对于可变对象，浅复制其实是创建了一个对于该对象的引用，也就是说只是给同一个对象贴上了另一个标签而已。

### 迭代器 iterator
可以直接作用于for循环的数据类型有以下几种：

一类是集合数据类型，如list、tuple、dict、set、str等；

一类是generator，包括生成器和带yield的generator function。

这些可以直接作用于for循环的对象统称为可迭代对象：Iterable。

可以使用isinstance()判断一个对象是否是Iterable对象：

In [50]:
from collections import Iterable
print(isinstance([],Iterable))
print(isinstance({},Iterable))
print(isinstance('abc',Iterable))

True
True
True


生成器都是Iterator对象，但list、dict、str虽然是Iterable，却不是Iterator。

把list、dict、str等Iterable变成Iterator可以使用iter()函数

note: 为什么list、dict、str等数据类型不是Iterator？

这是因为Python的Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误。

## 函数式编程
高阶函数英文叫Higher-order function，变量可以指向函数，函数的参数能接收变量，那么一个函数就可以接收另一个函数作为参数，这种函数就称之为高阶函数。

map()函数接收两个参数，一个是函数，一个是Iterable，map将传入的函数依次作用到序列的每个元素，并把结果作为新的Iterator返回。

In [52]:
def f(x):
    return x * x

r = map(f,[1,2,3,4,5])
print(r)
list(r) #由于结果r是一个Iterator，Iterator是惰性序列，
        #因此通过list()函数让它把整个序列都计算出来并返回一个list。

<map object at 0x00000189614BA9B0>


[1, 4, 9, 16, 25]

reduce把一个函数作用在一个序列[x1, x2, x3, ...]上，这个函数必须接收两个参数，reduce把结果继续和序列的下一个元素做累积计算，其效果就是

reduce(f,[x1,x2,x3,x4])=f(f(f(x1,x2),x3),x4)

In [54]:
from functools import reduce
def fn(x,y):
    return x * 10 + y

reduce(fn,[1,3,5,7,9])

13579

In [59]:
def normalize(name):
    s = name[0].upper()
    s = s + name[1:len(name)].lower()
    return s

L1 = ['adam','LISA','barT']
L2 = list(map(normalize,L1))
print(L2)

['Adam', 'Lisa', 'Bart']


In [62]:
from functools import reduce  # 可以接受一个list并求积
def prod(L):
    return reduce(lambda x, y:x * y, L)

print('3 * 5 * 7 * 9=', prod([3,5,7,9]))
if prod([3,5,7,9]) == 945:
    print('tests success')
else:
    print('test failure')

3 * 5 * 7 * 9= 945
tests success


In [64]:
from functools import reduce  # str2float函数，把字符串'123.456'转换成浮点数123.456

DIGITS = {'0': 0, '1': 1, '2': 2, '3': 3, '4': 4, '5': 5, '6': 6, '7': 7, '8': 8, '9': 9}

def char2num(s):
        return DIGITS[s]
    
def str2float(s):
    s1 = ''
    s2 = ''
    flt = 0
    [s1, s2] = s.split('.')
    flt = reduce(lambda x, y: 10 * x + y, map(char2num, s1))
    div = 10
    for char in s2:
        flt = flt + char2num(char)/div
        div = div * 10
    return flt

print('str2float(\'123.456\')=', str2float('123.456'))
if abs(str2float('123.456') - 123.456) < 0.00001:
    print('test success')
else:
    print('test failure')

str2float('123.456')= 123.456
test success


In [1]:
def is_palindrome(n):
    s = str(n)
    i = 0
    if len(s) == 1:
        return True
    else:
         while i < (len(s) - 1)/2:
                if s[i] != s[len(s)-1-i]:
                    return False
                i = i + 1
    return True

output = filter(is_palindrome, range(1,1000))
print('1~1000:', list(output))
if list(filter(is_palindrome, range(1,200))) == [1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 22, 33, 44, 55, 66, 77, 88, 99, 101, 111, 121, 131, 141, 151, 161, 171, 181, 191]:
    print('test success')
else:
    print('test failure')

1~1000: [1, 2, 3, 4, 5, 6, 7, 8, 9, 11, 22, 33, 44, 55, 66, 77, 88, 99, 101, 111, 121, 131, 141, 151, 161, 171, 181, 191, 202, 212, 222, 232, 242, 252, 262, 272, 282, 292, 303, 313, 323, 333, 343, 353, 363, 373, 383, 393, 404, 414, 424, 434, 444, 454, 464, 474, 484, 494, 505, 515, 525, 535, 545, 555, 565, 575, 585, 595, 606, 616, 626, 636, 646, 656, 666, 676, 686, 696, 707, 717, 727, 737, 747, 757, 767, 777, 787, 797, 808, 818, 828, 838, 848, 858, 868, 878, 888, 898, 909, 919, 929, 939, 949, 959, 969, 979, 989, 999]
test success


In [28]:
 # sorted()排序函数
L = [('Bob', 75), ('Adam', 92), ('Bart', 66), ('Lisa', 88)]
def by_name(t):
    #print('L adrress:',id(L))
    #print('t address',id(t))
    return t[1]
                
L2 = sorted(L, key=by_name)
print(L2)

[('Bart', 66), ('Bob', 75), ('Lisa', 88), ('Adam', 92)]


## 返回函数
高阶函数除了可以接受函数作为参数外，还可以把函数作为结果值返回。

In [25]:
def lazy_sum(*args):
    def sum():
        ax = 0
        for n in args:
            ax = n + ax
        return ax
    return sum

f = lazy_sum(1,3,5,9)
print(f)
print(f())

<function lazy_sum.<locals>.sum at 0x000001E2D2ACE598>
18


在函数lazy_sum中又定义了函数sum，并且，内部函数sum可以引用外部函数lazy_sum的参数和局部变量，当lazy_sum返回函数sum时，相关参数和变量都保存在返回的函数中，这种称为“闭包（Closure）”的程序结构拥有极大的威力。

需要注意的问题是，返回的函数并没有立刻执行，而是直到调用了f()才执行。

In [32]:
# 利用闭包返回一个计数器函数，每次调用它返回递增整数：
def createCounter():
    count = 0
    def counter():
        nonlocal count  #nonlocal关键字用来在函数或其他作用域中修改外层(非全局)变量
                        #global关键字则是用于修改全局变量
        count += 1
        return count
    return counter

counterA = createCounter()
print(counterA(), counterA(), counterA())
counterB = createCounter()
if [counterB(), counterB(), counterB(), counterB()] == [1, 2, 3, 4]:
    print('test success')
else:
    print('test failure')

1 2 3
test success


## 匿名函数
关键字lambda表示匿名函数，冒号前面的x表示函数参数。

匿名函数有个限制，就是只能有一个表达式，不用写return，返回值就是该表达式的结果。

In [33]:
f = lambda x: x * x
f

<function __main__.<lambda>>

In [34]:
f(5)

25

同样，也可以把匿名函数作为返回值返回，比如:

In [35]:
def build(x,y):
    return lambda: x * x + y * y

In [38]:
L = list(filter(lambda x: x % 2 == 1, range(1, 20)))
print(L)

[1, 3, 5, 7, 9, 11, 13, 15, 17, 19]


In [33]:
x = [lambda: x for x in range(3)]
print(x)
print(x[0]())
# note here x is a list of 3 functions. The reason is due to the precedence of operators.
# [lambda: x for x in range(3)] is equivalent to [(lambda: x) for x in range(3)]

[<function <listcomp>.<lambda> at 0x000001CE8466D620>, <function <listcomp>.<lambda> at 0x000001CE8466D9D8>, <function <listcomp>.<lambda> at 0x000001CE8458B378>]
2


## 装饰器 decorator
在代码运行期间动态增加功能的方式，称之为“装饰器”（Decorator）。

本质上，decorator就是一个返回函数的高阶函数。所以，我们要定义一个能打印日志的decorator，可以定义如下：

In [39]:
def log(func):
    def wrapper(*args, **kw):
        print('call %s():' %func.__name__) #函数对象有一个__name__属性，可以拿到函数的名字
        return func(*args, **kw)
    return wrapper

# 作为decorator的log，接受一个函数作为参数，并返回一个函数。
# 通过借助Python的@语法，我们把decorator置于函数的定义处：

@log  #将@log放到now()函数的定义处，相当于执行了语句:now = log(now)
def now():
    print('2015-03-25')

# 调用now()函数，不仅会运行now()函数本身，还会在运行now()函数前打印一行日志
now()

call now():
2015-03-25


由于log()是一个decorator，返回一个函数，所以，原来的now()函数仍然存在，只是现在同名的now变量指向了新的函数，于是调用now()将执行新函数，即在log()函数中返回的wrapper()函数。

In [42]:
import time, functools

def metric(fn):
    @functools.wraps(fn) #相当于执行了wrapper.__name__ = func.__name__
    def wrapper(*args, **kw):
        start = time.time()
        result = fn(*args, **kw)
        end = time.time()
        print('%s executed in %s ms' % (fn.__name__, end-start))
        return result 
    return wrapper

@metric
def fast(x,y):
    time.sleep(0.00012)
    return x + y

@metric
def slow(x,y,z):
    time.sleep(0.1234)
    return x * y * z
f = fast(11,22)
s = slow(11,22,33)
if f != 33:
    print('test failure')
elif s!= 7986:
    print('test failure')
    

fast executed in 0.001977682113647461 ms
slow executed in 0.12408781051635742 ms


## 偏函数
functools.partial的作用就是，把一个函数的某些参数给固定住（也就是设置默认值），返回一个新的函数，调用这个新函数会更简单。

In [46]:
int('12345', base=16)

74565

# 面向对象编程 OOP
## 类与实例

In [50]:
class Student(object):
    def __init__(self,name,score):
        self.__name = name
        self.__score = score
# 在Python中，实例的变量名如果以__开头，就变成了一个私有变量（private），只有内部可以访问，外部不能访问
    def print_score(self):
        print('%s: %s' %(self.name, self.score))
        

In [51]:
bart = Student('Bart Simpson', 59)
bart.__name

AttributeError: 'Student' object has no attribute '__name'

## 实例属性和类属性
由于Python是动态语言，根据类创建的实例可以任意绑定属性。

给实例绑定属性的方法是通过实例变量，或者通过self变量, 而类属性可以直接在class中定义，归类所有。

类变量是静态的，实例变量是非静态的。
静态变量的定义就是只初始化一次，然后存在内存中便于修改访问。

类和实例变量的严格访问方式：
1、在内部和外部，类变量都用类名.类变量名来进行访问，比如Student.count。
2、在内部，实例变量用self.实例变量来进行访问，比如self.count；在外部，实例变量用实例名.实例变量来进行访问，比如stu.count。

如果实例变量名和类变量名一样，访问优先级是实例变量>类变量

In [61]:
class Student(object):
    name = 'Student' # 类属性
s = Student()
print(s.name)
print(Student.name)
s.name='Mike'
print(s.name) 
print(Student.name)

Student
Student
Mike
Student


In [70]:
# 为了统计学生人数，可以给Student类增加一个类属性，每创建一个实例，该属性自动增加：
class Student(object):
    count = 0
    
    def __init__(self, name):
        self.name = name
        Student.count += 1  #类属性

if Student.count != 0:
    print('test failure1')
else:
    bart = Student('Bart')
    if Student.count != 1:
        print('test failure2')
    else:
        lisa = Student('Bart')
        if Student.count != 2:
            print('test failure3')
        else:
            print('Students:', Student.count)
            print('test success')

Students: 2
test success


Python 用下划线作为变量前缀和后缀指定特殊变量。
_xxx      不能用'from module import *'导入
__xxx__ 系统定义名字
__xxx    类中的私有变量名
单下划线" 开始的成员变量叫做保护变量，意思是只有类对象和子类对象自己能访问到这些变量；
"双下划线" 开始的是私有成员，意思是只有类对象自己能访问，连子类对象也不能访问到这个数据。
以单下划线开头（_foo）的代表不能直接访问的类属性，需通过类提供的接口进行访问，不能用“from xxx import *”而导入；以双下划线开头的（__foo）代表类的私有成员；以双下划线开头和结尾的（__foo__）代表python里特殊方法专用的标识，如 __init__（）代表类的构造函数。

## 使用__slots__

正常情况下，当我们定义了一个class，创建了一个class的实例后，我们可以给该实例绑定任何属性和方法，这就是动态语言的灵活性。先定义class：

In [71]:
class Student(object):
    pass
s= Student()
s.name = 'Michael' #给实例绑定一个属性

# 给实例绑定一个方法
def set_age(self, age): #定义一个函数作为方法
    self.age = age
from types import MethodType
s.set_age = MethodType(set_age, s) #给实例s绑定方法set_age
s.set_age(25)
print(s.age)

25


给一个实例绑定的方法，对另一个实例不起作用，为了给所有实例绑定方法，可以给class绑定

In [72]:
def set_score(self, score):
    self.score=score

Student.set_score = set_score

In [73]:
s.set_score(80)
s.score

80

为了达到限制实例属性的目的，Python允许在定义class的时候，定义一个特殊的__slots__变量，来限制该class实例能添加的属性：

In [74]:
class Student(object):
    __slots__ = ('name', 'age')
s = Student()
s.name = 'Mike'
s.score = 99
# note 使用__slots__要注意，__slots__定义的属性
# 仅对当前类实例起作用，对继承的子类是不起作用的

AttributeError: 'Student' object has no attribute 'score'

## @property
对于类的方法，装饰器一样起作用。Python内置的@property装饰器就是负责把一个方法变成属性调用的. 

把一个getter方法变成属性，只需要加上@property就可以了，此时，@property本身又创建了另一个装饰器@score.setter，负责把一个setter方法变成属性赋值，于是，我们就拥有一个可控的属性操作

In [81]:
class Student(object):
    @property
    def score(self):
        return self._score
    
    @score.setter
    def score(self, value):
        if not isinstance(value, int):
            raise ValueError('score must be an integer')
        if value < 0 and value > 100:
            raise ValueError('score must between 0 ~ 100')
        self._score = value

In [83]:
s = Student()
s.score = 60 # 转化为s.set_score
print(s.score) #转化为s.get_score

60


In [85]:
class Screen(object):
    @property
    def width(self):
        return self._width
    @width.setter
    def width(self, w):
        self._width = w
    
    @property
    def height(self):
        return self._height
    @height.setter
    def height(self, h):
        self._height = h
    
    @property
    def resolution(self):
        return self._width * self._height

# 测试:
s = Screen()
s.width = 1024
s.height = 768
print('resolution =', s.resolution)
if s.resolution == 786432:
    print('测试通过!')
else:
    print('测试失败!')

resolution = 786432
测试通过!


## 定制类

In [86]:
class Student(object):
    def __init__(self, name):
        self.name = name
print(Student('Mike'))

<__main__.Student object at 0x000001E2D2AA4240>


In [89]:
# 只需要定义好__str__()方法，返回一个好看的字符串就可以:
class Student(object):
    def __init__(self, name):
        self.name = name
    def __str__(self):
        return 'Student object (name: %s)'%self.name

print(Student('Mike'))

Student object (name: Mike)


In [90]:
s = Student('Mike')
s

Student object (name: Mike)

In [99]:
class Fib(object):
    def __init__(self):
        self.a, self.b = 0, 1 # 初始化
    def __iter__(self):
        return self  #实例本身是迭代对象，故返回自己
    def __next__(self):
        self.a, self.b = self.b, self.a + self.b
        if self.a > 1000:
            raise StopIteration()
        return self.a
for n in Fib():
    print(n)

1
1
2
3
5
8
13
21
34
55
89
144
233
377
610
987


In [96]:
a, b = 2, 3
print(id(a), id(b))
a, b = b, a
print(a, b)
print(id(a), id(b))

1469931712 1469931744
3 2
1469931744 1469931712


In [100]:
class Student(object):
    def __init__(self):
        self.name = 'Michael'
    def __getattr__(self, attr):
        if attr == 'score':
            return 99
        raise AttributeError('\'Student\' object has no attribute \'%s\''% attr)

## 使用枚举类

既可以用成员名称引用枚举常量，又可以直接根据value的值获得枚举常量。

In [103]:
from enum import Enum, unique

@unique  # @装饰器帮助检查保证没有重复值
class Weekday(Enum):
    Sun = 0  # Sun的value被设定为0
    Mon = 1
    Tue = 2
    Wed = 3
    Thu = 4
    Fri = 5
    Sat = 6
day1 = Weekday.Mon
print(day1)
print(Weekday.Tue)
print(Weekday['Tue'])
print(day1 == Weekday.Mon)
print(Weekday(1))  # 注意是 Weekday(1), 不是Weekday[1]
for name, member in Weekday.__members__.items():
    print(name, '>=', member)

Weekday.Mon
Weekday.Tue
Weekday.Tue
True
Weekday.Mon
Sun >= Weekday.Sun
Mon >= Weekday.Mon
Tue >= Weekday.Tue
Wed >= Weekday.Wed
Thu >= Weekday.Thu
Fri >= Weekday.Fri
Sat >= Weekday.Sat


In [105]:
from enum import Enum, unique

@unique
class Gender(Enum):
    Male = 0
    Female = 1
class Student(object):
    def __init__(self, name, gender):
        self.name = name
        self.gender = gender
# test
bart = Student('Bart', Gender.Male)
if bart.gender == Gender.Male:
    print('test success')
else:
    print('test failure')

test success


In [None]:
from functools import reduce
import logging

def str2num(s):
    sl = s.split('.') 
    if len(sl) == 1:
        return int(sl[0])
    else:
        return int(sl[0])+int(sl[1])/10**len(sl[1])

def calc(exp):
    ss = exp.split('+')
    ns = map(str2num, ss)
    return reduce(lambda acc, x: acc + x, ns)

def main():
    r = calc('100 + 200 + 345')
    print('100 + 200 + 345 =', r)
    r = calc('99 + 88 + 7.6')
    pdb.set_trace()
    print('99 + 88 + 7.6 =', r)

main()
print('end')

# IO编程
## 文件读写

In [None]:
#为了保证无论是否出错都能正确地关闭文件，我们可以使用try ... finally来实现：
try:
    f = open('/path/to/file', 'r')
    print(f.read())
finally:
    if f:
        f.close()
# 为了简便，Python引入了with语句来自动帮我们调用close()方法
with open('/path/to/file', 'r') as f:
    print(f.read()) 
#如果文件很小，read()一次性读取最方便；
#如果不能确定文件大小，反复调用read(size)读取size个字节比较保险；
#如果是配置文件，调用readlines()最方便

In [1]:
fpath = r'C:\Windows\system.ini'

with open(fpath, 'r') as f:
    s = f.read()
    print(s)

; for 16-bit app support
[386Enh]
woafont=dosapp.fon
EGA80WOA.FON=EGA80WOA.FON
EGA40WOA.FON=EGA40WOA.FON
CGA80WOA.FON=CGA80WOA.FON
CGA40WOA.FON=CGA40WOA.FON

[drivers]
wave=mmdrv.dll
timer=timer.drv

[mci]



In [3]:
import os
os.path.abspath('.')

'D:\\software\\Anaconda\\projects'

In [7]:
# 序列化
# -*- coding:utf-8 -*-
import json
obj = dict(name = '小明', age=20)
s = json.dumps(obj, ensure_ascii = True)
print(s)

{"name": "\u5c0f\u660e", "age": 20}


In [11]:
'a b  c'.split(' ')

['a', 'b', '', 'c']

## 正则表达式

In [16]:
# 正则表达式
import re
t = '19:05:30'
m = re.match(r'^(0[0-9]|1[0-9]|2[0-3]|[0-9])\:(0[0-9]|1[0-9]2[0-9]|3[0-9]4[0-9]|5[0-9]|[0-9]])\:(0[0-9]|1[0-9]|2[0-9]|3[0-9]|4[0-9]|5[0-9]|[0-9])$',t)
m.groups()

('19', '05', '30')

In [17]:
# 正则表达式--验证Email地址
# -*- coding:utf-8 -*-
import re
#出于效率的考虑，我们可以预编译该正则表达式
re_email = re.compile(r'^(\w+?)[\.]*(\w+)@([a-z]+).(com|org|edu)$')
def is_valid_email(addr):
    #用预编译的正则去匹配字符串
    if re_email.match(addr):
        return True
    return False
# 测试:
assert is_valid_email('someone@gmail.com')
assert is_valid_email('bill.gates@microsoft.com')
assert not is_valid_email('bob#example.com')
assert not is_valid_email('mr-bob@example.com')
print('ok')

ok


# 常用内建模块
## datetime

In [23]:
from datetime import datetime
now = datetime.now()
print(now)
dt = datetime(2015,4,19,12,20) #指定时间日期
print(dt)
print(dt.timestamp()) #datetime转timestamp
t = 1429427201.0
print(datetime.fromtimestamp(t)) #timestamp转datetime--本地
print(datetime.utcfromtimestamp(t))  #timestamp转datetime --utc

2018-02-20 19:00:16.287554
2015-04-19 12:20:00
1429417200.0
2015-04-19 15:06:41
2015-04-19 07:06:41


## urllib

In [30]:
from urllib import request
with request.urlopen('https://api.douban.com/v2/book/2129650') as f:
    data=f.read()
    print('Status:', f.status, f.reason)
    for k, v in f.getheaders():
        print('%s: %s'%(k, v))
    print('Data:', data.decode('utf-8'))

Status: 200 OK
Date: Tue, 20 Feb 2018 13:53:48 GMT
Content-Type: application/json; charset=utf-8
Content-Length: 2058
Connection: close
Vary: Accept-Encoding
X-Ratelimit-Remaining2: 99
X-Ratelimit-Limit2: 100
Expires: Sun, 1 Jan 2006 01:00:00 GMT
Pragma: no-cache
Cache-Control: must-revalidate, no-cache, private
Set-Cookie: bid=xK9jAnZh57s; Expires=Wed, 20-Feb-19 13:53:48 GMT; Domain=.douban.com; Path=/
X-DOUBAN-NEWBID: xK9jAnZh57s
X-DAE-Node: dis8
X-DAE-App: book
Server: dae
Data: {"rating":{"max":10,"numRaters":16,"average":"7.4","min":0},"subtitle":"","author":["廖雪峰"],"pubdate":"2007","tags":[{"count":21,"name":"spring","title":"spring"},{"count":13,"name":"Java","title":"Java"},{"count":6,"name":"javaee","title":"javaee"},{"count":5,"name":"j2ee","title":"j2ee"},{"count":4,"name":"计算机","title":"计算机"},{"count":4,"name":"编程","title":"编程"},{"count":3,"name":"藏书","title":"藏书"},{"count":3,"name":"POJO","title":"POJO"}],"origin_title":"","image":"https://img3.doubanio.com\/mpic\/s2552283

# Struct

准确地讲，Python没有专门处理字节的数据类型。但由于b'str'可以表示字节，所以，字节数组＝二进制str。而在C语言中，我们可以很方便地用struct、union来处理字节，以及字节和int，float的转换。

In [3]:
# python 二进制，十进制，十六进制的转换

# 转换成十进制，使用int()函数

int('0xf', 16) # 第一个参数是字符串 '0Xf' ,第二个参数是说明，这个字符串是几进制的数

15

In [15]:
#二进制到十进制
print(int('10101',2))
#八进制到十进制
print(int('17', 8))

21
15


In [21]:
#十进制到十六进制
print(hex(11))

print(oct(11)) # 10-->8
print(oct(0b100)) # 2-->8
print(oct(0xf))  #16-->8

0xb
0o13
0o4
0o17


In [6]:
#十进制到二进制
bin(10)

'0b1010'

In [12]:
print(oct(11))

0o13


**在Python中，比方说要把一个32位无符号整数变成字节，也就是4个长度的bytes，你得配合位运算符这么写**

In [35]:
n = 10240099
print(bin(n))
print(len(bin(n))-2)  # 27 bits binary number

0b100111000100000001100011
24


In [26]:
print(bin(0xff000000))
print(len(bin(0xff000000))-2) #32 bits

0b11111111000000000000000000000000
32


In [45]:
b1 = (n & 0xff00000) >> 24

In [44]:
b2 = (n & 0xff000) >> 16

In [42]:
b3 = (n & 0xff00) >> 8

In [43]:
b4 = n & 0xff

In [46]:
bs = bytes([b1, b2, b3, b4])
print(bs)

b'\x00\x0c@c'


 struct模块中最主要的三个函数式pack()、unpack()、calcsize()。

     pack(fmt, v1, v2, ...)  ------ 根据所给的fmt描述的格式将值v1，v2，...转换为一个字符串。

     unpack(fmt, bytes)    ------ 根据所给的fmt描述的格式将bytes反向解析出来，返回一个元组。

     calcsize(fmt)             ------ 根据所给的fmt描述的格式返回该结构的大小

In [47]:
import struct
struct.pack('>I', 10240099)

b'\x00\x9c@c'

In [49]:
# pack的第一个参数是处理指令，'>I'的意思是：
# >表示字节顺序是big-endian，也就是网络序，I表示4字节无符号整数
# note: H：2字节无符号整数
struct.unpack('>IH', b'\xf0\xf0\xf0\xf0\xf0\xf0')

(4042322160, 61680)

In [59]:
with open('save.bmp', 'rb') as f:
    s = f.read(30)
    print(s)
    print(struct.unpack('<ccIIIIIIHH', s))

b'BM6,"\x00\x00\x00\x00\x006\x00\x00\x00(\x00\x00\x00\x80\x04\x00\x00\x88\x02\x00\x00\x01\x00\x18\x00'
(b'B', b'M', 2239542, 0, 54, 40, 1152, 648, 1, 24)


In [92]:
# 16进制转二进制数据
import binascii

photohexstr = 'FFD8FFDB004300080404040404080404040808080808100C080808081410100C101814181818141818181C2420181C241C1818202C2024282828282818202C302C283024282828FFDB004301080808080808140C0C14281C181C2828282828282828282828282828282828282828282828282828282828282828282828282828282828282828282828282828FFC000110800A0008003012200021101031101FFC4001F0000010501010101010100000000000000000102030405060708090A0BFFC400B5100002010303020403050504040000017D01020300041105122131410613516107227114328191A1082342B1C11552D1F02433627282090A161718191A25262728292A3435363738393A434445464748494A535455565758595A636465666768696A737475767778797A838485868788898A92939495969798999AA2A3A4A5A6A7A8A9AAB2B3B4B5B6B7B8B9BAC2C3C4C5C6C7C8C9CAD2D3D4D5D6D7D8D9DAE1E2E3E4E5E6E7E8E9EAF1F2F3F4F5F6F7F8F9FAFFC4001F0100030101010101010101010000000000000102030405060708090A0BFFC400B51100020102040403040705040400010277000102031104052131061241510761711322328108144291A1B1C109233352F0156272D10A162434E125F11718191A262728292A35363738393A434445464748494A535455565758595A636465666768696A737475767778797A82838485868788898A92939495969798999AA2A3A4A5A6A7A8A9AAB2B3B4B5B6B7B8B9BAC2C3C4C5C6C7C8C9CAD2D3D4D5D6D7D8D9DAE2E3E4E5E6E7E8E9EAF2F3F4F5F6F7F8F9FAFFDA000C03010002110311003F00F2E0C4700D28DABC9FC714C2720823A77A148C104E6AB631DC93383F2E79A039C7CC298AF8E08FA52E79E94B416A39793CD3871CE7AF614D4009A72E3D3F5A7718B83EBD7A73401C700FBD00647038FAD3D57D074A3415C41B54E7D6946D39C8A509F3F029C1179C67DE815F51A235604951C502085BEF2D48A841C763E94E11617069683D4805B42C795148DA6DB3E72A3EB563CB1D40A0AE0F1DE9DB415D951B49B53FF2CC1F4C534E856D82C062AE902940A560E6926652BF078C7BD2F19EB4C534EC1FBC7A5031C0E3B7E34F1C8CD35416193534103C9C2A1C9F414C048D0EEF9454890B3F406B5F48F095EDF1C98C807BE2BA8D27C076F1E0DC28240F4A2F626F6389B7D2AE6603CB8989FA56959F84B53B95C880D7A05AE85A7D9A80235E2A733D8DB8DBB871DA92BB1731C2C5E01D458E59715623F87774472DF5AEB64D6ACE3FBBF98A84F886DC1E10FE54F9593CC7347E1E5CE301F9A826F00EA51AFC8338AEB17C496C3EF237D6A58F5FD3E4E1CE3EB4F958F9CF3FBBF0D6A769CBDB923D40AA525BB47F2BA107DC57A9A4BA7DE0E0AB0354753F0A69BA80256201BD40A5A8F9AE79B18CA9E714D24FD2B775DF0ADE6965A440590720FA5633A1190451B8FA186148EF522026A353CF3C55BD32D1AEE711AAF534B62C9B4DD36E2F2409126726BB4F0E7836284092E1727AF353F863C3B0DA4219E3E71D715B335DC76ABB17938A12B9939327B6B6B5B24C0518A7CB72767EE307D2B3AE2E1E78082DB7DE974926252649B23DEAAC41388AFAE4E49C0A923D191B995C9A95750B60768957E953A5C44FF75C1A2ED0D10268F68B8CA669E34CB407FD483E9C557BED696CA5DA4F5AB76D7497118955A86DD810C3A55A30C794BF95452E856520CF978FA0AB9BBDE92470A85BDA926D0EC635D787248BE7B3988C76CD4106B5A86993082FD495E9BAAD1F1091766D4AE79F4A65F15D414C6F1738E0E2AD79936340FD9756B5C8018115C378B3423A75C192352158F15BBA05DCD67766CA46F973C55BF16'  
if len(photohexstr) % 2 != 0:
    photohexstr = photohexstr + '0'
content = binascii.unhexlify(photohexstr)
# unhexlify(hexstr) or a2b_hex(hexstr): Return the binary data represented by the hexadecimal string 
# hexstr. This function is the inverse of b2a_hex(). hexstr must contain an even number of hexadecimal 
# digits (which can be upper or lower case), otherwise a TypeError is raised.

fmt = binascii.hexlify(content[0:4]).decode('utf-8') #读取前4字节转化为16进制字符串
# Return the hexadecimal representation of the binary data. Every byte of data is converted into the 
# corresponding 2-digit hex representation. The resulting string is therefore twice as long as the 
# length of data.
print(fmt)

phototype = {'47494638': '.gif', 'ffd8ffe0': '.jpg', 'ffd8ffe1': '.jpg', 'ffd8ffdb': '.jpg', 
             '89504e47': '.png'}  # 智能识别图片文件格式

qualified_file_name = 'testphoto' + phototype[fmt]
with open(qualified_file_name, 'wb') as f:
    f.write(content)
    print('转换完成')

ffd8ffdb
转换完成


## Hashlib
摘要算法又称哈希算法、散列算法。它通过一个函数，把任意长度的数据转换为一个长度固定的数据串（通常用16进制的字符串表示）。它的目的是为了发现原始数据是否被人篡改过。

摘要算法之所以能指出数据是否被篡改过，就是因为摘要函数是一个单向函数，计算f(data)很容易，但通过digest反推data却非常困难。而且，对原始数据做一个bit的修改，都会导致计算出的摘要完全不同。

In [93]:
# MD5 最常见的摘要算法，速度很快，生成结果是固定的128 bit字节，通常用一个32位的16进制字符串表示
import hashlib

md5 = hashlib.md5()
md5.update('how to use md5 in python hashlib?'.encode('utf-8'))
print(md5.hexdigest())

d26a53750bc40b38b65a520292f69306


In [96]:
# 可分块多次调用，结果一样
import hashlib
md5 = hashlib.md5()
md5.update('how to use md5 '.encode('utf-8'))
md5.update('in python hashlib?'.encode('utf-8'))
print(md5.hexdigest())
print(len(md5.hexdigest()))

d26a53750bc40b38b65a520292f69306
32


In [103]:
# 设计一个验证用户登录的函数，根据用户输入的口令是否正确，返回True或False：
# -*- coding:utf-8 -*-
import hashlib
db ={
    'michael': 'e10adc3949ba59abbe56e057f20f883e',
    'bob': '878ef96e86145580c38c87f0410ad153',
    'alice': '99b1c2188db85afee403b1536010c2c9'
}

def login(user, password):
    md5 = hashlib.md5()
    md5.update(password.encode('utf-8'))
    if user in db:
        if db[user] == md5.hexdigest():
            return True
    return False

assert login('michael', '123456')
assert login('bob', 'abc999')
assert login('alice', 'alice2008')
assert not login('michael', '1234567')
assert not login('bob', '123456')
assert not login('alice', 'Alice2008')
print('OK')

OK


## itertools
Python的内建模块itertools提供了非常有用的用于操作迭代对象的函数

In [108]:
import itertools
naturals = itertools.count(1) # count()会创建一个无限的迭代器, 类似的无限迭代器还有 cycle('ABC'), repeat('A')
for n in naturals:
    if n > 10:
        break
    else:
        print(n, end=' ')

1 2 3 4 5 6 7 8 9 10 

In [107]:
# 同时，我们也可以通过takewhile()等函数根据条件判断来‘截取’(记住是截取，而不是选择)出一个有限的序列：
naturals = itertools.count(1)
ns = itertools.takewhile(lambda x: x < 10, naturals)
list(ns)

[1, 2, 3, 4, 5, 6, 7, 8, 9]

In [115]:
import itertools

def pi(N):
    naturals = itertools.count(1)  
    maximum = itertools.takewhile(lambda x: x <= 2*N-1, naturals)
    sum = 0
    sign = 1
    for x in maximum:
        if x%2 != 0:
            sum = sum + sign*4/x
            sign = -sign
    return sum

print(pi(1000))

## a better way to do this is to use itertools.count(start=1, step=2)

3.140592653839794


## contextlib
并不是只有open()函数返回的fp对象才能使用with语句。实际上，任何对象，只要正确实现了上下文管理，就可以用于with语句。

In [1]:
from contextlib import contextmanager

class Query(object):
    def __init__(self,name):
        self.name=name
    def query(self):
        print('Query info about %s...'%self.name)

@contextmanager
def create_query(name):
    print('Begin')
    q = Query(name)
    yield q
    print('End')

with create_query('Bob') as q:
    q.query()

Begin
Query info about Bob...
End


## Urllib

In [3]:
from urllib import request

with request.urlopen('https://api.douban.com/v2/book/2129650') as f:
    data = f.read()
    print('status:', f.status, f.reason)
    for k, v in f.getheaders():
        print('%s：%s' %(k, v))
    print('Data:', data.decode('utf-8'))

status: 200 OK
Date：Mon, 05 Mar 2018 01:54:15 GMT
Content-Type：application/json; charset=utf-8
Content-Length：2058
Connection：close
Vary：Accept-Encoding
X-Ratelimit-Remaining2：97
X-Ratelimit-Limit2：100
Expires：Sun, 1 Jan 2006 01:00:00 GMT
Pragma：no-cache
Cache-Control：must-revalidate, no-cache, private
Set-Cookie：bid=UhaQt28I3-s; Expires=Tue, 05-Mar-19 01:54:15 GMT; Domain=.douban.com; Path=/
X-DOUBAN-NEWBID：UhaQt28I3-s
X-DAE-Node：daisy8b
X-DAE-App：book
Server：dae
Data: {"rating":{"max":10,"numRaters":16,"average":"7.4","min":0},"subtitle":"","author":["廖雪峰"],"pubdate":"2007","tags":[{"count":21,"name":"spring","title":"spring"},{"count":13,"name":"Java","title":"Java"},{"count":6,"name":"javaee","title":"javaee"},{"count":5,"name":"j2ee","title":"j2ee"},{"count":4,"name":"计算机","title":"计算机"},{"count":4,"name":"编程","title":"编程"},{"count":3,"name":"藏书","title":"藏书"},{"count":3,"name":"POJO","title":"POJO"}],"origin_title":"","image":"https://img3.doubanio.com\/mpic\/s2552283.jpg","bindi

In [7]:
from urllib import request

req = request.Request('http://www.douban.com')
req.add_header('User-Agent', 'Mozilla/6.0 (iPhone; CPU iPhone OS 8_0 like Mac OS X) ApppleWebKit/53 6.26 (KHTML, like Gecko) Version/8.0 Mobile/10A5376e Safari/8536.25')
with request.urlopen(req) as f:
    print('status:', f.status, f.reason)
    for k, v in f.getheaders():
        print('%s: %s'%(k, v))
    print('Data:', f.read().decode('utf-8'))

status: 200 OK
Date: Mon, 05 Mar 2018 03:31:34 GMT
Content-Type: text/html; charset=utf-8
Content-Length: 11534
Connection: close
Vary: Accept-Encoding
X-Xss-Protection: 1; mode=block
X-Douban-Mobileapp: 0
Expires: Sun, 1 Jan 2006 01:00:00 GMT
Pragma: no-cache
Cache-Control: must-revalidate, no-cache, private
Set-Cookie: bid=CZz7AFtyTxM; Expires=Tue, 05-Mar-19 03:31:34 GMT; Domain=.douban.com; Path=/
X-DOUBAN-NEWBID: CZz7AFtyTxM
X-DAE-Node: nain1
X-DAE-App: talion
Server: dae
Strict-Transport-Security: max-age=15552000;
X-Content-Type-Options: nosniff
Data: 


<!DOCTYPE html>
<html itemscope itemtype="http://schema.org/WebPage">
    <head>
        <meta charset="UTF-8">
        <title>豆瓣(手机版)</title>
        <meta name="viewport" content="width=device-width, height=device-height, user-scalable=no, initial-scale=1.0, minimum-scale=1.0, maximum-scale=1.0">
        <meta name="format-detection" content="telephone=no">
        <link rel="canonical" href="
http://m.douban.com/">
        <li

In [36]:
from xml.parsers.expat import ParserCreate

class DefaultSaxHandler(object):
    def start_element(self, name, attrs):
        print('sax:start_element: %s, attrs: %s, type of attrs: %s' % (name, str(attrs), type(attrs)))

    def end_element(self, name):
        print('sax:end_element: %s' % name)

    def char_data(self, text):
        print('sax:char_data: %s' % text)

xml = r'''<?xml version="1.0"?>
<ol>
    <li><a href="/python">Python</a></li>
    <li><a href="/ruby">Ruby</a></li>
</ol>
'''

handler = DefaultSaxHandler()
parser = ParserCreate()
parser.StartElementHandler = handler.start_element
parser.EndElementHandler = handler.end_element
parser.CharacterDataHandler = handler.char_data
parser.Parse(xml)

sax:start_element: ol, attrs: {}, type of attrs: <class 'dict'>
sax:char_data: 

sax:char_data:     
sax:start_element: li, attrs: {}, type of attrs: <class 'dict'>
sax:start_element: a, attrs: {'href': '/python'}, type of attrs: <class 'dict'>
sax:char_data: Python
sax:end_element: a
sax:end_element: li
sax:char_data: 

sax:char_data:     
sax:start_element: li, attrs: {}, type of attrs: <class 'dict'>
sax:start_element: a, attrs: {'href': '/ruby'}, type of attrs: <class 'dict'>
sax:char_data: Ruby
sax:end_element: a
sax:end_element: li
sax:char_data: 

sax:end_element: ol


1

In [29]:
from xml.parsers.expat import ParserCreate
from urllib import request
import time
class DefaultSaxHandler(object):
    def __init__(self):
        self.location = {}
        self.forecast = []
    def start_element(self, name, attrs):
        print('sax:start_element: %s, attrs: %s' % (name, str(attrs)))
        if name == 'yweather:location':
            self.location = attrs
        if name == 'yweather:forecast':
            data = {}
            date = time.strftime('%Y-%m-%d', time.strptime(attrs['date'],'%d %b %Y'))
            data['date'] = date
            data['high'] = attrs['high']
            data['low'] = attrs['low']
            self.forecast.append(data)

    def end_element(self, name):
        print('sax: end_element: %s'%name)
    def char_data(self, text):
        print('sax: char_data: %s'%text)

def parseXml(xml_str):
    handler = DefaultSaxHandler()
    parser = ParserCreate()
    parser.StartElementHandler = handler.start_element
    parser.EndElementHandler = handler.end_element
    parser.CharacterDataHandler = handler.char_data
    parser.Parse(xml_str)
    return {
        'city': handler.location['city'],
        'forecast': handler.forecast
    }

# 测试:
URL = 'https://query.yahooapis.com/v1/public/yql?q=select%20*%20from%20weather.forecast%20where%20woeid%20%3D%202151330&format=xml'

with request.urlopen(URL, timeout=4) as f:
    data = f.read()

result = parseXml(data.decode('utf-8'))
print(result)
assert result['city'] == 'Beijing'
print('ok')

sax:start_element: query, attrs: {'xmlns:yahoo': 'http://www.yahooapis.com/v1/base.rng', 'yahoo:count': '1', 'yahoo:created': '2018-03-05T06:49:47Z', 'yahoo:lang': 'en-US'}
sax:start_element: results, attrs: {}
sax:start_element: channel, attrs: {}
sax:start_element: yweather:units, attrs: {'xmlns:yweather': 'http://xml.weather.yahoo.com/ns/rss/1.0', 'distance': 'mi', 'pressure': 'in', 'speed': 'mph', 'temperature': 'F'}
sax: end_element: yweather:units
sax:start_element: title, attrs: {}
sax: char_data: Yahoo! Weather - Beijing, Beijing, CN
sax: end_element: title
sax:start_element: link, attrs: {}
sax: char_data: http://us.rd.yahoo.com/dailynews/rss/weather/Country__Country/*https://weather.yahoo.com/country/state/city-2151330/
sax: end_element: link
sax:start_element: description, attrs: {}
sax: char_data: Yahoo! Weather for Beijing, Beijing, CN
sax: end_element: description
sax:start_element: language, attrs: {}
sax: char_data: en-us
sax: end_element: language
sax:start_element: la

## HTMLParser

In [34]:
from html.parser import HTMLParser
from html.entities import name2codepoint

class MyHTMLParser(HTMLParser):
    def handle_starttag(self, tag, attrs):
        print('<%s>' % tag)
    def handle_endtag(self, tag):
        print('</%s>' % tag)
    def handle_startendtag(self, tag, attrs):
        print('<%s/>' % tag)
    def handle_data(self, data):
        print(data)
    def handle_comment(self, data):
        print('<!--', data, '-->')
    def handle_entityref(self, name):
        print('&%s;' % name)
    def handle_charref(self, name):
        print('&#%s;' % name)
parser = MyHTMLParser()
parser.feed('''<body>
<head></head>
<body>
<!-- test html parser-->
    <p>Some <a>html</a> HTML&nbsp;tutorial...<br>END</p>
</body></html>
''')

<body>


<head>
</head>


<body>


<!--  test html parser -->

    
<p>
Some 
<a>
html
</a>
 HTML tutorial...
<br>
END
</p>


</body>
</html>




In [49]:
from html.parser import HTMLParser
from urllib import request
import re

class MyHTMLParser(HTMLParser):
    flag = 0
    res = []
    is_get_data = 0
    
    def handle_starttag(self, tag, attrs):
        # find the target tag
# note:  tag是的html标签，attrs是 tag包含的所有(属性，值)元组(tuple)组成的列表(list).
        if tag == 'ul':
            for attr in attrs:
                if re.match(r'list-recent-events', attr[1]):
                    # print('attrs is %s of type %s' % (attrs, type(attrs)))
                    # print('attr is %s' % type(attr))
                    self.flag = 1
        # deal with element a
        if tag == 'a' and self.flag == 1:
            self.is_get_data = 'title'
        
        # deal withe element time
        if tag == 'time' and self.flag == 1:
            self.is_get_data = 'time'
        
        if tag == 'span' and self.flag == 1:
            self.is_get_data = 'addr'
    
    def handle_endtag(self, tag):
        if self.flag == 1 and tag == 'ul':
            self.flag = 0
    
    def handle_data(self, data):
        if self.is_get_data and self.flag == 1:
            if self.is_get_data == 'title':
                self.res.append({self.is_get_data:data})
            else:
                self.res[len(self.res) - 1][self.is_get_data] = data
            self.is_get_data = None
parser = MyHTMLParser()

with request.urlopen('https://www.python.org/events/python-events/') as f:
    data = f.read().decode('utf-8')
parser.feed(data)
for item in MyHTMLParser.res:
    print('-------------')
    for k, v in item.items():
        print('%s: %s' % (k, v))
        
'''
explanation for 'self.res[len(self.res) - 1][self.is_get_data] = data':
res是一个list，存储所有会议, list的元素是dict, 每个dict表示一个会议

获得title,即会议名时，给res添加一个新dict：
self.res.append({self.is_get_data: data})
res 由[] 变为 [{'title':'PyCascades 2018'}]

获得addr，time这样的其它属性时,先把最后一个dict（即当前处理的dict）取出：
即self.res[len(self.res) - 1]
再把新属性加入：
self.res[len(self.res) - 1][self.is_get_data] = data
 [{'title':'PyCascades 2018','time':'22 Jan. – 24 Jan.'}]

'''

-------------
title: PyCon SK 2018
time: 09 March – 12 March 
addr: Bratislava, Slovakia
-------------
title: PythonCamp 2018 - Cologne
time: 07 April – 09 April 
addr: GFU Cyrus AG, Am Grauen Stein 27, 51105 Köln, Germany
-------------
title: PyCon IT 9
time: 19 April – 23 April 
addr: Hotel Mediterraneo - Lungarno del Tempio, 44, 50121 Firenze FI, Italy
-------------
title: PyDays Vienna
time: 04 May – 06 May 
addr: FH Technikum Wien, Hoechstaedtplatz 6, Vienna, Austria
-------------
title: GeoPython 2018
time: 07 May – 10 May 
addr: Basel, Switzerland
-------------
title: PyCon US 2018
time: 09 May – 18 May 
addr: Cleveland, Ohio, USA
-------------
title: PyCon Belarus 2018
time: 24 Feb. – 25 Feb. 
addr: Minsk, Belarus
-------------
title: PyCon PH 2018
time: 24 Feb. – 26 Feb. 
addr: Makati City, Metro Manila, Philippines


"\nexplanation for 'self.res[len(self.res) - 1][self.is_get_data] = data':\nres是一个list，存储所有会议, list的元素是dict, 每个dict表示一个会议\n\n获得title,即会议名时，给res添加一个新dict：\nself.res.append({self.is_get_data: data})\nres 由[] 变为 [{'title':'PyCascades 2018'}]\n\n获得addr，time这样的其它属性时,先把最后一个dict（即当前处理的dict）取出：\n即self.res[len(self.res) - 1]\n再把新属性加入：\nself.res[len(self.res) - 1][self.is_get_data] = data\n [{'title':'PyCascades 2018','time':'22 Jan. – 24 Jan.'}]\n\n"

## Pillow

PIL：Python Imaging Library，已经是Python平台事实上的图像处理标准库了。PIL功能非常强大，但API却非常简单易用。

由于PIL仅支持到Python 2.7，加上年久失修，于是一群志愿者在PIL的基础上创建了兼容的版本，名字叫Pillow，支持最新Python 3.x，又加入了许多新特性，因此，我们可以直接安装使用Pillow。

### 操作图像

In [50]:
from PIL import Image

im = Image.open('test.jpg')
w, h = im.size
print('Origianl image size: %sx%s' % (w, h))

#缩放到50%
im.thumbnail((w//2, h//2))
print('Resize image to：%sx%s' % (w//2, h//2))

im.save('thumbnail.jpg', 'jpeg')

Origianl image size: 2592x1456
Resize image to：1296x728


In [1]:
from PIL import Image, ImageFilter

im = Image.open('test.jpg')

im2 = im.filter(ImageFilter.BLUR)
im2.save('blur.jpg', 'jpeg')

In [5]:
from PIL import Image, ImageDraw, ImageFont, ImageFilter
import random

def rndChar():
    return chr(random.randint(65, 90))

def rndColor():
    return (random.randint(64,255),random.randint(64,255),random.randint(64,255))

def rndColor2():
    return (random.randint(32,127),random.randint(32,127),random.randint(32,127))

width = 60 * 4
height = 60

image = Image.new('RGB', (width, height), (255,255,255))

font = ImageFont.truetype('C:/Windows/Fonts/Arial.ttf', 36)

draw = ImageDraw.Draw(image)

#填充每个像素作为背景
for x in range(width):
    for y in range(height):
        draw.point((x,y), fill=rndColor())
#输出文字
for t in range(4):
    draw.text((60 * t + 10, 10), rndChar(), font=font, fill=rndColor2())

image = image.filter(ImageFilter.BLUR)
image.save('code.jpg', 'jpeg')

## requests
Python内置的urllib模块，用于访问网络资源。但是，它用起来比较麻烦，而且，缺少很多实用的高级功能。

更好的方案是使用requests。它是一个Python第三方库，处理URL资源特别方便:

In [6]:
import requests
r = requests.get('https://www.douban.com')
print(r.status_code, r.text)

200 <!DOCTYPE HTML>
<html lang="zh-cmn-Hans" class="">
<head>
<meta charset="UTF-8">
<meta name="description" content="提供图书、电影、音乐唱片的推荐、评论和价格比较，以及城市独特的文化生活。">
<meta name="keywords" content="豆瓣,广播,登陆豆瓣">
<meta property="qc:admins" content="2554215131764752166375" />
<meta property="wb:webmaster" content="375d4a17a4fa24c2" />
<meta name="mobile-agent" content="format=html5; url=https://m.douban.com">
<title>豆瓣</title>
<script>
function set_cookie(t,e,o,n){var i,a,r=new Date;r.setTime(r.getTime()+24*(e||30)*60*60*1e3),i="; expires="+r.toGMTString();for(a in t)document.cookie=a+"="+t[a]+i+"; domain="+(o||"douban.com")+"; path="+(n||"/")}function get_cookie(t){var e,o,n=t+"=",i=document.cookie.split(";");for(e=0;e<i.length;e++){for(o=i[e];" "==o.charAt(0);)o=o.substring(1,o.length);if(0===o.indexOf(n))return o.substring(n.length,o.length).replace(/\"/g,"")}return null}window.Douban=window.Douban||{};var Do=function(){Do.actions.push([].slice.call(arguments))};Do.ready=function(){Do.actions.p

In [7]:
# 对于带参数的URL，传入一个dict作为params参数
r = requests.get('https://www.douban.com/search', params={
    'q':'python', 'cat':'1001'
})
r.url # return the true url

'https://www.douban.com/search?q=python&cat=1001'

In [8]:
r.encoding #自动检测编码

'utf-8'

# chardet
字符串编码检测

In [12]:
import chardet
chardet.detect(b'Hello World!')

{'confidence': 1.0, 'encoding': 'ascii', 'language': ''}

In [14]:
data = '你好, 我是张三'.encode('gbk')
chardet.detect(data)

{'confidence': 0.99, 'encoding': 'GB2312', 'language': 'Chinese'}

## psutil
process and system utilites 它不仅可以通过一两行代码实现系统监控，还可以跨平台使用，支持Linux／UNIX／OSX／Windows等，是系统管理员和运维小伙伴不可或缺的必备模块。

In [15]:
import psutil
psutil.cpu_count() # cpu逻辑数量

4

In [16]:
psutil.cpu_count(logical=False) # cpu物理核心

2

In [17]:
psutil.cpu_times()

scputimes(user=4112.40625, system=2657.53125, idle=44920.15625, interrupt=244.65625, dpc=87.46875381469727)

In [18]:
psutil.net_connections()

[sconn(fd=-1, family=<AddressFamily.AF_INET: 2>, type=1, laddr=addr(ip='127.0.0.1', port=6912), raddr=addr(ip='127.0.0.1', port=6932), status='ESTABLISHED', pid=13216),
 sconn(fd=-1, family=<AddressFamily.AF_INET: 2>, type=1, laddr=addr(ip='192.168.43.121', port=3810), raddr=addr(ip='183.236.28.142', port=80), status='CLOSE_WAIT', pid=8060),
 sconn(fd=-1, family=<AddressFamily.AF_INET: 2>, type=1, laddr=addr(ip='192.168.43.121', port=6986), raddr=addr(ip='183.236.28.142', port=80), status='CLOSE_WAIT', pid=8060),
 sconn(fd=-1, family=<AddressFamily.AF_INET: 2>, type=2, laddr=addr(ip='192.168.75.1', port=138), raddr=(), status='NONE', pid=4),
 sconn(fd=-1, family=<AddressFamily.AF_INET: 2>, type=2, laddr=addr(ip='192.168.43.121', port=1900), raddr=(), status='NONE', pid=10656),
 sconn(fd=-1, family=<AddressFamily.AF_INET: 2>, type=1, laddr=addr(ip='0.0.0.0', port=902), raddr=(), status='LISTEN', pid=4800),
 sconn(fd=-1, family=<AddressFamily.AF_INET: 2>, type=1, laddr=addr(ip='127.0.0.1

In [20]:
psutil.test()

USER         PID %MEM     VSZ     RSS TTY           START    TIME  COMMAND
SYSTEM         0    ?      52       8 ?             13:36   39:12  System Idle Process
SYSTEM         4  0.1     172    6612 ?             13:36   03:26  System
              76  0.3   11504   26100 ?             13:36   00:05  svchost.exe
             432  0.1    2880    9144 ?             13:36   00:00  WUDFHost.exe
             464    ?     456    1072 ?             13:36   00:00  smss.exe
             500    ?    2020    2816 ?             13:36   00:00  fontdrvhost.exe
             536  0.3    9228   20948 ?             13:37   00:10  speedfan.exe
             620  0.1    1748    4988 ?             13:36   00:00  csrss.exe
             716  0.1    1308    5472 ?             13:36   00:00  wininit.exe
             724  0.1    2592    6592 ?             13:36   00:50  csrss.exe
             788  0.1    2208    9428 ?             13:36   00:00  winlogon.exe
             864  0.1    5772    9528 ?             1

## 图形界面

In [23]:
from tkinter import *

class Application(Frame):
    def __init__(self, master=None):
        Frame.__init__(self, master)
        self.pack()
        self.createWidgets()
    
    def createWidgets(self):
        self.HelloLabel = Label(self, text='Hello World')
        self.HelloLabel.pack()
        self.quitButton = Button(self, text='Quit', command = self.quit)
        self.quitButton.pack()

In [None]:
app = Application()
app.master.title('hello world')
app.mainloop()

In [8]:
# 输入文本
from tkinter import *
import tkinter.messagebox as messagebox

class Application(Frame):
    def __init__(self, master=None):
        Frame.__init__(self, master)
        self.pack()
        self.createWidgets()
        
    def createWidgets(self):
        self.nameInput = Entry(self)
        self.nameInput.pack()
        self.alertButton = Button(self, text='Hello', command=self.hello)
        self.alertButton.pack()
# 注意此处，command = self.hello， 而不是self.hello(), 两者的区别在于前者的调用函数本身，而后者是调用函数返回的结果，见下面例子说
# 若想向button的command中传递参数，可以选择使用lambda函数: command = lambda: f(x)
    def hello(self):
        name = self.nameInput.get() or 'World'
        messagebox.showinfo('Message', 'Hello %s' % name)
        
app = Application()
app.master.title('Hello World')
app.mainloop()

In [34]:
def f(x):
    return x * x

print(f)
print(f(2))

<function f at 0x000001CE8458B268>
4


# 网络编程
## TCP编程

In [37]:
# 导入socket库
import socket

#创建一个基于tcp链接的Socket：AF_INET指定使用IPv4协议，如果要用IPv6，就指定为AF_INET6。SOCK_STREAM指定使用面向流的TCP协议
s = socket.socket(socket.AF_INET, socket.SOCK_STREAM)
#建立连接：
s.connect(('www.sina.com.cn',80))

In [38]:
#发送数据
s.send(b'GET / HTTP/1.1\r\nHost:www.sina.com.cn\r\nConnection:close\r\n\r\n')

#接受数据
buffer = []
while True:
    # 每次最多接收1k字节
    d = s.recv(1024)
    if d:
        buffer.append(d)
    else:
        break
data = b''.join(buffer)

#关闭连接
s.close()

header, html = data.split(b'\r\n\r\n', 1)
print(header.decode('utf-8'))
with open('sina.html', 'wb') as f:
    f.write(html)

HTTP/1.1 200 OK
Server: nginx
Date: Mon, 19 Mar 2018 03:00:41 GMT
Content-Type: text/html
Content-Length: 603473
Connection: close
Last-Modified: Mon, 19 Mar 2018 02:56:56 GMT
Vary: Accept-Encoding
X-Powered-By: shci_v1.03
Expires: Mon, 19 Mar 2018 03:01:40 GMT
Cache-Control: max-age=60
Age: 0
Via: http/1.1 ctc.ningbo.ha2ts4.97 (ApacheTrafficServer/6.2.1 [cHs f ]), http/1.1 ctc.xiamen.ha2ts4.41 (ApacheTrafficServer/6.2.1 [cHs f ])
X-Via-Edge: 1521428441485575d18743cd64cde6d9f1713
X-Cache: HIT.41
X-Via-CDN: f=edge,s=ctc.xiamen.ha2ts4.41.nb.sinaedge.com,c=116.24.93.87;f=Edge,s=ctc.xiamen.ha2ts4.41,c=222.76.214.41


# 电子邮件

要编写程序来发送和接收邮件，本质上就是：

编写MUA(message user agent)把邮件发到MTA (message transfer agent)；

编写MUA从MDA (message delivery agent)上收邮件。

发邮件时，MUA和MTA使用的协议就是SMTP：Simple Mail Transfer Protocol，后面的MTA到另一个MTA也是用SMTP协议。

收邮件时，MUA和MDA使用的协议有两种：POP：Post Office Protocol，目前版本是3，俗称POP3；IMAP：Internet Message Access Protocol，目前版本是4，优点是不但能取邮件，还可以直接操作MDA上存储的邮件，比如从收件箱移到垃圾箱，等等。

SMTP是发送邮件的协议，Python内置对SMTP的支持，可以发送纯文本邮件、HTML邮件以及带附件的邮件。

Python对SMTP支持有smtplib和email两个模块，email负责构造邮件，smtplib负责发送邮件。

In [50]:
# 构造邮件
from email.mime.text import MIMEText

msg = MIMEText('hello, this is message sent by me using python', 'plain', 'utf-8')

In [51]:
from_addr = input('From: ')
password = input('Password:')
to_addr = input('To: ')

msg['Subject'] = 'first_email'
msg['From'] = from_addr
msg['To'] = to_addr
# 如果没有给msg加上这些属性，会出现554 DT:SPM的错误

smtp_server = input('SMTP Server: ')

import smtplib
server = smtplib.SMTP(smtp_server, 25) # SMTP协议默认端口是25
server.set_debuglevel(1)
#用set_debuglevel(1)就可以打印出和SMTP服务器交互的所有信息。
server.login(from_addr, password)
server.sendmail(from_addr, [to_addr], msg.as_string())
server.quit()

From: derekwangwx@163.com
Password:albertml@2018
To: 954844431@qq.com
SMTP Server: smtp.163.com


(221, b'Bye')

In [53]:
from email import encoders
from email.header import Header
from email.mime.text import MIMEText
from email.utils import parseaddr, formataddr

import smtplib

def _format_addr(s):
    name, addr = parseaddr(s)
    return formataddr((Header(name, 'utf-8').encode(), addr))

from_addr = input('From: ')
password = input('Password: ')
to_addr = input('To: ')
smtp_server = input('SMTP server: ')

msg = MIMEText('<html><body><h1>Hello</h1>' +
              '<p> sent by <a href="http://www.python.org">Python</a></p>' + 
              '</body></html>', 'html', 'utf-8')
msg['From'] = _format_addr('Python爱好者<%s>' % from_addr)
msg['To'] = _format_addr('管理员<%s>'% to_addr)
msg['Subject'] = Header('来自SMTP的问候', 'utf-8').encode()
# encode(): Encode a message header into an RFC-compliant format
# RFC 2822 is the base standard that describes the format of email messages

server = smtplib.SMTP(smtp_server, 25)
server.set_debuglevel(1)
server.login(from_addr, password)
server.sendmail(from_addr, [to_addr], msg.as_string())
server.quit()

From: derekwangwx@163.com
Password: albertml@2018
To: 954844431@qq.com
SMTP server: smtp.163.com


send: 'ehlo windows10.microdone.cn\r\n'
reply: b'250-mail\r\n'
reply: b'250-PIPELINING\r\n'
reply: b'250-AUTH LOGIN PLAIN\r\n'
reply: b'250-AUTH=LOGIN PLAIN\r\n'
reply: b'250-coremail 1Uxr2xKj7kG0xkI17xGrU7I0s8FY2U3Uj8Cz28x1UUUUU7Ic2I0Y2UFiscqCUCa0xDrUUUUj\r\n'
reply: b'250-STARTTLS\r\n'
reply: b'250 8BITMIME\r\n'
reply: retcode (250); Msg: b'mail\nPIPELINING\nAUTH LOGIN PLAIN\nAUTH=LOGIN PLAIN\ncoremail 1Uxr2xKj7kG0xkI17xGrU7I0s8FY2U3Uj8Cz28x1UUUUU7Ic2I0Y2UFiscqCUCa0xDrUUUUj\nSTARTTLS\n8BITMIME'
send: 'AUTH PLAIN AGRlcmVrd2FuZ3d4QDE2My5jb20AYWxiZXJ0bWxAMjAxOA==\r\n'
reply: b'235 Authentication successful\r\n'
reply: retcode (235); Msg: b'Authentication successful'
send: 'mail FROM:<derekwangwx@163.com>\r\n'
reply: b'250 Mail OK\r\n'
reply: retcode (250); Msg: b'Mail OK'
send: 'rcpt TO:<954844431@qq.com>\r\n'
reply: b'250 Mail OK\r\n'
reply: retcode (250); Msg: b'Mail OK'
send: 'data\r\n'
reply: b'354 End data with <CR><LF>.<CR><LF>\r\n'
reply: retcode (354); Msg: b'End data with <CR><

(221, b'Bye')

In [54]:
# 发送html邮件
# 在构造MIMEText对象时，把HTML字符串传进去，再把第二个参数由plain变为html就可以了
msg = MIMEText('<html><body><h1>Hello</h1>' +
              '<p> sent by <a href="http://www.python.org">Python</a></p>' + 
              '</body></html>', 'html', 'utf-8')

In [None]:
import poplib

#输入邮件地址，口令和pop3服务器地址
email = input('Email: ')
password = input('password: ')
pop3_server = input('Pop3 server: ')

#连接到POP3服务器
server = poplib.POP3(pop3_server)
# 可以打开或关闭调试信息:
server.set_debuglevel(1)
# 可选，打印POP3服务器的欢迎文字:
print(server.getWelcome().decode('utf-8'))

#身份认证
server.user(email)
server.pass_(password)

# stat() 返回邮件数量和占用空间
print('Messags: %s, Size: %s' % server.stat())
# list() 返回所有邮件的编号
resp, mails, octets = server.list()
# 可以查看返回的列表
print(mails)

#获取最新的一封邮件，索引从1开始，而不是0
index = len(mails)
resp, lines, octets = server.retr(index)

msg_content = b'\r\n'.join(lines).decode('utf-8')
msg = Parser().parsestr(msg_content)

server.quit()

# 数据库

In [3]:
import sqlite3

conn = sqlite3.connect('test.db')