## collections 
collections是Python内建的一个集合模块，提供了许多有用的集合类

### Counter 计数器
统计一个字符串中每个元素出现的个数，是一个字典类型

In [29]:
from collections import Counter  
Counter('collections')
Counter('apple')

Counter({'a': 1, 'e': 1, 'l': 1, 'p': 2})

### defaultdict  缺失字典
使用dict时，如果引用的Key不存在，就会抛出KeyError。如果希望key不存在时，返回一个默认值，就可以用defaultdict

In [3]:
from collections import defaultdict 
d = defaultdict(lambda: 'None')
d[1] = 'a'
d[1],d[3]

('a', 'None')

### deque 双向列表
高效实现插入和删除操作，适用于队列和栈 
appendleft 和 appendpop 可以列表的头部实现插入和删除

In [4]:
from collections import deque 
q = deque() 
q.append(2) 
q.appendleft(1)
q,type(q), q[1]

(deque([1, 2]), collections.deque, 2)

### OrderDict  有序字典
会记住字典添加的顺序，然后按照原来添加时的相同顺序返回，让字典始终保持有序。


In [2]:
from collections import OrderedDict
od = OrderedDict()
od['a'] = 1 
od['b'] = 2 
od['c'] = 3 
od 

OrderedDict([('a', 1), ('b', 2), ('c', 3)])

当你想要构建一个将来需要序列化或编码成其他格式的映射的时候， OrderedDict 是非常有用的。
比如，你想精确控制以 JSON 编码后字段的顺序。

In [6]:
import json
json.dumps(od )#json.dumps()函数是将一个Python数据类型列表进行json格式的编码,字典->字符串

'{"a": 1, "b": 2, "c": 3}'

### Iterable    可迭代类型
一类是集合数据类型，如list、tuple、dict、set、str等；

一类是generator，包括生成器和带yield的generator function。generator并没有直接完全生成，而是边生成边计算，从而节省了大量的空间。

这些可以直接作用于for循环的对象统称为可迭代对象：Iterable

Python的Iterator对象表示的是一个数据流，Iterator对象可以被next()函数调用并不断返回下一个数据，直到没有数据时抛出StopIteration错误。可以把这个数据流看做是一个有序序列，但我们却不能提前知道序列的长度(没有len函数)，只能不断通过next()函数实现按需计算下一个数据，所以Iterator的计算是惰性的，只有在需要返回下一个数据时它才会计算。



In [5]:
from collections import Iterable
g = [_ for _ in range(3)]
isinstance(g,Iterable) 

True

Python的for循环本质上就是通过不断调用next()函数实现的

In [6]:
it = iter([1,2,3,4,5])
while True:
    try: 
        print(next(it))
    except StopIteration:
        break


1
2
3
4
5


## queue
先进先出

put( ) ：添加元素

get( ) ：删除元素，返回元素值

In [7]:
from queue import Queue 

q = Queue()
for i in range(3):
    q.put(i)
while not q.empty():
    print(q.get())

0
1
2


###  优先队列
处理高优先级的事情。
- 初始化时可以定义队列长度
- qsize 查看长度
- put 传入元素和优先级
- get 从队列中取数

In [5]:
from queue import PriorityQueue 

first_item = 3
second_item = 5

pq = PriorityQueue()
pq.put(second_item,2)
pq.put(first_item,1)  # 1的优先级比2大
pq.get() 


3

### Math

In [4]:
from math import radians,pi ,sin # 将角度变成弧度
radians(90)/pi , sin(radians(30))

(0.5, 0.49999999999999994)

## os 
- os.listdir() 可以列出当前目录下所有的文件名
- 可以用endswith()来筛选出某种类型的所有文件

In [10]:
import os
filename = os.listdir()
files = [file for file in filename if file.endswith('ipynb') ]
files

['numpy_tutorial.ipynb',
 'pandas_tutorial.ipynb',
 'fluent-python chapter2.ipynb',
 'collections.ipynb',
 'Python_point.ipynb']

### 正则表达式 re

In [27]:
import re 
line = 'a,b;c d'
letter1 = re.split(r'[,; ]',line) #方括号内为各种分隔符
letter2 = re.split(r'([,: ])',line)
print(letter1)
print(letter2)

['a', 'b', 'c', 'd']
['a', ',', 'b;c', ' ', 'd']


- 如果没有加括号，返回的就是正则表达式匹配的元素
- 如果加了括号，分隔符也会被当做元素返回

In [20]:
import re 
text = '2018'
if re.match('\d+',text):
    print('match')

match


In [21]:
import re 
text1 = '2017/08/20'
if re.match(r'\d+/\d+/\d+',text1): 
    print('match')

match
