## 模块化

* 只需要使用 . 代替 /  来表示子目录,调用子目录的模块时
* sys.path.append("..") 表示将当前程序所在位置向上提了一级
* 在 Python 3 规范中，__init__.py 并不是必须的
* 在大型工程中尽可能使用绝对位置是第一要义
* 相对的绝对路径:对于一个独立的项目，所有模块的追寻方式，从项目的根目录开始追溯
* 整个公司都只有一个代码仓库
    - 简化依赖管理
    - 版本统一
    - 代码追溯方便
* Python 解释器在遇到 import 时会在一个特定的列表中寻找模块　`sys.path`
    - 第一项为空。Pycharm 做的一件事就是将第一项设置为项目根目录的绝对地址
    - 修改 PYTHONHOM: 找到一个文件叫 activate，在这个文件的末尾填上内容 `export PYTHONPATH="/home/ubuntu/workspace/your_projects"`
* 对于每一个项目来说，最好要有一个独立的运行环境来保持包和模块的纯净性
* 用if __name__ == '__main__' 来避开 import 时执行
* from module_name import * 会把 module 中所有的函数和类全拿过来，如果和其他函数名类名有冲突就会出问题
* import model_name 也会导入所有函数和类，但是调用时必须使用 model_name.func 的方法，等于增加了一层 layer，有效避免冲突

In [None]:
from PIL import Image, ImageFilter

# 打开一个jpg图像文件，注意是当前路径:
im = Image.open('test.jpg')
# 获得图像尺寸:
w, h = im.size
print('Original image size: %sx%s' % (w, h))
# 缩放到50%:
im.thumbnail((w // 2, h // 2))
print('Resize image to: %sx%s' % (w // 2, h // 2))
# 把缩放后的图像用jpeg格式保存:
im.save('thumbnail.jpg', 'jpeg')

# 应用模糊滤镜:
im2 = im.filter(ImageFilter.BLUR)
im2.save('blur.jpg', 'jpeg')

In [None]:
from PIL import Image, ImageDraw, ImageFont, ImageFilter

import random


# 随机字母:
def rndChar():
    return chr(random.randint(65, 90))


# 随机颜色1:
def rndColor():
    return (random.randint(64, 255), random.randint(64, 255), random.randint(64, 255))


# 随机颜色2:
def rndColor2():
    return (random.randint(32, 127), random.randint(32, 127), random.randint(32, 127))


# 240 x 60:
width = 60 * 4
height = 60
image = Image.new('RGB', (width, height), (255, 255, 255))
# 创建Font对象:
font = ImageFont.truetype('Arial.ttf', 36)
# 创建Draw对象:
draw = ImageDraw.Draw(image)
# 填充每个像素:
for x in range(width):
    for y in range(height):
        draw.point((x, y), fill=rndColor())
# 输出文字:
for t in range(4):
    draw.text((60 * t + 10, 10), rndChar(), font=font, fill=rndColor2())
# 模糊:
image = image.filter(ImageFilter.BLUR)
image.save('code.jpg', 'jpeg')

In [None]:
import requests

r = requests.get('https://www.douban.com/search', params={'q': 'python', 'cat': '1001'})

r.json()

In [None]:
import psutil

psutil.cpu_count()
psutil.cpu_count(logical=False)
psutil.cpu_times()

psutil.virtual_memory()
psutil.swap_memory()

psutil.disk_partitions()
psutil.disk_usage('/')
psutil.disk_io_counters()  # 磁盘IO

psutil.net_io_counters()  # 获取网络读写字节／包的个数
psutil.net_if_stats()  # 获取网络接口状态

psutil.net_connections()

psutil.pids()  # 所有进程ID
p = psutil.Process(3776)
p.status()
p.memory_info()
p.open_files()

## 内建模块
### datetime

In [None]:
from datetime import datetime, timedelta, timezone

# 一个python文件就是一个模块，你把文件命名为datetime，于是解释器就去你这文件里找datetime，找不到于是报错
now = datetime.now()
print(now)

dt = datetime(2015, 4, 19, 12, 20)  # 用指定日期时间创建datetime
timestamp = dt.timestamp()
print(timestamp)
print(datetime.fromtimestamp(timestamp))
print(datetime.utcfromtimestamp(timestamp))

# str转换为datetime
cday = datetime.strptime('2015-6-1 18:19:59', '%Y-%m-%d %H:%M:%S')
print(cday)

# datetime转换为str
dtnow = datetime.now()
print(now.strftime('%a, %b %d %H:%M'))

# datetime加减
print(now + timedelta(hours=10))
print(now - timedelta(days=1))
print(now + timedelta(days=2, hours=12))

# 本地时间转换为UTC时间
tz_utc_8 = timezone(timedelta(hours=8))  # 创建时区UTC+5:00
now = datetime.now()
print(now)
dt = now.replace(tzinfo=tz_utc_8)
print(dt)

# 时区转换：通过utcnow()拿到当前的UTC时间，再转换为任意时区的时间
# 拿到一个datetime时，要获知其正确的时区，然后强制设置时区，作为基准时间。 通过astimezone()方法，可以转换到任意时区
utc_dt = datetime.utcnow().replace(tzinfo=timezone.utc)
print(utc_dt)
print(utc_dt.astimezone(timezone(timedelta(hours=9))))  # 东京时间


### collections


In [None]:
from collections import namedtuple, deque, defaultdict, OrderedDict, ChainMap, Counter
import os
import argparse

# namedtuple 一个函数，用来创建一个自定义tuple对象，并且规定tuple元素的个数，并可以用属性而不是索引来引用tuple的某个元素
Point = namedtuple('Point', ['x', 'y'])
p = Point(1, 2)
print(p.x)
print(p.y)

# deque 为了高效实现插入和删除操作的双向列表，适合用于队列和栈
q = deque(['a', 'b', 'c'])
q.append('d')
q.appendleft('z')
print(q)


# defaultdict 使用dict时，如果引用的Key不存在，就会抛出KeyError。如果希望key不存在时，返回一个默认值时使用
dd = defaultdict(lambda: 'N/A')
dd['key1'] = 'abc'
print(dd['key1'])
print(dd['key2'])


# OrderedDict 保持Key顺序, 会按照插入的顺序排列，不是Key本身排序
# 可以实现一个FIFO（先进先出）的dict，当容量超出限制时，先删除最早添加的Key
print(dict([('c', 3), ('a', 1), ('z', 27)]))
print(OrderedDict([('c', 3), ('a', 1), ('z', 27)]))


class LastUpdatedOrderedDict(OrderedDict):

    def __init__(self, capacity):
        super(LastUpdatedOrderedDict, self).__init__()
        self._capacity = capacity

    def __setitem__(self, key, value):
        containsKey = 1 if key in self else 0
        if len(self) - containsKey >= self._capacity:
            last = self.popitem(last=False)
            print('remove:', last)
        if containsKey:
            del self[key]
            print('set:', (key, value))
        else:
            print('add:', (key, value))
        OrderedDict.__setitem__(self, key, value)


od = LastUpdatedOrderedDict(3)

od['x'] = 1
od['y'] = 1
od['z'] = 1
od['a'] = 1
print(od)


# ChainMap可以把一组dict串起来并组成一个逻辑上的dict。ChainMap本身也是一个dict，但是查找的时候，会按照顺序在内部的dict依次查找
# 构造缺省参数:
defaults = {
    'color': 'red',
    'user': 'guest'
}

# 构造命令行参数:
parser = argparse.ArgumentParser()
parser.add_argument('-u', '--user')
parser.add_argument('-c', '--color')
namespace = parser.parse_args()
command_line_args = {k: v for k, v in vars(namespace).items() if v}

# 组合成ChainMap:
combined = ChainMap(command_line_args, os.environ, defaults)

# 打印参数:
print('color=%s' % combined['color'])
print('user=%s' % combined['user'])


# Counter是一个简单的计数器
c = Counter()
for ch in 'Programming':
    c[ch] = c[ch] + 1

print(c)


### base64


In [None]:
import base64

base64.b64encode(b'binary\x00string')


# url safe"的base64编码，其实就是把字符+和/分别变成-和_
print(base64.urlsafe_b64decode(b'binary\x00string'))

print(base64.b64decode(b'YmluYXJ5AHN0cmluZw=='))


In [None]:
# struct 模块来解决bytes和其他二进制数据类型的转换
import struct

# 处理字节的数据类型, b'str'可以表示字节，所以，字节数组＝二进制str
n = 10240099
b1 = (n & 0xff000000) >> 24
b2 = (n & 0xff0000) >> 16
b3 = (n & 0xff00) >> 8
b4 = n & 0xff
bs = bytes([b1, b2, b3, b4])
print(bs)

# >表示字节顺序是big-endian，也就是网络序，I表示4字节无符号整数 H：2字节无符号整数
# unpack把bytes变成相应的数据类型
print(struct.pack('>I', n))
print(struct.unpack('>IH', b'\xf0\xf0\xf0\xf0\x80\x80'))


### hashlib 提供常见的摘要算法

In [None]:
import hashlib

# 摘要算法又称哈希算法、散列算法。它通过一个函数，把任意长度的数据转换为一个长度固定的数据串
# MD5是最常见的摘要算法，速度很快，生成结果是固定的128 bit字节，通常用一个32位的16进制字符串表示
md5 = hashlib.md5()
md5.update('how to use md5 in python hashlib?'.encode('utf-8'))
print(md5.hexdigest())

md5.update('how to use md5 in '.encode('utf-8'))
md5.update('python hashlib?'.encode('utf-8'))
print(md5.hexdigest())

# SHA1的结果是160 bit字节，通常用一个40位的16进制字符串表示
sha1 = hashlib.sha1()
sha1.update('how to use sha1 in '.encode('utf-8'))
sha1.update('python hashlib?'.encode('utf-8'))
print(sha1.hexdigest())

# 比SHA1更安全的算法是SHA256和SHA512，不过越安全的算法不仅越慢，而且摘要长度更长
# 碰撞:两个不同的数据通过某个摘要算法得到了相同的摘要
# 不存储用户的明文口令，而是存储用户口令的摘要:可以事先计算出这些常用口令的MD5值，得到一个反推表
# 通过把登录名作为Salt的一部分来计算MD5，从而实现相同口令的用户也存储不同的MD5


def calc_md5(username, password):
    md5 = hashlib.md5()
    md5.update((password + username + 'the-Salt').encode('utf-8'))
    return md5.hexdigest()


print(calc_md5('henry1', '12334444sas*&^&*88'))
