# 常用模块

- calendar:跟日历相关，打印日历、判断闰年、获取各种日历参数
- time：1970年以来到现在的，时间戳、当前时间、程序睡眠等
- datetime：获取理想日历时间格式
- timeit：测量程序运行时间的工具

- os：操作系统相关，路径拼合、进出路径、文件修改、删除、
- shutil：移动、复制、修改内容，文件归档
- zip：文件压缩打包

- math：数学模块
- string：字符串模块

- 上述所有模块使用理论上都应该先导入，string是特例
- calendar，time，datetime的区别参考中文意思

- [详细扩展资料一](https://www.cnblogs.com/smallmars/p/6947084.html)
- [更多模块分类列表](http://www.cnblogs.com/itech/archive/2011/01/28/1945273.html)
- [代码示范](https://www.cnblogs.com/huan-ge/p/6822817.html)
- [详细扩展资料二](https://www.cnblogs.com/mingerlcm/category/1130720.html)

### Log模块的资料
- https://www.cnblogs.com/yyds/p/6901864.html

## 更多模块

### logging：用于便捷记录日志且线程安全的模块

### suprocess：用来生成子进程
  - subprocess最早在2.4版本引入。用来生成子进程，并可以通过管道连接他们的输入/输出/错误，以及获得他们的返回值。
  - subprocess提供了一些管理标准流(standard stream)和管道(pipe)的工具，从而在进程间使用文本通信。
  
### hashlib：加密相关
  - 用于加密相关的操作，代替了md5模块和sha模块，主要提供SHA1，SHA224，SHA256，SHA384，SHA512,MD5算法。
  - 在python3中已经废弃了md5和sha模块。
  - 摘要算法又称为哈希算法，散列算法。
  - 它通过一个函数，把任意长度的数据转换为一个长度固顶的数据串（通常用16进制的字符串表示）用于加密相关的操作。
  
### configparser： 配置文件解析相关
  - configparser用于配置文件解析，可以解析特定格式的配置文件，
  - 多数此类配置文件名格式为XXX.ini，例如mysql的配置文件。

### xml：
  - xml是实现不同语言或程序之间进行数据交换的协议，可扩展标记语言，标准通用标记语言的子集。
  - 是一种用于标记电子文件使其具有结构性的标记语言。
  
### 正则re模块：正则表达式
  
  
## json&pickle 序列化
  - 序列化定义：
    - 把对象(变量)从内存中变成可存储或传输的过程称之为序列化
    - 在Python中叫pickling
    - 在其他语言中也被称之为serialization，marshalling，flattening等等，都是一个意思。
    
#### 序列化的好处：
    - 持久保存状态：需知一个软件/程序的执行就在处理一系列状态的变化，在编程语言中，'状态'会以各种各样有结构的数据类型(也可简单的理解为变量)的形式被保存在内存中。内存是无法永久保存数据的，当程序运行了一段时间，我们断电或者重启程序，内存中关于这个程序的之前一段时间的数据（有结构）都被清空了。在断电或重启程序之前将程序当前内存中所有的数据都保存下来（保存到文件中），以便于下次程序执行能够从文件中载入之前的数据，然后继续执行，这就是序列化。具体的来说，你玩使命召唤闯到了第13关，你保存游戏状态，关机走人，下次再玩，还能从上次的位置开始继续闯关。或如，虚拟机状态的挂起等。
    - 跨平台数据交互：序列化之后，不仅可以把序列化后的内容写入磁盘，还可以通过网络传输到别的机器上，如果收发的双方约定好实用一种序列化的格式，那么便打破了平台/语言差异化带来的限制，实现了跨平台数据交互。反过来，把变量内容从序列化的对象重新读到内存里称之为反序列化，即unpickling。

### json：
  - JSON(JavaScript Object Notation) 是一种轻量级的数据交换格式。
  - json模块主要用于处理json格式的数据，可以将json格式的数据转化为python的字典，便于python处理。
  - 同时也可以将python的字典或列表等对象转化为json格式的数据，便于跨平台或跨语言进行数据交互。

### pickle：
  - pickle模块实现了基本的数据序列和反序列化，和json的功能类似。
  - 通过pickle模块的序列化操作我们能够将程序中运行的对象信息保存到文件中去，永久存储，也可以简单的将字符进行序列化
  - 通过pickle模块的反序列化操作，我们能够从文件中创建上一次程序保存的对象，也可以将字符进行反序列化。
  - 和json不同的是：json 更适合跨语言 可以处理字符串，基本数据类型；pickle python专有,更适合处理复杂类型的序列化
  
### shelve：
  - shelve模块比pickle模块简单，只有一个open函数，返回类似字典的对象，可读可写;key必须为字符串，而值可以是python所支持的数据类型。

## calendar
- 跟日历相关的模块

In [2]:
# 使用需要先导入
import calendar

In [4]:
# calendar：　获取一年的日历字符串
# 参数
# w = 每个日期之间的间隔字符数
# l = 每周所占用的行数
# c = 每个月之间的间隔字符数
cal = calendar.calendar(2017)
print(type(cal))
# print(cal)

<class 'str'>


In [5]:
cal = calendar.calendar(2017, l=0, c=5)
print(cal)

                                 2017

      January                  February                  March
Mo Tu We Th Fr Sa Su     Mo Tu We Th Fr Sa Su     Mo Tu We Th Fr Sa Su
                   1            1  2  3  4  5            1  2  3  4  5
 2  3  4  5  6  7  8      6  7  8  9 10 11 12      6  7  8  9 10 11 12
 9 10 11 12 13 14 15     13 14 15 16 17 18 19     13 14 15 16 17 18 19
16 17 18 19 20 21 22     20 21 22 23 24 25 26     20 21 22 23 24 25 26
23 24 25 26 27 28 29     27 28                    27 28 29 30 31
30 31

       April                     May                      June
Mo Tu We Th Fr Sa Su     Mo Tu We Th Fr Sa Su     Mo Tu We Th Fr Sa Su
                1  2      1  2  3  4  5  6  7               1  2  3  4
 3  4  5  6  7  8  9      8  9 10 11 12 13 14      5  6  7  8  9 10 11
10 11 12 13 14 15 16     15 16 17 18 19 20 21     12 13 14 15 16 17 18
17 18 19 20 21 22 23     22 23 24 25 26 27 28     19 20 21 22 23 24 25
24 25 26 27 28 29 30     29 30 31                 26 

In [6]:
# isleap: 判断某一年是否闰年
calendar.isleap(2000)

True

In [12]:
# leapdays: 获取指定年份之间的闰年的个数
print(calendar.leapdays(1901, 2018))
print(calendar.leapdays(2001, 1998))
help(calendar.leapdays)

29
-1
Help on function leapdays in module calendar:

leapdays(y1, y2)
    Return number of leap years in range [y1, y2).
    Assume y1 <= y2.



In [13]:
# month（） 获取某个月的日历字符串
# 格式:calendar.month(年，月)
# 回值：月日历的字符串
m3 = calendar.month(2018, 3)
print(m3)

     March 2018
Mo Tu We Th Fr Sa Su
          1  2  3  4
 5  6  7  8  9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31



In [14]:
# monthrange（） 获取一个月的周几开始即和天数
# 格式：calendar.monthrange(年,月)
# 回值：元组(周几开始,总天数)
# 注意：周默认 0 -6 表示周一到周天
w,t = calendar.monthrange(2017, 3)
print(w)
print(t)

2
31


In [15]:
# monthcalendar() 返回一个月每天的矩阵列表
# 格式：calendar.monthcalendar(年，月)
# 回值：二级列表
# 注意：矩阵中没有天数用0表示
m = calendar.monthcalendar(2018, 3)
print(type(m))
print(m)

<class 'list'>
[[0, 0, 0, 1, 2, 3, 4], [5, 6, 7, 8, 9, 10, 11], [12, 13, 14, 15, 16, 17, 18], [19, 20, 21, 22, 23, 24, 25], [26, 27, 28, 29, 30, 31, 0]]


In [16]:
# prcal: print calendar 直接打印日历
#calendar.prcal(2018)
help(calendar.prcal)

Help on method pryear in module calendar:

pryear(theyear, w=0, l=0, c=6, m=3) method of calendar.TextCalendar instance
    Print a year's calendar.



In [17]:
# prmonth() 直接打印整个月的日历
# 格式：calendar.prmonth(年，月)
# 返回值：无
calendar.prmonth(2018, 3)

     March 2018
Mo Tu We Th Fr Sa Su
          1  2  3  4
 5  6  7  8  9 10 11
12 13 14 15 16 17 18
19 20 21 22 23 24 25
26 27 28 29 30 31


In [19]:
# weekday() 获取周几
# 格式:calendar.weekday(年，月，日)
# 返回值:周几对应的数字
calendar.weekday(2018, 3, 28)

2

## time模块
### 时间戳
- 一个时间表示，根据不同语言，可以是整数或者浮点数
- 是从1970年1月1日0时0分0秒到现在经历的秒数
- 如果表示的时间是1970年以前或者太遥远的未来，可能出现异常
- 32位操作系统能够支持到2038年

### UTC时间
- UTC又称为世界协调时间，以英国的格林尼治天文所在地区的时间作为参考的时间，也叫做世界标准时间。
- 中国时间是 UTC+8 东八区

### 夏令时
- 夏令时就是在夏天的时候将时间调快一小时，本意是督促大家早睡早起节省蜡烛！ 每天变成25个小时，本质没变还是24小时

### 时间元组
- 一个包含时间内容的普通元组


    索引      内容    属性            值

    0       年       tm_year     2015
    1       月       tm_mon      1～12
    2       日       tm_mday     1～31
    3       时       tm_hour     0～23
    4       分       tm_min      0～59
    5       秒       tm_sec      0～61  60表示闰秒  61保留值
    6       周几     tm_wday     0～6
    7       第几天    tm_yday     1～366
    8       夏令时    tm_isdst    0，1，-1（表示夏令时）

In [20]:
# 需要单独导入
import time

In [22]:
# 时间模块的属性
# timezone: 当前时区和UTC时间相差的秒数，在没有夏令时的情况下的间隔,东八区的是 -28800
# altzone  获取当前时区与UTC时间相差的秒数，在有夏令时的情况下，
# daylight 测当前是否是夏令时时间状态, 0 表示是
print(time.daylight)
print(time.timezone)

0
-28800


In [23]:
# 得到时间戳
time.time()

1539999935.8277242

In [24]:
# localtime， 得到当前时间的时间结构
# 可以通过点号操作符得到相应的属性元素的内容
t = time.localtime()
print(t.tm_hour)

9


In [25]:
#asctime() 返回元组的正常字符串化之后的时间格式 
# 格式：time.asctime（时间元组）
# 返回值:字符串 Tue Jun  6 11:11:00 2017
t = time.localtime()

tt = time.asctime(t)
print(type(tt))
print(tt)

<class 'str'>
Sat Oct 20 09:46:10 2018


In [26]:
# ctime: 获取字符串化的当前时间
t = time.ctime()
print(type(t))
print(t)

<class 'str'>
Sat Oct 20 09:46:20 2018


In [27]:
# mktime() 使用时间元组获取对应的时间戳
# 格式：time.mktime（时间元组）
# 返回值：浮点数时间戳

lt = time.localtime()
ts = time.mktime(lt)
print(type(ts))
print(ts)

<class 'float'>
1539999990.0


In [None]:
# clock: 获取cpu时间， 3.0-3.3版本直接使用, 3.6调用有问题

In [28]:
# sleep: 使程序进入睡眠，n秒后继续
for i in range(3):
    print(i)
    time.sleep(1)

0
1
2


In [33]:
# windows下正确
def p():
    time.sleep(2.6)
    
t0 = time.clock()
p()
t1 = time.clock()

print(t1 - t0)

0.0008120000000000349


In [34]:
# strftime:将时间元组转化为自定义的字符串格式
'''
格式  含义  备注
%a  本地（locale）简化星期名称    
%A  本地完整星期名称    
%b  本地简化月份名称    
%B  本地完整月份名称    
%c  本地相应的日期和时间表示    
%d  一个月中的第几天（01 - 31）   
%H  一天中的第几个小时（24 小时制，00 - 23）   
%I  一天中的第几个小时（12 小时制，01 - 12）   
%j  一年中的第几天（001 - 366）  
%m  月份（01 - 12） 
%M  分钟数（00 - 59）    
%p  本地 am 或者 pm 的相应符    注1
%S  秒（01 - 61）  注2
%U  一年中的星期数（00 - 53 星期天是一个星期的开始）第一个星期天之前的所有天数都放在第 0 周   注3
%w  一个星期中的第几天（0 - 6，0 是星期天） 注3
%W  和 %U 基本相同，不同的是 %W 以星期一为一个星期的开始  
%x  本地相应日期  
%X  本地相应时间  
%y  去掉世纪的年份（00 - 99）    
%Y  完整的年份   
%z  用 +HHMM 或 -HHMM 表示距离格林威治的时区偏移（H 代表十进制的小时数，M 代表十进制的分钟数）      
%%  %号本身
'''
# 把时间表示成， 2018年3月26日 21:05
t = time.localtime()
ft = time.strftime("%Y年%m月%d日 %H:%M" , t)
print(ft)

2018年10月20日 09:49


## datetime模块
- datetinme提供日期和时间的运算和表示
- 提供比较好用的时间而已

### 类定义
    class datetime.datetime(year, month, day[, hour
          [, minute
          [, second
          [, microsecond
          [, tzinfo]]]]])

### The year, month and day arguments are required.
       MINYEAR <= year <= MAXYEAR
       1 <= month <= 12
       1 <= day <= n
       0 <= hour < 24
       0 <= minute < 60
       0 <= second < 60
       0 <= microsecond < 10**
       
### 类方法
      datetime.today(): 返回当前本地datetime.随着 tzinfo None. datetime.fromtimestamp(time.time()).
      datetime.now([tz]): 返回当前本地日期和时间, 如果可选参数tz为None或没有详细说明,这个方法会像today(). 
      datetime.utcnow(): 返回当前的UTC日期和时间, 如果tzinfo None ,那么与now()类似. 
      datetime.fromtimestamp(timestamp[, tz]): 根据时间戳返回本地的日期和时间.tz指定时区.
      datetime.utcfromtimestamp(timestamp): 根据时间戳返回 UTC datetime. 
      datetime.fromordinal(ordinal): 根据Gregorian ordinal 返回datetime. 
      datetime.combine(date, time): 根据date和time返回一个新的datetime. 
      datetime.strptime(date_string, format): 根据date_string和format返回一个datetime.
      datetime.timedelta(hours=4,...):表示一个时间间隔

### 实例方法
      datetime.date(): 返回相同年月日的date对象. 
      datetime.time(): 返回相同时分秒微秒的time对象. 
      datetime.replace(kw): kw in [year, month, day, hour, minute, second, microsecond, tzinfo], 与date类似. 
      
### 类属性
      datetime.min: datetime(MINYEAR, 1, 1). 
      datetime.max: datetime(MAXYEAR, 12, 31, 23, 59, 59, 999999).

### 实例属性(read-only)
      datetime.year: 1 至 9999 
      datetime.month: 1 至 12 
      datetime.day: 1 至 n 
      datetime.hour: In range(24). 0 至 23 
      datetime.minute: In range(60). 
      datetime.second: In range(60). 
      datetime.microsecond: In range(1000000). `


In [35]:
import datetime

In [61]:
from datetime import datetime as dt
print(dt.now())

2018-10-20 10:36:44.424556


In [36]:
# datetime常见属性
# datetime.date: 一个理想和的日期，提供year, month, day属性
dt = datetime.date(2018, 3,26)
print(dt)
print(dt.day)
print(dt.year)
print(dt.month)

# datetime.time: 提供一个理想和的时间， 居于哦hour， minute，sec，microsec等内容
# datetime.datetime: 提供日期跟时间的组合
# datetime.timedelta: 提供一个时间差，时间长度

2018-03-26
26
2018
3


In [38]:
# datetime.datetime
from datetime import datetime
# 常用类方法：
# today： 
# now
# utcnow
# fromtimestamp： 从时间戳中返回本地时间
dt = datetime(2018, 3, 26)
print(dt)
print(dt.today())
print(dt.now())

print(dt.fromtimestamp(time.time()))

2018-03-26 00:00:00
2018-10-20 09:54:17.902217
2018-10-20 09:54:17.902421
2018-10-20 09:54:17.902608


In [41]:
# datetime.timedelta 
# 表示一个时间间隔
from datetime import datetime, timedelta

t1 = datetime.now()
print( t1.strftime("%Y-%m-%d %H:%M:%S"))
# td表示以小时的时间长度
add1 = timedelta(hours=4)
# 当前时间加上时间间隔后，把得到的一个小时后的时间格式化输出
print( (t1 + add1).strftime("%Y-%m-%d %H:%M:%S"))

2018-10-20 09:55:33
2018-10-20 13:55:33


## timeit 模块

In [43]:
# timeit-时间测量工具,Linux有效
# 测量程序运行时间间隔实验

def p():
    time.sleep(3.6)
    
t1 = time.time()
p()
t2 = time.time()
print(t2 - t1)

3.603426694869995


In [50]:
import timeit
# 生成列表两种方法代码的比较
# 如果单纯比较生成一个列表的时间，可能很难实现,所以需要十万次的执行

# 先将两段代码,当做字符串赋值给c1,c2
# 然后使用timeit.timeit()函数测量执行c1,c2代码100000次所花的时间，然后进行比较

# timeit 用于测量小代码片段执行时间的工具。
# Tool for measuring execution time of small code snippets.
c1 = '''
sum = []
for i in range(1000):
    sum.append(i)
'''
c2 = "[i for i in range(1000)]"

# 测量代码c1执行100000次运行结果
t1 = timeit.timeit(stmt=c1, number=100000)

# 利用timeit调用代码，执行100000次，查看c2运行时间
t2 = timeit.timeit(stmt=c2, number=100000)

# 重复3次，默认3次
t3 = timeit.repeat(stmt=c2, number=100000)   

print(t1)
print(t2)
print(t3)

7.039981558999898
2.646910740000294
[2.6195404390000476, 2.6369597969996903, 2.6217752100001235]


In [52]:
help(timeit.timeit)
help(timeit.repeat)

Help on function timeit in module timeit:

timeit(stmt='pass', setup='pass', timer=<built-in function perf_counter>, number=1000000, globals=None)
    Convenience function to create Timer object and call timeit method.

Help on function repeat in module timeit:

repeat(stmt='pass', setup='pass', timer=<built-in function perf_counter>, repeat=3, number=1000000, globals=None)
    Convenience function to create Timer object and call repeat method.



In [58]:
# timeit 也可以执行一个函数，来测量一个函数的执行时间 
def doIt():
    num = 2
    for i in range(num):
        print("Repeat for {0}".format(i))
        
# 执行函数，重复10次
t = timeit.timeit(stmt=doIt, number=3)
print(t)

Repeat for 0
Repeat for 1
Repeat for 0
Repeat for 1
Repeat for 0
Repeat for 1
0.001297450000038225


In [60]:
# 执行doIt(num)这段函数，3次，返回时间长
# setup负责把环境变量准备好，setup负责组装代码片段，便于操作片段内的变化
# 实际相当于给timeit创造了一个小运行环境

s1 = '''
def doIt(num):
    for i in range(num):
        print("Repeat for {0}".format(i))

'''
s2 = "num=3"


t = timeit.timeit("doIt(num)", setup=s1+s2, number=3)
print(t)

Repeat for 0
Repeat for 1
Repeat for 2
Repeat for 0
Repeat for 1
Repeat for 2
Repeat for 0
Repeat for 1
Repeat for 2
0.008970422999482253


## os - 操作系统相关¶
- 跟操作系统相关，主要是文件操作
- 于系统相关的操作，主要包含在三个模块里
  - os， 操作系统目录相关
  - os.path, 系统路径相关操作
- shutil， 高级文件操作，目录树的操作，文件赋值，删除，移动
- 路径：
  - 绝对路径： 总是从根目录上开始
  - 相对路径： 基本以当前环境为开始的一个相对的地方

### os 模块

In [69]:
import os

In [63]:
# getcwd() 获取当前的工作目录
# 格式：os.getcwd()
# 返回值：当前工作目录的字符串
# 当前工作目录就是程序在进行文件相关操作，默认查找文件的目录

mydir = os.getcwd()
print(mydir)

/home/tlxy/PycharmProjects/Blue_Sunday


In [64]:
# chdir() 改变当前的工作目录
# change directory
# 格式：os.chdir（路径）
# 返回值：无

os.chdir('/home/tlxy')
mydir = os.getcwd()
print(mydir)

/home/tlxy


In [65]:
# listdir() 获取一个目录中所有子目录和文件的名称列表
#  格式:os.listdir(路径)
#  返回值：所有子目录和文件名称的列表

ld = os.listdir()
print(ld)

['.viminfo', '.xsession-errors.old', '.sudo_as_admin_successful', '.bashrc', '.ICEauthority', '.sunpinyin', '图片', '.profile', '.conda', '.java', '.presage', '.pki', '.sogouinput', '.config', 'tulingxueyuan', '.astropy', '.Xdefaults', '.swo', '.gitconfig', '.bash_history', '.ssh', '.dmrc', '下载', 'Downloads', '.vboxclient-clipboard.pid', '.vboxclient-draganddrop.pid', '.PyCharm2017.3', '.bash_logout', '.gconf', '.swp', '.local', 'PycharmProjects', '.gnome2', 'java_error_in_PYCHARM_2922.log', '.xsession-errors', '.mozilla', '.jupyter', '.gnupg', '.ipynb_checkpoints', '.thumbnails', 'PythonNotebook2', '文档', '.cache', '.ipython', '.swn', '.git', '桌面', '.nano', '.vboxclient-seamless.pid', '.vboxclient-display.pid', '.xscreensaver', '.xinputrc', '.Xauthority']


In [71]:
# makedirs（） 递归创建文件夹
# 格式：os.makedirs(递归路径)
# 返回值：无
#  递归路径：多个文件夹层层包含的路径就是递归路径 例如 a/b/c...

os.chdir('/home/tlxy/PycharmProjects/')
rst = os.makedirs("dana")
print(rst)

None


In [72]:
# system() 运行系统shell命令
# 格式：os.system(系统命令)
#  返回值：打开一个shell或者终端界面
# 一般推荐使用subprocess代替

# ls是列出当前文件和文件夹的系统命令
rst = os.system("ls")
print(rst)

# 在当前目录下创建一个dana.haha 的文件
rst = os.system("touch dana.haha")
print(rst)

0
0


In [73]:
# getenv() 获取指定的系统环境变量值
# 相应的还有putenv
#  格式：os.getenv('环境变量名')
#  返回值：指定环境变量名对应的值
rst = os.getenv("PATH")
print(rst)

/var/sw/anaconda3/bin:/home/tlxy/bin:/home/tlxy/.local/bin:/var/sw/anaconda3/bin:/usr/local/sbin:/usr/local/bin:/usr/sbin:/usr/bin:/sbin:/bin:/usr/games:/usr/local/games:/snap/bin


In [None]:
# exit() 退出当前程序
#  格式：exit()
#  返回值:无

### 值部分
-   os.curdir: curretn dir,当前目录
-   os.pardir: parent dir， 父亲目录
-   os.sep: 当前系统的路径分隔符
-   windows: "\"
-   linux: "/"
-   os.linesep: 当前系统的换行符号
-   windows: "\r\n"
-   unix,linux,macos: "\n"
-   os.name： 当前系统名称
-   windows： nt
-   mac，unix，linux： posix

In [74]:
print(os.pardir)
print(os.curdir)

..
.


In [75]:
#   os.sep: 当前系统的路径分隔符： windows: "\"    linux: "/"
#   os.linesep: 当前系统的换行符号
print(os.sep)
print(os.linesep)

/




In [76]:
# 在路径相关的操作中，不要手动拼写地址，因为手动拼写的路径可能不具有移植性
path = "/home/tlxy" + "/" + "dana"
print(path)

/home/tlxy/dana


In [77]:
# linux操作系统的名称是posix
print(os.name)

posix


## os.path 模块， 跟路径相关的模块

In [79]:
import os.path as op

In [80]:
# abspath() 将路径转化为绝对路径
# abselute 绝对
#  格式:os.path.abspath('路径')
#  返回值：路径的绝对路径形式

# linux中
# . 点号，代表当前目录
# .. 双点，代表父目录
absp = op.abspath(".")
print(absp)

/home/tlxy/PycharmProjects


In [82]:
# basename() 获取路径中的文件名部分
#  格式:os.path.basename(路径)
#  返回值：文件名字符串

bn = op.basename("/home/tlxy")
print(bn)

tlxy


In [83]:
# join() 将多个路径拼合成一个路径
#  格式：os.path.join(路径1，路径2....)
#  返回值：组合之后的新路径字符串

bd = "/home/tlxy"
fn = "dana.haha"

p = op.join(bd, fn)
print(p)

/home/tlxy/dana.haha


In [84]:
# split() 将路径切割为文件夹部分和当前文件部分
#  格式:os.path.split（路径）
#  返回值：路径和文件名组成的元组

t = op.split("/home/tlxy/dana.haha")
print(t)

d,p = op.split("/home/tlxy/dana.haha")
print(d, p)

('/home/tlxy', 'dana.haha')
/home/tlxy dana.haha


In [88]:
# isdir（） 检测是否是目录
#  格式：os.path.isdir(路径)
#  返回值：布尔值

rst = op.isdir("/home/tlxy/dana.haha")
print(rst)
rst = op.isdir("/home/tlxy/")
print(rst)

False
True


In [89]:
# exists() 检测文件或者目录是否存在
#  格式：os.path.exists(路径)
#  返回值:布尔值

e = op.exists("/home/tlxy/haha")
e

False

In [None]:
# os模块是与操作系统交互的一个接口
'''
os.access(path, mode)           # 检验权限模式   
os.chdir(path)                  # 改变当前工作目录
os.chflags(path, flags)         # 设置路径的标记为数字标记。
os.chmod(path, mode)            # 更改权限
os.chown(path, uid, gid)        # 更改文件所有者
os.chroot(path)                 # 改变当前进程的根目录
os.close(fd)                    # 关闭文件描述符 fd
os.closerange(fd_low, fd_high)  # 关闭所有文件描述符，从 fd_low (包含) 到 fd_high (不包含), 错误会忽略
os.curdir                       # 返回当前目录：（'.'）
os.dup(fd)                      # 复制文件描述符 fd
os.dup2(fd, fd2)                # 将一个文件描述符 fd 复制到另一个 fd2
os.environ                      # 获取系统环境变量
os.fchdir(fd)                   # 通过文件描述符改变当前工作目录
os.fchmod(fd, mode)             # 改变一个文件的访问权限，该文件由参数fd指定，参数mode是Unix下的文件访问权限。
os.fchown(fd, uid, gid)         # 修改一个文件的所有权，这个函数修改一个文件的用户ID和用户组ID，该文件由文件描述符fd指定。
os.fdatasync(fd)                # 强制将文件写入磁盘，该文件由文件描述符fd指定，但是不强制更新文件的状态信息。
os.fdopen(fd[, mode[, bufsize]])  # 通过文件描述符 fd 创建一个文件对象，并返回这个文件对象
os.fpathconf(fd, name)          # 返回一个打开的文件的系统配置信息。name为检索的系统配置的值，它也许是一个定义系统值的字符串，这些名字在很多标准中指定（POSIX.1, Unix 95, Unix 98, 和其它）。
os.fstat(fd)                    # 返回文件描述符fd的状态，像stat()。
os.fstatvfs(fd)                 # 返回包含文件描述符fd的文件的文件系统的信息，像 statvfs()
os.fsync(fd)                    # 强制将文件描述符为fd的文件写入硬盘。
os.ftruncate(fd, length)        # 裁剪文件描述符fd对应的文件, 所以它最大不能超过文件大小。
os.getcwd()                     # 返回当前工作目录
os.getcwdu()                    # 返回一个当前工作目录的Unicode对象
os.isatty(fd)                   # 如果文件描述符fd是打开的，同时与tty(-like)设备相连，则返回true, 否则False。
os.lchflags(path, flags)        # 设置路径的标记为数字标记，类似 chflags()，但是没有软链接
os.lchmod(path, mode)           # 修改连接文件权限
os.lchown(path, uid, gid)       # 更改文件所有者，类似 chown，但是不追踪链接。
os.link(src, dst)               # 创建硬链接，名为参数 dst，指向参数 src
os.listdir(path)                # 返回path指定的文件夹包含的文件或文件夹的名字的列表。
os.lseek(fd, pos, how)          # 设置文件描述符 fd当前位置为pos, how方式修改: SEEK_SET 或者 0 设置从文件开始的计算的pos; SEEK_CUR或者 1 则从当前位置计算; os.SEEK_END或者2则从文件尾部开始. 在unix，Windows中有效
os.lstat(path)                  # 像stat(),但是没有软链接
os.linesep                      # 当前平台使用的行终止符，win下为"\t\n",Linux下为"\n"
os.major(device)                # 从原始的设备号中提取设备major号码 (使用stat中的st_dev或者st_rdev field)。
os.makedev(major, minor)        # 以major和minor设备号组成一个原始设备号
os.makedirs(path[, mode])       # 递归文件夹创建函数。像mkdir(), 但创建的所有intermediate-level文件夹需要包含子文件夹。
os.minor(device)                # 从原始的设备号中提取设备minor号码 (使用stat中的st_dev或者st_rdev field )。
os.mkdir(path[, mode])          # 以数字mode的mode创建一个名为path的文件夹.默认的 mode 是 0777 (八进制)。
os.mkfifo(path[, mode])         # 创建命名管道，mode 为数字，默认为 0666 (八进制)
os.mknod(filename[, mode=0600, device])  # 创建一个名为filename文件系统节点（文件，设备特别文件或者命名pipe）。
os.open(file, flags[, mode])    # 打开一个文件，并且设置需要的打开选项，mode参数是可选的
os.openpty()                    # 打开一个新的伪终端对。返回 pty 和 tty的文件描述符。
os.pathconf(path, name)         # 返回相关文件的系统配置信息。
os.pathsep                      # 用于分割文件路径的字符串
os.pardir                       # 获取当前目录的父目录字符串名：('..')
os.pipe()                       # 创建一个管道. 返回一对文件描述符(r, w) 分别为读和写
os.popen(command[, mode[, bufsize]])  # 从一个 command 打开一个管道
os.path.abspath(path)           # 返回path规范化的绝对路径
os.path.split(path)             # 将path分割成目录和文件名二元组返回
os.path.dirname(path)           # 返回path的目录。其实就是os.path.split(path)的第一个元素
os.path.basename(path)          # 返回path最后的文件名。如何path以／或\结尾，那么就会返回空值。即os.path.split(path)的第二个元素
os.path.exists(path)            # 如果path存在，返回True；如果path不存在，返回False
os.path.isabs(path)             # 如果path是绝对路径，返回True
os.path.isfile(path)            # 如果path是一个存在的文件，返回True。否则返回False
os.path.isdir(path)             # 如果path是一个存在的目录，则返回True。否则返回False
os.path.join(path1[, path2[, ...]])  # 将多个路径组合后返回，第一个绝对路径之前的参数将被忽略
os.path.getatime(path)          # 返回path所指向的文件或者目录的最后存取时间
os.path.getmtime(path)          # 返回path所指向的文件或者目录的最后修改时间
os.name                         # 字符串指示当前使用平台。win->'nt'; Linux->'posix'
os.read(fd, n)                  # 从文件描述符 fd 中读取最多 n 个字节，返回包含读取字节的字符串，文件描述符 fd对应文件已达到结尾, 返回一个空字符串。
os.readlink(path)               # 返回软链接所指向的文件
os.remove(path)                 # 删除路径为path的文件。如果path 是一个文件夹，将抛出OSError; 查看下面的rmdir()删除一个 directory。
os.removedirs(path)             # 递归删除目录。若目录为空，则删除，并递归到上一级目录，如若也为空，则删除，依此类推
os.rename(src, dst)             # 重命名文件或目录，从 src 到 dst
os.renames(old, new)            # 递归地对目录进行更名，也可以对文件进行更名。
os.rmdir(path)                  # 删除path指定的空目录，如果目录非空，则抛出一个OSError异常。
os.sep                          # 操作系统特定的路径分隔符，win下为"\\",Linux下为"/"
os.stat(path)                   # 获取path指定的路径的信息，功能等同于C API中的stat()系统调用。
os.stat_float_times([newvalue]) # 决定stat_result是否以float对象显示时间戳
os.statvfs(path)                # 获取指定路径的文件系统统计信息
os.symlink(src, dst)            # 创建一个软链接
os.system("bash command")       # 运行shell命令，直接显示
os.tcgetpgrp(fd)                # 返回与终端fd（一个由os.open()返回的打开的文件描述符）关联的进程组
os.tcsetpgrp(fd, pg)            # 设置与终端fd（一个由os.open()返回的打开的文件描述符）关联的进程组为pg。
os.tempnam([dir[, prefix]])     # 返回唯一的路径名用于创建临时文件。
os.tmpfile()                    # 返回一个打开的模式为(w+b)的文件对象 .这文件对象没有文件夹入口，没有文件描述符，将会自动删除。
os.tmpnam()                     # 为创建一个临时文件返回一个唯一的路径
os.ttyname(fd)                  # 返回一个字符串，它表示与文件描述符fd 关联的终端设备。如果fd 没有与终端设备关联，则引发一个异常。
os.unlink(path)                 # 删除文件路径
os.utime(path, times)           # 返回指定的path文件的访问和修改的时间。
os.walk(top[, topdown=True[, onerror=None[, followlinks=False]]])  # 输出在文件夹中的文件名通过在树中游走，向上或者向下。
os.write(fd, str)               # 写入字符串到文件描述符 fd中. 返回实际写入的字符串长度

'''

## shutil 模块
- 高级的文件、文件夹、压缩包处理模块

In [90]:
import shutil

In [93]:
# copy() 复制文件
#  格式：shutil.copy(来源路径，目标路径)
#  返回值：返回目标路径
# 拷贝的同时，可以给文件重命名

rst = shutil.copy("/home/tlxy/PycharmProjects/dana.haha", "/home/tlxy/PycharmProjects/dana/haha.haha")
print(rst)


# copy2() 复制文件，保留元数据（文件信息）
#  格式：shutil.copy2(来源路径，目标路径)
#  返回值：返回目标路径
#  注意：copy和copy2的唯一区别在于copy2复制文件时尽量保留元数据

/home/tlxy/PycharmProjects/dana/haha.haha


In [94]:
# copyfile()将一个文件中的内容复制（覆盖）到另外一个文件当中
#  格式：shutil.copyfile（'源路径','目标路径')
#  返回值：无

rst = shutil.copyfile("/home/tlxy/PycharmProjects/dana.haha", "/home/tlxy/PycharmProjects/dana/haha.haha")
print(rst)

/home/tlxy/PycharmProjects/dana/haha.haha


In [96]:
# move() 移动文件/文件夹
#  格式：shutil.move(源路径，目标路径)
#  返回值：目标路径！
rst  = shutil.move("/home/tlxy/PycharmProjects/dana.haha", "/home/tlxy/PycharmProjects/dana")
print(rst)

/home/tlxy/PycharmProjects/dana/dana.haha


## 归档和压缩
- 归档： 把多个文件或者文件夹合并到一个文件当中
- 压缩： 用算法把多个文件或者文件夹无损或者有损合并到一个文件当中

In [None]:
# make_archive() 归档操作
#  格式:shutil.make_archive('归档之后的目录和文件名','后缀','需要归档的文件夹')
#  返回值：归档之后的地址

#help(shutil.make_archive)

# 是想得到一个叫做tuling.zip的归档文件
rst = shutil.make_archive("/home/tlxy/tuling", "zip", "/home/tlxy/dana")
print(rst)

In [None]:
# unpack_archive() 解包操作
# 格式：shutil.unpack_archive('归档文件地址','解包之后的地址')
# 返回值：解包之后的地址

## zip - 压缩包
- 名称叫 zipfile

In [97]:
import zipfile

In [None]:
#zipfile.ZipFile(file[, mode[, compression[, allowZip64]]])
# 创建一个ZipFile对象，表示一个zip文件。参数file表示文件的路径或类文件对象(file-like object)；参数mode指示打开zip文件的模式，默认值为’r’，表示读已经存在的zip文件，也可以为’w’或’a’，’w’表示新建一个zip文档或覆盖一个已经存在的zip文档，’a’表示将数据附加到一个现存的zip文档中。参数compression表示在写zip文档时使用的压缩方法，它的值可以是zipfile. ZIP_STORED 或zipfile. ZIP_DEFLATED。如果要操作的zip文件大小超过2G，应该将allowZip64设置为True。

zf = zipfile.ZipFile("/home/tlxy/tuling.zip")

In [None]:
# ZipFile.getinfo(name):
#  获取zip文档内指定文件的信息。返回一个zipfile.ZipInfo对象，它包括文件的详细信息。将在下面 具体介绍该对象。

rst = zf.getinfo("dana.haha")
print(rst)

In [None]:
# ZipFile.namelist()
#  获取zip文档内所有文件的名称列表。

nl = zf.namelist()
print(nl)

In [None]:
# ZipFile.extractall([path[, members[, pwd]]])
#  解压zip文档中的所有文件到当前目录。参数members的默认值为zip文档内的所有文件名称列表，也可以自己设置，选择要解压的文件名称。

rst = zf.extractall("/home/tlxy/dana")

In [None]:
print(rst)

## random随机数
- 随机生成0-1的小数，随机生成0-100的整数
- 随机在列表中选一个
- 随机打乱列表
- help(random)
- 所有的随机模块都是伪随机

In [99]:
import random

In [100]:
# random() 获取0-1之间的随机小数
#  格式：random.random()
#  返回值：随机0-1之间的小数

print(random.random())

# 作业： 利用random函数，注意是函数，生成0-100直接的整数

0.23954000155598787


In [101]:
# choice() 随机返回序列中的某个值
#  格式：random.choice(序列)
#  返回值：序列中的某个值

l = [str(i)+"haha" for i in range(10)]
print(l)
rst = random.choice(l)
print(rst)

['0haha', '1haha', '2haha', '3haha', '4haha', '5haha', '6haha', '7haha', '8haha', '9haha']
0haha


In [102]:
# shuffle() 随机打乱列表
#  格式：random.shuffle(列表)
#  返回值：打乱顺序之后的列表

l1 = [i for i in range(10)]
print(l1)

random.shuffle(l1)
print(l1)

[0, 1, 2, 3, 4, 5, 6, 7, 8, 9]
[5, 2, 6, 4, 0, 8, 7, 1, 3, 9]


In [104]:
# randint(a,b): 返回一个a到b之间的随机整数，包含a和b
print(random.randint(0,100))

35


## sys
- sys模块用于提供对python解释器的相关操作。

In [None]:
'''
sys.argv   命令行参数List，第一个元素是程序本身路径
sys.modules 返回系统导入的模块字段，key是模块名，value是模块
sys.exit(n)        退出程序，正常退出时exit(0)
sys.version        获取Python解释程序的版本信息
sys.maxint         最大的Int值
sys.path           返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值
sys.platform       返回操作系统平台名称
sys.stdout.write('please:')
val = sys.stdin.readline()[:-1]
sys.modules.keys() 返回所有已经导入的模块名
sys.modules.values() 返回所有已经导入的模块
sys.exc_info()     获取当前正在处理的异常类,exc_type、exc_value、exc_traceback当前处理的异常详细信息
sys.exit(n)        退出程序，正常退出时exit(0)
sys.hexversion     获取Python解释程序的版本值，16进制格式如：0x020403F0
sys.version        获取Python解释程序的
sys.api_version    解释器的C的API版本
sys.version_info
‘final’表示最终,也有’candidate’表示候选，serial表示版本级别，是否有后继的发行
sys.displayhook(value)      如果value非空，这个函数会把他输出到sys.stdout，并且将他保存进__builtin__._.指在python的交互式解释器里，’_’ 代表上次你输入得到的结果，hook是钩子的意思，将上次的结果钩过来
sys.getdefaultencoding()    返回当前你所用的默认的字符编码格式
sys.getfilesystemencoding() 返回将Unicode文件名转换成系统文件名的编码的名字
sys.setdefaultencoding(name)用来设置当前默认的字符编码，如果name和任何一个可用的编码都不匹配，抛出 LookupError，这个函数只会被site模块的sitecustomize使用，一旦别site模块使用了，他会从sys模块移除
sys.builtin_module_names    Python解释器导入的模块列表
sys.executable              Python解释程序路径
sys.getwindowsversion()     获取Windows的版本
sys.copyright      记录python版权相关的东西
sys.byteorder      本地字节规则的指示器，big-endian平台的值是’big’,little-endian平台的值是’little’
sys.exc_clear()    用来清除当前线程所出现的当前的或最近的错误信息
sys.exec_prefix    返回平台独立的python文件安装的位置
sys.stderr         错误输出
sys.stdin          标准输入
sys.stdout         标准输出
sys.platform       返回操作系统平台名称
sys.path           返回模块的搜索路径，初始化时使用PYTHONPATH环境变量的值
sys.maxunicode     最大的Unicode值
sys.maxint         最大的Int值
sys.version        获取Python解释程序的版本信息
sys.hexversion     获取Python解释程序的版本值，16进制格式如：0x020403F0

'''

In [17]:
# 进度条（注意：在pycharm中执行无效，请到命令行中以脚本的方式执行）

import sys,time
'''
for i in range(50):
    sys.stdout.write('%s\r' %('#'*i))
    sys.stdout.flush()
    time.sleep(0.1)
'''
help(sys.stdout.flush)

Help on method flush in module ipykernel.iostream:

flush() method of ipykernel.iostream.OutStream instance
    trigger actual zmq send
    
    send will happen in the background thread

