In [1]:
"""文件的读写操作默认使用系统编码"""

import sys

print(sys.getdefaultencoding())
print(sys.getfilesystemencoding())
print(sys.stdout.encoding)

utf-8
utf-8
UTF-8


In [2]:
"""自定义打印分隔符和行终止符"""

print('hello', 'world')
print('hello', 'world', sep=',', end='#\n')

hello world
hello,world#


In [10]:
"""文本字符串和字节字符串"""

# 文本字符串
txt1 = 'hello world'
for t in txt1:
    print(t, end='\t')

print('')
    
# 字节字符串
txt2 = b'hello world'
for t in txt2:
    print(t, end='\t')
    
print('')
    
# 文本字符串和字节字符串的转换
t = 'hello world'
bt = t.encode('utf-8')  # 文本串转字节串
print(type(bt))
print(bt)

tt = bt.decode('utf-8')  # 字节串转文本串
print(type(tt))
print(tt)

h	e	l	l	o	 	w	o	r	l	d	
104	101	108	108	111	32	119	111	114	108	100	
<class 'bytes'>
b'hello world'
<class 'str'>
hello world


In [4]:
"""打印输出重定向到文件，必须以文本模式打开"""

with open('./files/hello_world.txt', 'wt') as f:
    print('hello world', file=f)

In [16]:
"""字符串的I/O操作

创建类文件对象，该对象可以被传递给某个参数为普通文件对象的函数
io.StringIO 和 io.BytesIO
"""

import io

s = io.StringIO()
s.write('hello world\n')
print('This is a test', file=s)
print(s.getvalue())

t = io.StringIO('hi, world')
print(t.read(3))
print(t.read())

hello world
This is a test

hi,
 world


In [18]:
"""读写压缩文件"""

import gzip

with gzip.open('./files/somefile.gz', 'rt') as f:
    t = f.read()
    
# 指定压缩级别
with gzip.open('./files/somefile.gz', 'wt', compresslevel=5) as f:
    f.write('sometext ...')
    
import bz2

with bz2.open('./files/somefile.bz2', 'rt') as f:
    t = f.read()

In [22]:
"""读取二进制文件

以一个固定长度的数据块迭代读取，而不是在文件中一行一行地读取
这种方式常用于读取二进制文件
"""

from functools import partial

RECORD_SIZE = 32

with open('./files/octocat.png', 'rb') as f:
    records = iter(partial(f.read, RECORD_SIZE), b'')
    for r in records:
        print(r)

b'\x89PNG\r\n\x1a\n\x00\x00\x00\rIHDR\x00\x00\x02\x00\x00\x00\x02\x00\x08\x06\x00\x00\x00\xf4x\xd4'
b'\xfa\x00\x00\x00\x19tEXtSoftware\x00Adobe ImageRea'
b'dyq\xc9e<\x00\x00\x03fiTXtXML:com.adobe.xmp\x00'
b'\x00\x00\x00\x00<?xpacket begin="\xef\xbb\xbf" id="W5'
b'M0MpCehiHzreSzNTczkc9d"?> <x:xmp'
b'meta xmlns:x="adobe:ns:meta/" x:'
b'xmptk="Adobe XMP Core 5.0-c060 6'
b'1.134777, 2010/02/12-17:32:00   '
b'     "> <rdf:RDF xmlns:rdf="http'
b'://www.w3.org/1999/02/22-rdf-syn'
b'tax-ns#"> <rdf:Description rdf:a'
b'bout="" xmlns:xmpMM="http://ns.a'
b'dobe.com/xap/1.0/mm/" xmlns:stRe'
b'f="http://ns.adobe.com/xap/1.0/s'
b'Type/ResourceRef#" xmlns:xmp="ht'
b'tp://ns.adobe.com/xap/1.0/" xmpM'
b'M:OriginalDocumentID="xmp.did:F9'
b'7F1174072068119109DAC61B29CD71" '
b'xmpMM:DocumentID="xmp.did:7C7BF4'
b'917F7F11E08664BAFC9709A271" xmpM'
b'M:InstanceID="xmp.iid:7C7BF4907F'
b'7F11E08664BAFC9709A271" xmp:Crea'
b'torTool="Adobe Photoshop CS5 Mac'
b'intosh"> <xmpMM:DerivedFrom stRe'
b'f:instanceID="xm

In [3]:
import os

# 列出当前目录下的所有子目录
sub_dirs = [d for d in os.listdir('.') if os.path.isdir(d)]
print('子目录：', sub_dirs)

# 列出当前目录下的所有文件
all_files = [f for f in os.listdir('.') if os.path.isfile(f)]
print('所有文件：', all_files)

# 列出当前目录下的所有.ipynb文件
ipynb_files = [f for f in os.listdir('.') if os.path.isfile(f) and os.path.splitext(f)[1] == '.ipynb']
print('所有ipynb文件：', ipynb_files)

子目录： ['.ipynb_checkpoints', 'files']
所有文件： ['函数式编程.ipynb', '字符串和文本.ipynb', '并发编程.ipynb', '数字.ipynb', '数据结构和算法.ipynb', '数据结构和算法2.ipynb', '数据结构和算法3.ipynb', '数据编码和处理.ipynb', '文件和IO.ipynb', '日期和时间.ipynb', '网络编程.ipynb', '迭代器和生成器.ipynb', '错误和异常处理.ipynb', '面向对象编程.ipynb', '面向对象编程2.ipynb']
所有ipynb文件： ['函数式编程.ipynb', '字符串和文本.ipynb', '并发编程.ipynb', '数字.ipynb', '数据结构和算法.ipynb', '数据结构和算法2.ipynb', '数据结构和算法3.ipynb', '数据编码和处理.ipynb', '文件和IO.ipynb', '日期和时间.ipynb', '网络编程.ipynb', '迭代器和生成器.ipynb', '错误和异常处理.ipynb', '面向对象编程.ipynb', '面向对象编程2.ipynb']


In [32]:
"""os 和 sys

有关文件路径名的操作，使用os.path
"""

import os
import sys

# 获取当前目录
print('当前目录：', os.getcwd())

# 获取当前目录下的文件和子目录
print('当前目录下的文件和子目录：', os.listdir())

# 获取当前文件
print('当前文件：', os.path.basename(sys.argv[0]))

# 获取当前文件的绝对路径
print('当前文件的绝对路径：', os.path.abspath(os.path.basename(sys.argv[0])))

# 获取当前文件所在的目录
print('当前文件所在目录：', os.path.dirname(os.path.abspath(os.path.basename(sys.argv[0]))))

# 获取当前文件扩展名
print('当前文件扩展名：', os.path.splitext(sys.argv[0]))

# 构建新的文件路径
print('新的文件路径：', os.path.join('tmp', 'py', os.path.basename(sys.argv[0])))

当前目录： D:\Installation\WampServer\www\PyProjects\iJupyter\iPyThree
当前目录下的文件和子目录： ['.ipynb_checkpoints', 'files', '函数式编程.ipynb', '字符串和文本.ipynb', '数字.ipynb', '数据结构和算法.ipynb', '数据结构和算法2.ipynb', '数据结构和算法3.ipynb', '文件和IO.ipynb', '日期和时间.ipynb', '类的基本用法.ipynb', '类的基本用法2.ipynb', '迭代器和生成器.ipynb', '错误和异常处理.ipynb']
当前文件： ipykernel_launcher.py
当前文件的绝对路径： D:\Installation\WampServer\www\PyProjects\iJupyter\iPyThree\ipykernel_launcher.py
当前文件所在目录： D:\Installation\WampServer\www\PyProjects\iJupyter\iPyThree
当前文件扩展名： ('D:\\Installation\\Anaconda\\lib\\site-packages\\ipykernel_launcher', '.py')
新的文件路径： tmp\py\ipykernel_launcher.py


In [1]:
"""测试文件是否存在，是否为目录"""

import os

for f in os.listdir():
    if os.path.exists(f):
        if os.path.isfile(f):
            print(f, ' is a file')
        else:
            print(f, ' is a dir')

.ipynb_checkpoints  is a dir
files  is a dir
函数式编程.ipynb  is a file
字符串和文本.ipynb  is a file
数字.ipynb  is a file
数据结构和算法.ipynb  is a file
数据结构和算法2.ipynb  is a file
数据结构和算法3.ipynb  is a file
文件和IO.ipynb  is a file
日期和时间.ipynb  is a file
类的基本用法.ipynb  is a file
类的基本用法2.ipynb  is a file
迭代器和生成器.ipynb  is a file
错误和异常处理.ipynb  is a file


In [12]:
"""获取文件的元数据，包括文件大小和更新时间"""

import os
import time

f = os.listdir()[-1]

print('文件：', f)
print('文件大小：', os.path.getsize(f), 'B')
print('更新时间：', time.ctime(os.path.getmtime(f)))

文件： 错误和异常处理.ipynb
文件大小： 3332 B
更新时间： Sun Apr 26 11:27:19 2020


In [16]:
"""listdir()只是返回目录中的实体名列表而已

使用列表推导式对文件进行过滤，并在此基础上获取其他元信息
"""

import os 
import glob
import time

# 获取当前目录下的所有*.ipynb文件
ipynb_files = glob.glob('*.ipynb')

# 获取文件大小及修改时间
file_size_mtime = [(name, os.path.getsize(name), os.path.getmtime(name)) for name in ipynb_files]
for name, size, mtime in file_size_mtime:
    print(name, size, time.ctime(mtime))
    
# 获取文件的所有元信息
file_metadata = [(name, os.stat(name)) for name in ipynb_files]
for name, metadata in file_metadata:
    print(name, metadata)

函数式编程.ipynb 15310 Tue May 12 12:53:11 2020
字符串和文本.ipynb 14229 Thu Jun  4 10:16:59 2020
数字.ipynb 5958 Mon Jun  8 09:51:25 2020
数据结构和算法.ipynb 9598 Thu May 14 09:19:27 2020
数据结构和算法2.ipynb 12507 Mon May 18 11:03:16 2020
数据结构和算法3.ipynb 10020 Fri May 29 13:05:34 2020
文件和IO.ipynb 90846 Tue Jun 16 09:58:39 2020
日期和时间.ipynb 6625 Tue Jun  9 10:18:15 2020
类的基本用法.ipynb 8461 Sun Apr 26 11:32:37 2020
类的基本用法2.ipynb 8577 Sun Apr 26 11:31:53 2020
迭代器和生成器.ipynb 13823 Fri Jun 12 11:22:35 2020
错误和异常处理.ipynb 3332 Sun Apr 26 11:27:19 2020
函数式编程.ipynb os.stat_result(st_mode=33206, st_ino=5629499534437073, st_dev=3492308285, st_nlink=1, st_uid=0, st_gid=0, st_size=15310, st_atime=1589259232, st_mtime=1589259191, st_ctime=1589160809)
字符串和文本.ipynb os.stat_result(st_mode=33206, st_ino=33495522228962591, st_dev=3492308285, st_nlink=1, st_uid=0, st_gid=0, st_size=14229, st_atime=1591237165, st_mtime=1591237019, st_ctime=1590976116)
数字.ipynb os.stat_result(st_mode=33206, st_ino=495677433987639497, st_dev=3492308285

In [19]:
"""临时文件

在程序执行时创建一个临时文件或目录，并在使用完成后自动销毁
"""

from tempfile import TemporaryFile

# 模式w+t同时支持读写操作
with TemporaryFile('w+t', encoding='utf-8') as f:
    f.write('Hello World \n')
    f.write('This is a test')
    
    # seek back to beginning and read the data
    f.seek(0)
    print(f.read())
    
# temporary file is destroyed

Hello World 
This is a test


In [22]:
"""命名临时文件，并阻止文件关闭时被自动删除"""

from tempfile import NamedTemporaryFile

with NamedTemporaryFile('w+t', delete=False) as f:
    print('Tempfile is ', f.name)
    
# 通过关键字参数自定义临时文件所在目录及命名规则
f = NamedTemporaryFile(prefix='temp', suffix='.txt', dir='./files')
print(f.name)

Tempfile is  C:\Users\Neo\AppData\Local\Temp\tmphitt8oje
D:\Installation\WampServer\www\PyProjects\iJupyter\iPyThree\files\tempq2_3lnaa.txt


In [23]:
"""创建临时目录"""

from tempfile import TemporaryDirectory

with TemporaryDirectory() as dirname:
    print('Tempdir is ', dirname)
    
# temporary directory and contents destroyed

Tempdir is  C:\Users\Neo\AppData\Local\Temp\tmp6axi54ay


In [35]:
"""序列化python对象

pickle是python特有的自描述的数据编码
通过自描述，被序列化后的数据包含每个对象的开始和结束，以及它的类型信息
"""

import pickle

color_data = {
    'red': 'ff0000',
    'green': '00ff00',
    'blue': '0000ff'
}

# 将对象序列化为字符串
color_str = pickle.dumps(color_data)
print(color_str)

# 将字符串复原为对象
color_obj = pickle.loads(color_str)
print(color_obj)

# 将对象保存到文件
with open('./files/color_data', 'wb') as f:
    pickle.dump(color_data, f)
    
# 从文件中恢复
with open('./files/color_data', 'rb') as f:
    print('从文件中获取：', pickle.load(f))

b'\x80\x03}q\x00(X\x03\x00\x00\x00redq\x01X\x06\x00\x00\x00ff0000q\x02X\x05\x00\x00\x00greenq\x03X\x06\x00\x00\x0000ff00q\x04X\x04\x00\x00\x00blueq\x05X\x06\x00\x00\x000000ffq\x06u.'
{'red': 'ff0000', 'green': '00ff00', 'blue': '0000ff'}
从文件中获取： {'red': 'ff0000', 'green': '00ff00', 'blue': '0000ff'}


In [40]:
"""递归实现文件批量重命名"""

import os

# 参数root_dir: 文件根目录
# 参数no_text: 要从文件名中去除的字符串
def rename_file(root_dir, no_text):
    if not os.path.isdir(root_dir):
        return
    if not root_dir.endswith(os.path.sep):
        root_dir += os.path.sep
        
    # 获取根目录下是所有子目录及文件
    sub_dirs = os.listdir(root_dir)
    for sub_dir in sub_dirs:
        sub_path = os.path.join(root_dir, sub_dir)
        
        # 递归调用
        if os.path.isdir(sub_path):
            rename_file(sub_path, no_text)
            
        new_dir = sub_dir.replace(no_text, '')
        new_path = os.path.join(root_dir, new_dir)
        # 重命名
        os.rename(sub_path, new_path)
        
# 测试
# rename_file(r'D:\iPyThree', '[www.abc.com]')

In [None]:
"""串口通信

使用pySerial进行串口通信
串口通信的典型场景就是和硬件设备打交道
所有涉及到串口的I/O都是二进制模式的
"""

In [6]:
"""通过文件名查找文件"""

import os
import sys

def findfile(start, name):
    # os.walk()方法返回一个三元组
    # 包含相对于查找目录的相对路径、该目录下的目录名列表以及该目录下的文件名列表
    for realpath, dirs, files in os.walk(start):
        if name in files:
            full_name = os.path.join(start, realpath, name)
            print(os.path.normpath(os.path.abspath(full_name)))
            
if __name__ == '__main__':
    findfile(sys.argv[1], sys.argv[2])

In [7]:
"""创建和解压归档文件"""

import shutil

# 创建压缩文件
# 参数1：期望生成的归档文件名称
# 参数2：期望生成的归档文件格式
# 参数3：目标文件夹
# shutil.make_archive('bar', 'zip', 'bar-1.0')

# 解压
# shutil.unpack_archive('foo.zip')

# 获取支持的归档格式列表
shutil.get_archive_formats()

[('bztar', "bzip2'ed tar-file"),
 ('gztar', "gzip'ed tar-file"),
 ('tar', 'uncompressed tar file'),
 ('xztar', "xz'ed tar-file"),
 ('zip', 'ZIP file')]