In [1]:
import os
from pathlib import Path

NOTEBOOK_PATH: Path = Path(os.path.abspath(''))

# print(f'当前运行在：{NOTEBOOK_PATH} 目录下。')

PATH_FOR_RESULT: Path = NOTEBOOK_PATH.joinpath('RESULT')

if not PATH_FOR_RESULT.exists():
    PATH_FOR_RESULT.mkdir()

# 处理压缩文件

处理 zip 文件，使用 Python 自带了 zipfile 模块即可。

In [2]:
from typing import List
import zipfile

def unzip_file(zipped_file: Path, unzip_path: Path, keep: bool = False) -> List[Path]:
    """
    解压单个 zip 文件。
    Unzip a zip file to ten temporary directory defined in <CONFIGS>, and return the unzipped file path.
    :param zipped_file:   Path，待解压文件的路径。
    :param unzip_path: Path，保存被解压出来的文件的路径。
    :param keep:       bool，保留待解压文件的话，取值 True，否则解压完成后删除待解压文件。
    :return: list，被解压出来的文件的路径（Path）的列表。
    """
    
    # 如果参数 <zip_file> 不存在，引发异常。
    if not zipped_file.exists():
        raise FileNotFoundError(f'<{zipped_file}> 不存在。')

    # 如果参数 <unzip_path> 不存在，引发异常。
    if not unzip_path.exists():
        raise FileNotFoundError(f'<{unzip_path}> 不存在。')

    # 用 zipfile 模块的 ZipFile 打开待解压文件。
    zip_file = zipfile.ZipFile(zipped_file, 'r')
    
    # 生成解压文件列表
    result: List[Path] = [unzip_path.joinpath(filename) for filename in zip_file.namelist()]
    
    # 解压文件。
    zip_file.extractall(unzip_path)
    
    # 关闭文件。
    zip_file.close()
    
    # 删除待解压文件
    if not keep:
        zipped_file.unlink()
    
    # 返回解压出来的文件列表
    return result

# 测试

# 测试用待解压文件
# 如果你的 RESULT\ 文件夹没有 CFFEX_2020-08.zip 文件，去中金所下载一个。
# 其实只要是个 zip 文件就行，可能需要修改你的 zip 文件的名字，或者下面代码中的文件名。
test_zipped_file: Path = PATH_FOR_RESULT.joinpath('CFFEX_2020-08.zip')

# 测试用解压路径
test_unzip_path: Path = PATH_FOR_RESULT.joinpath('unzipped')

# 如果解压路径不存在，创建它。
if not test_unzip_path.exists():
    test_unzip_path.mkdir()

# 测试
unzip_file(
    zipped_file=test_zipped_file,
    unzip_path=test_unzip_path,
    keep=True
)

[WindowsPath('d:/Development/Jupyter/InvestmentNotebook/notebook/collect_data/RESULT/unzipped/20200820_1.csv'),
 WindowsPath('d:/Development/Jupyter/InvestmentNotebook/notebook/collect_data/RESULT/unzipped/20200831_1.csv'),
 WindowsPath('d:/Development/Jupyter/InvestmentNotebook/notebook/collect_data/RESULT/unzipped/20200813_1.csv'),
 WindowsPath('d:/Development/Jupyter/InvestmentNotebook/notebook/collect_data/RESULT/unzipped/20200825_1.csv'),
 WindowsPath('d:/Development/Jupyter/InvestmentNotebook/notebook/collect_data/RESULT/unzipped/20200803_1.csv'),
 WindowsPath('d:/Development/Jupyter/InvestmentNotebook/notebook/collect_data/RESULT/unzipped/20200821_1.csv'),
 WindowsPath('d:/Development/Jupyter/InvestmentNotebook/notebook/collect_data/RESULT/unzipped/20200812_1.csv'),
 WindowsPath('d:/Development/Jupyter/InvestmentNotebook/notebook/collect_data/RESULT/unzipped/20200827_1.csv'),
 WindowsPath('d:/Development/Jupyter/InvestmentNotebook/notebook/collect_data/RESULT/unzipped/20200826_1

完美！

下一步，我们着手[读取中金所历史数据](read_cffex_history_data.ipynb)。