# 默认代码
>- `filePath` 需要带文件后缀 `.txt` 或 `.xlsx` 或 `.json`
>- 除了读取操作，其他任何操作都不要在打开文件的情况下进行

In [None]:
# 导入形式

# %%capture
# %run "file_Tool.ipynb"

In [None]:
# 只要导入了 file_Tool.ipynb ，则不再需要重复导入这些包

import warnings
warnings.filterwarnings('ignore')

from IPython.display import display

import os
import numpy as np
import pandas as pd

# Text
>- `DataFrame` $\Leftrightarrow$ `.txt` 文件

## 写入
>- 将 `List` 元素一行一行地写入 `.txt` 文件

In [None]:
# .txt 文件不存在：自动创建，并写入
# .txt 文件存在时：直接覆盖

def cover_txt(lines , filePath):
    
    # 判断文件是否存在
    E = os.path.exists(filePath)
    
    with open(filePath , 'w' , encoding = 'utf-8') as file:
        for line in lines:
            file.write(str(line))
            file.write('\n')
    
    if E:
        print(f"文件存在，直接覆盖 '{filePath}'")
    else:
        print(f"文件不存在，自动创建，并写入 '{filePath}'")

In [None]:
# .txt 文件不存在：自动创建，并写入
# .txt 文件存在时：末尾追加

def append_txt(lines , filePath):
    
    # 判断文件是否存在
    E = os.path.exists(filePath)
    
    with open(filePath , 'a' , encoding = 'utf-8') as file:
        
        # 存在
        if E:
            file.write('\n-----追加-----\n')
            
        for line in lines:
            file.write(str(line))
            file.write('\n')
    
    if E:
        print(f"文件存在，末尾追加 '{filePath}'")
    else:
        print(f"文件不存在，自动创建，并写入 '{filePath}'")

## 读取
>- `.txt` 文件必须已经存在

In [None]:
# 返回 lines == ['第一行' , '第二行' , '第三行' , ...]

def read_txt(filePath):
    
    # 判断文件是否存在
    E = os.path.exists(filePath)
    
    if E:
        with open(filePath , 'r' , encoding = 'utf-8') as file:
            lines = file.readlines()
            lines = [line.strip() for line in lines]                       # 去除每一行首尾的：空白 + \n + \r + \t
            lines = [line for line in lines if (len(line) != 0)]           # 去除空字符串
            lines = [line for line in lines if (line.isspace() != True)]   # 去除空白行
            return lines
    else:
        print(f"指定的文件 '{filePath}' 不存在！！！")

# Excel
>- `DataFrame` $\Leftrightarrow$ `.xlsx` 文件

In [None]:
import openpyxl

## 单 sheet
>- 注意：`List`  ==>  存储  ==>  Excel  ==>  读取  ==> `String`（详见 `file_Tool_Test.ipynb`）

In [None]:
# .xlsx 文件不存在：自动创建，并写入（sheetName 默认命名为 Sheet1）
# .xlsx 文件存在时：直接覆盖（多个原先的 sheet 会被全部删除，仅有一个覆盖后的 Sheet1）

def save_ex(data , filePath):
    
    # 判断文件是否存在
    E = os.path.exists(filePath)
    
    # 修改 data 的行索引名称，方便下面保存为一列数据
    data.index.name = 'Index'
    
    # index = True 表明将 data 的行索引也作为一列数据保存，方便到时候 data = data.set_index('Index') 重置行索引
    data.to_excel(filePath , index = True)
    
    if E:
        print(f"文件存在，直接覆盖 '{filePath}'")
    else:
        print(f"文件不存在，自动创建，并写入 '{filePath}'")

In [None]:
# 也可用于读取多 sheet 的 .xlsx 文件，默认仅读取第一个 sheet

def read_ex(filePath):
    
    # 判断文件是否存在
    E = os.path.exists(filePath)
    
    if E:
        res = pd.read_excel(filePath)
        return res
    else:
        print(f"指定的文件 '{filePath}' 不存在！！！")

## 多 sheet
>- 仅读取

In [None]:
# 返回所有 sheetName 组成的 List

def read_all_sheets(filePath):
    
    # 判断文件是否存在
    E = os.path.exists(filePath)
    
    if E:
        return openpyxl.load_workbook(filePath).sheetnames
    else:
        print(f"指定的文件 '{filePath}' 不存在！！！")

In [None]:
# 读取指定的 sheetName ，单 sheetName 也适用

def read_ex_sheet(filePath , sheetName):
    
    # 判断文件是否存在
    E = os.path.exists(filePath)
    
    if E:
        res = pd.read_excel(filePath , sheetName)
        return res
    else:
        print(f"指定的文件 '{filePath}' 不存在！！！")

# Json
>- `DataFrame` $\Leftrightarrow$ `.json` 文件
>  - 最外面是 `[]`
>  - 里面一个一个是 `{}, ...`
>  - 再里面一个一个是 `"key" : "value", ...`
>  - 若 `value` 是数值或 `List` ，则没有双引号 `"` 括起来
>- `orient = 'records'`
>  - `DataFrame` 的一行  ==  一个 `{}`
>  - 不包括行索引 index
>- 注意一：`List`  ==>  存储  ==>  JSON  ==>  读取  ==> `List`（区别于上述的 Eecel）
>- 注意二：存储的字符串带有 `/` 时，会在 `.json` 文件中显示为 `\/`

In [None]:
# 直接覆盖

def save_json(data , filePath):
    
    # 判断文件是否存在
    E = os.path.exists(filePath)
    
    # 设置参数 force_ascii = False 确保中文不乱码
    data.to_json(filePath , orient = 'records' , force_ascii = False)
    
    if E:
        print(f"文件存在，直接覆盖 '{filePath}'")
    else:
        print(f"文件不存在，自动创建，并写入 '{filePath}'")

In [None]:
def read_json(filePath):
    
    # 判断文件是否存在
    E = os.path.exists(filePath)
    
    if E:
        res = pd.read_json(filePath , orient = 'records')
        return res
    else:
        print(f"指定的文件 '{filePath}' 不存在！！！")

# 属性
>- `DataFrame` 每一列的数据类型，比单纯的 `data.dtypes` 要更加详细
>- 详见 `README_Soft` 的 `WPS`

In [None]:
def allCols(data):
    
    cols = data.columns.values
    # print(f'{str(type(cols)):<25s}     {cols}')
    # 所有列名组成的 numpy.ndarray
    
    print('-------------------------------------------------------------------')
    
    for c in cols:
        print(f'{str(type(data.iloc[0][c])):>25s}     {c:<10s}')
    
    print('-------------------------------------------------------------------')
    
    return cols