In [6]:
import os
import numpy as np
import pandas as pd
import joblib
import matplotlib.pyplot as plt

In [4]:
pd.set_option('max_rows', 20)

plt.style.use('default')
plt.rcParams['figure.figsize'] = (12, 3)
plt.rcParams['font.family'] = 'sans-serif'

In [5]:
# 指定檔案位置，包含完整路徑以及檔案名稱
# os.curdir: 回傳目前目錄的路徑
# 若無法在個人電腦上以 Anaconda 開啟 Notebook，請用Google Colab開啟，並將下兩行程式的註解消除，再將 turbofan.csv 和 turbofan_rul.csv資料上傳 
# Turbofan_FILEPATH = os.path.join(os.curdir, 'turbofan.csv')
# Turbofan_RUL_FILEPATH = os.path.join(os.curdir, 'turbofan_rul.csv')
Turbofan_FILEPATH = os.path.join(os.curdir, 'data', 'turbofan.csv')
Turbofan_RUL_FILEPATH = os.path.join(os.curdir, 'data', 'turbofan_rul.csv')

# 檢視檔案位置
print(Turbofan_FILEPATH)

# 讀取 CSV 檔案，並將其指定為名稱是 df (DataFrame) 的物件
df = pd.read_csv(filepath_or_buffer=Turbofan_FILEPATH)
df_bak = df.copy()

df_rul = pd.read_csv(filepath_or_buffer=Turbofan_RUL_FILEPATH)
df_rul_bak = df_rul.copy()

./data/turbofan.csv


## `to_csv()`：儲存 DataFrame 或 Series 為csv格式

* 常用 Parameters：
    * `path_or_buf`：儲存路徑
        * `outer`：將相同 column/row label 的資料結合，不相同的 label 則**另外存放**
        * `inner`：只將相同 column/row label 的資料結合，不相同的 label 則**捨棄**
    * `index`：是否要儲存 row index
        * `True`：儲存
        * `False`：不儲存
* 參考文件：
    * [pandas.DataFrame.to_csv](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.DataFrame.to_csv.html#pandas-dataframe-to-csv)
    * [pandas.Series.to_csv](https://pandas.pydata.org/pandas-docs/stable/reference/api/pandas.Series.to_csv.html#pandas-series-to-csv)
    * [10 MInutes to Pandas | Getting data in/out | csv](https://pandas.pydata.org/pandas-docs/stable/user_guide/10min.html#csv)

In [11]:
# 若無法在個人電腦上以 Anaconda 開啟 Notebook，請用Google Colab開啟，並將下兩行程式的註解消除，再將 turbofan_test.csv 儲存
# df.to_csv(os.path.join(os.curdir, 'turbofan_test.csv'), index=False)
df.to_csv(os.path.join(os.curdir, 'data', 'turbofan_test.csv'), index=False)

## `joblib.dump`：保有 python物件 格式，將其儲存成一個檔案

* 常用 Parameters：
    * `value`：任何python物件
    * `filename`：檔案名稱
* 參考文件：
    * [joblib.dump](https://joblib.readthedocs.io/en/latest/generated/joblib.dump.html)

In [9]:
# 若無法在個人電腦上以 Anaconda 開啟 Notebook，請用Google Colab開啟，並將下兩行程式的註解消除，再將 turbofan_test.joblib 儲存
# joblib.dump(df, os.path.join(os.curdir, 'turbofan_test.joblib'))
joblib.dump(df, os.path.join(os.curdir, 'data', 'turbofan_test.joblib'))

['./data/turbofan_test.joblib']

## `joblib.load`：讀取經由 `joblib.dump` 所儲存的 python物件

* 常用 Parameters：
    * `filename`：檔案名稱
* 參考文件：
    * [joblib.load](https://joblib.readthedocs.io/en/latest/generated/joblib.load.html)

In [10]:
# 若無法在個人電腦上以 Anaconda 開啟 Notebook，請用Google Colab開啟，並將下兩行程式的註解消除，再讀取 turbofan_test.joblib 
# df = joblib.load(os.path.join(os.curdir, 'turbofan_test.joblib'))
df = joblib.load(os.path.join(os.curdir, 'data', 'turbofan_test.joblib'))