In [2]:
# 抽象クラスを作成するために、Python標準モジュールabcからABCクラスとabstractmethodデコレータをインポート
from abc import ABC, abstractmethod
# データ整形のため、サードパーティライブラリpandasをインポート
import pandas as pd

# 共通のデータクレンジング関数
def clean_sales_data(df):
    expected_cols = ["date", "order_id", "money", "province"]
    df = df.reindex(columns=expected_cols)

    df["date"] = pd.to_datetime(df["date"], errors="coerce")
    df["money"] = pd.to_numeric(df["money"], errors="coerce")

    df = df.dropna(subset=["date", "money"])
    
    return df
    
# ABCのサブクラスを作成し、データ読み込みの抽象クラスとして定義
class FileReader(ABC):
    # abstractmethodを使って下記のメソッドを抽象メソッドとして宣言
    @abstractmethod
    # read_dataメソッドはインスタンス化できず、サブクラスでオーバーライドする必要がある
    def read_data(self):
        pass

# txtファイルを読み込むサブクラスを定義し、read_dataメソッドでtxtの読み込み機能を実装
class TxtFileReader(FileReader):
    # txtリーダーの属性を初期化、data_pathパラメータで読み込むファイルのパスを受け取る
    def __init__(self, data_path):
        self.data_path = data_path
        
    # 親クラスの抽象メソッドをオーバーライド
    def read_data(self):
        # pd.read_csvを使ってtxtファイルのデータを読み込む
        df = pd.read_csv(self.data_path, header=None, names=["date", "order_id", "money", "province"])
        return clean_sales_data(df)

# jsonファイルを読み込むサブクラスを定義し、read_dataメソッドでjsonの読み込み機能を実装
class JsonFileReader(FileReader):
    # jsonリーダーの属性を初期化、data_pathパラメータで読み込むファイルのパスを受け取る
    def __init__(self, data_path):
        self.data_path = data_path

    # 親クラスの抽象メソッドをオーバーライド
    def read_data(self):
        df = pd.read_json(self.data_path)
        return clean_sales_data(df)

if __name__ == "__main__":
    txt_file_reader = TxtFileReader("data/january_sales.txt")
    
    try:
        print(txt_file_reader.read_data())
    except Exception as e:
        print("ファイルの読み込みに失敗しました：", e)
    
    json_file_reader = JsonFileReader("data/february_sales.json")
    try:
        print(json_file_reader.read_data())
    except Exception as e:
        print("ファイルの読み込みに失敗しました：", e)

    

          date  order_id    money  province
0   2025-01-01  ORD93810   645.52   Jiangsu
1   2025-01-01  ORD46048  1299.97  Shanghai
2   2025-01-01  ORD23434  3415.83   Sichuan
3   2025-01-01  ORD21395  2993.41   Beijing
4   2025-01-01  ORD13905   559.11  Shanghai
..         ...       ...      ...       ...
305 2025-01-31  ORD21959  2403.05  Zhejiang
306 2025-01-31  ORD53687  1673.19   Beijing
307 2025-01-31  ORD31079  1716.04   Jiangsu
308 2025-01-31  ORD74942  1512.27  Zhejiang
309 2025-01-31  ORD82102   279.82   Beijing

[310 rows x 4 columns]
          date  order_id    money  province
0   2025-02-01  ORD51224  1336.75   Beijing
1   2025-02-01  ORD62976  4338.06   Beijing
2   2025-02-01  ORD96200  4359.90  Zhejiang
3   2025-02-01  ORD64165   365.60   Sichuan
4   2025-02-01  ORD57419  3150.91  Zhejiang
..         ...       ...      ...       ...
275 2025-02-28  ORD41147  1575.64   Beijing
276 2025-02-28  ORD41252  2157.15   Sichuan
277 2025-02-28  ORD69914   407.76  Zhejiang
278 2025