## 必要なライブラリのインポート


In [2]:
import pandas as pd
import glob
import os

# フォルダ内の .csv をすべて取得
csv_paths = glob.glob("DatasetA/*.csv")

## CSV ファイルのパスを取得

In [3]:
df_dict = {}
for path in csv_paths:
    name = os.path.splitext(os.path.basename(path))[0]  # 拡張子なしファイル名をキーに
    df = pd.read_csv(path)
    df["__source__"] = name  # 後からどのファイル由来か分かるように列を追加（任意）
    df_dict[name] = df


## 各ファイルを読み込んで辞書に格納

In [4]:
# 全ファイルの合計行数
total_rows = sum(df.shape[0] for df in df_dict.values())
print(f"全ファイル合計行数：{total_rows:,}件\n")

# 各 DataFrame の件数・列数をプリント
for name, df in df_dict.items():
    print(f"―― {name} ――")
    print(f"  行数：{df.shape[0]:,}件  列数：{df.shape[1]:,}列")
print()

# またはまとめて DataFrame で確認
import pandas as pd
summary = pd.DataFrame([
    {"source": name, "rows": df.shape[0], "cols": df.shape[1]}
    for name, df in df_dict.items()
])
print(summary)


全ファイル合計行数：19,501件

―― case-accessory ――
  行数：8件  列数：5列
―― case-fan ――
  行数：2,403件  列数：9列
―― cpu-cooler ――
  行数：2,431件  列数：7列
―― cpu ――
  行数：1,373件  列数：9列
―― external-hard-drive ――
  行数：646件  列数：8列
―― fan-controller ――
  行数：43件  列数：8列
―― headphones ――
  行数：2,865件  列数：9列
―― internal-hard-drive ――
  行数：6,062件  列数：9列
―― keyboard ――
  行数：3,670件  列数：9列

                source  rows  cols
0       case-accessory     8     5
1             case-fan  2403     9
2           cpu-cooler  2431     7
3                  cpu  1373     9
4  external-hard-drive   646     8
5       fan-controller    43     8
6           headphones  2865     9
7  internal-hard-drive  6062     9
8             keyboard  3670     9
