In [None]:

# CSVファイルからデータフレームを読み込み、特定の列に対して箱ひげ図を描画し、四分位範囲を用いて外れ値を除去した新しいデータフレームを作成してCSVファイルに保存する

import pandas as pd
import seaborn as sns
import matplotlib.pyplot as plt

# CSVファイルを読み込む
target = 'data.csv'
df = pd.read_csv(target)

# 変数の初期化
min_quartile = 0.25  # 第1四分位数
max_quartile = 0.75  # 第3四分位数
columns_for_boxplot = []  # 箱ひげ図に使用する列のリスト
filtered_data = []  # 外れ値を除去したデータを格納するリスト

# '年月日時'列以外の各列に対して処理を行う
for column in df.columns:
    if column == "年月日時":
        continue  # '年月日時'列は処理から除外

    # 箱ひげ図の描画
    sns.boxplot(data=df, x=column)
    plt.show()  # 箱ひげ図を表示

    # 四分位範囲と外れ値の計算
    Q1 = df[column].quantile(min_quartile)
    Q3 = df[column].quantile(max_quartile)
    IQR = Q3 - Q1
    LOWER_BOUND = Q1 - 3 * IQR
    UPPER_BOUND = Q3 + 3 * IQR

    # 外れ値を除去したデータの選択
    filtered_series = df[column][(LOWER_BOUND <= df[column]) & (df[column] <= UPPER_BOUND)].dropna()
    filtered_data.append(filtered_series)
    columns_for_boxplot.append(column)

# 外れ値を除去したデータで新しいデータフレームを作成
df_filtered = pd.concat(filtered_data, axis=1)
df_filtered.columns = columns_for_boxplot

# '年月日時'列を新しいデータフレームに追加
df_filtered.insert(0, '年月日時', df['年月日時'])

# 新しいデータフレームをCSVファイルに保存
df_filtered.to_csv('data_filtered.csv', index=False)
