<a href="https://colab.research.google.com/github/Yuto-Kishi/ECHONET-Lite/blob/main/Untitled35.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [3]:
import pandas as pd
from datetime import datetime, timedelta

# ==============================================================================
#  【設定エリア】 以下の変数を編集して、処理内容を決定してください
# ==============================================================================

# 1. ファイル設定
INPUT_FILE = 'smart_home_0107_processed.csv'   # 読み込むファイル
OUTPUT_FILE = 'smart_home_time_edited0106.csv'     # 保存するファイル名

# 2. 日付の変更設定
# 実験を開始したことにしたい「新しい日付」を指定 (YYYY-MM-DD)
# ※データ全体の時間は、この日付を基準に相対的にシフトします（日跨ぎも維持されます）。
# ※変更したくない場合は None にしてください。
TARGET_START_DATE = '2026-01-15'

# 3. データのカット設定 (YYYY-MM-DD HH:MM 形式)
# データを残したい開始日時と終了日時を指定します。
# ※ 上記 TARGET_START_DATE で設定した「変更後の日付」を基準に書いてください。
# ※ カットせず全て残したい場合は None にしてください。

KEEP_START_DATETIME = '2026-01-15 19:57'   # 例: '2026-01-09 21:00'
KEEP_END_DATETIME   = '2026-01-16 00:00'   # 例: '2026-01-10 02:00' (翌日)


# ==============================================================================
#  処理ロジック (ここから下は変更不要です)
# ==============================================================================

def process_time_editing():
    print(f"処理を開始します: {INPUT_FILE}")

    # 1. データの読み込み
    try:
        try:
            df = pd.read_csv(INPUT_FILE)
        except UnicodeDecodeError:
            df = pd.read_csv(INPUT_FILE, encoding='cp932')
        print(f"データを読み込みました。行数: {len(df)}")
    except FileNotFoundError:
        print(f"エラー: ファイル '{INPUT_FILE}' が見つかりません。")
        return

    # タイムスタンプ列の確認と変換
    if 'timestamp' in df.columns:
        df['timestamp'] = pd.to_datetime(df['timestamp'], errors='coerce')
        # 無効なタイムスタンプを削除してソート
        df = df.dropna(subset=['timestamp']).sort_values('timestamp').reset_index(drop=True)
    else:
        print("エラー: 'timestamp' 列が見つかりません。")
        return

    # ---------------------------------------------------------
    # 2. 日付の変更 (相対時間を維持)
    # ---------------------------------------------------------
    if TARGET_START_DATE:
        print(f"日付を変更中... (新しい開始日: {TARGET_START_DATE})")
        original_start = df['timestamp'].iloc[0]
        target_start_date = pd.to_datetime(TARGET_START_DATE)

        # 元の開始時間の「時刻」成分を取得し、ターゲットの日付と結合して新しい基準日時を作成
        target_start_full = pd.Timestamp.combine(target_start_date.date(), original_start.time())

        # 全データに対して「元の開始日時からの経過時間」を足す
        # これにより、日を跨ぐデータも相対関係を崩さずにシフトされます
        time_deltas = df['timestamp'] - original_start
        df['timestamp'] = target_start_full + time_deltas

    # ---------------------------------------------------------
    # 3. 時間のカット (日時指定でのフィルタリング)
    # ---------------------------------------------------------
    if KEEP_START_DATETIME or KEEP_END_DATETIME:
        print(f"指定日時外のデータを削除中... \n  Start: {KEEP_START_DATETIME}\n  End:   {KEEP_END_DATETIME}")
        original_len = len(df)

        if KEEP_START_DATETIME:
            dt_start = pd.to_datetime(KEEP_START_DATETIME)
            df = df[df['timestamp'] >= dt_start]

        if KEEP_END_DATETIME:
            dt_end = pd.to_datetime(KEEP_END_DATETIME)
            df = df[df['timestamp'] <= dt_end]

        deleted_rows = original_len - len(df)
        print(f"削除された行数: {deleted_rows}")

        if len(df) == 0:
            print("\n!!! 警告: データが0件になりました !!!")
            print("指定した日時範囲にデータが存在しません。")
            print("KEEP_START/END_DATETIME の日付が、TARGET_START_DATE で設定した日付と合っているか確認してください。")
            return

    # ---------------------------------------------------------
    # 4. 保存
    # ---------------------------------------------------------
    df.to_csv(OUTPUT_FILE, index=False)

    print("-" * 30)
    print(f"処理完了！")
    print(f"保存ファイル: {OUTPUT_FILE}")
    if len(df) > 0:
        print(f"データ期間:   {df['timestamp'].min()} 〜 {df['timestamp'].max()}")
        print(f"最終行数:     {len(df)}")
    print("-" * 30)

if __name__ == "__main__":
    process_time_editing()

処理を開始します: smart_home_0107_processed.csv
データを読み込みました。行数: 1763
日付を変更中... (新しい開始日: 2026-01-15)
指定日時外のデータを削除中... 
  Start: 2026-01-15 19:57
  End:   2026-01-16 00:00
削除された行数: 306
------------------------------
処理完了！
保存ファイル: smart_home_time_edited0106.csv
データ期間:   2026-01-15 19:57:07.312012 〜 2026-01-15 23:59:55.967021
最終行数:     1457
------------------------------


In [9]:
import pandas as pd
import os

def standardize_csv_columns(input_file_path, output_file_path=None):
    """
    CSVファイルを読み込み、指定されたターゲットフォーマットに合わせて
    カラムのリネーム、並べ替え、不要カラムの削除を行う関数。
    """

    # 1. 目標とするカラムリスト（smart_home_renamed_with_timestamp.csv と同じ構成）
    target_columns = [
        'timestamp',
        'Label_Total_People',
        'Label_Living_Action',
        'Label_Living_Count',
        'Label_Japanese_Count',
        'Label_Japanese_Action',
        'PIR1_motion(Living)',
        'PIR2_motion(Living)',
        'PIR3_motion(Living)',
        'PIR4_motion(Living)',
        'PIR18_motion(Living)',
        'PIR21_motion(JapaneseRoom)',
        'PIR17_motion(JapaneseRoom)',
        'M5Stack1_co2', 'M5Stack1_temp', 'M5Stack1_hum',
        'C0A80341_pm2_5', 'C0A80341_voc', # M5Stack1由来
        'M5Stack2_co2', 'M5Stack2_temp', 'M5Stack2_hum',
        'C0A8033B_pm2_5', 'C0A8033B_voc', # M5Stack2由来
        'M5Stack8_co2', 'M5Stack8_temp', 'M5Stack8_hum', 'M5Stack8_pm2_5', 'M5Stack8_voc',
        # リビング空気清浄機 (C0A8033B)
        'C0A8033B-013501_opStatus', 'C0A8033B-013501_temp', 'C0A8033B-013501_hum',
        'C0A8033B-013501_pm25', 'C0A8033B-013501_gas', 'C0A8033B-013501_illuminance',
        'C0A8033B-013501_dust', 'C0A8033B-013501_power', 'C0A8033B-013501_flow',
        'C0A8033B-013501_odor', 'C0A8033B-013501_dirt',
        # 和室空気清浄機 (C0A80341)
        'C0A80341-013501_opStatus', 'C0A80341-013501_temp', 'C0A80341-013501_hum',
        'C0A80341-013501_pm25', 'C0A80341-013501_gas', 'C0A80341-013501_illuminance',
        'C0A80341-013501_dust', 'C0A80341-013501_power', 'C0A80341-013501_flow',
        'C0A80341-013501_odor', 'C0A80341-013501_dirt',
        # リビングエアコン (C0A80367)
        'C0A80367-013001_opStatus', 'C0A80367-013001_mode', 'C0A80367-013001_setTemp',
        'C0A80367-013001_roomTemp', 'C0A80367-013001_hum', 'C0A80367-013001_outsideTemp',
        'C0A80367-013001_blowTemp', 'C0A80367-013001_power', 'C0A80367-013001_totalPower',
        'C0A80367-013001_flow', 'C0A80367-013001_human', 'C0A80367-013001_sunshine',
        'C0A80367-013001_co2',
        # 和室エアコン (C0A80368)
        'C0A80368-013001_opStatus', 'C0A80368-013001_mode', 'C0A80368-013001_setTemp',
        'C0A80368-013001_roomTemp', 'C0A80368-013001_hum', 'C0A80368-013001_outsideTemp',
        'C0A80368-013001_blowTemp', 'C0A80368-013001_power', 'C0A80368-013001_totalPower',
        'C0A80368-013001_flow', 'C0A80368-013001_human', 'C0A80368-013001_sunshine',
        'C0A80368-013001_co2'
    ]

    # 2. リネームのルール定義（古い名前 -> 新しい名前）
    rename_mapping = {
        # M5Stack関連の変更
        'M5Stack1_pm2_5': 'C0A80341_pm2_5',
        'M5Stack1_voc': 'C0A80341_voc',
        'M5Stack2_pm2_5': 'C0A8033B_pm2_5',
        'M5Stack2_voc': 'C0A8033B_voc',

        # PIRセンサー（suffixの追加）
        'PIR1_motion': 'PIR1_motion(Living)',
        'PIR2_motion': 'PIR2_motion(Living)',
        'PIR3_motion': 'PIR3_motion(Living)',
        'PIR4_motion': 'PIR4_motion(Living)',
        'PIR18_motion': 'PIR18_motion(Living)', # 台所だがLivingとして扱うターゲットに合わせて変更
        'PIR21_motion': 'PIR21_motion(JapaneseRoom)',
        'PIR17_motion': 'PIR17_motion(JapaneseRoom)',
    }

    # 3. ファイルの読み込み
    print(f"Reading file: {input_file_path}")
    try:
        df = pd.read_csv(input_file_path)
    except Exception as e:
        print(f"Error reading file: {e}")
        return

    # 4. カラムのリネーム実行
    df.rename(columns=rename_mapping, inplace=True)

    # 5. 必要なカラムのみ抽出して並べ替え
    # 存在しないカラムがある場合は、NaN（欠損値）として追加し、警告を出す
    missing_cols = [col for col in target_columns if col not in df.columns]
    if missing_cols:
        print("Warning: The following columns were missing and filled with NaN:")
        print(missing_cols)
        for col in missing_cols:
            df[col] = pd.NA

    # ターゲットカラムの順番通りに再構築（余分なカラムはここで捨てられる）
    df_processed = df[target_columns]

    # 6. 保存
    if output_file_path is None:
        base, ext = os.path.splitext(input_file_path)
        output_file_path = f"{base}_processed{ext}"

    df_processed.to_csv(output_file_path, index=False)
    print(f"Successfully saved processed file to: {output_file_path}")

# --- 使い方 ---
# 変換したいファイル名をリストに入れて実行してください
input_files = [
    "smart_home_1215 (4).csv",
    # "smart_home_XXXX.csv",  <-- 他のファイルがあればここに追加
]

for file in input_files:
    if os.path.exists(file):
        standardize_csv_columns(file)
    else:
        print(f"File not found: {file}")

Reading file: smart_home_1215 (4).csv


  df = pd.read_csv(input_file_path)


Successfully saved processed file to: smart_home_1215 (4)_processed.csv
