In [None]:
import pandas as pd
import numpy as np
from scipy.stats import entropy
from mcp_persor import BVHparser


In [None]:
# 窓ごとの特徴量を抽出
## データの読み込み
bvhp = BVHparser('./logs/refrigerator.bvh')
df = bvhp.get_motion_df()

# 窓ごとの特徴量を抽出する関数
def calculate_features(window):
    features = []
    
    # 中央値の計算
    median_time = window['time'].mean()
    
    # 平均、分散、相関、ゼロ交差数、エネルギー、エントロピーの計算
    for joint in columns:
        X_rotate = window[joint + '_Xrotation'].values
        Y_rotate = window[joint + '_Yrotation'].values
        Z_rotate = window[joint + '_Zrotation'].values
        
        # 平均
        mean_value = np.mean([X_rotate, Y_rotate, Z_rotate])
        # 分散
        variance_value = np.var([X_rotate, Y_rotate, Z_rotate])
        # 相関
        correlation_value = np.corrcoef([X_rotate, Y_rotate, Z_rotate])[0, 1]
        # ゼロ交差数
        zero_crossings = np.sum(np.diff(np.signbit([X_rotate, Y_rotate, Z_rotate])) != 0)
        # エネルギー
        energy_value = np.sum(np.square([X_rotate, Y_rotate, Z_rotate]))
        # エントロピー
        # entropy_value = entropy([X_rotate, Y_rotate, Z_rotate])
        
        # features.extend([mean_value, variance_value, correlation_value, zero_crossings, energy_value, entropy_value])
        features.extend([mean_value, variance_value, correlation_value, zero_crossings, energy_value])
    
    return [median_time] + features

# 窓ごとの特徴量を計算し、結果をデータフレームに格納
window_size = 30
window_stride = 1

columns = [j for j in bvhp.get_joints() if not j.startswith('_')]
windows = [df.iloc[i:i + window_size] for i in range(0, len(df), window_stride) if i + window_size <= len(df)]
# result_columns = ['time'] + [f'{joint}_{metric}' for joint in columns for metric in ['mean', 'var', 'corr', 'zero_cross', 'energy', 'entropy']]
result_columns = ['time'] + [f'{joint}_{metric}' for joint in columns for metric in ['mean', 'var', 'corr', 'zero_cross', 'energy']]
result_data = [calculate_features(window) for window in windows]
result_df = pd.DataFrame(result_data, columns=result_columns)


In [None]:
# ラベル情報をもとにstateカラムを追加
labels = [
    {'num': 1, 'title': '冷蔵庫を開ける', 'times': [[11.366666666666665, 12.8], [34.26666666666666, 36.13333333333333], [40.39999999999999, 42.7], [56.433333333333344, 58.39999999999999], [78.46666666666667, 79.86666666666669], [104.89999999999999, 106.43333333333332], [134.1, 135.90000000000003]]},
    {'num': 2, 'title': '冷蔵庫を閉める', 'times': [[13.833333333333334, 15.833333333333334], [36.36666666666667, 38.73333333333333], [42.800000000000004, 44.73333333333333], [58.73333333333333, 60.39999999999999], [83.40000000000002, 84.79999999999998], [107.26666666666667, 108.83333333333333], [136.2666666666667, 138.4333333333333]]}
]

result_df['state'] = 0  # 初期値として全ての行に0を設定

for label in labels:
    for time_range in label['times']:
        start_time, end_time = time_range
        result_df.loc[(result_df['time'] >= start_time) & (result_df['time'] <= end_time), 'state'] = label['num']

# 結果をCSVファイルに書き出し
result_df.to_csv('./logs/refrigerator_with_state.csv', index=False)