In [None]:
pip install japanize_matplotlib

In [None]:
pip install bottleneck

In [None]:
#ライブラリをインポート
import os #OSに依存する様々な機能を利用するためのモジュール(ファイルやディレクトリ操作など)
import re #正規表現を利用するためのモジュール
import csv  #csvファイルを扱うためのモジュール
import statistics #数学的計算のためのモジュール
import math #数学的計算のためのモジュール
from decimal import Decimal #小数点桁落ちをなくすためのモジュール
import matplotlib.pyplot as plt #グラフ描画のためのモジュール
import japanize_matplotlib #グラフ描画に日本語を用いるためのモジュール
import numpy as np  #多次元配列計算のためのモジュール
import bottleneck as bn #移動平均計算のためのモジュール
import pandas as pd #データフレームを扱うためのモジュール
from scipy import signal  #信号処理のためのモジュール
from scipy.stats import skew, kurtosis  #歪度と尖度を調べるためのモジュール
from sklearn.model_selection import train_test_split  #データをトレーニング用とテスト用に分けるためのモジュール
from sklearn import preprocessing #データを正規化するためのモジュール
from sklearn.preprocessing import StandardScaler  #データを標準化するためのモジュール
from sklearn.preprocessing import LabelEncoder  #カテゴリ変数を数値化するためのモジュール
from sklearn.preprocessing import PolynomialFeatures  #多項式回帰のためのモジュール
from sklearn.metrics import accuracy_score, mean_squared_error, mean_absolute_error, r2_score #機械学習モデルの性能評価のためのモジュール
import tensorflow as tf #TensorFlow(Googleが開発したオープンソースの機械学習フレームワーク)
from tensorflow import keras  #TensorFlow用のニューラルネットワークライブラリAPI
from tensorflow.keras import layers #ニューラルネットワークのレイヤーを定義するためのモジュール

In [None]:
#Google colab用
from google.colab import drive
drive.mount('/content/drive')

In [None]:
#GPUを使うためのコマンド
import tensorflow as tf
device_name = tf.test.gpu_device_name()
if device_name != '/device:GPU:0':
  raise SystemError('GPU device not found')
print('Found GPU at: {}'.format(device_name))

In [None]:
#よく使うgit command

#google colabと揃える
#git fetch origin main
#git reset --hard origin/main

In [None]:
#定数を定義
BINS = 4000  #ヒストグラムのビンの数
EPSILON = .00001  #スムージングパラメータ
UPPER_LIMIT = 1.1 #静止区間の上限
LOWER_LIMIT = 0.9 #静止区間の加減
STATIONARY_INTERVALS = 5  #静止区間除去のサンプルの間隔(静止区間が何サンプル連続したら除去するか)
TRAIN_SIZE = 0.8  #機械学習のトレーニングデータの割合

#transformer regression
#各種パラメータ
NUM_HEADS = 8
KEY_DIM = 500
DROPOUT = 0.1
N = 1 #Encoderのレイヤー

In [None]:
#AMSW020の加速度データのCSVファイルから3軸加速度を取得する関数
def get_acceleration(filename: str) -> tuple[list[float], list[float], list[float]]:
    AccX, AccY, AccZ = [], [], []
    with open(filename) as f:
        reader = csv.reader(f)
        for row in reader:
            AccX.append(float(row[2]))
            AccY.append(float(row[3]))
            AccZ.append(float(row[4]))

    return AccX, AccY, AccZ

In [None]:
#selfBACKとKU_HARの加速度データのCSVファイルから3軸加速度を取得する関数
def get_acceleration_self_KUHAR(filename: str) -> tuple[list[float], list[float], list[float]]:
    AccX, AccY, AccZ = [], [], []
    with open(filename) as f:
        reader = csv.reader(f)
        for row in reader:
            AccX.append(float(row[1]))
            AccY.append(float(row[2]))
            AccZ.append(float(row[3]))

    return AccX, AccY, AccZ

In [None]:
#PAMAP2の加速度データのCSVファイルから3軸加速度を取得する関数
def get_acceleration_pamap2(filename: str) -> tuple[list[float], list[float], list[float]]:
    AccX, AccY, AccZ = [], [], []
    with open(filename) as f:
        reader = csv.reader(f)
        for row in reader:
            AccX.append(float(row[4]))
            AccY.append(float(row[5]))
            AccZ.append(float(row[6]))

    return AccX, AccY, AccZ

In [None]:
#3軸合成加速度を計算する関数
def acc_to_resultant(AccX: list[float], AccY: list[float], AccZ: list[float]) -> list[float]:
    ResultantAcc = [math.sqrt(x ** 2 + y ** 2 + z ** 2) for x, y, z in zip(AccX, AccY, AccZ)]   #各時刻の合成加速度を求める
    return ResultantAcc

In [None]:
#静止区間を除去する関数(STATIONARY_INTERVALS分のみ)
def acc_to_remove_stationary_intervals(AccX: list[float], AccY: list[float], AccZ: list[float]) -> list[float]:
    #各軸の加速度の平均を求める
    AvgAccX = sum(AccX) / len(AccX)
    AvgAccY = sum(AccY) / len(AccY)
    AvgAccZ = sum(AccZ) / len(AccZ)

    AvgResultantAcc = math.sqrt(AvgAccX ** 2 + AvgAccY ** 2 + AvgAccZ ** 2) #重力加速度の推定値=合成加速度の平均を求める

    ResultantAcc = [math.sqrt(x ** 2 + y ** 2 + z ** 2) for x, y, z in zip(AccX, AccY, AccZ)]   #各時刻の合成加速度を求める

    #各時刻の合成加速度から静止区間(重力加速度の推定値に近い値が一定以上以上連続している区間)を除去する
    i = 0 #ループ変数
    counter = 0 #静止区間がSTATIONARY_INTERVALS分続いているかをカウントする変数
    while i < len(ResultantAcc):
        if AvgResultantAcc * LOWER_LIMIT < ResultantAcc[i] < AvgResultantAcc * UPPER_LIMIT:   #平均のLOWER_LIMIT倍~UPPER_LIMIT倍の範囲を調べる
            counter += 1    #範囲内ならカウントを増やす
            if counter == STATIONARY_INTERVALS: #カウントがSTATIONARY_INTERVALSに達したらその区間を削除
                del ResultantAcc[i+1-STATIONARY_INTERVALS:i+1]    #スライスでは選択範囲の開始位置startと終了位置stopを[start:stop]のように書くとstart <= x < stopの範囲が選択される #start番目の値は含まれるがstop番目の値は含まれない
                counter = 0 #カウンターをリセット
                i -= STATIONARY_INTERVALS   #削除した分インデックスがズレるので補正する
        else:
            counter = 0 #カウンターをリセット
        i += 1

    return ResultantAcc  #静止区間を除去した後のリストを返す

In [None]:
#静止区間を除去する関数(STATIONARY_INTERVALS以上続いた静止区間全て)
def acc_to_remove_all_stationary_intervals(AccX: list[float], AccY: list[float], AccZ: list[float]) -> list[float]:
    #各軸の加速度の平均を求める
    AvgAccX = sum(AccX) / len(AccX)
    AvgAccY = sum(AccY) / len(AccY)
    AvgAccZ = sum(AccZ) / len(AccZ)

    AvgResultantAcc = math.sqrt(AvgAccX ** 2 + AvgAccY ** 2 + AvgAccZ ** 2) #重力加速度の推定値=合成加速度の平均を求める

    ResultantAcc = [math.sqrt(x ** 2 + y ** 2 + z ** 2) for x, y, z in zip(AccX, AccY, AccZ)]   #各時刻の合成加速度を求める

    #各時刻の合成加速度から静止区間(重力加速度の推定値に近い値が一定以上以上連続している区間)を除去する
    i = 0 #ループ変数
    counter = 0 #静止区間がSTATIONARY_INTERVALS分続いているかをカウントする変数
    while i < len(ResultantAcc):
        if AvgResultantAcc * LOWER_LIMIT < ResultantAcc[i] < AvgResultantAcc * UPPER_LIMIT:   #平均のLOWER_LIMIT倍~UPPER_LIMIT倍の範囲を調べる
            counter += 1    #範囲内ならカウントを増やす
        else:
            if counter >= STATIONARY_INTERVALS:
                del ResultantAcc[i+1-counter:i+1]   #スライスでは選択範囲の開始位置startと終了位置stopを[start:stop]のように書くとstart <= x < stopの範囲が選択される #start番目の値は含まれるがstop番目の値は含まれない
                counter = 0 #カウンターをリセット
                i -= STATIONARY_INTERVALS   #削除した分インデックスがズレるので補正する
            else :
                counter = 0 #カウンターをリセット
        i += 1

    return ResultantAcc  #静止区間を除去した後のリストを返す

In [None]:
#連続する2サンプルの差分を取る関数
def calculate_differences_of_acceleration(ResultantAcc: list[float]) -> list[float]:
    DifferenceAcc = [math.fabs(Decimal(ResultantAcc[i + 1]) - Decimal(ResultantAcc[i])) for i in range(len(ResultantAcc) - 1)]  #連続する2サンプルの誤差を取る
    return DifferenceAcc

In [None]:
#入力された加速度の差分のリストからヒストグラムを作る関数（ビンの範囲が各加速度の差分データの最小値〜最大値）
def create_histogram(DifferenceAcc_list: list[float]) -> np.histogram:
    DifferenceAcc_hist = np.zeros((len(DifferenceAcc_list), BINS), dtype=float)
    for i in range(len(DifferenceAcc_list)):
        DifferenceAcc_hist[i], _ = np.histogram(DifferenceAcc_list[i], bins=BINS, density=True) #ヒストグラムを作成し、同じ数のビンで区切る
    return DifferenceAcc_hist

In [None]:
#入力された加速度の差分のリストからヒストグラムを作る関数（ビンの範囲が全加速度の差分データの中の最小値〜最大値）
def create_histogram2(DifferenceAcc_list: list[float]) -> np.histogram:
    DifferenceAcc_hist = np.zeros((len(DifferenceAcc_list), BINS), dtype=float)
    min_value = min(min(row) for row in DifferenceAcc_list)
    max_value = max(max(row) for row in DifferenceAcc_list)
    for i in range(len(DifferenceAcc_list)):
        DifferenceAcc_hist[i], _ = np.histogram(DifferenceAcc_list[i], bins=BINS, range=(min_value, max_value), density=True) #ヒストグラムを作成し、同じ数のビンで区切る
    return DifferenceAcc_hist

In [None]:
#入力された加速度の差分のリストからヒストグラムを作る関数（ビンの範囲が0~固定値)
def create_histogram3(DifferenceAcc_list: list[float]) -> np.histogram:
    DifferenceAcc_hist = np.zeros((len(DifferenceAcc_list), BINS), dtype=float)
    for i in range(len(DifferenceAcc_list)):
        DifferenceAcc_hist[i], _ = np.histogram(DifferenceAcc_list[i], bins=BINS, range=(0, MAX_VALUE), density=True) #ヒストグラムを作成し、同じ数のビンで区切る
    return DifferenceAcc_hist

In [None]:
#各加速度データをダウンサンプリングする関数
def resampling_Acc(originHz: int, newHz: int, AccX: list[float], AccY: list[float], AccZ: list[float], Hz: np.array) -> tuple[list[float], list[float], list[float], np.array]:
    i = 0   #カウンター変数

    while (Hz[i] == originHz):
        originlen = len(AccX[i])    #元々のデータの長さ
        sampling_factor = int(originlen * (newHz/originHz)) #ダウンサンプリングした後のデータの長さ
        newAccX = signal.resample(AccX[i], sampling_factor)    #データをダウンサンプリング
        newAccY = signal.resample(AccY[i], sampling_factor)    #データをダウンサンプリング
        newAccZ = signal.resample(AccZ[i], sampling_factor)    #データをダウンサンプリング
        AccX.append(newAccX)   #ダウンサンプリングデータを加速度データに追加
        AccY.append(newAccY)   #ダウンサンプリングデータを加速度データに追加
        AccZ.append(newAccZ)   #ダウンサンプリングデータを加速度データに追加
        Hz = np.append(Hz, newHz)   #ダウンサンプリングレートを追加
        i += 1

    return AccX, AccY, AccZ, Hz

In [None]:
#My Transformer Model
def Transformer_Encoder_B():
      # Define the input shape
      input_shape = (BINS,)
      output_shape = (1,)

      #形を定義(このモジュールは行列でないとダメっぽい)
      inputs_encoder = layers.Input(shape=input_shape)
      #inputs_decoder = layers.Input(shape=output_shape)

      #Encoderに対する入力の形状
      x_encoder = layers.Reshape((10, 400))(inputs_encoder)

      #Transformer Encoder Layer(BERT)
      for i in range(N):
            #Multi-Head-Attention Layer
            attention_encoder = layers.MultiHeadAttention(num_heads=NUM_HEADS, key_dim=KEY_DIM, use_bias=True)(x_encoder, x_encoder, x_encoder)

            #Dropout Layer
            attention_encoder = layers.Dropout(rate=DROPOUT)(attention_encoder)
            #Add & Norm Layer
            attention_encoder = layers.LayerNormalization()(x_encoder + attention_encoder)

            #Feed-Forward-Network
            ffn_encoder = layers.Dense(400 * 4, use_bias=True, activation="relu")(attention_encoder)
            ffn_encoder = layers.Dense(400, use_bias=True)(ffn_encoder)

            #Dropout Layer
            ffn_encoder = layers.Dropout(rate=DROPOUT)(ffn_encoder)
            #Add & Norm Layer
            x_encoder = layers.LayerNormalization()(attention_encoder + ffn_encoder)

      x = layers.Flatten()(x_encoder)
      x = layers.Dense(128, activation="relu")(x)
      x = layers.Dropout(0.1)(x)
      x = layers.Dense(64, activation="relu")(x)
      x = layers.Dropout(0.1)(x)
      outputs = layers.Dense(1, activation="relu")(x)

      model = keras.Model(inputs=inputs_encoder, outputs=outputs)

      # Compile the model
      model.compile(
            optimizer=keras.optimizers.Adam(),
            loss=keras.losses.mean_squared_error,
            metrics=[keras.metrics.mean_squared_error],
      )

      return model

In [None]:
#My Transformer Model
def Transformer_Encoder_S():
      # Define the input shape
      input_shape = (BINS,)
      output_shape = (1,)

      #形を定義(このモジュールは行列でないとダメっぽい)
      inputs_encoder = layers.Input(shape=input_shape)
      #inputs_decoder = layers.Input(shape=output_shape)

      #Encoderに対する入力の形状
      x_encoder = layers.Reshape((1, 100))(inputs_encoder)

      #Transformer Encoder Layer(BERT)
      for i in range(N):
            #Multi-Head-Attention Layer
            attention_encoder = layers.MultiHeadAttention(num_heads=NUM_HEADS, key_dim=KEY_DIM, use_bias=True)(x_encoder, x_encoder, x_encoder)

            #Dropout Layer
            attention_encoder = layers.Dropout(rate=DROPOUT)(attention_encoder)
            #Add & Norm Layer
            attention_encoder = layers.LayerNormalization()(x_encoder + attention_encoder)

            #Feed-Forward-Network
            ffn_encoder = layers.Dense(BINS * 4, use_bias=True, activation="relu")(attention_encoder)
            ffn_encoder = layers.Dense(BINS, use_bias=True)(ffn_encoder)

            #Dropout Layer
            ffn_encoder = layers.Dropout(rate=DROPOUT)(ffn_encoder)
            #Add & Norm Layer
            x_encoder = layers.LayerNormalization()(attention_encoder + ffn_encoder)

      x = layers.Flatten()(x_encoder)
      x = layers.Dense(32, activation="relu")(x)
      x = layers.Dropout(0.1)(x)
      x = layers.Dense(16, activation="relu")(x)
      x = layers.Dropout(0.1)(x)
      outputs = layers.Dense(1, activation="relu")(x)

      model = keras.Model(inputs=inputs_encoder, outputs=outputs)

      # Compile the model
      model.compile(
            optimizer=keras.optimizers.Adam(),
            loss=keras.losses.mean_squared_error,
            metrics=[keras.metrics.mean_squared_error],
      )

      return model

In [None]:
#path(サンプリング周波数100Hzのデータ)から加速度の差分値, ヒストグラム, 正解ラベルを返す関数
def path_to_histogram(path: str) -> tuple[list[float], np.array, np.array]:
    filename = os.listdir(path) #引数のパスのディレクトリの中のファイル名一覧を取得
    #使う変数を宣言
    readAccX, readAccY, readAccZ = [], [], []   #データ読み込む用
    AccX, AccY, AccZ = [], [], []
    ResultantAcc = []
    DifferenceAcc_list = []

    #各データセットからデータを読み込み二次元配列に格納
    for i in filename:
        readAccX, readAccY, readAccZ = get_acceleration(path+i)
        AccX.append(readAccX), AccY.append(readAccY), AccZ.append(readAccZ)

    Hz = np.ones(len(filename)) * 100

    #各加速度データをダウンサンプリング
    for i in range(9, 1, -1):
        AccX, AccY, AccZ, Hz = resampling_Acc(100, i * 10, AccX, AccY, AccZ, Hz)

    #静止区間を除去
    for i in range(len(Hz)):
        ResultantAcc.append(acc_to_remove_all_stationary_intervals(AccX[i], AccY[i], AccZ[i]))

    #ヒストグラム作成
    for i in range(len(ResultantAcc)):
        DifferenceAcc_list.append(calculate_differences_of_acceleration(ResultantAcc[i]))
    DifferenceAcc_hist = create_histogram3(DifferenceAcc_list)

    return DifferenceAcc_list, DifferenceAcc_hist, Hz

In [None]:
#path(サンプリング周波数100Hzのデータ)から様々な特徴量と正解ラベルを返す関数
def path_to_features(path: str) -> tuple[np.array, np.array]:
    filename = os.listdir(path) #引数のパスのディレクトリの中のファイル名一覧を取得
    #使う変数を宣言
    readAccX, readAccY, readAccZ = [], [], []   #データ読み込む用
    AccX, AccY, AccZ = [], [], []
    ResultantAcc = []
    DifferenceAcc_list = []

    #各データセットからデータを読み込み二次元配列に格納
    for i in filename:
        readAccX, readAccY, readAccZ = get_acceleration_self_KUHAR(path+i)
        AccX.append(readAccX), AccY.append(readAccY), AccZ.append(readAccZ)

    Hz = np.ones(len(filename)) * 100

    #各加速度データをダウンサンプリング
    for i in range(9, 1, -1):
        AccX, AccY, AccZ, Hz = resampling_Acc(100, i * 10, AccX, AccY, AccZ, Hz)

    features = np.ones((len(Hz), 8))    #各特徴量を入れる変数でこの関数の返り値

    for i in range(len(Hz)):
        ResultantAcc.append(acc_to_resultant(AccX[i], AccY[i], AccZ[i]))
        features[i][0] = np.var(ResultantAcc[i])   #静止区間を除去する前の合成加速度の分散値を0列目に格納
        features[i][1] = len(ResultantAcc[i])   #静止区間を除去する前のデータの長さを1列目に格納

    #静止区間を除去
    ResultantAcc = []
    for i in range(len(Hz)):
        ResultantAcc.append(acc_to_remove_all_stationary_intervals(AccX[i], AccY[i], AccZ[i]))

    for i in range(len(Hz)):
      features[i][2] = np.var(ResultantAcc[i])   #静止区間を除去した後の合成加速度の分散値を2列目に格納
      features[i][3] = len(ResultantAcc[i])   #静止区間を除去した後のデータの長さを3列目に格納

    #ヒストグラム作成
    for i in range(len(ResultantAcc)):
        DifferenceAcc_list.append(calculate_differences_of_acceleration(ResultantAcc[i]))
    DifferenceAcc_hist = create_histogram3(DifferenceAcc_list)

    for i in range(len(Hz)):
      features[i][4] = kurtosis(DifferenceAcc_hist[i])  #標準化前のヒストグラムの尖度を4列目に格納
      features[i][5] = skew(DifferenceAcc_hist[i])  #標準化前のヒストグラムの歪度を5列目に格納

    #標準化
    scaler = StandardScaler()
    # Fit the scaler to x_train
    scaler.fit(DifferenceAcc_hist)
    # Use the scaler to transform x_train and x_test
    DifferenceAcc_hist = scaler.transform(DifferenceAcc_hist)

    for i in range(len(Hz)):
      features[i][6] = kurtosis(DifferenceAcc_hist[i])  #標準化後のヒストグラムの尖度を6列目に格納
      features[i][7] = skew(DifferenceAcc_hist[i])  #標準化後のヒストグラムの歪度を7列目に格納

    return features, Hz

In [None]:
BINS = 50
MAX_VALUE = 4

In [None]:
#my data +-8G 100Hz masx40000
#selfBACK +-8G 100Hz max4
#KU-HAR max40
#pamap2 +-16G 100Hz

In [None]:
DifferenceAcc_listSBF, DifferenceAcc_SBF, Hz = path_to_histogram("/content/drive/MyDrive/PAMAP2/")

In [None]:
DifferenceAcc_list, DifferenceAcc_hist, Hz = path_to_histogram("/content/drive/MyDrive/my_walk_data(100Hz15minutes)/")

In [None]:
#2, 4, 6km/hで5分厳密に取った時
Features2, Hz2 = path_to_features("/content/drive/MyDrive/walk2km_per_hour/")
Features4, Hz4 = path_to_features("/content/drive/MyDrive/walk4km_per_hour/")
Features6, Hz6 = path_to_features("/content/drive/MyDrive/jog6km_per_hour/")
two_per_hour = np.column_stack((Features2[:, 4], Features2[:, 5], np.sqrt(Features2[:, 2])))
four_per_hour = np.column_stack((Features4[:, 4], Features4[:, 5], np.sqrt(Features4[:, 2])))
six_per_hour = np.column_stack((Features6[:, 4], Features6[:, 5], np.sqrt(Features6[:, 2])))

In [None]:
#2, 4km/hで10分厳密に取った時
Features2_10, Hz2_10 = path_to_features("/content/drive/MyDrive/walk2km_per_hour_10minutes/")
Features4_10, Hz4_10 = path_to_features("/content/drive/MyDrive/walk4km_per_hour_10minutes/")
two_per_hour_10 = np.column_stack((Features2_10[:, 4], Features2_10[:, 5], np.sqrt(Features2_10[:, 2])))
four_per_hour_10 = np.column_stack((Features4_10[:, 4], Features4_10[:, 5], np.sqrt(Features4_10[:, 2])))

In [None]:
#selfBACK
FeaturesSBF, HzSBF = path_to_features("/content/drive/MyDrive/selfBACK/walk_fast/")
FeaturesSBM, HzSBM = path_to_features("/content/drive/MyDrive/selfBACK/walk_mod/")
FeaturesSBS, HzSBS = path_to_features("/content/drive/MyDrive/selfBACK/walk_slow/")
SBF = np.column_stack((FeaturesSBF[:, 4], FeaturesSBF[:, 5], np.sqrt(FeaturesSBF[:, 2])))
SBM = np.column_stack((FeaturesSBM[:, 4], FeaturesSBM[:, 5], np.sqrt(FeaturesSBM[:, 2])))
SBS = np.column_stack((FeaturesSBS[:, 4], FeaturesSBS[:, 5], np.sqrt(FeaturesSBS[:, 2])))

In [None]:
#kuhar
FeaturesKHW, HzKHW = path_to_features("/content/drive/MyDrive/kuhar(walk)/")
FeaturesKHJ, HzKHJ = path_to_features("/content/drive/MyDrive/kuhar(jump)/")
FeaturesKHR, HzKHR = path_to_features("/content/drive/MyDrive/kuhar(run)/")
KHW = np.column_stack((FeaturesKHW[:, 4], FeaturesKHW[:, 5], np.sqrt(FeaturesKHW[:, 2])))
KHJ = np.column_stack((FeaturesKHJ[:, 4], FeaturesKHJ[:, 5], np.sqrt(FeaturesKHJ[:, 2])))
KHR = np.column_stack((FeaturesKHR[:, 4], FeaturesKHR[:, 5], np.sqrt(FeaturesKHR[:, 2])))

In [None]:
#pamap2
FeaturesPMP, HzPMP = path_to_features("/content/drive/MyDrive/PAMAP2/")
PMP = np.column_stack((FeaturesPMP[:, 4], FeaturesPMP[:, 5], np.sqrt(FeaturesPMP[:, 2])))

In [None]:
#5分のをまとめるやつ
#two_per_hour, four_per_hour, six_per_hour, two_per_hour_10, four_per_hour_10, Hz2, Hz4, Hz6, Hz2_10, Hz4_10,
#all = np.concatenate([SBF, SBM, SBS, KHW, KHJ, KHR])
#allHz = np.concatenate([HzSBF, HzSBM, HzSBS, HzKHW, HzKHJ, HzKHR])

all = np.concatenate([SBM, KHW])
allHz = np.concatenate([HzSBM, HzKHW])

In [None]:
X_train = SBM
y_train = HzSBM
X_test = KHW
y_test = HzKHW

In [None]:
#5分のをまとめるやつ
all = np.concatenate([two_per_hour, four_per_hour])
allHz = np.concatenate([Hz2, Hz4])

In [None]:
#10分のをまとめるやつ
all10 = np.concatenate([two_per_hour_10, four_per_hour_10])
allHz10 = np.concatenate([Hz2_10, Hz4_10])

In [None]:
#全部まとめるやつ
all = np.concatenate([two_per_hour, four_per_hour, six_per_hour, two_per_hour_10, four_per_hour_10])
allHz = np.concatenate([Hz2, Hz4, Hz6, Hz2_10, Hz4_10])

In [None]:
#2, 6km/hのをまとめるやつ
all = np.concatenate([two_per_hour, six_per_hour, two_per_hour_10])
allHz = np.concatenate([Hz2, Hz6, Hz2_10])

In [None]:
#4km/hのをまとめるやつ
all10 = np.concatenate([four_per_hour, four_per_hour_10])
allHz10 = np.concatenate([Hz4, Hz4_10])

In [None]:
len(allHz)

In [None]:
polynomial_features= PolynomialFeatures(degree=3)
X_train = polynomial_features.fit_transform(all)
X_test = polynomial_features.fit_transform(all10)
y_train = allHz
y_test = allHz10

In [None]:
stdsc = StandardScaler()
# 注意
# 訓練用のデータを標準化
X_train = stdsc.fit_transform(X_train)
# 訓練用データを基準にテストデータも標準化
X_test = stdsc.transform(X_test)

In [None]:
from sklearn.linear_model import LinearRegression
model = LinearRegression()
model.fit(X_train, y_train)
y_pred = tf.cast(tf.clip_by_value(model.predict(X_test), 20, 100), tf.int32)

In [None]:
mean_absolute_error(y_pred, y_test)

In [None]:
X_train, X_test, y_train, y_test = train_test_split(all, allHz, test_size = 0.2)

In [None]:
mae = []

In [None]:
 #線形回帰
 for i in range(1000):
    X_train, X_test, y_train, y_test = train_test_split(all, allHz, test_size = 0.2)
    stdsc = StandardScaler()
    # 注意
    # 訓練用のデータを標準化
    X_train = stdsc.fit_transform(X_train)
    # 訓練用データを基準にテストデータも標準化
    X_test = stdsc.transform(X_test)
    from sklearn.linear_model import LinearRegression
    model = LinearRegression()
    model.fit(X_train, y_train)
    y_pred = tf.cast(tf.clip_by_value(model.predict(X_test), 20, 100), tf.int32)
    mae.append(mean_absolute_error(y_pred, y_test))
min(mae)

In [None]:
#多項式回帰
for i in range(1000):
    polynomial_features= PolynomialFeatures(degree=3)
    x_poly = polynomial_features.fit_transform(all)
    X_train, X_test, y_train, y_test = train_test_split(x_poly, allHz, test_size = 0.2)
    stdsc = StandardScaler()
    # 注意
    # 訓練用のデータを標準化
    X_train = stdsc.fit_transform(X_train)
    # 訓練用データを基準にテストデータも標準化
    X_test = stdsc.transform(X_test)
    from sklearn.linear_model import LinearRegression
    model = LinearRegression()
    model.fit(X_train, y_train)
    y_pred = tf.cast(tf.clip_by_value(model.predict(X_test), 20, 100), tf.int32)
    mae.append(mean_absolute_error(y_pred, y_test))
min(mae)

In [None]:
mae

In [None]:
model.coef_

In [None]:
# クラスごとに色分けされたプロットを作成
plt.figure(figsize=(10, 10))
#plt.scatter(HzN, FeaturesN[:, 4], alpha=0.3, c="b", label="普通に歩いた時の尖度")
#plt.scatter(HzS, FeaturesS[:, 4], alpha=0.3, c="r", label="遅めに歩いた時の尖度")
#plt.scatter(HzN, FeaturesN[:, 5], alpha=0.3, c="b", label="普通に歩いた時の歪度")
#plt.scatter(HzS, FeaturesS[:, 5], alpha=0.3, c="r", label="遅めに歩いた時の歪度")
#plt.scatter(HzN, np.sqrt(FeaturesN[:, 2]), alpha=0.3, c="b", label="普通に歩いた時の標準偏差")
#plt.scatter(HzS, np.sqrt(FeaturesS[:, 2]), alpha=0.3, c="r", label="遅めに歩いた時の標準偏差")
#plt.scatter(HzN, sinN, alpha=0.3, c="b", label="普通に歩いた時の標準偏差*尖度")
#plt.scatter(HzS, sinS, alpha=0.3, c="r", label="遅めに歩いた時の標準偏差*尖度")

#plt.scatter(Hz2, Features2[:, 4], alpha=0.3, c="r", label="2km/hで歩いた時の尖度")
#plt.scatter(Hz4, Features4[:, 4], alpha=0.3, c="b", label="4km/hで歩いた時の尖度")
#plt.scatter(Hz6, Features6[:, 4], alpha=0.3, c="y", label="6km/hで走った時の尖度")

#plt.scatter(Hz2_10, Features2_10[:, 4], alpha=0.3, c="y", label="2km/hで10分歩いた時の尖度")
#plt.scatter(Hz4_10, Features4_10[:, 4], alpha=0.3, c="g", label="4km/hで10分歩いた時の尖度")

#plt.scatter(Hz2, Features2[:, 5], alpha=0.3, c="r", label="2km/hで歩いた時の歪度")
#plt.scatter(Hz4, Features4[:, 5], alpha=0.3, c="b", label="4km/hで歩いた時の歪度")
#plt.scatter(Hz6, Features6[:, 5], alpha=0.3, c="y", label="6km/hで走った時の歪度")

#plt.scatter(Hz2_10, Features2_10[:, 5], alpha=0.3, c="y", label="2km/hで10分歩いた時の歪度")
#plt.scatter(Hz4_10, Features4_10[:, 5], alpha=0.3, c="g", label="4km/hで10分歩いた時の歪度")

#plt.scatter(Hz2, np.sqrt(Features2[:, 2]), alpha=0.3, c="r", label="2km/hで歩いた時の標準偏差")
#plt.scatter(Hz4, np.sqrt(Features4[:, 2]), alpha=0.3, c="b", label="4km/hで歩いた時の標準偏差")
#plt.scatter(Hz6, np.sqrt(Features6[:, 2]), alpha=0.3, c="y", label="6km/hで走った時の標準偏差")

#plt.scatter(Hz2_10, np.sqrt(Features2_10[:, 2]), alpha=0.3, c="y", label="2km/hで10分歩いた時の標準偏差")
#plt.scatter(Hz4_10, np.sqrt(Features4_10[:, 2]), alpha=0.3, c="g", label="4km/hで10分歩いた時の標準偏差")

plt.xlabel('Frequency (Hz)')
plt.ylabel('root_var')
#plt.ylim(-0.5, 4.5)
plt.legend()
plt.grid(True)
plt.show()

In [None]:
pathHascJog = "/content/drive/MyDrive/hasc(jog)/"
filename = os.listdir(pathHascJog) #引数のパスのディレクトリの中のファイル名一覧を取得
#filename.remove(".DS_Store")

In [None]:
#使う変数を宣言
readAccX, readAccY, readAccZ = [], [], []   #データ読み込む用
AccX, AccY, AccZ = [], [], []
ResultantAcc = []
DifferenceAcc_list = []

#各データセットからデータを読み込み二次元配列に格納
for i in filename:
    readAccX, readAccY, readAccZ = get_acceleration(pathHascJog+i)
    AccX.append(readAccX), AccY.append(readAccY), AccZ.append(readAccZ)

HzHascJog = np.ones(len(filename)) * 100

#各加速度データをダウンサンプリング
for i in range(9, 1, -1):
    AccX, AccY, AccZ, HzHascJog = resampling_Acc(100, i * 10, AccX, AccY, AccZ, HzHascJog)

#静止区間を除去
for i in range(len(HzHascJog)):
    ResultantAcc.append(acc_to_remove_all_stationary_intervals(AccX[i], AccY[i], AccZ[i]))

#ヒストグラム作成
for i in range(len(ResultantAcc)):
    DifferenceAcc_list.append(calculate_differences_of_acceleration(ResultantAcc[i]))
DifferenceAcc_histHascJog = create_histogram(DifferenceAcc_list)

In [None]:
#グラフを表示する領域を，figオブジェクトとして作成。
fig = plt.figure(figsize = (9,6))
xl1 = "acceleration (0.1mG)"
yl1 = "frequency"

#グラフを描画するsubplot領域を作成。
ax1 = fig.add_subplot(3, 1, 1)
ax2 = fig.add_subplot(3, 1, 2)
ax3 = fig.add_subplot(3, 1, 3)

#各subplot領域にデータを渡す(範囲指定)
ax1.hist(DifferenceAcc_list[0], bins=BINS,density=True, range=(0, 1), label="100 Hz")
ax2.hist(DifferenceAcc_list[260], bins=BINS,density=True, range=(0, 1), label="50 Hz")
ax3.hist(DifferenceAcc_list[416], bins=BINS,density=True, range=(0, 1), label="20 Hz")

#各subplot領域にデータを渡す
#ax1.hist(DifferenceAcc_list[0], bins=BINS,density=True, label="100 Hz")
#ax2.hist(DifferenceAcc_list[260], bins=BINS,density=True, label="50 Hz")
#ax3.hist(DifferenceAcc_list[416], bins=BINS,density=True, label="20 Hz")

#各subplotにxラベルを追加
ax1.set_xlabel(xl1)
ax2.set_xlabel(xl1)
ax3.set_xlabel(xl1)

#各subplotにyラベルを追加
ax1.set_ylabel(yl1)
ax2.set_ylabel(yl1)
ax3.set_ylabel(yl1)

#各subplotのy軸の範囲を指定
ax1.set_ylim(0, 15)
ax2.set_ylim(0, 15)
ax3.set_ylim(0, 15)

# 凡例表示
ax1.legend(loc = 'upper right')
ax2.legend(loc = 'upper right')
ax3.legend(loc = 'upper right')

plt.show()

In [None]:
for i in range(5):
  #X_train, X_test, y_train, y_test = train_test_split(DifferenceAcc_histW, HzW, test_size = 0.2)
  model = Transformer_Encoder_S()
  model.fit(stdW, HzW, batch_size=32, epochs=50, shuffle=True, validation_split=0.2)
  y_pred = tf.cast(tf.clip_by_value(model.predict(stdJ), 20, 100), tf.int32)
  mae.append(mean_absolute_error(y_pred, HzJ))
mae