In [None]:
#ライブラリをインポート
import os
import re
import csv
import math
import matplotlib.pyplot as plt
import numpy as np
import pandas as pd

In [None]:
#マクロを定義
BINS = 10000  #ヒストグラムのビンの数
EPSILON = .00001  #スムージングパラメータ
UPPER_LIMIT = 1.1 #静止区間の上限
LOWER_LIMIT = 0.9 #静止区間の加減
STATIONARY_INTERVALS = 5  #静止区間除去のサンプルの間隔(何サンプル静止区間が連続したら除去するか)

In [None]:
#データセットのファイル名と周波数を取得する関数
def get_filename_and_Hz(path: str) -> list[str, int]:
    filename = os.listdir(path)
    filename_and_Hz=[]

    for file in filename:
        Hz = re.search(r'\d+', file)
        if Hz:  #数字の入っていないファイル名があるとエラーを吐くので、このif文でチェックしています
            filename_and_Hz.append([file, int(Hz.group(0))])

    return filename_and_Hz

In [None]:
#加速度データのCSVファイルから3軸加速度を取得する関数
def get_acceleration(filename: list[str, int]) -> tuple[list[float], list[float], list[float]]:
    AccX = []
    AccY = []
    AccZ = []
    #ｘ軸,y軸,z軸の値を配列に格納
    with open(filename) as f:
        reader = csv.reader(f)
        for row in reader:
            AccX.append(float(row[2]))
            AccY.append(float(row[3]))
            AccZ.append(float(row[4]))
    return AccX, AccY, AccZ

In [None]:
path = "岡本さん/data"
filename_and_Hz=[]
filename_and_Hz=get_filename_and_Hz(path)
AccX, AccY, AccZ = get_acceleration(filename_and_Hz[0][0])

In [None]:
filename_and_Hz[0][0]

In [None]:
#静止区間除去関数
def remove_stationary_intervals(AccX: list[float], AccY: list[float], AccZ: list[float]) -> list[float]:

    #各軸の加速度の平均を求める
    AvgAccX = sum(AccX) / len(AccX)
    AvgAccY = sum(AccY) / len(AccY)
    AvgAccZ = sum(AccZ) / len(AccZ)

    #重力加速度の推定値=合成加速度の平均を求める
    AvgResultantAcc = math.sqrt(AvgAccX ** 2 + AvgAccY ** 2 + AvgAccZ ** 2)

    #各時刻の合成加速度を求める
    ResultantAcc = [math.sqrt(x ** 2 + y ** 2 + z ** 2) for x, y, z in zip(AccX, AccY, AccZ)]

    #各時刻の合成加速度から静止区間(重力加速度の推定値に近い値が一定以上以上連続している区間)を除去する
    i=0 #ループ変数
    counter = 0 #静止区間がSTATIONARY_INTERVALS分続いているかをカウントする変数
    while i < len(ResultantAcc):
        if AvgResultantAcc * LOWER_LIMIT < ResultantAcc[i] < AvgResultantAcc * UPPER_LIMIT:   #平均のLOWER_LIMIT倍~UPPER_LIMIT倍の範囲を調べる
            counter += 1    #範囲内ならカウントを増やす
            if counter == STATIONARY_INTERVALS: #カウントがSTATIONARY_INTERVALSに達したらその区間を削除
                del ResultantAcc[i+1-STATIONARY_INTERVALS:i+1]    #スライスでは選択範囲の開始位置startと終了位置stopを[start:stop]のように書く。start <= x < stopの範囲が選択される。start番目の値は含まれるがstop番目の値は含まれない。
                counter = 0
                i -= STATIONARY_INTERVALS   #削除した分インデックスがズレるので補正する
        else:
            counter = 0
        i += 1

    return ResultantAcc  #静止区間を除去した後のリストを返す

In [None]:
#連続する2サンプルの差分を取る関数
def differences_of_acceleration(ResultantAcc: list[float]) -> list[float]:
    index = 0
    DifferenceAcc = []
    for dif in ResultantAcc[:-1]:
        DifferenceAcc.append(math.fabs(ResultantAcc[index + 1]*100000 - ResultantAcc[index]*100000))
        index += 1

    return DifferenceAcc

In [None]:
#KLダイバージェンス関数
def KL_divergence(a: list[float], b: list[float]) -> float:
    min_value = min(min(a), min(b)) #a,bの最小値の小さい方
    max_value = max(max(a), max(b)) #a,bの最大値の大きい方

    #a,bのヒストグラムを作成し、同じ数のビンで区切る
    a_hist, _ = np.histogram(a, bins=BINS, range=(min_value, max_value))
    b_hist, _ = np.histogram(b, bins=BINS, range=(min_value, max_value))

    #正規化する(確率分布に変換する、合計を1にする)ために全合計で割る
    a_hist = (a_hist + EPSILON) / a_hist.sum()
    b_hist = (b_hist + EPSILON) / b_hist.sum()

    #KLダイバージェンスの値を返す
    return np.sum([ai * np.log(ai / bi) for ai, bi in zip(a_hist, b_hist)])

In [None]:
path = "岡本さん/data"
filename_and_Hz=[]
filename_and_Hz=get_filename_and_Hz(path)
filename_and_Hz

In [None]:
def get_filename_and_Hz(path: str) -> list[tuple]:
    filename = os.listdir(path)
    filename_and_Hz = []

    for file in filename:
        match = re.search(r'\d+', file)
        if match:
          Hz = int(match.group(0))
          filename_and_Hz.append((file, Hz))

    return filename_and_Hz

path = "岡本さん/data"
filename_and_Hz = get_filename_and_Hz(path)

filename_and_Hz

In [None]:
#ファイルを読み込む
number = 1046
filename1 = "walk100Hz-0809-0900.csv".format(number)
filename2 = "walk100Hz-0809-1000.csv".format(number)

In [None]:
accX1, accY1, accZ1 = retrieve_acceleration(filename1)
accX2, accY2, accZ2 = retrieve_acceleration(filename2)

In [None]:
print(accX1[:5])
print(accY1[:5])
print(accZ1[:5])

In [None]:
print(sum(accX1))
print(sum(accY1))
print(sum(accZ1))

In [None]:
accAveX1 = sum(accX1) / len(accX1)
accAveY1 = sum(accY1) / len(accY1)
accAveZ1 = sum(accZ1) / len(accZ1)

#重力加速度の推定値=合成加速度の平均を求める
accResAve1 = math.sqrt(accAveX1 ** 2 + accAveY1 ** 2 + accAveZ1 ** 2)

print(accAveX1, accAveY1, accAveZ1, accResAve1)

In [None]:
#各時刻の合成加速度を求める
accRes1 = [math.sqrt(x ** 2 + y ** 2 + z ** 2) for x, y, z in zip(accX1, accY1, accZ1)]

print(accRes1[:5])
len(accRes1)

In [None]:
print(accRes1[:5])
len(accRes1)

In [None]:
i=0 #ループ変数
counter = 0 #静止区間がSTATIONARY_INTERVALS分続いているかをカウントする変数
while i < len(accRes1):
    if accResAve1 * LOWER_LIMIT < accRes1[i] < accResAve1 * UPPER_LIMIT:   #平均のLOWER_LIMIT倍~UPPER_LIMIT倍の範囲を調べる
        counter += 1    #範囲内ならカウントを増やす
        if counter == STATIONARY_INTERVALS: #カウントがSTATIONARY_INTERVALSに達したらその区間を削除
            del accRes1[i-4:i+1]    #スライスでは選択範囲の開始位置startと終了位置stopを[start:stop]のように書く。start <= x < stopの範囲が選択される。start番目の値は含まれるがstop番目の値は含まれない。
            counter = 0
            i -= 5   #削除した分インデックスがズレるので補正する
    else:
        counter = 0
    i += 1

print(i, accRes1[:5], len(accRes1))

In [None]:
accDif1 = differences_of_acceleration(acc1)
accDif2 = differences_of_acceleration(acc2)

In [None]:
i=0
counter = 0
while i < len(acc):
    if accAve * 0.9 < acc[i] < accAve * 1.1:
        counter += 1
        if counter == 5:
            del acc[i-4:i+1]
            counter = 0
            i -= 5
    else:
        counter = 0
    i += 1

In [None]:
acc=[1.0, 1.4, 0.6, 0.91, 1.09, 1.08, 0.92, 1.05, 0.95, 1.3, 0.7]
accAve = sum(acc) / len(acc)
accAve

In [None]:
start = None
end = None
counter = 0
for i in range(len(acc)):
    if accAve * 0.9 <= acc[i] <= accAve * 1.1:
        if start is None:
            start = i
        end = i
        counter += 1
        if counter == 5:
            if start is not None and end is not None:
                del acc[start:end+1]
                start = None
                end = None
                counter = 0
                i -= 5
    else:
        start = None
        end = None
        counter = 0

print(acc)

In [None]:
accAve = sum(acc) / len(acc)
start = None
end = None
counter = 0
while True:
    for i in range(len(acc)):
        if accAve * 0.9 <= acc[i] <= accAve * 1.1:
            if start is None:
                start = i
            end = i
            counter += 1
            if counter == 5:
                if start is not None and end is not None:
                    del acc[start:end+1]
                    start = None
                    end = None
                    counter = 0
                    break
        else:
            start = None
            end = None
            counter = 0
    else:
        break
    
acc