In [7]:
import re
import csv

# 입력 및 출력 파일 경로
input_file = '../data/Arduino/standing.log'
output_file = '../data/Arduino/standing_output.csv'

# 데이터 추출 및 CSV 파일 저장
with open(input_file, 'r') as file:
    lines = file.readlines()

data = []
line_data = []
for line in lines:
    matches = re.findall(r'accX:(.*?),accY:(.*?),accZ:(.*?),gyrX:(.*?),gyrY:(.*?),gyrZ:(.*?)\n', line)
    if matches:
        line_data = [float(match) for match in matches[0]]
    else:
        continue
    data.append(line_data)

with open(output_file, 'w', newline='') as file:
    writer = csv.writer(file)
    writer.writerows(data)


In [8]:
import pandas as pd

# CSV 파일 경로
csv_file = "../data/Arduino/standing_output.csv"

# 필드명 리스트
fields = ["accX", "accY", "accZ", "gyrX", "gyrY", "gyrZ"]

# CSV 파일을 DataFrame으로 불러오기
df = pd.read_csv(csv_file, header=None)

# 필드명을 지정해주기
df.columns = fields

# "label" 열을 새로 만들고 모든 값을 "fall"로 설정
df["label"] = "standing"

In [9]:
print(df)

       accX     accY     accZ     gyrX     gyrY    gyrZ     label
0    2052.0  10844.0 -13084.0  -1276.0    694.0  -463.0  standing
1    2356.0  11404.0 -13728.0   -154.0    388.0  -257.0  standing
2    1540.0  11308.0 -13776.0  -1854.0    -48.0  -293.0  standing
3    1476.0  11392.0 -13484.0    234.0    127.0  -304.0  standing
4    2180.0  11208.0 -13252.0   -285.0    819.0  -172.0  standing
..      ...      ...      ...      ...      ...     ...       ...
215  1212.0   6664.0 -17252.0   7002.0   2714.0   180.0  standing
216  2700.0  20440.0 -19140.0 -32768.0  13283.0   617.0  standing
217  2776.0   8600.0 -11272.0  12400.0   3770.0  1877.0  standing
218  4044.0   9848.0 -14076.0   -836.0   1256.0   675.0  standing
219  3624.0  10480.0 -14268.0  -4907.0    746.0   273.0  standing

[220 rows x 7 columns]


In [10]:
from sklearn.preprocessing import MinMaxScaler

# MinMaxScaler 인스턴스 생성
scaler = MinMaxScaler(feature_range=(-1, 1))

# 'gx', 'gy', 'gz' 열의 데이터 추출
data = df[['gyrX', 'gyrY', 'gyrZ']].values

# 데이터 스케일링
scaled_data = scaler.fit_transform(data)

# 스케일링된 값을 새로운 열에 저장
df['scaled_gx'] = scaled_data[:, 0]
df['scaled_gy'] = scaled_data[:, 1]
df['scaled_gz'] = scaled_data[:, 2]

print(df.head())

     accX     accY     accZ    gyrX   gyrY   gyrZ     label  scaled_gx   
0  2052.0  10844.0 -13084.0 -1276.0  694.0 -463.0  standing   0.114347  \
1  2356.0  11404.0 -13728.0  -154.0  388.0 -257.0  standing   0.154049   
2  1540.0  11308.0 -13776.0 -1854.0  -48.0 -293.0  standing   0.093894   
3  1476.0  11392.0 -13484.0   234.0  127.0 -304.0  standing   0.167778   
4  2180.0  11208.0 -13252.0  -285.0  819.0 -172.0  standing   0.149413   

   scaled_gy  scaled_gz  
0   0.397555   0.026599  
1   0.382911   0.042907  
2   0.362046   0.040057  
3   0.370421   0.039186  
4   0.403536   0.049636  


In [11]:
df.to_csv('../data/Arduino/standing_sc.csv', index=False)