In [1]:
import os
import pandas as pd
import numpy as np
from sklearn.model_selection import train_test_split
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import classification_report

In [2]:
# Шлях до папок з даними
data_folders = [
    r'e:\go_it\hw5\data\idle',
    r'e:\go_it\hw5\data\running',
    r'e:\go_it\hw5\data\stairs',
    r'e:\go_it\hw5\data\walking'
]


In [3]:
data = []

# Проходимося по кожній папці
for folder in data_folders:
    # Проходимося по кожному файлу у папці
    for filename in os.listdir(folder):
        # Перевіряємо, чи є файл з розширенням .csv
        if filename.endswith('.csv'):
            file_path = os.path.join(folder, filename)
            # Зчитуємо дані з файлу та додаємо до списку даних
            df = pd.read_csv(file_path)
            # Додаємо з міткою класу (назва папки)
            df['activity'] = os.path.basename(folder)
            data.append(df)



In [4]:
# Об'єднуємо всі дані у один датасет
combined_data = pd.concat(data, ignore_index=True)

print(combined_data.head())

# Зберігаємо об'єднані дані у файл
combined_data.to_csv('combined_data.csv', index=False)

   accelerometer_X  accelerometer_Y  accelerometer_Z activity
0         1.000776         4.616021         8.576031     idle
1         0.718261         4.209007         8.446744     idle
2        -0.909797        -0.282516         9.203311     idle
3         5.099650         0.148441         8.418014     idle
4         1.762132        -0.162806         9.251195     idle


In [5]:

# Розділити дані на ознаки (X) та цільову змінну (y)
X = combined_data.drop('activity', axis=1)
y = combined_data['activity']

# Розділити дані на навчальний та тестовий набори
X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

windowed_df = pd.DataFrame(X_train)
windowed_df['activity'] = y_train.values

# Виведіть перші декілька рядків windowed_df для перевірки
print(windowed_df.head())

        accelerometer_X  accelerometer_Y  accelerometer_Z activity
186383        -9.811439       -22.132000       -13.053187  walking
85476         -4.826710        25.560497        -8.446744  running
91093          4.137180         5.635951         4.659117  running
89073         -8.192958        -1.503559        -1.177947  running
124211        -2.303222         6.373365         5.372589  running


In [6]:

unique_classes = np.unique(y_train)
print(unique_classes)



['idle' 'running' 'stairs' 'walking']


In [7]:
# Навчання моделі SVM
svm_model = SVC()
svm_model.fit(X_train, y_train)

# Навчання моделі випадкового лісу
rf_model = RandomForestClassifier()
rf_model.fit(X_train, y_train)

# Оцінка продуктивності моделей на тестових даних
svm_predictions = svm_model.predict(X_test)
rf_predictions = rf_model.predict(X_test)

# Виведення результатів класифікації
print("SVM Classification Report:")
print(classification_report(y_test, svm_predictions))

print("\nRandom Forest Classification Report:")
print(classification_report(y_test, rf_predictions))

SVM Classification Report:
              precision    recall  f1-score   support

        idle       0.95      0.99      0.97      6203
     running       0.93      0.90      0.92     20485
      stairs       1.00      0.00      0.00      1022
     walking       0.80      0.90      0.85     11062

    accuracy                           0.89     38772
   macro avg       0.92      0.70      0.68     38772
weighted avg       0.90      0.89      0.88     38772


Random Forest Classification Report:
              precision    recall  f1-score   support

        idle       1.00      1.00      1.00      6203
     running       1.00      1.00      1.00     20485
      stairs       1.00      0.99      0.99      1022
     walking       1.00      1.00      1.00     11062

    accuracy                           1.00     38772
   macro avg       1.00      1.00      1.00     38772
weighted avg       1.00      1.00      1.00     38772

