In [3]:
import os
import pandas as pd
import random
from sklearn.model_selection import train_test_split
from sklearn.preprocessing import StandardScaler
from sklearn.svm import SVC
from sklearn.ensemble import RandomForestClassifier
from sklearn.metrics import accuracy_score, classification_report

# Функция для извлечения признаков из одного CSV-файла
def process_csv_file(csv_file):
    df = pd.read_csv(csv_file)
    activity = os.path.basename(csv_file).split('.')[0]  # Используйте имя файла как метку активности
    mean_x = df['accelerometer_X'].mean()
    mean_y = df['accelerometer_Y'].mean()
    mean_z = df['accelerometer_Z'].mean()
    return [activity, mean_x, mean_y, mean_z]

# 1. Загрузка данных и объединение
data_folder = r'C:\Users\Сергій\Documents\Code\Current_task\Math-test\homework\data'
csv_files = []

for root, dirs, files in os.walk(data_folder):
    for file in files:
        if file.endswith('.csv'):
            csv_files.append(os.path.join(root, file))

# Выберите случайную подвыборку файлов для анализа
sample_size = 50  # Размер выборки (можете изменить по своему усмотрению)
csv_files_sample = random.sample(csv_files, sample_size)

# Извлечение признаков для выборки файлов
results = []
for csv_file in csv_files_sample:
    result = process_csv_file(csv_file)
    results.append(result)

# Создание DataFrame из результатов
data = pd.DataFrame(results, columns=['activity', 'mean_x', 'mean_y', 'mean_z'])

# 2. Разделение данных на обучающую и тестовую выборки
X = data[['mean_x', 'mean_y', 'mean_z']]
y = data['activity']

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)

# 3. Масштабирование признаков
scaler = StandardScaler()
X_train = scaler.fit_transform(X_train)
X_test = scaler.transform(X_test)

# 4. Обучение моделей
# SVM
svm_classifier = SVC(kernel='linear')
svm_classifier.fit(X_train, y_train)

# Random Forest
rf_classifier = RandomForestClassifier(n_estimators=100, random_state=42)
rf_classifier.fit(X_train, y_train)

# 5. Оценка производительности моделей
# SVM
svm_predictions = svm_classifier.predict(X_test)
svm_accuracy = accuracy_score(y_test, svm_predictions)
svm_report = classification_report(y_test, svm_predictions, zero_division=1)  # Установите zero_division=1

# Random Forest
rf_predictions = rf_classifier.predict(X_test)
rf_accuracy = accuracy_score(y_test, rf_predictions)
rf_report = classification_report(y_test, rf_predictions, zero_division=1)  # Установите zero_division=1

# 6. Вывод результатов
print("SVM Accuracy:", svm_accuracy)
print("SVM Classification Report:\n", svm_report)

print("\nRandom Forest Accuracy:", rf_accuracy)
print("Random Forest Classification Report:\n", rf_report)


SVM Accuracy: 0.0
SVM Classification Report:
               precision    recall  f1-score   support

    idle-129       0.00      1.00      0.00       0.0
    idle-482       1.00      0.00      0.00       1.0
running-1589       0.00      1.00      0.00       0.0
running-2471       1.00      0.00      0.00       1.0
running-2756       0.00      1.00      0.00       0.0
running-2843       1.00      0.00      0.00       1.0
 running-309       0.00      1.00      0.00       0.0
running-3139       1.00      0.00      0.00       1.0
running-3243       1.00      0.00      0.00       1.0
 running-437       0.00      1.00      0.00       0.0
 running-731       1.00      0.00      0.00       1.0
 running-964       0.00      1.00      0.00       0.0
  stairs-147       0.00      1.00      0.00       0.0
  stairs-160       0.00      1.00      0.00       0.0
walking-1184       1.00      0.00      0.00       1.0
walking-1265       1.00      0.00      0.00       1.0
walking-1538       1.00      0.00  