برای اجرای پروژه طبقه‌بندی صدای قلب با استفاده از SVM در Google Colab، می‌توانید مراحل زیر را دنبال کنید. این مراحل شامل بارگذاری داده‌ها، پردازش آن‌ها، و آموزش مدل است. در اینجا، ما فرض می‌کنیم که شما فایل‌های صوتی را در Google Drive خود دارید.


### مرحله ۱: راه‌اندازی Google Colab و اتصال به Google Drive

1. به Google Colab بروید و یک نوت‌بوک جدید ایجاد کنید.
2. کد زیر را برای اتصال به Google Drive خود اجرا کنید:



In [1]:
from google.colab import drive
drive.mount('/content/drive')


Mounted at /content/drive



### مرحله ۲: نصب کتابخانه‌های لازم

کتابخانه‌های مورد نیاز را نصب کنید:



In [2]:
!pip install numpy pandas librosa scikit-learn matplotlib



In [3]:
%cd /content/drive/MyDrive/SourceKaravi/

/content/drive/MyDrive/SourceKaravi


### مرحله ۳: بارگذاری و پردازش داده‌ها

کد زیر را برای بارگذاری و پردازش داده‌های صوتی بنویسید. فرض می‌کنیم که فایل‌های صوتی شما در پوشه‌ای به نام `heart_sounds` در Google Drive قرار دارند.


In [5]:
import os
import librosa
import numpy as np
import pandas as pd

# تابعی برای استخراج ویژگی‌ها از فایل‌های صوتی
def extract_features(file_name):
    audio, sample_rate = librosa.load(file_name, sr=None)
    mfccs = librosa.feature.mfcc(y=audio, sr=sample_rate, n_mfcc=40)
    return np.mean(mfccs.T, axis=0)

# بارگذاری داده‌ها
def load_data(data_directory):
    features = []
    labels = []

    for file in os.listdir(data_directory):
        if file.endswith('.wav'):  # فرض بر این است که فایل‌ها با فرمت wav هستند
            label = file.split('_')[0]  # فرض بر این است که نام فایل شامل برچسب است
            file_path = os.path.join(data_directory, file)
            mfccs = extract_features(file_path)
            features.append(mfccs)
            labels.append(label)

    return np.array(features), np.array(labels)

data_directory = '/content/drive/MyDrive/SourceKaravi/DataSet/heart_sounds_upload/set_a'  # مسیر به پوشه فایل‌های صوتی در Google Drive
X, y = load_data(data_directory)

### مرحله ۴: تقسیم داده‌ها به مجموعه‌های آموزشی و آزمایشی

In [6]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


### مرحله ۵: آموزش مدل SVM

کد زیر را برای آموزش مدل SVM بنویسید:


In [7]:
from sklearn import svm
from sklearn.metrics import classification_report, accuracy_score

# ایجاد مدل SVM
model = svm.SVC(kernel='linear')  # می‌توانید از 'rbf' یا 'poly' نیز استفاده کنید
model.fit(X_train, y_train)

# پیش‌بینی بر روی مجموعه آزمایشی
y_pred = model.predict(X_test)

# ارزیابی مدل
print("Accuracy:", accuracy_score(y_test, y_pred))
print(classification_report(y_test, y_pred))

Accuracy: 0.42105263157894735
                 precision    recall  f1-score   support

Aunlabelledtest       0.31      0.36      0.33        11
       artifact       0.73      0.80      0.76        10
       extrahls       0.50      0.60      0.55         5
         murmur       0.00      0.00      0.00         2
         normal       0.20      0.10      0.13        10

       accuracy                           0.42        38
      macro avg       0.35      0.37      0.35        38
   weighted avg       0.40      0.42      0.40        38




### مرحله ۶: تجزیه و تحلیل نتایج

پس از اجرای کد، دقت و نتایج را با استفاده از `classification_report` بررسی کنید.

### یادداشت
- اطمینان حاصل کنید که فایل‌های صوتی شما به درستی برچسب‌گذاری شده‌اند.
- می‌توانید دیگر تکنیک‌های پیش‌پردازش و بهینه‌سازی مدل را نیز امتحان کنید.
- حتماً نام پوشه و مسیر فایل‌ها را به درستی تنظیم کنید.

