

در زیر، تمام مراحل و کدهای لازم برای دانلود دیتاست صدای قلب از Kaggle و اجرای پروژه طبقه‌بندی صدای قلب با استفاده از SVM در Google Colab به ترتیب آورده شده است.

### مرحله ۱: ایجاد حساب کاربری در Kaggle و دریافت توکن API

1. به سایت Kaggle بروید و حساب کاربری بسازید.
2. به پروفایل خود رفته و در بخش "Account"، بر روی "Create New API Token" کلیک کنید تا فایل `kaggle.json` را دانلود کنید.



### مرحله ۲: راه‌اندازی Google Colab و بارگذاری توکن API

1. به Google Colab بروید و یک نوت‌بوک جدید ایجاد کنید.
2. کد زیر را برای بارگذاری فایل `kaggle.json` اجرا کنید. ابتدا فایل `kaggle.json` را از سیستم خود به Google Colab بارگذاری کنید.




### مرحله ۱: راه‌اندازی Google Colab و اتصال به Google Drive

1. به Google Colab بروید و یک نوت‌بوک جدید ایجاد کنید.
2. کد زیر را برای اتصال به Google Drive خود اجرا کنید:


In [3]:
from google.colab import drive
drive.mount('/content/gdrive')

#from google.colab import files
#uploaded = files.upload()


Drive already mounted at /content/gdrive; to attempt to forcibly remount, call drive.mount("/content/gdrive", force_remount=True).


### مرحله ۳: نصب کتابخانه‌های لازم

کتابخانه‌های مورد نیاز را نصب کنید:


In [4]:
!pip install kaggle
!pip install numpy pandas librosa scikit-learn matplotlib




### مرحله ۴: ایجاد پوشه برای توکن و دانلود دیتاست

In [13]:
%mkdir -p /content/gdrive/MyDrive/SourceKaravi/DataSet/
%mkdir -p /content/gdrive/MyDrive/SourceKaravi/DataSet/heart_sounds/
%mkdir -p /content/gdrive/MyDrive/SourceKaravi/DataSet/heart_sounds/.kaggle



In [14]:
%cp /content/gdrive/MyDrive/SourceKaravi/kaggle.json /content/gdrive/MyDrive/SourceKaravi/DataSet/heart_sounds/.kaggle/kaggle.json


In [16]:
!chmod 600 /content/gdrive/MyDrive/SourceKaravi/DataSet/heart_sounds/.kaggle/kaggle.json


### مرحله ۵: دانلود دیتاست

اگر دیتاست صدای قلب به نام `heart-sound-dataset` باشد (لطفاً نام دقیق کاربری و دیتاست را از Kaggle بگیرید)، می‌توانید از کد زیر استفاده کنید:



In [18]:
%cd /content/gdrive/MyDrive/SourceKaravi/DataSet/heart_sounds
!kaggle datasets download -d saifeemustafa/heart-sound-classification

/content/gdrive/MyDrive/SourceKaravi/DataSet/heart_sounds
403 - Forbidden - Permission 'datasets.get' was denied


### مرحله ۶: استخراج فایل‌های دانلود شده

In [None]:
!unzip heart-sound-dataset.zip

### مرحله ۷: بارگذاری و پردازش داده‌ها

کد زیر را برای بارگذاری و پردازش داده‌های صوتی بنویسید


In [None]:
import os
import librosa
import numpy as np
import pandas as pd

# تابعی برای استخراج ویژگی‌ها از فایل‌های صوتی
def extract_features(file_name):
    audio, sample_rate = librosa.load(file_name, sr=None)
    mfccs = librosa.feature.mfcc(y=audio, sr=sample_rate, n_mfcc=40)
    return np.mean(mfccs.T, axis=0)

# بارگذاری داده‌ها
def load_data(data_directory):
    features = []
    labels = []

    for file in os.listdir(data_directory):
        if file.endswith('.wav'):  # فرض بر این است که فایل‌ها با فرمت wav هستند
            label = file.split('_')[0]  # فرض بر این است که نام فایل شامل برچسب است
            file_path = os.path.join(data_directory, file)
            mfccs = extract_features(file_path)
            features.append(mfccs)
            labels.append(label)

    return np.array(features), np.array(labels)

data_directory = '/content/drive/MyDrive/SourceKaravi/DataSet/heart_sounds'  # مسیر به پوشه فایل‌های صوتی
X, y = load_data(data_directory)


### مرحله ۸: تقسیم داده‌ها به مجموعه‌های آموزشی و آزمایشی

In [None]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


### مرحله ۹: آموزش مدل SVM

کد زیر را برای آموزش مدل SVM بنویسید:



In [None]:
from sklearn import svm
from sklearn.metrics import classification_report, accuracy_score

# ایجاد مدل SVM
model = svm.SVC(kernel='linear')  # می‌توانید از 'rbf' یا 'poly' نیز استفاده کنید
model.fit(X_train, y_train)

# پیش‌بینی بر روی مجموعه آزمایشی
y_pred = model.predict(X_test)

# ارزیابی مدل
print("Accuracy:", accuracy_score(y_test, y_pred))
print(classification_report(y_test, y_pred))


### مرحله ۱۰: تجزیه و تحلیل نتایج

پس از اجرای کد، دقت و نتایج را با استفاده از `classification_report` بررسی کنید.

### نکته

- نام کاربری و نام دیتاست را با توجه به دیتاست مورد نظر خود در Kaggle تغییر دهید.
- اطمینان حاصل کنید که فایل‌های صوتی شما به درستی برچسب‌گذاری شده‌اند.
- ممکن است نیاز به تغییر مسیر فایل‌ها یا نام‌ها داشته باشید.




ALireza Karavi

In [None]:
from google.colab import drive
drive.mount('/content/gdrive')

Mounted at /content/gdrive


### مرحله ۱: ایجاد حساب کاربری در Kaggle

اگر هنوز حساب کاربری در Kaggle ندارید، به سایت Kaggle بروید و ثبت‌نام کنید.

### مرحله ۲: دریافت توکن API

1. به پروفایل خود در Kaggle بروید.
2. به بخش "Account" بروید.
3. در قسمت "API", بر روی "Create New API Token" کلیک کنید. این کار یک فایل به نام `kaggle.json` دانلود می‌کند که حاوی توکن API شما است.

### مرحله ۳: بارگذاری توکن API در Google Colab

1. به Google Colab بروید و یک نوت‌بوک جدید ایجاد کنید.
2. کد زیر را برای بارگذاری فایل `kaggle.json` اجرا کنید. ابتدا، فایل `kaggle.json` را از سیستم خود به Google Colab بارگذاری کنید.


In [None]:
from google.colab import files
uploaded = files.upload()


### مرحله ۴: نصب کتابخانه Kaggle

کتابخانه Kaggle را نصب کنید:


In [None]:
!pip install kaggle


### مرحله ۵: ایجاد پوشه برای توکن و دانلود دیتاست

کد زیر را برای ایجاد پوشه `.kaggle` و کپی کردن توکن API در آن اجرا کنید:



In [None]:
!mkdir -p ~/.kaggle
!cp kaggle.json ~/.kaggle/
!chmod 600 ~/.kaggle/kaggle.json


### مرحله ۶: دانلود دیتاست

حالا می‌توانید دیتاست مورد نظر را دانلود کنید. به عنوان مثال، اگر دیتاست صدای قلب به نام `heart-sound-dataset` باشد، می‌توانید از کد زیر استفاده کنید:



In [None]:
!kaggle datasets download -d <USERNAME>/<DATASET_NAME>


### مرحله ۷: استخراج فایل‌های دانلود شده

پس از دانلود دیتاست، فایل ZIP را با استفاده از کد زیر استخراج کنید:



In [None]:
!unzip heart-sound-dataset.zip

### مرحله ۲: نصب کتابخانه‌های لازم

In [None]:
!pip install numpy pandas librosa scikit-learn matplotlib



### مرحله ۳: بارگذاری و پردازش داده‌ها

In [None]:
import os
import librosa
import numpy as np
import pandas as pd

# تابعی برای استخراج ویژگی‌ها از فایل‌های صوتی
def extract_features(file_name):
    audio, sample_rate = librosa.load(file_name, sr=None)
    mfccs = librosa.feature.mfcc(y=audio, sr=sample_rate, n_mfcc=40)
    return np.mean(mfccs.T, axis=0)

# بارگذاری داده‌ها
def load_data(data_directory):
    features = []
    labels = []

    for file in os.listdir(data_directory):
        if file.endswith('.wav'):  # فرض بر این است که فایل‌ها با فرمت wav هستند
            label = file.split('_')[0]  # فرض بر این است که نام فایل شامل برچسب است
            file_path = os.path.join(data_directory, file)
            mfccs = extract_features(file_path)
            features.append(mfccs)
            labels.append(label)

    return np.array(features), np.array(labels)

data_directory = '/content/drive/MyDrive/SourceKaravi/DataSet/heart_sounds'  # مسیر به پوشه فایل‌های صوتی در Google Drive
X, y = load_data(data_directory)

### مرحله ۴: تقسیم داده‌ها به مجموعه‌های آموزشی و آزمایشی

In [None]:
from sklearn.model_selection import train_test_split

X_train, X_test, y_train, y_test = train_test_split(X, y, test_size=0.2, random_state=42)


### مرحله ۵: آموزش مدل SVM

کد زیر را برای آموزش مدل SVM بنویسید:


In [None]:
from sklearn import svm
from sklearn.metrics import classification_report, accuracy_score

# ایجاد مدل SVM
model = svm.SVC(kernel='linear')  # می‌توانید از 'rbf' یا 'poly' نیز استفاده کنید
model.fit(X_train, y_train)

# پیش‌بینی بر روی مجموعه آزمایشی
y_pred = model.predict(X_test)

# ارزیابی مدل
print("Accuracy:", accuracy_score(y_test, y_pred))
print(classification_report(y_test, y_pred))


### مرحله ۶: تجزیه و تحلیل نتایج

پس از اجرای کد، دقت و نتایج را با استفاده از `classification_report` بررسی کنید.
