In [13]:
{
 "cells": [
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "# Exploratory Data Analysis (EDA) for Heart Sound Data\n",
    "\n",
    "Bu notebook, heart_sound_analysis projesi için yapılacak olan veri analizi ve ses dosyalarının incelenmesini içermektedir. Veri setindeki dağılımı, ses dosyalarının görselleştirilmesi ve MFCC özelliklerinin incelenmesi adımları işlenecektir."
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 0,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Gerekli kütüphanelerin import edilmesi\n",
    "import pandas as pd\n",
    "import librosa\n",
    "import librosa.display\n",
    "import matplotlib.pyplot as plt\n",
    "import numpy as np\n",
    "from sklearn.preprocessing import StandardScaler\n",
    "from feature_extraction import extract_mfcc"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 1. Veri Yükleme ve İlk İnceleme"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 0,
   "metadata": {},
   "outputs": [],
   "source": [
    "# CSV dosyasını yükle\n",
    "reference_file = \"data/training/REFERENCE.csv\"\n",
    "df = pd.read_csv(reference_file, header=None)\n",
    "\n",
    "# İlk 5 satırı göster\n",
    "df.head()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 0,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Etiketlerin dağılımını kontrol et\n",
    "df[1].value_counts()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 2. Eksik Veri Analizi"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 0,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Eksik veri kontrolü\n",
    "df.isnull().sum()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 3. Sınıf Dağılımı ve Grafiksel Gösterim"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 0,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Sınıf dağılımı grafiği\n",
    "df[1].value_counts().plot(kind='bar', title='Sınıf Dağılımı (Normal vs. Anormal)')\n",
    "plt.show()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 4. Ses Verilerinin Görselleştirilmesi"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 0,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Örnek bir ses dosyası yükle\n",
    "y, sr = librosa.load(\"data/training/a0001.wav\", sr=2000)\n",
    "\n",
    "# Dalga formu\n",
    "plt.figure(figsize=(10, 4))\n",
    "librosa.display.waveshow(y, sr=sr)\n",
    "plt.title('Dalga Formu')\n",
    "plt.show()"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 0,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Mel-spectrogram gösterimi\n",
    "plt.figure(figsize=(10, 4))\n",
    "S = librosa.feature.melspectrogram(y=y, sr=sr)\n",
    "librosa.display.specshow(librosa.power_to_db(S, ref=np.max), sr=sr, x_axis='time', y_axis='mel')\n",
    "plt.title('Mel-Spectrogram')\n",
    "plt.colorbar(format='%+2.0f dB')\n",
    "plt.show()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 5. MFCC Özelliklerinin İncelenmesi"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 0,
   "metadata": {},
   "outputs": [],
   "source": [
    "# Örnek bir ses dosyasından MFCC çıkarımı\n",
    "y, sr = librosa.load(\"data/training/a0001.wav\", sr=2000)\n",
    "mfccs = extract_mfcc(y)\n",
    "\n",
    "# MFCC değerlerinin gösterimi\n",
    "plt.figure(figsize=(10, 4))\n",
    "plt.plot(mfccs)\n",
    "plt.title('MFCC Özellikleri')\n",
    "plt.show()"
   ]
  },
  {
   "cell_type": "markdown",
   "metadata": {},
   "source": [
    "## 6. Veri Normalizasyonu"
   ]
  },
  {
   "cell_type": "code",
   "execution_count": 0,
   "metadata": {},
   "outputs": [],
   "source": [
    "# MFCC özelliklerini çıkar ve normalleştir\n",
    "X = np.array([extract_mfcc(y) for y in data])\n",
    "scaler = StandardScaler()\n",
    "X_scaled = scaler.fit_transform(X)\n",
    "\n",
    "# İlk ses dosyasının normalleştirilmiş MFCC özelliklerini göster\n",
    "X_scaled[0]"
   ]
  }
 ],
 "metadata": {
  "kernelspec": {
   "display_name": "Python 3",
   "language": "python",
   "name": "python3"
  },
  "language_info": {
   "name": "python",
   "version": "3.8.5"
  }
 },
 "nbformat": 4,
 "nbformat_minor": 4
}


{'cells': [{'cell_type': 'markdown',
   'metadata': {},
   'source': ['# Exploratory Data Analysis (EDA) for Heart Sound Data\n',
    '\n',
    'Bu notebook, heart_sound_analysis projesi için yapılacak olan veri analizi ve ses dosyalarının incelenmesini içermektedir. Veri setindeki dağılımı, ses dosyalarının görselleştirilmesi ve MFCC özelliklerinin incelenmesi adımları işlenecektir.']},
  {'cell_type': 'code',
   'execution_count': 0,
   'metadata': {},
   'outputs': [],
   'source': ['# Gerekli kütüphanelerin import edilmesi\n',
    'import pandas as pd\n',
    'import librosa\n',
    'import librosa.display\n',
    'import matplotlib.pyplot as plt\n',
    'import numpy as np\n',
    'from sklearn.preprocessing import StandardScaler\n',
    'from feature_extraction import extract_mfcc']},
  {'cell_type': 'markdown',
   'metadata': {},
   'source': ['## 1. Veri Yükleme ve İlk İnceleme']},
  {'cell_type': 'code',
   'execution_count': 0,
   'metadata': {},
   'outputs': [],
   'source'