# **Analisis dan Pengolahan Sinyal Digital dari Instrumen Musik: Pemisahan Audio dua Instrumen dari Rekaman**
##### Proyek ini adalah suatu proyek yang bertujuan untuk menganalisis dan mengolah sinyal digital dari rekaman musik, terutama dalam upaya memisahkan suara instrumen tertentu dari campuran suara dalam rekaman. Di dalam rekaman musik, suara berbagai instrumen biasanya bergabung menjadi satu saluran audio, sehingga sulit untuk mengisolasi suara satu instrumen saja tanpa terganggu oleh suara instrumen lainnya.

Untuk mengatasi hal ini, proyek ini akan mengembangkan metode dan teknik pemrosesan sinyal yang mampu memisahkan suara instrumen tertentu.Selain itu, proyek ini bertujuan untuk memudahkan para pemusik dalam mengulik dan menganalisis instrumen yang mereka mainkan. Dengan adanya pemisahan suara yang lebih jelas, musisi dapat lebih mudah memahami komposisi dan elemen-elemen musik dalam rekaman, yang dapat membantu mereka dalam proses belajar, latihan, dan pengembangan keterampilan musikal. Hal ini akan sangat berguna untuk pengembangan keterampilan musikal, terutama dalam konteks latihan mandiri, pengajaran, dan kolaborasi antar musisi.

Oleh karena itu, proyek ini tidak hanya berfokus pada pemisahan sinyal secara teknis, tetapi juga pada penciptaan peluang baru bagi musisi untuk berinteraksi dengan musik dengan cara yang lebih mendalam dan edukatif.
##### **Sumber Data**: [rekaman audio](https://youtu.be/aeeNVqVj7SQ?si=ArIOg_1U4PU80cQd)


##### **Kelompok 2**:
1.   Putri Manika Rukmamaya (23031554091)
2.   Monika Intan Puspitasari (23031554189)
3.   Sintiya Risla Miftaqul Nikmah (23031554204)



# **Akuisisi Data**

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import librosa

# Mengambil data dari file audio
filename = 'falling.mp3'
audio_signal, sr = librosa.load(filename, sr=None)

# Tampilkan sinyal
plt.figure(figsize=(12, 6))
plt.plot(audio_signal)
plt.title('Sinyal Audio dari Instrumen Musik')
plt.xlabel('Sampel')
plt.ylabel('Amplitudo')
plt.grid()
plt.show()

```
Berikan penjelasan tentang sinyal tersebut.

*   Sinyal apakah itu?
*   Bagaimana sinyal itu diperoleh? Sinyal tersebut menggambarkan kondisi apa?
*   Informasi apa sajakah yang tersimpan pada sinyal tersebut
*   Apa perbedaan sinyal dalam kondisi normal dan abnormal?
```

1. **Sinyal tersebut adalah sinyal audio** dalam domain waktu, yang menggambarkan perubahan amplitudo suara dari instrumen musik seperti double bass dan biola seiring waktu. Sinyal ini merupakan representasi digital dari gelombang suara yang dihasilkan oleh instrumen tersebut. Sinyal audio ini berisi informasi tentang frekuensi, amplitudo, dan durasi suara yang dihasilkan oleh instrumen double bass daan biola. Dalam visualisasi yang ditampilkan, setiap titik pada sumbu horizontal menunjukkan waktu (dalam hal ini sampel) selama rekaman berlangsung dan sumbu vertikal menunjukkan amplitudo sinyal suara pada titik waktu tersebut.

2. **Sinyal audio yang diperoleh dari perekaman video** dihasilkan melalui mikrofon yang terpasang pada perangkat perekam, seperti kamera atau alat perekam video lainnya. Mikrofon ini berfungsi untuk menangkap gelombang suara yang datang dari lingkungan sekitar, termasuk suara instrumen musik seperti double bass dan biola. Ketika gelombang suara memasuki mikrofon, ia dikonversi menjadi sinyal listrik yang kemudian diproses oleh perangkat perekam. Setelah itu, sinyal listrik tersebut diubah menjadi sinyal digital melalui proses analog-to-digital conversion (ADC), yang mengubah informasi gelombang suara menjadi data yang dapat dipahami dan diproses oleh sistem komputer.

3. **Sinyal ini menggambarkan gelombang suara** yang dihasilkan oleh instrumen musik double bass dan biola dalam sebuah rekaman musik. Dalam visualisasi yang ditampilkan, kita bisa melihat hubungan antara waktu dan amplitudo sinyal audio tersebut:
- **Waktu atau sampel (Sumbu Horizontal)**: Setiap titik pada sumbu horizontal menunjukkan waktu yang berlalu selama rekaman berlangsung. Biasanya satu titik pada sumbu horizontal merujuk pada sebuah sampel audio pada waktu tertentu. Waktu ini biasanya dinyatakan dalam detik (saat menggunakan sampel rate).
- **Amplitudo (Sumbu Vertikal)**: Sumbu vertikal menunjukkan amplitudo sinyal suara pada titik waktu tersebut. Amplitudo ini merepresentasikan volume atau kekuatan suara pada saat tertentu. Ketika amplitudo lebih tinggi, itu berarti suara lebih keras, sedangkan amplitudo yang lebih rendah berarti suara lebih lembut atau lebih diam.

4. **Dari sinyal tersebut di dapat beberapa informasi seperti:**

- **Amplitudo**: Menggambarkan kekuatan atau volume suara pada setiap titik waktu.

- **Frekuensi**: Frekuensi suara yang dimainkan (dapat dijelaskan lebih lanjut menggunakan analisis spektral seperti Transformasi Fourier).

- **Durasi**: Waktu keberlangsungan suara, baik secara keseluruhan maupun per bagian.

- **Pitch** (Nada): Nada yang dimainkan oleh instrumen double bass daan biola dapat diketahui dari pola sinyal gelombang.

5. **Perbedaan Sinyal dalam kondisi normal dan abnormal**:

- Dalam kondisi **normal**, sinyal audio menunjukkan variasi amplitudo yang halus dan teratur, yang mencerminkan nada dan ritme yang dimainkan dalam musik. Ketika instrumen dimainkan, sinyal audio akan menunjukkan perubahan frekuensi yang sesuai dengan instrumen yang digunakan, seperti double bass dan biola. Variasi amplitudo ini berhubungan dengan volume suara. Dalam kondisi ini, gelombang suara terlihat halus dan teratur, menunjukkan bahwa suara yang dihasilkan oleh instrumen adalah jelas dan tidak terganggu oleh masalah teknis apapun.

- Sebaliknya, dalam kondisi **abnormal**, sinyal audio dapat mengalami gangguan yang menyebabkan distorsi atau ketidaknormalan dalam gelombang suara. Gangguan ini bisa berupa bising (noise) atau ganguan yang muncul akibat masalah teknis seperti peralatan yang rusak, kabel yang buruk, atau masalah pada proses perekaman atau pemutaran. Gangguan ini menyebabkan gelombang suara menjadi tidak teratur, dengan bentuk yang berubah-ubah secara tiba-tiba dan seringkali tajam. Salah satu bentuk gangguan yang paling umum adalah clipping, yang terjadi ketika amplitudo sinyal melebihi batas maksimal yang dapat direkam atau diputar oleh perangkat. Clipping ini menghasilkan puncak amplitudo yang terdistorsi dan menyebabkan suara menjadi terpotong atau pecah, mengurangi kualitas audio secara signifikan.

# **Visualisasi Sinyal**

In [None]:
from IPython.display import Audio

# Path ke file audio
file_path = 'falling.mp3'

# Memutar audio
Audio(file_path)

### Domain Waktu

In [None]:
# Import dan tampilkan sinyal tersebut di sini

import numpy as np
import matplotlib.pyplot as plt
import librosa

# Mengambil data dari file audio
filename = 'falling.mp3'
audio_signal, sr = librosa.load(filename, sr=None)

# Tampilkan sinyal
plt.figure(figsize=(12, 6))
plt.plot(audio_signal)
plt.title('Sinyal Audio dari Instrumen Musik')
plt.xlabel('Sampel')
plt.ylabel('Amplitudo')
plt.grid()
plt.show()

```
Penjelasan untuk membaca plotting sinyal dalam domain waktu
```
Plot sinyal dalam domain waktu di atas menggambarkan bagaimana amplitudo sinyal audio berubah seiring waktu. Berikut adalah penjelasannya:

1. Sumbu X (Sampel)
Sumbu horizontal pada grafik ini mewakili sampel dalam sinyal audio. Setiap titik pada sumbu X adalah satu unit sampel dari data audio yang telah diproses. Jika sinyal direkam dengan frekuensi sampling tertentu, nilai pada sumbu X ini bisa dikonversi menjadi waktu dalam detik. Misalnya, jika frekuensi sampling adalah 44,100 Hz (yang biasa digunakan pada audio), maka setiap detik berisi 44,100 sampel. Dengan demikian, posisi sampel pada sumbu X menunjukkan urutan data amplitudo dari sinyal audio yang terekam.

2. Sumbu Y (Amplitudo)
Sumbu vertikal pada grafik ini menunjukkan amplitudo sinyal, yang merupakan ukuran intensitas atau kekuatan dari suara pada waktu tertentu. Amplitudo ini dapat berupa nilai positif atau negatif, yang menggambarkan variasi tekanan udara atau perubahan gelombang suara yang menghasilkan suara yang kita dengar. Nilai amplitudo yang lebih besar menggambarkan suara yang lebih keras, sedangkan nilai amplitudo yang lebih kecil menunjukkan suara yang lebih lembut.

3. Bentuk Gelombang
Pola naik-turun pada grafik menggambarkan variasi amplitudo yang terjadi seiring waktu. Bentuk gelombang ini mengandung informasi penting, seperti nada (pitch), intensitas suara, dan karakteristik harmonik. Misalnya, bagian dengan amplitudo besar (puncak pada grafik) menunjukkan bagian-bagian dengan volume suara lebih keras, sedangkan bagian dengan amplitudo kecil menunjukkan suara yang lebih lembut atau bahkan jeda dalam musik. Pola naik-turun ini mencerminkan perubahan suara yang kompleks dari instrumen musik yang terekam.

4. Durasi
Durasi sinyal dapat dihitung dengan membagi jumlah total sampel dengan frekuensi sampling. Jumlah sampel pada sinyal adalah 2,5 juta dan frekuensi sampling adalah 44,100 Hz, maka durasi sinyal audio tersebut dapat dihitung dengan rumus: 2.5 × 10^6 / 44,100 ≈ 57 detik. Durasi ini menunjukkan seberapa lama sinyal audio tersebut berlangsung dalam waktu nyata. Dengan kata lain, durasi adalah panjang waktu dari rekaman yang digambarkan oleh sinyal audio tersebut.


### Domain Frekuensi

In [None]:
# Transformasikan sinyal tersebut ke dalam domain frekuensi
# Gunakan modul scipy.fft
from scipy.fft import fft

# Transformasi Fourier
N = len(audio_signal)
yf = fft(audio_signal)
xf = np.fft.fftfreq(N, 1 / sr)

# Tampilkan spektrum frekuensi
plt.figure(figsize=(12, 6))
plt.plot(xf[:N // 2], 2.0 / N * np.abs(yf[:N // 2]))
plt.title('Spektrum Frekuensi Sinyal Audio')
plt.xlabel('Frekuensi (Hz)')
plt.ylabel('Amplitudo')
plt.grid()
plt.show()

```
Berikan penjelasan tentang informasi apa saja yang dapat diketahui dari hasil transformasi sinyal tersebut dalam domain frekuensi
```

Transformasi Fast Fourier Transform (FFT) adalah transformasi yang menguraikan sinyal menjadi komponen-komponen frekuensinya. Grafik spektrum ini menunjukkan bagaimana kekuatan sinyal (amplitudo) tersebar di berbagai frekuensi.

1. **Frekuensi Dominan**
    
  Puncak-puncak yang tinggi pada bagian awal spektrum menunjukkan bahwa
energi sinyal terkonsentrasi pada frekuensi rendah. Ini biasanya merupakan karakteristik dari suara-suara dengan nada dasar atau frekuensi fundamental yang kuat, dalam hal ini yaitu instrumen bass dan biola.
  Dengan mengidentifikasi frekuensi-frekuensi yang memiliki amplitudo tinggi, kita bisa mengetahui nada atau pitch utama yang ada dalam sinyal.

2. **Rentang Frekuensi Sinyal**
  
  Grafik menunjukkan bahwa sebagian besar energi sinyal berada di bawah 5000 Hz, dan setelahnya amplitudo cenderung menurun hingga mendekati nol. Hal ini menunjukkan bahwa sinyal memiliki frekuensi yang terbatas pada rentang ini.
  Untuk musik, rentang ini umum pada banyak jenis instrumen. Ini juga menunjukkan bahwa frekuensi tinggi (>10,000 Hz) mungkin tidak terlalu signifikan dalam sinyal ini, atau bisa jadi hanya ada sedikit informasi pada frekuensi tersebut.

3. **Kualitas dan Karakterisrik Sumber Suara**

  Dari distribusi amplitudo pada frekuensi rendah hingga menengah,  Suara yang didominasi oleh frekuensi rendah biasanya berasal dari instrumen bass atau drum, sedangkan suara bernada tinggi cenderung berasal dari instrumen seperti biola atau seruling.
  Dalam spektrum ini, karena amplitudo di frekuensi rendah sangat dominan, ini bisa mengindikasikan bahwa sinyal mungkin berasal dari instrumen dengan suara rendah atau sinyal suara manusia yang memiliki rentang frekuensi dasar di area tersebut.

4. **Intensitas Sinyal**

  Amplitudo pada sumbu y menunjukkan intensitas atau kekuatan sinyal pada setiap frekuensi. Dengan mengamati amplitudo ini, kita dapat mengetahui pada frekuensi mana sinyal memiliki energi paling besar. Semakin tinggi amplitudo pada frekuensi tertentu, semakin besar kontribusi frekuensi tersebut dalam sinyal asli.

5. **Bandwith dan Spektrum SInyal**

  Spektrum frekuensi ini juga mengindikasikan bandwidth sinyal, yaitu rentang frekuensi di mana energi sinyal terkonsentrasi. Sinyal dengan bandwidth rendah umumnya terdengar lebih "mellow" atau lebih terfokus pada frekuensi rendah, sementara sinyal dengan bandwidth lebar bisa terdengar lebih "terbuka" dan kaya akan komponen frekuensi tinggi.
  Pemahaman mengenai bandwidth sinyal berguna dalam kompresi atau pengiriman sinyal, karena kita dapat membuang frekuensi yang tidak penting atau tidak memiliki energi berarti tanpa mengurangi kualitas secara signifikan.



# **Pra-Pemrosesan**

```
jelaskan langkah-langkah pra-pemrosesan yang diperlukan untuk mengolah sinyal tersebut. Misalkan filtering, normalisasi, dsb. Sesuaikan dengan kebutuhan tiap proyek.
```

Sebelum melakukan pemrosesan lebih lanjut pada sinyal audio, ada beberapa langkah pra-pemrosesan yangkami lakukan untuk memastikan bahwa sinyal tersebut siap untuk diproses dengan baik. Kami melakukan filtering dan normalisasi untuk proses pra-pemrosesan pada proyek ini. Langkah-langkah pra-pemrosesan ini membantu untuk meminimalkan gangguan dan distorsi pada sinyal yang akan dipisahkan.


1. **Filtering**
adalah teknik yang digunakan untuk memisahkan atau menghilangkan komponen frekuensi tertentu dalam sinyal audio. Tujuan dari filtering adalah untuk memastikan bahwa hanya komponen frekuensi yang relevan yang tetap ada, sementara komponen frekuensi lainnya dihilangkan. Pada proyek ini kami menggunakan teknik filtering digital dengan menggunakan **filter Butterworth** yang diterapkan pada sinyal audio. Filter Butterworth adalah jenis filter yang memiliki respons frekuensi yang sangat halus (tanpa ripple) di sekitar cutoff-nya, sehingga sangat cocok untuk aplikasi seperti ini di mana kita menginginkan transisi yang halus antara frekuensi yang dibatasi oleh filter. Selain itu, kami menggunakan dua jenis filter untuk memisahkan suara bass dan biola berdasarkan rentang frekuensinya.

* **Low-pass Filter** untuk Double Bass: Filter jenis ini digunakan untuk memisahkan suara double bass dari sinyal campuran. Low-pass filter membiarkan frekuensi rendah (double bass) lewat dan menghilangkan frekuensi yang lebih tinggi, seperti suara biola. Kami memilih cutoff frequency untuk double bass yang berada di rentang frekuensi sekitar 150 Hz hingga 400 Hz, yang merupakan rentang frekuensi utama dari instrumen double bass. Filter Butterworth orde ke-4 digunakan dengan normalized_cutoff, yang merupakan nilai cutoff yang dinormalisasi dengan frekuensi Nyquist (setengah dari frekuensi sampling). Dengan filter ini, suara double bass akan tetap utuh, sementara suara biola yang berada di frekuensi lebih tinggi akan hilang.

* **High-pass Filter** untuk Biola: Sebaliknya, filter high-pass digunakan untuk memisahkan suara biola dengan membiarkan frekuensi tinggi (biola) melalui dan menghilangkan suara double bass yang berada pada frekuensi lebih rendah. Filter ini akan memblokir frekuensi yang lebih rendah dari 2000 Hz yang umumnya terkait dengan suara double bass, sementara suara biola yang memiliki frekuensi lebih tinggi tetap dipertahankan. Sama seperti low-pass, filter high-pass juga menggunakan filter Butterworth orde ke-4 dengan cutoff yang telah dinormalisasi.

Proses filtering ini membantu memisahkan dua instrumen tersebut dengan efektif, berdasarkan frekuensi masing-masing.

2. **Normalisasi**
Setelah melakukan filtering, langkah berikutnya adalah normalisasi sinyal audio. Normalisasi bertujuan untuk memastikan bahwa amplitudo sinyal berada dalam rentang yang dapat diterima, misalnya antara -1 dan 1. Hal ini penting agar sinyal tidak terlalu keras (yang bisa menyebabkan distorsi) atau terlalu lemah (yang bisa membuat audio sulit didengar).

* Amplitudo yang terlalu rendah setelah pemisahan dapat menyebabkan suara yang sangat lemah dan kurang jelas. Misalnya, setelah pemisahan suara double bass atau biola dengan filtering, amplitudo pada sinyal yang dihasilkan seringkali menjadi kecil. Normalisasi memastikan bahwa amplitudo tersebut diperbesar kembali ke rentang yang optimal.

* Amplitudo yang terlalu tinggi setelah pemisahan, di sisi lain, bisa menyebabkan clipping atau distorsi audio. Dengan normalisasi, kita mencegah sinyal mencapai level yang bisa menyebabkan kliping, menjaga kualitas audio tetap baik.

Melalui normalisasi, kita dapat memastikan bahwa sinyal audio yang telah dipisahkan masih berada pada tingkat kekuatan suara yang dapat diterima tanpa kehilangan kualitas.

### Implementasi Code Filtering

In [None]:
import numpy as np
import scipy.signal as signal
import scipy.io.wavfile as wav
import matplotlib.pyplot as plt
from scipy.fft import fft, ifft, fftfreq
import soundfile as sf

# Fungsi untuk menerapkan filter
def apply_filter(audio, sr, filter_type, cutoff):
    nyquist = sr / 2
    normalized_cutoff = cutoff / nyquist

    if filter_type == "lowpass":
        b, a = signal.butter(4, normalized_cutoff, btype="low")
    elif filter_type == "highpass":
        b, a = signal.butter(4, normalized_cutoff, btype="high")
    else:
        raise ValueError("Filter type harus 'lowpass' atau 'highpass'.")

    filtered_audio = signal.filtfilt(b, a, audio)
    return filtered_audio

# Baca file audio
input_file = "falling.mp3"
audio, sr = sf.read(input_file)

# Pastikan audio mono
if len(audio.shape) > 1:
    audio = np.mean(audio, axis=1)

# Pisahkan Bass dan Biola
bass_audio = apply_filter(audio, sr, filter_type="lowpass", cutoff=400)  # Low-pass untuk bass
violin_audio = apply_filter(audio, sr, filter_type="highpass", cutoff=2000)  # High-pass untuk biola

# Simpan hasil
sf.write("bass_filtering.wav", bass_audio, sr)
sf.write("violin_filtering.wav", violin_audio, sr)

print("Hasil telah berhasil di simpan")

# Visualisasi hasil dari filtering
time = np.linspace(0, len(audio) / sr, num=len(audio))

plt.figure(figsize=(12, 8))
plt.subplot(3, 1, 1)
plt.plot(time, audio, label="Campuran (Bass + Biola)")
plt.legend()
plt.title("Campuran (Bass + Biola)")

plt.subplot(3, 1, 2)
plt.plot(time, bass_audio, label="Bass (Low-pass Filter)", color="r")
plt.legend()
plt.title("Bass")

plt.subplot(3, 1, 3)
plt.plot(time, violin_audio, label="Biola (High-pass Filter)", color="g")
plt.legend()
plt.title("Biola")

plt.tight_layout()
plt.show()


Hasil Filtering Menggunakan **Butterworth**

In [None]:
from IPython.display import Audio, display

# Path ke file audio
file_path_1 = 'bass_filtering.wav'
file_path_2 = 'violin_filtering.wav'
# Membuat objek Audio untuk masing-masing file
audio_1 = Audio(file_path_1)
audio_2 = Audio(file_path_2)

# Menampilkan pemutar audio untuk kedua file
display(audio_1)
display(audio_2)



### Implementasi Code Normalisasi

In [None]:
import numpy as np
import matplotlib.pyplot as plt
import soundfile as sf

# Fungsi untuk normalisasi
def normalize_audio(audio):
    max_amplitude = np.max(np.abs(audio))
    normalized_audio = audio / max_amplitude
    return normalized_audio

# Baca file audio asli (sebelum difilter)
original_audio, sr = librosa.load("falling.mp3", sr=None)

# Baca file audio yang sudah difilter (hasil filter sebelumnya)
bass_audio, sr = sf.read("bass_filtering.wav")  # Bass hasil filter lowpass
violin_audio, sr = sf.read("violin_filtering.wav")  # Biola hasil filter highpass

# Normalisasi hasil filtering
bass_normalized = normalize_audio(bass_audio)
violin_normalized = normalize_audio(violin_audio)

# Simpan hasil normalisasi ke file audio baru
sf.write("bass_norm.wav", bass_normalized, sr)
sf.write("violin_norm.wav", violin_normalized, sr)

print("Hasil normalisasi telah berhasil disimpan")

# Visualisasi hasil Normalisasi
time = np.linspace(0, len(bass_audio) / sr, num=len(bass_audio))

plt.figure(figsize=(12, 8))
plt.subplot(3, 1, 1)
plt.plot(time,  original_audio, label="Audio Asli")
plt.legend()
plt.title("Sebelum Filtering dan Normalisasi")

plt.subplot(3, 1, 2)
plt.plot(time, bass_normalized, label="Bass (Normalized)", color="r")
plt.legend()
plt.title("Bass (Normalized)")

plt.subplot(3, 1, 3)
plt.plot(time, violin_normalized, label="Violin (Normalized)", color="g")
plt.legend()
plt.title("Biola (Normalized)")

plt.tight_layout()
plt.show()


Hasil Normalisasi

In [None]:
from IPython.display import Audio, display

# Path ke file audio
file_path_1 = 'bass_norm.wav'
file_path_2 = 'violin_norm.wav'
# Membuat objek Audio untuk masing-masing file
audio_1 = Audio(file_path_1)
audio_2 = Audio(file_path_2)

# Menampilkan pemutar audio untuk kedua file
display(audio_1)
display(audio_2)



# **Ekstraksi Fitur**

```
Jelaskan fitur apa yang ingin diekstraksi dan mengapa. Berikan statement pendukung dari artikel terkait
```

Fitur yang kami ekstrasi untuk proyek ini yaitu Zero-Crossing Rate (ZCR) dan Spectral Centroid. Adapun penjelasan dan alasan kami memilih fitur ini sebagai berikut:

1. **Zero-Crossing Rate (ZCR)** - **Domain Waktu**

  ZCR mengukur seberapa sering sinyal audio melewati sumbu nol (dari positif ke negatif atau sebaliknya) dalam suatu interval waktu. Nilai ZCR mencerminkan frekuensi osilasi atau ritme sinyal audio.

  **Alasan:**
  - Bass memiliki frekuensi rendah dan perubahan amplitudo yang lebih lambat,
  menghasilkan ZCR yang rendah.
  - Biola memiliki frekuensi tinggi dan osilasi cepat, menghasilkan ZCR yang lebih tinggi.
  - Membantu membedakan tekstur temporal dari suara bass (frekuensi rendah dan crossing jarang) dan biola (frekuensi tinggi dengan crossing lebih sering).

  **Statement Pendukung:** ZCR efektif untuk mendeteksi karakteristik suara impulsif dan kontinu, seperti dalam pengelompokan musik berbasis genre atau karakteristik suara​.


2. **Spectral Centroid** - **Domain Frekuensi**

  Spectral Centroid mengukur "pusat massa" spektrum frekuensi suatu sinyal audio. Nilai ini mencerminkan distribusi energi pada spektrum frekuensi, sering dikaitkan dengan persepsi kecerahan suara.

  **Alasan:**
  - Bass cenderung menghasilkan nada berat dan suara "gelap", sehingga memiliki spectral centroid yang rendah karena konsentrasi energinya (distribusi energi) berada pada frekuensi rendah.
  - Biola cenderung menghasilkan nada tinggi dan suara "terang", sehingga distribusi energi biola berada pada frekuensi tinggi dan menyebabkan memiliki spektral centroid yang lebih tinggi.
  - Membantu pemisahan instrumen berdasarkan karakteristik spektral mereka, seperti dominasi frekuensi rendah untuk bass dan frekuensi tinggi untuk biola.

  **Statement Pendukung:** Dalam analisis musik dan pengenalan suara, spectral centroid digunakan untuk mengklasifikasikan instrumen berdasarkan spektrum frekuensinya dan telah terbukti efektif dalam membedakan instrumen dengan karakter spektral yang berbeda​.



  #### **Link Sumber:**  [jurnal pendukung]( https://repository.unej.ac.id/bitstream/handle/123456789/99906/Moch%20Arifudin%20Syahrul%20Maulud151810201049_.pdf?sequence=1&isAllowed=y )

In [None]:
import librosa
import librosa.display
import numpy as np
import pandas as pd

### Zero-Crossing Rate

In [None]:
# Fungsi untuk ekstraksi Zero-Crossing Rate (ZCR)
def extract_zcr(audio):
    # Ekstraksi Zero-Crossing Rate (ZCR)
    zcr = librosa.feature.zero_crossing_rate(audio)

    # Menghitung rata-rata ZCR
    zcr_mean = np.mean(zcr)

    return zcr_mean

# Menggunakan fungsi untuk bass dan biola
bass_zcr = extract_zcr(bass_normalized)
violin_zcr = extract_zcr(violin_normalized)

# Menampilkan hasil ZCR
print("Zero-Crossing Rate untuk Bass (Normalized):", bass_zcr)
print("Zero-Crossing Rate untuk Biola (Normalized):", violin_zcr)

In [None]:
# ZCR per frame untuk bass dan violin
bass_zcr_per_frame = librosa.feature.zero_crossing_rate(bass_normalized)[0]
violin_zcr_per_frame = librosa.feature.zero_crossing_rate(violin_normalized)[0]

# Waktu per frame
frames = range(len(bass_zcr_per_frame))
times = librosa.frames_to_time(frames, sr=sr)

# Plot ZCR
plt.figure(figsize=(12, 6))
plt.plot(times, bass_zcr_per_frame, label="Bass ZCR", color="r")
plt.plot(times, violin_zcr_per_frame, label="Violin ZCR", color="g")
plt.xlabel("Time (s)")
plt.ylabel("Zero-Crossing Rate")
plt.title("Zero-Crossing Rate (ZCR) Over Time")
plt.legend()
plt.show()

### Spectral Centroid


In [None]:
# Fungsi untuk ekstraksi Spectral Centroid
def extract_spectral_centroid(audio, sr):
    # Ekstraksi Spectral Centroid
    spectral_centroid = librosa.feature.spectral_centroid(y=audio, sr=sr)

    # Menghitung rata-rata Spectral Centroid
    spectral_centroid_mean = np.mean(spectral_centroid)

    return spectral_centroid_mean

# Menggunakan fungsi untuk bass dan biola
bass_spectral_centroid = extract_spectral_centroid(bass_normalized, sr)
violin_spectral_centroid = extract_spectral_centroid(violin_normalized, sr)

# Menampilkan hasil Spectral Centroid
print("Spectral Centroid untuk Bass (Normalized):", bass_spectral_centroid)
print("Spectral Centroid untuk Biola (Normalized):", violin_spectral_centroid)

In [None]:
# Menghitung Spectral Centroid per frame
bass_spectral_centroid_frames = librosa.feature.spectral_centroid(y=bass_normalized, sr=sr)[0]
violin_spectral_centroid_frames = librosa.feature.spectral_centroid(y=violin_normalized, sr=sr)[0]

# Waktu untuk setiap frame
times = librosa.frames_to_time(range(len(bass_spectral_centroid_frames)), sr=sr)

# Plot Spectral Centroid untuk Bass dan Violin
plt.figure(figsize=(12, 6))

plt.plot(times, bass_spectral_centroid_frames, label="Bass Spectral Centroid", color="r")
plt.plot(times, violin_spectral_centroid_frames, label="Violin Spectral Centroid", color="g")

plt.xlabel("Time (s)")
plt.ylabel("Spectral Centroid (Hz)")
plt.title("Spectral Centroid untuk Bass dan Violin")
plt.legend()
plt.show()

# **Analisis**

jelaskan langkah-langkah dan hasil analisis dari pengolahan sinyal tersebut. Analisis dapat berupa:
*   Perbandingan kondisi normal dan abnormal
*   Signal-to-Noise-Ratio
*   Sinyal sebelum dan sesudah treatment
*   dst

sesuaikan dengan tujuan pengolahan sinyal



### SIGNAL-TO-NOISE-RATIO

In [None]:
import numpy as np
import scipy.signal as signal
import matplotlib.pyplot as plt
from scipy.fft import fft, fftfreq
import soundfile as sf

# Fungsi untuk menerapkan filter
def apply_filter(audio, sr, filter_type, cutoff):
    nyquist = sr / 2
    normalized_cutoff = cutoff / nyquist

    if filter_type == "lowpass":
        b, a = signal.butter(4, normalized_cutoff, btype="low")
    elif filter_type == "highpass":
        b, a = signal.butter(4, normalized_cutoff, btype="high")
    else:
        raise ValueError("Filter type harus 'lowpass' atau 'highpass'.")

    filtered_audio = signal.filtfilt(b, a, audio)
    return filtered_audio

# Fungsi untuk menghitung SNR
def calculate_snr(original, filtered):
    noise = original - filtered
    signal_power = np.sum(filtered ** 2)
    noise_power = np.sum(noise ** 2)
    snr = 10 * np.log10(signal_power / noise_power)
    return snr

# Fungsi untuk menghitung energi sinyal
def calculate_energy(audio):
    return np.sum(audio ** 2)

# Fungsi untuk menghitung spektrum frekuensi
def calculate_spectrum(audio, sr):
    N = len(audio)
    freq = fftfreq(N, 1 / sr)
    spectrum = np.abs(fft(audio)) / N
    return freq[:N // 2], spectrum[:N // 2]

# Baca file audio
input_file = "falling.mp3"
audio, sr = sf.read(input_file)

# Pastikan audio mono
if len(audio.shape) > 1:
    audio = np.mean(audio, axis=1)

# Pisahkan Bass dan Biola
bass_audio = apply_filter(audio, sr, filter_type="lowpass", cutoff=400)  # Low-pass untuk bass
violin_audio = apply_filter(audio, sr, filter_type="highpass", cutoff=2000)  # High-pass untuk biola

# Analisis SNR
bass_snr = calculate_snr(audio, bass_audio)
violin_snr = calculate_snr(audio, violin_audio)

# Analisis Energi
original_energy = calculate_energy(audio)
bass_energy = calculate_energy(bass_audio)
violin_energy = calculate_energy(violin_audio)

# Spektrum Frekuensi
freq, original_spectrum = calculate_spectrum(audio, sr)
_, bass_spectrum = calculate_spectrum(bass_audio, sr)
_, violin_spectrum = calculate_spectrum(violin_audio, sr)

# Cetak hasil analisis
print("=== Analisis Sinyal ===")
print(f"Energy Original: {original_energy:.2f}")
print(f"Energy Bass: {bass_energy:.2f}")
print(f"Energy Violin: {violin_energy:.2f}")
print(f"SNR Bass: {bass_snr:.2f} dB")
print(f"SNR Violin: {violin_snr:.2f} dB")

# Visualisasi Spektrum Frekuensi
plt.figure(figsize=(12, 8))

# Spektrum Sinyal Original
plt.subplot(3, 1, 1)
plt.plot(freq, original_spectrum, label="Original", color="b")
plt.title("Spektrum Frekuensi - Original")
plt.xlabel("Frekuensi (Hz)")
plt.ylabel("Amplitudo")
plt.legend()

# Spektrum Sinyal Bass
plt.subplot(3, 1, 2)
plt.plot(freq, bass_spectrum, label="Bass", color="r")
plt.title("Spektrum Frekuensi - Bass")
plt.xlabel("Frekuensi (Hz)")
plt.ylabel("Amplitudo")
plt.legend()

# Spektrum Sinyal Violin
plt.subplot(3, 1, 3)
plt.plot(freq, violin_spectrum, label="Violin", color="g")
plt.title("Spektrum Frekuensi - Violin")
plt.xlabel("Frekuensi (Hz)")
plt.ylabel("Amplitudo")
plt.legend()

plt.tight_layout()
plt.show()


Analisis Sinyal :
1. Filtering **low-pass** dan **high-pass** berhasil memisahkan dua instrumen yang tumpang tindih dalam sinyal campuran, dengan bass terfokus pada frekuensi rendah dan biola pada frekuensi tinggi. Ini menunjukkan bahwa filtering efektif dalam isolasi instrumen berdasarkan karakteristik frekuensinya.

2. Filtering meningkatkan kualitas sinyal dengan mengurangi noise. Nilai **SNR** yang tinggi setelah filtering menunjukkan bahwa komponen suara yang relevan (bass dan biola) berhasil dipertahankan, sementara noise diminimalisasi.

3. Energi yang hilang pada frekuensi yang tidak relevan (terutama pada bass dan biola yang telah difilter) menunjukkan bahwa filtering berhasil mengisolasi komponen yang sesuai, meningkatkan kejelasan masing-masing instrumen.

4. Setelah filtering, spektrum frekuensi menunjukkan pemisahan yang jelas antara bass (frekuensi rendah) dan biola (frekuensi tinggi). Ini mengindikasikan bahwa proses filtering berhasil memisahkan kedua instrumen berdasarkan frekuensinya dengan sangat baik.



### Sinyal sebelum dan sesudah treatment

In [None]:
# Sinyal Sebelum dan Sesudah Treatment
time = np.linspace(0, len(audio) / sr, num=len(audio))

plt.figure(figsize=(12, 8))

# Plot Campuran (Bass + Biola)
plt.plot(time, audio, label="Sebelum Treatment", alpha=0.6)

# Plot Bass (Low-pass Filter, Normalized)
plt.plot(time, bass_normalized, label="Bass (Low-pass Filter, Normalized)", color="r")

# Plot Biola (High-pass Filter, Normalized)
plt.plot(time, violin_normalized, label="Biola (High-pass Filter, Normalized)", color="g")

# Menambahkan legenda dan judul
plt.legend()
plt.title("Sinyal sebelum dan sesudah treatment")

# Menyesuaikan layout dan menampilkan plot
plt.tight_layout()
plt.show()

1. **Sinyal Sebelum Treatment (Campuran Asli)**
- Sinyal berwarna biru dalam grafik adalah sinyal campuran asli yang mengandung kedua instrumen, yaitu bass dan biola, dalam satu file audio. Ini adalah sinyal yang belum diproses. Pada grafik ini, kita dapat melihat bentuk gelombang dari sinyal audio yang mencampurkan kedua instrumen. Kedua instrumen ini memiliki frekuensi yang sangat berbeda. Bass memiliki frekuensi rendah (biasanya di bawah 400 Hz), sedangkan biola memiliki frekuensi tinggi (di atas 2000 Hz). Tujuan dari grafik ini digunakan untuk menunjukkan bagaimana bentuk gelombang sinyal asli sebelum dilakukan pemrosesan lebih lanjut, seperti filtering atau normalisasi.

2. **Sinyal Setelah Treatment (Filtering dan Normalisasi)**
- Setelah proses filtering dan normalisasi, sinyal audio mengalami perubahan signifikan untuk meningkatkan kualitas dan memisahkan instrumen secara jelas. Filtering menggunakan low-pass filter dengan cutoff sekitar 400 Hz berhasil memisahkan suara bass dari sinyal campuran, menghilangkan frekuensi tinggi (biola) dan meninggalkan hanya komponen bass, yang biasanya lebih halus dan tidak berisik.
- Di sisi lain, high-pass filter dengan cutoff sekitar 2000 Hz berhasil memisahkan suara biola, menghilangkan frekuensi rendah (bass) dan hanya membiarkan suara biola yang terdengar jelas. Namun, setelah proses pemisahan ini, amplitudo dari kedua sinyal (double bass dan biola) sering kali tidak seimbang dan bisa jadi sangat rendah.
- Oleh karena itu, normalisasi diterapkan untuk memastikan bahwa amplitudo kedua sinyal berada dalam rentang optimal, meningkatkan kualitas audio. Normalisasi meningkatkan amplitudo bass yang mungkin lebih rendah dari yang diinginkan, sehingga lebih mudah didengar dan seimbang dengan biola. Hal yang sama dilakukan untuk biola, memastikan amplitudo sinyal biola tidak terlalu lemah atau keras, memberikan kualitas audio yang lebih baik dan lebih seimbang.

3. **Perbandingan Sinyal Sebelum dan Sesudah Treatment**
- Sebelum dilakukan filtering sinyal campuran adalah gabungan dari bass dan biola yang memiliki frekuensi yang sangat berbeda. Bentuk gelombangnya lebih rumit dan mengandung informasi dari kedua instrumen.
Setelah filtering sinyal bass dan biola sudah dipisahkan dengan jelas. Sinyal bass hanya berisi frekuensi rendah, sementara sinyal biola berisi frekuensi tinggi. Namun, tanpa normalisasi, amplitudo sinyal ini bisa sangat bervariasi dan kurang optimal untuk pendengaran.
- Setelah normalisasi setelah normalisasi, amplitudo sinyal bass dan biola disesuaikan agar lebih konsisten dan berada dalam rentang yang dapat diterima tanpa distorsi. Kedua sinyal, bass dan biola, akan lebih mudah didengar dan lebih seimbang, memberikan kualitas audio yang lebih baik.


In [None]:
# Fungsi untuk transformasi dan plot FFT
def plot_fft(audio_signal, sr, label, color):
    N = len(audio_signal)  # panjang sinyal
    yf = fft(audio_signal)  # FFT
    xf = np.fft.fftfreq(N, 1 / sr)  # Frekuensi terkait dengan setiap titik FFT

    # Plot hanya untuk frekuensi positif
    plt.plot(xf[:N // 2], 2.0 / N * np.abs(yf[:N // 2]), label=label, color=color)

# Visualisasi Spektrum Frekuensi menggunakan FFT
plt.figure(figsize=(12, 6))

# Plot FFT untuk audio asli, bass, dan violin setelah normalisasi
plot_fft(audio, sr, label="Sebelum Treatment", color='blue')
plot_fft(bass_normalized, sr, label="Bass (Setelah Treatment)", color='red')
plot_fft(violin_normalized, sr, label="Violin (Setelah Treatment)", color='green')

# Menambahkan label, judul, dan grid
plt.title("Spektrum Frekuensi Sinyal Audio (FFT)")
plt.xlabel("Frekuensi (Hz)")
plt.ylabel("Amplitudo")
plt.legend()
plt.grid(True)
plt.tight_layout()
plt.show()

Grafik di atas memberikan representasi tentang bagaimana frekuensi sinyal audio dapat dimodifikasi dan dipisahkan melalui proses filtering dan normalisasi. Garis biru, yang mencerminkan sinyal campuran asli, menunjukkan sinyal gabungan double bass dan biola, di mana frekuensi rendah dan tinggi saling bertumpuk, menciptakan sebuah spektrum yang penuh. Setelah dilakukan filtering, garis merah yang mewakili double bass menunjukkan pengurangan signifikan pada frekuensi tinggi, meninggalkan hanya frekuensi rendah yang relevan, yang mencirikan nada-nada mendalam dan berat dari instrumen tersebut. Di sisi lain, garis hijau yang menunjukkan hasil filtering biola memperlihatkan dominasi frekuensi tinggi, mencerminkan karakteristik suara biola yang tajam, jernih, dan melengking.

Selain filtering, proses normalisasi turut memastikan bahwa hasil sinyal tetap memiliki level amplitudo yang konsisten, meskipun telah terjadi penghilangan komponen frekuensi tertentu. Hal ini penting untuk menjaga kualitas audio sehingga output tetap terdengar alami dan tidak terlalu lemah atau terlalu keras. Visualisasi ini tidak hanya menegaskan keberhasilan proses filtering, tetapi juga memberikan wawasan tentang peran penting normalisasi dalam memastikan sinyal yang telah difilter tetap optimal untuk didengarkan atau dianalisis lebih lanjut.

# **Kesimpulan**

## Hasil Akhir Proyek

In [None]:
from IPython.display import Audio, display

# Path ke file audio

file_audio_asli = 'falling.mp3'
file_hasil_bass = 'bass_norm.wav'
file_hasil_biola = 'violin_norm.wav'
# Membuat objek Audio untuk masing-masing file
audio_1 = Audio(file_audio_asli)
audio_2 = Audio(file_hasil_bass)
audio_3 = Audio(file_hasil_biola)

# Menampilkan pemutar audio untuk kedua file
display(audio_1)
display(audio_2)
display(audio_3)

```
Tuliskan kesimpulan di sini (3 - 5 kalimat)
```

Proses pemisahan suara double bass dan biola dari sinyal campuran berhasil dilakukan melalui langkah-langkah terstruktur. Akuisisi data memastikan sinyal siap diolah, sementara visualisasi domain waktu dan frekuensi membantu memahami karakteristik awal sinyal sehingga memudahkan dalam pengolahannya. Filtering dengan teknik Butterworth filter dimana kami menggunakan Lowpass dan highpass filter dan normalisasi yang tujuannya memisahkan jenis instrumen berdasarkan frekuensi dengan efektif, diikuti ekstraksi fitur seperti Zero Crossing Rate dan Spectral Centroid untuk analisis mendalam. Signal-to-Noise Ratio (SNR) menunjukkan peningkatan kejelasan sinyal setelah filtering, mempertegas efektivitas proses pra-pemrosesan. Secara keseluruhan, proses ini tidak hanya menghasilkan sinyal yang terpisah dengan baik tetapi juga memungkinkan analisis lanjutan terhadap karakteristik kedua instrumen.


