## Chapter 4: Hearing

### 4.2 Psychoacoustics

#### 4.2.1 Equal loudness contours

In [1]:
def tonegen(Ft, Fs, Td):
    # 시간 벡터 생성
    t = np.arange(1, Fs * Td + 1) / Fs
    # 사인파 생성
    s = np.sin(2 * np.pi * Ft * t)
    return s

In [2]:
import numpy as np
import sounddevice as sd

# 톤 생성
# 교재에서는 원래 sampling rate가 441000Hz인데, 여기에서는 오디오 하드웨어에서 지원하지 않아 44100Hz로 변경함
lo = tonegen(250, 44100, 2)    # 250Hz 톤
mi = tonegen(1200, 44100, 2)   # 1200Hz 톤
hi = tonegen(11000, 44100, 2)  # 11000Hz 톤

# 톤 재생
sd.play(lo / np.max(np.abs(lo)), samplerate=44100)  # lo 톤 재생
sd.wait()  # 재생이 끝날 때까지 대기

sd.play(mi / np.max(np.abs(mi)), samplerate=44100)  # mi 톤 재생
sd.wait()  # 재생이 끝날 때까지 대기

sd.play(hi / np.max(np.abs(hi)), samplerate=44100)  # hi 톤 재생
sd.wait()  # 재생이 끝날 때까지 대기

#### 4.2.8 Masking

In [3]:
# 톤 생성
lo = 0.2 * tonegen(800, 8000, 2)  # 0.2배 크기의 800Hz 톤
hi = tonegen(880, 8000, 2)        # 880Hz 톤

# 출력 예시 (첫 10개 샘플 확인)
print("Low tone (lo):", lo[:10])
print("High tone (hi):", hi[:10])

Low tone (lo): [ 1.17557050e-01  1.90211303e-01  1.90211303e-01  1.17557050e-01
  2.44929360e-17 -1.17557050e-01 -1.90211303e-01 -1.90211303e-01
 -1.17557050e-01 -4.89858720e-17]
High tone (hi): [ 0.63742399  0.98228725  0.87630668  0.36812455 -0.30901699 -0.84432793
 -0.9921147  -0.68454711 -0.06279052  0.58778525]


In [4]:
# 사운드 재생 (lo/2, hi/2, (lo+hi)/2)
sd.play(lo / 2, samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

sd.play(hi / 2, samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

sd.play((lo + hi) / 2, samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

#### 4.2.11 Frequency discrimination

In [5]:
# 톤 생성
t1 = tonegen(1000, 8000, 2)  # 1000Hz 톤 생성 (2초)
t2 = tonegen(1002, 8000, 2)  # 1002Hz 톤 생성 (2초)

# 사운드 재생
sd.play(t1 / np.max(np.abs(t1)), samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

sd.play(t2 / np.max(np.abs(t2)), samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

#### 4.2.12 Pitch of complex tones

In [6]:
# 톤 생성
t1 = tonegen(196, 8000, 2)       # 196Hz 톤 생성 (2초)
t2 = tonegen(196 * 2, 8000, 2)   # 392Hz 톤 생성 (2초)
t3 = tonegen(196 * 3, 8000, 2)   # 588Hz 톤 생성 (2초)
t4 = tonegen(196 * 4, 8000, 2)   # 784Hz 톤 생성 (2초)

# 출력 확인 (예시로 첫 10개의 샘플 출력)
print("Tone t1 (196Hz):", t1[:10])
print("Tone t2 (392Hz):", t2[:10])
print("Tone t3 (588Hz):", t3[:10])
print("Tone t4 (784Hz):", t4[:10])

Tone t1 (196Hz): [0.15333078 0.30303527 0.44557292 0.5775727  0.6959128  0.79779444
 0.88080811 0.94299054 0.98287108 0.99950656]
Tone t2 (392Hz): [0.30303527 0.5775727  0.79779444 0.94299054 0.99950656 0.96202767
 0.83407843 0.62769136 0.36227537 0.06279052]
Tone t3 (588Hz): [ 0.44557292  0.79779444  0.98287108  0.96202767  0.73963109  0.36227537
 -0.0909802  -0.52517463 -0.8493404  -0.99556196]
Tone t4 (784Hz): [ 0.5775727   0.94299054  0.96202767  0.62769136  0.06279052 -0.52517463
 -0.92023185 -0.97726812 -0.67533281 -0.12533323]


In [7]:
# 톤 t1 재생
sd.play(t1 / np.max(np.abs(t1)), samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

# t1 + t2 + t3 + t4 재생
combined1 = t1 + t2 + t3 + t4
sd.play(combined1 / np.max(np.abs(combined1)), samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

# t2 + t3 + t4 재생
combined2 = t2 + t3 + t4
sd.play(combined2 / np.max(np.abs(combined2)), samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

#### 4.2.14 Mistuning of harmonics

In [8]:
# 기본 노트와 변형된 노트 계산
note = 440  # 기본 주파수 (440Hz, A4)

# 첫 번째 톤 (440Hz)
t1 = tonegen(note, 8000, 1)  # 1초 동안의 440Hz 톤

# 두 번째 톤 (음정이 3/12만큼 증가한 톤)
t2 = tonegen(note * 2 ** (3/12), 8000, 1)  # 1초 동안의 조정된 톤

# 세 번째 톤 (음정이 8/12만큼 증가한 톤)
t3 = tonegen(note * 2 ** (8/12), 8000, 1)  # 1초 동안의 조정된 톤

# 출력 확인 (첫 10개의 샘플 출력)
print("Tone t1 (440Hz):", t1[:10])
print("Tone t2 (adjusted 3/12):", t2[:10])
print("Tone t3 (adjusted 8/12):", t3[:10])

Tone t1 (440Hz): [ 0.33873792  0.63742399  0.86074203  0.98228725  0.98768834  0.87630668
  0.66131187  0.36812455  0.03141076 -0.30901699]
Tone t2 (adjusted 3/12): [ 0.39949002  0.732455    0.94344797  0.99733336  0.8851379   0.62554493
  0.26178314 -0.14557205 -0.52868588 -0.82376033]
Tone t3 (adjusted 8/12): [ 0.52146453  0.88990317  0.99719609  0.81185774  0.38827642 -0.14924619
 -0.64297191 -0.94801489 -0.97485903 -0.71562681]


In [9]:
# 세 개의 톤을 더하고 정규화
combined_signal = t1 + t2 + t3
combined_signal /= np.max(np.abs(combined_signal))  # 정규화

# 사운드 재생
sd.play(combined_signal, samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

In [10]:
m2 = tonegen(note * 1.05 * 2 ** (3/12), 8000, 1)  # 1.05배 곱한 3/12 음정 증가 톤

# 세 개의 톤을 더하고 정규화
combined_signal = t1 + m2 + t3
combined_signal /= np.max(np.abs(combined_signal))  # 정규화

# 사운드 재생
sd.play(combined_signal, samplerate=8000)
sd.wait()  # 재생이 끝날 때까지 대기

#### 4.2.15 The precedence effect

In [11]:
# 예시: audio 배열과 샘플링 속도 (Fs) 설정
Fs = 8000  # 샘플링 속도 (8kHz)

# 2초 길이의 임의의 오디오 신호 예시 -> 이건 교재 본문에 없음
audio = np.random.randn(Fs * 2)  

# audio를 1D 배열로 변환
audio = np.reshape(audio, (1, len(audio)))[0]

# 에코 추가 및 재생
for echo in np.arange(0.01, 0.1 + 0.020, 0.020):
    pad = np.zeros(int(Fs * echo))  # 에코 패딩
    input('Press any key to hear the next echo')  # 사용자 입력 대기
    
    # 에코 효과 적용 및 신호 결합
    echoed_audio = np.concatenate((audio, pad)) + np.concatenate((pad, audio))
    
    # 오디오 재생
    sd.play(echoed_audio / np.max(np.abs(echoed_audio)), samplerate=Fs)
    sd.wait()  # 재생 완료 대기

Press any key to hear the next echo1
Press any key to hear the next echoa
Press any key to hear the next echo2
Press any key to hear the next echob
Press any key to hear the next echo3
Press any key to hear the next echoc


### 4.3 Amplitude and frequency models

#### 4.3.2 The Bark scale

In [12]:
# f2bark 함수 정의 (Hz -> Bark 변환)
def f2bark(hz):
    cn = 2 * np.pi * hz / (1200 * np.pi)
    bark = 6 * np.log(cn + np.sqrt(cn ** 2 + 1))
    return bark

# bark2f 함수 정의 (Bark -> Hz 변환)
def bark2f(bark):
    hz = 600 * np.sinh(bark / 6)
    return hz

# 예시 사용
hz_value = 1000  # 예시로 1000Hz
bark_value = f2bark(hz_value)
hz_converted_back = bark2f(bark_value)

print(f"Hz to Bark: {hz_value} Hz -> {bark_value} Bark")
print(f"Bark to Hz: {bark_value} Bark -> {hz_converted_back} Hz")

Hz to Bark: 1000 Hz -> 7.702773976459156 Bark
Bark to Hz: 7.702773976459156 Bark -> 1000.0 Hz


### 4.5 Auditory scene analysis

#### 4.5.1 Proximity

In [13]:
# 파라미터 설정
ss = 0.1  # 짧은 사운드 길이 (초)
ls = 0.4  # 긴 사운드 길이 (초)
Fs = 8000  # 샘플링 속도 (Hz)

# 짧은 톤과 긴 톤 생성
short_a = tonegen(440, Fs, ss)  # A4 (440Hz) 짧은 톤
short_b = tonegen(932, Fs, ss)  # B5 (932Hz) 짧은 톤
long_a = tonegen(440, Fs, ls)   # A4 (440Hz) 긴 톤
long_b = tonegen(932, Fs, ls)   # B5 (932Hz) 긴 톤

# 사운드 매트릭스 생성 (alternating sounds)
short_mat = np.concatenate([short_a, short_b])
long_mat = np.concatenate([long_a, long_b])

# 매트릭스 반복
long = np.tile(long_mat, 3)   # 긴 사운드를 3번 반복
short = np.tile(short_mat, 12)  # 짧은 사운드를 12번 반복

In [14]:
# 사운드 재생 (long 신호)
sd.play(long / np.max(np.abs(long)), samplerate=Fs)
sd.wait()  # 재생이 끝날 때까지 대기

In [15]:
# 사운드 재생 (short 신호)
sd.play(short / np.max(np.abs(short)), samplerate=Fs)
sd.wait()  # 재생이 끝날 때까지 대기

#### 4.5.2 Closure

In [16]:
# 파라미터 설정
gs = 0.30  # gap/noise 길이 (초)
ls = 1.50  # 사운드 길이 (초)
Fs = 8000  # 샘플링 속도 (Hz)
fr = 110   # 시작 주파수 (Hz)
to = 880   # 끝 주파수 (Hz)
gap_len = int(Fs * gs)  # gap/noise의 길이
au_len = int(Fs * ls)   # 사운드의 길이

# Gap과 Noise 생성
gap = np.zeros(gap_len)
noise = np.random.rand(gap_len)

# steadily rising note 생성
note_f = np.linspace(fr, to, au_len)  # 주파수가 점점 올라가는 배열

# freqgen 함수 정의
def freqgen(frequencies, Fs):
    t = np.arange(len(frequencies)) / Fs
    return np.sin(2 * np.pi * frequencies * t)

# 사운드 생성
au = freqgen(note_f, Fs)
au_gap = np.copy(au)
au_noise = np.copy(au)

# 사운드에 gap과 noise 추가 (중간에)
au_gap[int(au_len/2):int(au_len/2 + gap_len)] = gap
au_noise[int(au_len/2):int(au_len/2 + gap_len)] = noise

# 사운드 반복
au_gap = np.tile(au_gap, 3)
au_noise = np.tile(au_noise, 3)

In [17]:
# 사운드 재생
sd.play(au_noise / np.max(np.abs(au_noise)), samplerate=Fs)
sd.wait()  # 재생이 끝날 때까지 대기

In [18]:
sd.play(au_gap / np.max(np.abs(au_gap)), samplerate=Fs)
sd.wait()  # 재생이 끝날 때까지 대기

In [19]:
sd.play((np.tile(au, 3) + au_noise) / np.max(np.abs(np.tile(au, 3) + au_noise)), samplerate=Fs)
sd.wait()  # 재생이 끝날 때까지 대기

#### 4.5.3 Common fate

In [20]:
# 파라미터 설정
dur = 1.2  # 사운드 길이 (초)
Fs = 8000  # 샘플링 속도 (Hz)
a = 220  # A 음 (220Hz)
b = a * 2 ** (3/12)  # B 음
c = a * 2 ** (7/12)  # C 음

# 톤 생성 (1옥타브)
sa = tonegen(a, Fs, dur)
sb = tonegen(b, Fs, dur)
sc = tonegen(c, Fs, dur)
sa2 = tonegen(a * 2, Fs, dur)
sb2 = tonegen(b * 2, Fs, dur)
sc2 = tonegen(c * 2, Fs, dur)

# 사운드 1, 2 결합
sound1 = sa + sb + sc
sound2 = sound1 + sa2 + sb2 + sc2

# 모듈레이션 생성
mod1 = tonegen(7, Fs, dur)
mod2 = tonegen(27, Fs, dur)
mod3 = tonegen(51, Fs, dur)

# AM 변조된 사운드
am = mod1 * (sa + sa2)
bm = mod2 * (sb + sb2)
cm = mod3 * (sc + sc2)

In [21]:
# 0.05초의 Gap
gap = np.zeros(int(Fs * 0.05))

# 사운드 3 생성
sound3 = np.concatenate([am, gap, gap]) + np.concatenate([gap, bm, gap]) + np.concatenate([gap, gap, cm])

# 사운드 재생 (정규화)
final_sound = np.concatenate([sound1, sound2, sound3])
final_sound /= np.max(np.abs(final_sound))

# 사운드 재생
sd.play(final_sound, samplerate=Fs)
sd.wait()  # 재생 완료 대기

In [22]:
# AM 변조 재생 (mod1로 변조)
am = mod1 * (sa + sa2)
bm = mod1 * (sb + sb2)
cm = mod1 * (sc + sc2)

# 결합된 AM 사운드 재생
final_am_sound = np.concatenate([am, bm, cm])
final_am_sound /= np.max(np.abs(final_am_sound))
sd.play(final_am_sound, samplerate=Fs)
sd.wait()  # 재생 완료 대기

#### 4.5.4 Good continuation

In [23]:
# freqgen 함수 정의
def freqgen(frequencies, Fs):
    t = np.arange(len(frequencies)) / Fs
    return np.sin(2 * np.pi * frequencies * t)

# 파라미터 설정
Fs = 8000  # 샘플링 속도
n1 = 832  # 첫 번째 주파수 (Hz)
n2 = 350  # 두 번째 주파수 (Hz)
d1 = int(0.1 * Fs)  # 첫 번째 구간의 길이 (샘플 수)
dm = int(0.04 * Fs)  # 중간 구간의 길이 (샘플 수)
d2 = int(0.1 * Fs)  # 두 번째 구간의 길이 (샘플 수)

# a 배열 생성
a = np.concatenate([n1 * np.ones(d1), np.zeros(dm), n2 * np.ones(d2), np.zeros(dm)])

# b 배열 생성
b_ramp_down = n1 - np.arange(1, dm + 1) * (n1 - n2) / dm
b_ramp_up = n2 + np.arange(1, dm + 1) * (n1 - n2) / dm
b = np.concatenate([n1 * np.ones(d1), b_ramp_down, n2 * np.ones(d2), b_ramp_up])

# 사운드 신호 생성
sa = freqgen(a, Fs)
sb = freqgen(b, Fs)

In [24]:
# amp 계산
amp = 0.4 + np.sign(a) / 2

# sa와 sb에 amp를 곱하여 조정
sa = sa * amp
sb = sb * amp

In [25]:
sa_repeated = np.tile(sa, 8)

# 사운드 재생 (sa)
sd.play(sa_repeated / np.max(np.abs(sa_repeated)), samplerate=Fs)
sd.wait()  # 재생이 끝날 때까지 대기

In [26]:
sb_repeated = np.tile(sb, 8)

# 사운드 재생 (sb)
sd.play(sb_repeated / np.max(np.abs(sb_repeated)), samplerate=Fs)
sd.wait()  # 재생이 끝날 때까지 대기