<h2>Работа с аудио</h2>

Научимся читать звуковые файлы с помощью библиотеки pydub.



In [None]:
!wget https://raw.githubusercontent.com/phonetics-spbu/phonetics-spbu.github.io/main/public/courses/python_2_mag/files/s18-27s.wav
!wget https://raw.githubusercontent.com/phonetics-spbu/phonetics-spbu.github.io/main/public/courses/python_2_mag/files/guitar-background-sound.wav


In [None]:
from pydub import AudioSegment
import os

# 1. Загружаем аудиофайл
audio = AudioSegment.from_file("guitar-background-sound.wav")

print("Файл успешно загружен!")

# 2. Узнаем информацию о файле
# Длина в миллисекундах
duration_ms = len(audio)
# Переводим в секунды
duration_seconds = duration_ms / 1000
# Переводим в минуты и секунды
minutes = int(duration_seconds // 60)
seconds = int(duration_seconds % 60)

print(f"📊 ИНФОРМАЦИЯ О ФАЙЛЕ:")
print(f"Длина: {minutes} минут {seconds} секунд")
print(f"Длина в миллисекундах: {duration_ms} мс")
print(f"Частота: {audio.frame_rate} Hz")
print(f"Каналы: {'стерео' if audio.channels > 1 else 'моно'}")

# 3. Сохраняем копию в другом формате
audio.export("copy_of_guitar.wav", format="wav")
print("Копия сохранена как 'copy_of_guitar.wav'")

In [None]:
audio

In [None]:
audio = AudioSegment.from_file("guitar-background-sound.wav")

print("=== ПРОСТЫЕ ОПЕРАЦИИ СО ЗВУКОМ ===")

# 1. Обрезаем звук (первые 3 секунды)
first_3_seconds = audio[:3000]  # 3000 миллисекунд = 3 секунды
first_3_seconds.export("first_3_seconds.wav", format="wav")
print("Обрезали первые 10 секунд")

# 2. Делаем звук тише
quieter = audio - 10  # Уменьшаем громкость на 10 децибел
quieter.export("quieter_version.wav", format="wav")
print("Создали тихую версию")

# 3. Делаем звук громче
louder = audio + 5  # Увеличиваем громкость на 5 децибел
louder.export("louder_version.wav", format="wav")
print("Создали громкую версию")

# 4. Добавляем тишину в начале
silence = AudioSegment.silent(duration=2000)  # 2 секунды тишины
with_silence = silence + audio
with_silence.export("with_silence_at_start.wav", format="wav")
print("Добавили 2 секунды тишины в начало")

In [None]:
first_3_seconds

In [None]:
quieter

In [None]:
louder

In [None]:
with_silence

In [None]:
from pydub.generators import Sine

print("=== СОЗДАЕМ СВОЙ ЗВУК ===")

# Создаем простой тон
# 440 Hz - нота "Ля"
beep = Sine(440).to_audio_segment(duration=1000)  # 1000 мс = 1 секунда

# Сохраняем наш звук
beep.export("my_beep.wav", format="wav")
print("Создан файл 'my_beep.wav'")

# Создаем несколько разных звуков
# Низкий звук
low_beep = Sine(220).to_audio_segment(duration=1000)
low_beep.export("low_beep.wav", format="wav")

# Высокий звук
high_beep = Sine(880).to_audio_segment(duration=1000)
high_beep.export("high_beep.wav", format="wav")

In [None]:
beep

In [None]:
low_beep

In [None]:
high_beep

In [None]:
print("=== СОЗДАЕМ ПРОСТУЮ МЕЛОДИЮ ===")

# Создаем три разных звука (три ноты)
note1 = Sine(261).to_audio_segment(duration=500)  # Нота До (500 мс)
note2 = Sine(329).to_audio_segment(duration=500)  # Нота Ми (500 мс)
note3 = Sine(392).to_audio_segment(duration=500)  # Нота Соль (500 мс)

# Добавляем тишину между нотами (200 миллисекунд)
silence = AudioSegment.silent(duration=200)

# Собираем мелодию: нота1 - тишина - нота2 - тишина - нота3
melody = note1 + silence + note2 + silence + note3

# Сохраняем нашу мелодию
melody.export("simple_melody.wav", format="wav")
print("Мелодия сохранена как 'simple_melody.wav'")

In [None]:
melody

In [None]:
from pydub import AudioSegment
from pydub.generators import Sine
import time

# Создаем тишину разной длины
short_silence = AudioSegment.silent(duration=100)   # 0.1 секунды тишины
medium_silence = AudioSegment.silent(duration=200)  # 0.2 секунды тишины
long_silence = AudioSegment.silent(duration=500)    # 0.5 секунды тишины

# Создаем ноты разной высоты
beep_low = Sine(262).to_audio_segment(duration=300)   # Нота До (300 мс)
beep_medium = Sine(330).to_audio_segment(duration=300) # Нота Ми (300 мс)
beep_high = Sine(392).to_audio_segment(duration=300)  # Нота Соль (300 мс)
beep_very_high = Sine(523).to_audio_segment(duration=300) # Нота До высокой октавы

# МЕЛОДИЯ 1
melody1 = (beep_medium + short_silence +
          beep_high + short_silence +
          beep_very_high + medium_silence +
          beep_high + short_silence +
          beep_medium + long_silence)

melody1.export("simple_melody1.wav", format="wav")
print("мелодия сохранена как 'simple_melody1.wav'")

# МЕЛОДИЯ 2
melody2 = (beep_low + short_silence +
          beep_medium + short_silence +
          beep_high + medium_silence +
          beep_high + short_silence +
          beep_medium + short_silence +
          beep_low + long_silence)

melody2.export("simple_melody2.wav", format="wav")
print("мелодия сохранена как 'simple_melody2.wav'")

# МЕЛОДИЯ 3
# Создаем короткие бипы для ритма
short_beep = Sine(440).to_audio_segment(duration=100)  # Короткий бип

melody3 = (beep_high + short_silence +
          short_beep + short_silence +
          short_beep + short_silence +
          beep_very_high + medium_silence +
          beep_medium + short_silence +
          beep_low + long_silence)

melody3.export("happy_melody.wav", format="wav")
print("мелодия сохранена как 'happy_melody.wav'")

print("\n Все мелодии созданы!")

In [None]:
melody1

In [None]:
melody2

In [None]:
melody3

Задача 1. Программа, конвертирующая аудио к новому формату

In [None]:
# Конвертация аудио

def convert_format(input_file, output_file, new_format):
    audio = AudioSegment.from_file(input_file)
    audio.export(output_file, format=new_format)
    print(f"✅ Файл конвертирован в {new_format}: {output_file}")

In [None]:
convert_format("violin_original.wav", "violin.mp3", "mp3")

Задача 2. Заставка для подкаста:

    * Музыка начинается громко
    * Голос поверх музыки
    * Музыка постепенно становится тише (fade out)
    * В конце только голос

In [None]:
def create_podcast_intro(voice_file, music_file, output_file, intro_duration=15000):
    voice = AudioSegment.from_file(voice_file)
    music = AudioSegment.from_file(music_file)

    silence = AudioSegment.silent(duration=3000)

    voice = silence + voice

    # Обрезаем музыку до нужной длины
    music = music[2000:intro_duration]

    # Fade in и fade out для музыки
    music = music.fade_in(2000).fade_out(3000)

    # Уменьшаем громкость музыки под голосом
    quiet_music = music - 10

    # Накладываем голос поверх музыки
    mixed = voice.overlay(quiet_music)

    mixed.export(output_file, format="wav")
    print(f"Заставка создана: {output_file}")

In [None]:
voice_file = "s18-27s.wav"
music_file = "guitar-background-sound.wav"
output_file = "podcast_with_intro.wav"

In [None]:
music = AudioSegment.from_file(music_file)
music

In [None]:
create_podcast_intro(voice_file, music_file, output_file, intro_duration=15000)

In [None]:
podcast = AudioSegment.from_file(output_file)
podcast

Задача 1
* прочитайте TextGrid, найдите начало и конец каждой паузы в секундах
* с помощью PyDub соберите из старого аудио новое, в котором не будет пауз

In [None]:
!wget https://raw.githubusercontent.com/annashell/python_mag/refs/heads/main/txt_files/av18s.wav
!wget https://raw.githubusercontent.com/annashell/python_mag/refs/heads/main/txt_files/av18s.TextGrid

Задача 2. Напишите функцию, принимающую на вход аудио-файл и соответствующий ему TextGrid, содержащий точечный слой, а также длительность паузы в секундах. Выходом функции будет новый аудио-файл, содержащий паузы указанной длительности в точках, отмеченных в TextGrid.

Задача 3. Напишите функцию, аналогичную функции в предыдущей задаче, но длительность паузы в ней будет равна длительности предшествующего ей отрывка исходного аудио.