# Audio Study

In [1]:
import sys
from pathlib import Path
import os

# Obtener la ruta absoluta de la carpeta que contiene el módulo
root_dir = Path.cwd().resolve().parent.parent

# Agregar la ruta de la carpeta al sys.path
sys.path.append(str(root_dir))

In [2]:
from config.variables import indiv_sample_path, audio_path, text_path, wav_path

from audio_utils import convert_to_wav, transcribe_audio

# 0. Speech extraction

First of all, we extract the speech from the audios, using one of the best pretrained models for this work. It is important to highlight that this step is not one of the main points of the project. For that reason, there will not be experimentation with different models of the rest of the phases.

In [4]:
# Directorio que contiene los archivos de audio
audio_folder = os.path.join(root_dir, audio_path)
wav_folder = os.path.join(root_dir, wav_path)

# Directorio donde se guardarán los archivos de texto transcritos
output_folder = os.path.join(root_dir, text_path)

# Creamos el directorio de salida si no existe
if not os.path.exists(output_folder):
    os.makedirs(output_folder)

# Recorremos los archivos de audio en la carpeta
for filename in os.listdir(audio_folder):
    if filename.endswith('.mp3'):  # Puedes ajustar la extensión según tus archivos de audio
        audio_file = os.path.join(audio_folder, filename)
        wav_file = convert_to_wav(audio_file, wav_folder)
        text = transcribe_audio(wav_file)
        
        output_file = os.path.splitext(filename)[0] + '.txt'
        output_path = os.path.join(output_folder, output_file)
        with open(output_path, 'w') as f:
            f.write(text)
        print(f"Transcripción del archivo {filename} guardada en {output_file}")

No se pudo entender el audio
Transcripción del archivo 6875317312082201857_audio.mp3 guardada en 6875317312082201857_audio.txt
Transcripción del archivo 6875323773755657474_audio.mp3 guardada en 6875323773755657474_audio.txt
Transcripción del archivo 6875342937002085633_audio.mp3 guardada en 6875342937002085633_audio.txt
No se pudo entender el audio
Transcripción del archivo 6875370613523909890_audio.mp3 guardada en 6875370613523909890_audio.txt
No se pudo entender el audio
Transcripción del archivo 6875373441432816898_audio.mp3 guardada en 6875373441432816898_audio.txt
No se pudo entender el audio
Transcripción del archivo 6875378565614013697_audio.mp3 guardada en 6875378565614013697_audio.txt
No se pudo entender el audio
Transcripción del archivo 6875394675985992966_audio.mp3 guardada en 6875394675985992966_audio.txt
Transcripción del archivo 6875405441472498949_audio.mp3 guardada en 6875405441472498949_audio.txt
No se pudo entender el audio
Transcripción del archivo 6875436892226178

## 1 Data Exploration and Visualisation

In [4]:
import IPython.display as ipd

ipd.Audio(os.path.join(root_dir, indiv_sample_path))