# Carga de audios, transcripción, limpieza y almacenamiento

In [7]:
import os
#import mysql.connector
import re

# Install whisper package
#%pip install openai-whisper

import whisper
import subprocess

#para hacer que la transcripcion sea mas rapida 
from concurrent.futures import ThreadPoolExecutor

In [8]:
# Folderes donde se ubican los audios y donde se almacenan los txt
audio_folder = "C:/Users/Usuario/tfm_call_optimizer/audios_prueba/"
transcription_folder = "C:/Users/Usuario/tfm_call_optimizer/transcripciones_prueba/"

In [9]:
# Load Whisper model
model = whisper.load_model("medium")

In [10]:
def clean_transcription(text):
    """
    Limpia la transcripción eliminando muletillas, espacios extra
    y artefactos no deseados.
    """
    filler_words = ["y","eh", "mmm", "este", "o sea", "pues", "bueno", "entonces", "verdad", "sabes", "digo"]
    filler_pattern = r'\b(?:' + '|'.join(filler_words) + r')\b'

    text = re.sub(filler_pattern, '', text, flags=re.IGNORECASE)  # Elimina muletillas
    text = re.sub(r'\s+', ' ', text)  # Reemplaza múltiples espacios por uno solo
    text = re.sub(r'([.?!])\1+', r'\1', text)  # Elimina repeticiones innecesarias de signos de puntuación
    text = text.strip()  # Elimina espacios al inicio y al final

    return text


In [11]:

# Ensure the transcription directory exists
os.makedirs(transcription_folder, exist_ok=True)

def transcribe_audio(filename):
    audio_path = os.path.join(audio_folder, filename)
    ##transcription_path = os.path.join(transcription_folder, filename.replace(".wav", ".txt").replace(".mp3", ".txt"))
    
    # Realizar la transcripción del audio
    result = model.transcribe(audio_path)
    
    # El texto transcrito se obtiene aquí
    raw_text = result["text"]
    
    # Limpiar la transcripción
    cleaned_text = clean_transcription(raw_text)
    
    # Construct the file path for the transcription
    transcription_path = os.path.join(transcription_folder, filename.replace(".wav", ".txt").replace(".mp3", ".txt"))
    
    # Guardar la transcripción limpia en un archivo de texto
    with open(transcription_path, "w", encoding="utf-8") as f:
        f.write(cleaned_text)

    print(f"Transcripción de {filename} guardada en {transcription_folder}")

# Listar todos los archivos de audio
audio_files = [f for f in os.listdir(audio_folder) if f.endswith(".wav") or f.endswith(".mp3")]
# Transcribe each file
for file in audio_files:
    transcribe_audio(file)

Transcripción de Audios_mp3_call0001.mp3 guardada en C:/Users/Usuario/tfm_call_optimizer/transcripciones_prueba/
Transcripción de Audios_mp3_call0003.mp3 guardada en C:/Users/Usuario/tfm_call_optimizer/transcripciones_prueba/
Transcripción de Audios_mp3_call0004.mp3 guardada en C:/Users/Usuario/tfm_call_optimizer/transcripciones_prueba/
Transcripción de Audios_mp3_call0006.mp3 guardada en C:/Users/Usuario/tfm_call_optimizer/transcripciones_prueba/
Transcripción de Audios_mp3_call0007.mp3 guardada en C:/Users/Usuario/tfm_call_optimizer/transcripciones_prueba/
Transcripción de Audios_mp3_call0008.mp3 guardada en C:/Users/Usuario/tfm_call_optimizer/transcripciones_prueba/


# Ruta del archivo WAV
input_audio_path = "C:/Users/Usuario/tfm_call_optimizer/audios/MESAVOIP_20250114-163456_4007_6044038280-all.WAV"
output_audio_path = "C:/Users/Usuario/tfm_call_optimizer/audios/MESAVOIP_20250114-163456_4007_6044038280-all.mp3"

# Comando para convertir WAV a MP3
ffmpeg_command = [
    r"C:\Users\Usuario\ffmpeg-2025-03-06-git-696ea1c223-essentials_build\bin\ffmpeg.exe",
    "-i", input_audio_path,
    output_audio_path
]

# Ejecutar el comando
try:
    subprocess.run(ffmpeg_command, check=True)
    print(f"✅ El archivo se ha convertido exitosamente a: {output_audio_path}")
except subprocess.CalledProcessError as e:
    print(f"❌ Error en la conversión: {e}")

# Ahora, usa este archivo convertido para transcribirlo con whisper
audio_path = output_audio_path

filename = "MESAVOIP_20250114-163456_4007_6044038280-all.wav"  # Nombre del archivo de prueba
audio_path = os.path.join(audio_folder, filename)
transcription_path = os.path.join(transcription_folder, filename.replace(".wav", ".txt"))

# Transcribir audio
result = model.transcribe(audio_path)
raw_text = result["text"]

# Limpiar transcripción
#cleaned_text = clean_transcription(raw_text)

# Guardar en archivo de texto
with open(transcription_path, "w", encoding="utf-8") as f:
    f.write(cleaned_text)

print(f"✅ Saved cleaned transcription: {transcription_path}")


# Transcribir el archivo de audio convertido
audio_path = "C:/Users/Usuario/tfm_call_optimizer/audios/MESAVOIP_20250114-163456_4007_6044038280-all.mp3"

# Transcribir audio
result = model.transcribe(audio_path)

# Obtener el texto transcrito
raw_text = result["text"]

# Imprimir el texto transcrito
print(f"Texto transcrito: {raw_text}")

# Guardar la transcripción en un archivo de texto
transcription_path = "C:/Users/Usuario/tfm_call_optimizer/transcripciones/MESAVOIP_20250114-163456_4007_6044038280-all.txt"
with open(transcription_path, "w", encoding="utf-8") as f:
    f.write(raw_text)

print(f"✅ Transcripción guardada en: {transcription_path}")

# Connect to MySQL
conn = mysql.connector.connect(
    host="your-mysql-server",
    user="your-username",
    password="your-password",
    database="your-database"
)
cursor = conn.cursor()

# Asegurémonos de que `ffmpeg` esté en el PATH antes de la transcripción
ffmpeg_path = r"C:\Users\Usuario\ffmpeg-2025-03-06-git-696ea1c223-essentials_build\bin\ffmpeg.exe"

# Verificar si ffmpeg está accesible desde Python
try:
    subprocess.run([ffmpeg_path, "-version"], check=True, capture_output=True)
    print("✅ ffmpeg está correctamente accesible.")
except FileNotFoundError:
    print("❌ No se pudo encontrar ffmpeg en la ruta especificada.")
    exit()


# Verificar si ffmpeg está accesible desde Python
try:
    subprocess.run([ffmpeg_path, "-version"], check=True, capture_output=True)
    print("✅ ffmpeg está correctamente accesible.")
except FileNotFoundError:
    print("❌ No se pudo encontrar ffmpeg en la ruta especificada.")
    exit()

# Asegurémonos de que `ffmpeg` esté en el PATH antes de la transcripción
ffmpeg_path = r"C:\Users\Usuario\ffmpeg-2025-03-06-git-696ea1c223-essentials_build\bin\ffmpeg.exe"

# Configurar ffmpeg manualmente en whisper
whisper.utils.ffmpeg_bin = ffmpeg_path  # Esto le dice a whisper dónde encontrar ffmpeg

# Limpiar transcripción
cleaned_text = clean_transcription(raw_text)

# Guardar en archivo de texto
with open(transcription_path, "w", encoding="utf-8") as f:
    f.write(cleaned_text)

print(f"✅ Saved cleaned transcription: {transcription_path}")


# Function to clean transcription text
def clean_transcription(text):
    """
    Cleans the transcription text by removing filler words, extra spaces,
    and unwanted artifacts.
    """
    # Define common filler words (can be extended)
    filler_words = ["eh", "mmm", "este", "o sea", "pues", "bueno", "entonces", "verdad", "sabes", "digo"]
    filler_pattern = r'\b(?:' + '|'.join(filler_words) + r')\b'

    # Remove filler words
    text = re.sub(filler_pattern, '', text, flags=re.IGNORECASE)

    # Remove multiple spaces
    text = re.sub(r'\s+', ' ', text)

    # Remove unnecessary punctuation repetition (e.g., "Hello...." → "Hello.")
    text = re.sub(r'([.?!])\1+', r'\1', text)

    # Strip leading/trailing spaces
    text = text.strip()

    return text



for filename in os.listdir(audio_folder):
    if filename.endswith(".wav") or filename.endswith(".mp3"):
        audio_path = os.path.join(audio_folder, filename)
        transcription_path = os.path.join(transcription_folder, filename.replace(".wav", ".txt").replace(".mp3", ".txt"))

        # Transcribe audio
        result = model.transcribe(audio_path)
        raw_text = result["text"]

        # Clean transcription text
        cleaned_text = clean_transcription(raw_text)

        # Save cleaned transcription to a .txt file
        with open(transcription_path, "w", encoding="utf-8") as f:
            f.write(cleaned_text)

        # Insert cleaned transcription into MySQL
        sql = """
        INSERT INTO transcriptions (call_id, transcription, status)
        VALUES (%s, %s, %s)
        """
        values = (filename.replace(".wav", "").replace(".mp3", ""), cleaned_text, "Pending")

        cursor.execute(sql, values)
        conn.commit()

        print(f"✅ Saved cleaned transcription: {transcription_path} & stored in database.")

cursor.close()
conn.close()
