In [None]:
# ============================================
# Reconocimiento de Voz
# Autor: Maximiliano Ruiz
# Fecha: Octubre 2025
# ============================================

# Este cuaderno implementa la conversión de voz (audio WAV) a texto
# utilizando la librería SpeechRecognition.

In [None]:
# === Instalación de librerías necesarias ===
# Ejecutar esta celda una sola vez.

%pip install SpeechRecognition

Note: you may need to restart the kernel to use updated packages.


In [None]:
# === Importación de librerías ===
import speech_recognition as sr

In [5]:
# === Función: Reconocimiento de Voz ===

def reconocer_voz(archivo_audio):
    """
    Convierte un archivo de audio WAV a texto usando SpeechRecognition.
    Requiere que el archivo esté en el mismo directorio del notebook.
    """
    print("=== Reconocimiento de voz (Audio a Texto) ===")
    recognizer = sr.Recognizer()

    try:
        with sr.AudioFile(archivo_audio) as source:
            print("Procesando el archivo de audio...")
            audio = recognizer.record(source)

        # Reconocimiento de voz mediante el servicio de Google
        texto = recognizer.recognize_google(audio, language="es-ES")

        print("\nTexto reconocido:")
        print(texto)
        return texto

    except FileNotFoundError:
        print("⚠️ No se encontró el archivo de audio. Verifique el nombre o la ruta.")
    except sr.UnknownValueError:
        print("⚠️ No se pudo reconocer el habla en el audio.")
    except sr.RequestError:
        print("⚠️ Error con el servicio de reconocimiento de voz.")

In [6]:
# === Ejemplo de ejecución ===
# Se recomienda usar un archivo de audio WAV grabado previamente.
# Por ejemplo: ejemplo.wav

archivo = input("Ingrese el nombre del archivo WAV (ej: ejemplo.wav): ")
reconocer_voz(archivo)


=== Reconocimiento de voz (Audio a Texto) ===
Procesando el archivo de audio...

Texto reconocido:
Hola Mi nombre es Maximiliano Ruiz Y esta es una prueba para procesamiento del habla


'Hola Mi nombre es Maximiliano Ruiz Y esta es una prueba para procesamiento del habla'