In [1]:
import whisper
import subprocess
import datetime
from pathlib import Path


Hiperpar√°metros

In [2]:
LANG = "es"
NORMALIZE_AUDIO = True
TEMPERATURE = 0.0
BEAM_SIZE = 8
INITIAL_PROMPT = (
    "Transcripci√≥n fiel en espa√±ol de un archivo de audio. "
    "Usar ortograf√≠a y gram√°tica correctas, con buena puntuaci√≥n. "
    "Contexto: discurso, conferencia o grabaci√≥n personal. "
    "Palabras clave: claridad, precisi√≥n, coherencia, fidelidad."
)

In [None]:
# --- Funciones auxiliares ---
def toWav16k(inPath: Path, outPath: Path) -> Path:
    cmd = [
        "ffmpeg", "-y", "-i", str(inPath),
        "-vn",
        "-ac", "1",
        "-af", "aresample=resampler=soxr:precision=33",
        "-ar", "16000",
        "-c:a", "pcm_s16le",
        str(outPath)
    ]
    subprocess.run(cmd, check=True, stdout=subprocess.PIPE, stderr=subprocess.PIPE)
    return outPath

def prepareAudioForWhisper(srcPath: Path, enabled: bool = True) -> Path:
    if not enabled:
        return srcPath
    target = srcPath.parent / "input.16k.wav"
    return toWav16k(srcPath, target)

def makeTimestamp() -> str:
    return datetime.datetime.now().strftime("%Y%m%d-%H%M%S")

# --- Uso ---
# Puedes cambiar "base" por "large-v3" o "turbo"
model = whisper.load_model("base")  

audioPath = Path("./audio.mp3")
normalizedPath = prepareAudioForWhisper(audioPath, enabled=NORMALIZE_AUDIO)

result = model.transcribe(
    str(normalizedPath),
    language=LANG,
    task="transcribe",
    temperature=TEMPERATURE,
    beam_size=BEAM_SIZE,
    patience=1.0,
    condition_on_previous_text=True,
    initial_prompt=INITIAL_PROMPT if INITIAL_PROMPT.strip() else None,
    fp16=False   # si CPU; en GPU puedes pasar True
)

text = result["text"].strip()

üìÑ Texto transcrito:

Buenas ardemana Mar√≠a Luisa, hermana, mi pregunta est√° en efectos 431. En pasados de estudios b√≠blicos, usted nos dec√≠a de que cuando uno sent√≠a algo en el coraz√≥n y lo reconoc√≠a del ante Dios, el se√±or entra a ayudarle a uno. Entonces, sabemos que para servirle al se√±or, tenemos que tener el coraz√≥n libre, pues, de topecado, de toa amargura. Y cuando uno hora, cuando uno le peal, se√±or, es sincero con el se√±or, se arrodilla, pero sigue como el mismo problema, ac√° dice el ap√≥stol, en efectos 431. Qu√≠tese de vosotros toda amargura en ojo, ira, griter√≠a y maledicencia y toda amalicia. Cuando uno ya ha aplicado todas estas cosas de pedirle al se√±or, de reconocer, de humillarse y como que es esp√≠ritu persiste, ¬øqu√© m√°s podemos hacer hermana? Bueno, pues uno dice que yo he reconoco y que me humillo y que le hablo el se√±or y le pido el se√±or. Es uno lo hace, pero es que uno tiene que esforzarse tambi√©n para sacar eso del coraz√≥n. Hay que esfor

Guardar en archivo

In [6]:
outFile = Path(f"transcript-{makeTimestamp()}.txt")
outFile.write_text(text, encoding="utf-8")
print(f"\n‚úÖ Transcripci√≥n guardada en: {outFile}")

print("üìÑ Texto transcrito:\n")
print(text)


‚úÖ Transcripci√≥n guardada en: transcript-20250917-163811.txt
üìÑ Texto transcrito:

Buenas ardemana Mar√≠a Luisa, hermana, mi pregunta est√° en efectos 431. En pasados de estudios b√≠blicos, usted nos dec√≠a de que cuando uno sent√≠a algo en el coraz√≥n y lo reconoc√≠a del ante Dios, el se√±or entra a ayudarle a uno. Entonces, sabemos que para servirle al se√±or, tenemos que tener el coraz√≥n libre, pues, de topecado, de toa amargura. Y cuando uno hora, cuando uno le peal, se√±or, es sincero con el se√±or, se arrodilla, pero sigue como el mismo problema, ac√° dice el ap√≥stol, en efectos 431. Qu√≠tese de vosotros toda amargura en ojo, ira, griter√≠a y maledicencia y toda amalicia. Cuando uno ya ha aplicado todas estas cosas de pedirle al se√±or, de reconocer, de humillarse y como que es esp√≠ritu persiste, ¬øqu√© m√°s podemos hacer hermana? Bueno, pues uno dice que yo he reconoco y que me humillo y que le hablo el se√±or y le pido el se√±or. Es uno lo hace, pero es que uno tiene qu