In [13]:
import torch
from transformers import AutoModelForSpeechSeq2Seq, AutoProcessor, pipeline
import warnings

# Suppress all warnings
warnings.filterwarnings("ignore")

# Set device and data types
device = "cuda:0" if torch.cuda.is_available() else "cpu"
torch_dtype = torch.float16 if torch.cuda.is_available() else torch.float32

# Specify the model ID
model_id = "openai/whisper-large-v3-turbo"

# Load the model
model = AutoModelForSpeechSeq2Seq.from_pretrained(
    model_id, torch_dtype=torch_dtype, low_cpu_mem_usage=True, use_safetensors=True
)
model.to(device)

# Load the processor
processor = AutoProcessor.from_pretrained(model_id)

# Create the pipeline
pipe = pipeline(
    "automatic-speech-recognition",
    model=model,
    tokenizer=processor.tokenizer,
    feature_extractor=processor.feature_extractor,
    torch_dtype=torch_dtype,
    device=device,
)

In [14]:
# Select filename
filename = "trabajo_lidia_2"

# Select language
language = "spanish"

# Transcribe an audio file directly in the pipeline call
audio_file = f"../../audio_samples/{filename}.mp3"  # Replace with your audio file path
result = pipe(audio_file, return_timestamps=True, generate_kwargs={"language": language})
print(result["text"])  # Displays transcription with timestamps

 ... ...muchas gracias querido Jerónimo por tus amables palabras... ...ayer después de cenar en una tertulia... ...Humberto, mi colega de la OIT Humberto... ...decía hablando de José Manuel Álvarez de la Rosa... ...decía... ...yo me acuerdo la primera vez que te conocí en Costa Rica... ...porque iniciaste una intervención diciendo... se puede amar por referencia. Y realmente pensé, querido Jerónimo, que yo te tengo consideración y estima por referencia, desde hace mucho tiempo, desde hace mucho tiempo como sindicalista, como presidente de Canarias, como ministro de Educación. y siento un inmenso honor personalmente cuando vi en el programa que me ibas a presentar, lo sentí y ahora lo renuevo. Muchas gracias por tu trayectoria vital, que nos ha enseñado mucho, que nos sigue enseñando y por tu amable presentación. Y les voy a hablar de la situación del trabajo y de su futuro. Ya he comenzado en mi primer saludo explicando el contexto en el que se desarrolla este debate sobre el futuro de

In [15]:
# Specify the file path
file_path = f"/mnt/c/Users/luisg/Desktop/STAR/STAR/transcriptions/{filename}.txt"

# Write the text to the file
with open(file_path, "w", encoding="utf-8") as file:
    file.write(result["text"])