In [None]:
import os
from transformers import pipeline
import torch
import time

# === CARTELLE SPECIFICHE ===
AUDIO_FOLDER = "audio_input"          # cartella dove mettere gli audio
TRANSCRIPT_FOLDER = "audio_output"    # cartella dove salvare le trascrizioni

# Crea la cartella di output se non esiste
os.makedirs(TRANSCRIPT_FOLDER, exist_ok=True)

# === MODELLO ===
pipe = pipeline(
    "automatic-speech-recognition",
    model="openai/whisper-small",
    return_timestamps=True,
    generate_kwargs={"task": "transcribe", "language": "it"}
)

# === ESTENSIONI AUDIO SUPPORTATE ===
audio_extensions = (".wav", ".mp3", ".m4a", ".flac", ".ogg")

# === CICLO SU TUTTI GLI AUDIO NELLA CARTELLA ===
for audio_file in os.listdir(AUDIO_FOLDER):

    if audio_file.lower().endswith(audio_extensions):

        audio_path = os.path.join(AUDIO_FOLDER, audio_file)
        print(f"\nInizio trascrizione: {audio_file}")

        start_time = time.time()
        result = pipe(audio_path)
        end_time = time.time()

        transcription_duration = end_time - start_time
        print(f"Trascrizione completata in {transcription_duration:.2f} secondi.")

        print("=== TRASCRIZIONE ===\n")
        print(result["text"])

        # Salvataggio nella cartella dedicata
        output_filename = os.path.splitext(audio_file)[0] + ".txt"
        output_path = os.path.join(TRANSCRIPT_FOLDER, output_filename)

        with open(output_path, "w", encoding="utf-8") as f:
            f.write(result["text"])

        print(f"Trascrizione salvata in: {output_path}")

print("\nTutte le trascrizioni sono state completate.")