<a href="https://colab.research.google.com/github/ivanrlg/WhisperDemo/blob/main/Whisper-Large-V3-Turbo.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

# **Whisper Turbo Demo** 🎙️
---

## Instalación del paquete 🔧

Primero, necesitamos instalar Whisper y ffmpeg. Asegúrate de ejecutar esta celda para instalar las dependencias necesarias.

In [None]:

# Instalar dependencias necesarias
!pip install git+https://github.com/openai/whisper.git
!pip install setuptools-rust
!sudo apt-get install ffmpeg


## Sube tu archivo de audio 🎧

Haz clic en el botón de abajo para subir tu archivo de audio. Asegúrate de que sea un archivo en formato MP3.

In [None]:

from google.colab import files

uploaded = files.upload()
audio_file = list(uploaded.keys())[0]


## Transcripción de voz 🗣️

Vamos a transcribir tu archivo de audio utilizando el modelo 'turbo'.

In [None]:

import whisper

# Cargar el modelo 'turbo'
model = whisper.load_model("large-v3-turbo")

# Transcribir el archivo de audio
def transcribe_audio(audio_file):
    result = model.transcribe(audio_file)
    print(f"Texto transcrito: {result['text']}")
    return result

# Ejecutar transcripción
result = transcribe_audio(audio_file)


## Detectar idioma 🈴

Ahora, detectemos el idioma hablado en el archivo de audio.

In [None]:

# Detectar el idioma del audio
def detect_language(audio_file):
    audio = whisper.load_audio(audio_file)
    audio = whisper.pad_or_trim(audio)
    mel = whisper.log_mel_spectrogram(audio).to(model.device)
    _, probs = model.detect_language(mel)
    detected_language = max(probs, key=probs.get)
    print(f"Idioma detectado: {detected_language}")
    return detected_language

# Ejecutar detección de idioma
detect_language(audio_file)


## Descargar la transcripción como archivo de texto 📜

Ejecuta la celda de abajo para descargar la transcripción en formato `.txt`.

In [None]:

# Guardar la transcripción en un archivo de texto
transcription_text = result['text']
with open('transcription.txt', 'w') as f:
    f.write(transcription_text)

# Descargar el archivo
files.download('transcription.txt')


## Descargar la transcripción completa en JSON 🗂️

Puedes descargar la transcripción completa junto con los timestamps en formato JSON.

In [None]:

import json

# Guardar la transcripción completa en formato JSON
with open('transcription.json', 'w') as f:
    json.dump(result, f, indent=4)

# Descargar el archivo
files.download('transcription.json')
