<a href="https://colab.research.google.com/github/KennedyMolinaQ/Transcripcion_Video_Youtube_con_WHISPER/blob/main/Generar_transcripci%C3%B3n_a_partir_de_videos_de_Youtube_con_WHISPER.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

---
title: "Generar transcripción a partir de videos de Youtube con WHISPER"

author: "KennedyMolinaQ"

date: "03/03/2024"

---

🎙️ **Whisper** es una herramienta desarrollada por OpenAI que permite transcribir automáticamente archivos de audio en texto. Utiliza modelos de lenguaje avanzados para lograr una transcripción precisa y eficiente.

💡 Se podría utilizar para transcribir los audios de las llamadas de un call center para su posterior análisis.

💡 Se podría utilizar para subtitular videos para subir a plataformas como Instagram o tiktok (considerando que tienen un mayor alcance aquellos que están subtitulados)
En esta versión se utilizará videos de Youtube para fines prácticos.

**Proceso:**

1.   **Instalación:** Comienzo instalando las bibliotecas y dependencias necesarias. Esto incluye openai-whisper, ffmpeg, pytube y moviepy. Estas herramientas son esenciales para procesar y analizar los archivos de video y audio.

2.   **Selección del Modelo:** A continuación, selecciono el tamaño del modelo de Whisper. Puedes elegir entre "tiny", "base", "small", "medium" o "large", según tus necesidades. Esta elección determina la precisión y complejidad de la transcripción.

3.   **Procesamiento de Video/Audio:** Proporciono la URL del video de YouTube que deseo transcribir. El código descarga el video en formato MP4 y lo convierte en un archivo MP3. Este paso garantiza que estemos trabajando con la parte de audio del video.
4.   **Generación de Transcripción:** Utilizando el modelo de Whisper seleccionado, transcribo el archivo de audio. La transcripción resultante se guarda en un archivo de texto. Además, el código extrae los segmentos individuales de la transcripción y los sincroniza con sus respectivas marcas de tiempo.

5.   **Descargar y Compartir:** Por último, descargo el archivo de transcripción y el archivo de transcripción sincronizada. Esto me permite tener un registro escrito de la transcripción y la versión sincronizada para una fácil referencia.



🔗 Encuentra el código tutorial completo [aquí](htthttps://colab.research.google.com/drive/1zBm1hqxvPUSsqD3PJU1xUQZAJ9qdwmQF?usp=sharingp:// "aquí") o en https://github.com/KennedyMolinaQ


Cuéntame qué opinas sobre esta técnica de transcripción y si te resulta útil en tu trabajo. Comparte tus experiencias o cualquier pregunta que puedas tener. ¡Juntos, desbloqueemos el potencial de la inteligencia artificial en la transcripción!



In [1]:
#@title Pip Install
from IPython.display import clear_output
!pip install -U openai-whisper -q > /dev/null 2>&1;
!sudo apt update && sudo apt install ffmpeg -q > /dev/null 2>&1;
!pip install pytube -q > /dev/null 2>&1;
!pip install moviepy -q > /dev/null 2>&1;
clear_output()

In [2]:
#@title  🚩 Seleccionar tamaño de modelo
import whisper
modelo_de_entrenamiento = "medium" #@param ["tiny","base", "small", "medium","large"]
model = whisper.load_model(modelo_de_entrenamiento)

100%|██████████████████████████████████████| 1.42G/1.42G [00:12<00:00, 122MiB/s]


In [3]:
#@title  🚩 Video / Audio
from pytube import YouTube
import moviepy.editor as mp

url = 'https://www.youtube.com/watch?v=DbPTmR3N_XU&ab_channel=DotCSV'#@param {type:"string"}
# Descargar el video de YouTube en formato MP4
yt = YouTube(url)
video = yt.streams.filter(only_audio=True).first()
video.download(output_path='/content', filename='video.mp4')
# Convertir el archivo MP4 a MP3 (opcional)
clip = mp.AudioFileClip("/content/video.mp4")
clip.write_audiofile("/content/audio.mp3")
clip.close()
clear_output()

In [4]:
#@title  🚩 Generar Transcripción
from google.colab import files
# Guardar el texto transcritoen un archivo
result = model.transcribe(f"/content/audio.mp3")
with open("/content/transcripcion.txt", "w") as file:
    file.write(result["text"])

# Obtener los segmentos de la transcripción
segmentos = result["segments"]
# Generar la transcripción con sincronización
transcripcion_sincronizada = ""
for segmento in segmentos:
    inicio = segmento["start"]
    fin = segmento["end"]
    texto = segmento["text"]
    transcripcion_sincronizada += f"{inicio} - {fin}: {texto}\n"

# Guardar la transcripción con sincronización en un archivo de texto
with open("/content/transcripcion_sincronizada.txt", "w") as file:
    file.write(transcripcion_sincronizada)
# Descargar el archivo a tu computadora
files.download("transcripcion.txt")
# Descargar el archivo de transcripción sincronizada a tu computadora
files.download("/content/transcripcion_sincronizada.txt")

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>

<IPython.core.display.Javascript object>