# 🎯 Objetivo

Tomar un video .mp4 (en inglés), y obtener un nuevo .mp4 con audio doblado al español, manteniendo el mismo contenido y sincronía.


# 🧩 Flujo general del script

- 🎞️ Entrada: archivo .mp4 descargado (de Coursera, por ejemplo).

- 🎧 Extraer audio original → .wav o .mp3

- ✍️ Transcribir el audio (en inglés) con Whisper (OpenAI)

- 🌎 Traducir texto al español (usando ChatGPT o DeepL)

- 🗣️ Generar nueva voz en español (usando ElevenLabs o gTTS si querés algo gratuito)

- 🎬 Reemplazar el audio original con el doblado → nuevo .mp4

### ⚙️ Requisitos técnicos

- Instalá estos paquetes antes de correr el script:

`pip install moviepy openai-whisper gtts deep-translator`


⚠️ Si querés usar voces de alta calidad tipo natural (IA realista), te conviene usar la API de ElevenLabs o OpenAI TTS — puedo integrarlo en la siguiente versión.

In [3]:
# Versión vieja moviepy 1.0.3 NO ANDA

import os
from moviepy.editor import VideoFileClip, AudioFileClip
import whisper
from gtts import gTTS
from deep_translator import GoogleTranslator

# === CONFIGURACIÓN ===
VIDEO_PATH = "/videos_originales/index.mp4"
OUTPUT_VIDEO = "/videos_traducidos/index_traducido.mp4"
TEMP_AUDIO = "audio_en.wav"
AUDIO_ES = "audio_es.mp3"

# === 1. Extraer audio del video ===
video = VideoFileClip(VIDEO_PATH)
video.audio.write_audiofile(TEMP_AUDIO)

# === 2. Transcribir audio con Whisper ===
print("🎧 Transcribiendo audio con Whisper...")
model = whisper.load_model("base")  # podés usar 'small' o 'medium' para mejor precisión
result = model.transcribe(TEMP_AUDIO, language="en")
texto_en = result["text"]

# === 3. Traducir texto al español ===
print("🌎 Traduciendo texto al español...")
texto_es = GoogleTranslator(source="en", target="es").translate(texto_en)

# === 4. Generar audio en español (voz IA básica) ===
print("🗣️ Generando audio en español con gTTS...")
tts = gTTS(text=texto_es, lang="es")
tts.save(AUDIO_ES)

# === 5. Combinar nuevo audio con el video ===
print("🎬 Creando video final con audio en español...")
audio_es = AudioFileClip(AUDIO_ES)
video_final = video.set_audio(audio_es)
video_final.write_videofile(OUTPUT_VIDEO, codec="libx264", audio_codec="aac")

print("✅ Proceso completo. Video generado:", OUTPUT_VIDEO)


TypeError: deprecated_version_of() got an unexpected keyword argument 'oldname'

In [9]:
import os
from moviepy import VideoFileClip, AudioFileClip
import whisper
from gtts import gTTS
from deep_translator import GoogleTranslator

# === CONFIGURACIÓN ===
VIDEO_PATH = "index.mp4"   # tu archivo de entrada
OUTPUT_VIDEO = "video_traducido.mp4"
TEMP_AUDIO = "audio_en.wav"
AUDIO_ES = "audio_es.mp3"

# === 1. Extraer audio del video ===
print("🎞️ Extrayendo audio del video original...")
video = VideoFileClip(VIDEO_PATH)
#video.audio.write_audiofile(TEMP_AUDIO, verbose=False, logger=None)
video.audio.write_audiofile(TEMP_AUDIO)


# === 2. Transcribir audio con Whisper ===
print("🎧 Transcribiendo audio con Whisper...")
model = whisper.load_model("base")  # opciones: tiny, base, small, medium, large
result = model.transcribe(TEMP_AUDIO, language="en")
texto_en = result["text"]

# === 3. Traducir texto al español ===
print("🌎 Traduciendo texto al español...")
texto_es = GoogleTranslator(source="en", target="es").translate(texto_en)

# === 4. Generar nuevo audio en español ===
print("🗣️ Generando voz en español...")
tts = gTTS(text=texto_es, lang="es")
tts.save(AUDIO_ES)

# === 5. Reemplazar audio original por el nuevo ===
print("🎬 Reemplazando audio y creando video final...")
audio_es = AudioFileClip(AUDIO_ES)
video_final = video.with_audio(audio_es)

video_final.write_videofile(
    OUTPUT_VIDEO,
    codec="libx264",
    audio_codec="aac",
    verbose=False,
    logger=None
)

# === 6. Limpieza (opcional) ===
os.remove(TEMP_AUDIO)
os.remove(AUDIO_ES)

print("✅ Video traducido con éxito:", OUTPUT_VIDEO)


🎞️ Extrayendo audio del video original...
MoviePy - Writing audio in audio_en.wav


                                                                      

MoviePy - Done.
🎧 Transcribiendo audio con Whisper...


100%|███████████████████████████████████████| 139M/139M [00:06<00:00, 21.6MiB/s]


FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado

In [1]:
import os
from moviepy import VideoFileClip, AudioFileClip
import whisper
from gtts import gTTS
from deep_translator import GoogleTranslator

# === CONFIGURACIÓN ===
VIDEO_INPUT = "index.mp4"      # Ruta del video original
VIDEO_OUTPUT = "video_traducido.mp4"    # Salida final con audio traducido
AUDIO_TEMP = "audio_temp.wav"
AUDIO_ES = "audio_es.wav"
LANG_TARGET = "es"                      # Español

# === PASO 1: Extraer el audio del video ===
print("🎬 Extrayendo audio del video...")
video = VideoFileClip(VIDEO_INPUT)
video.audio.write_audiofile(AUDIO_TEMP, fps=16000)

# === PASO 2: Transcribir el audio con Whisper ===
print("🧠 Transcribiendo audio (Whisper)...")
model = whisper.load_model("base")
result = model.transcribe(AUDIO_TEMP, task="translate")  # Traduce si detecta otro idioma
texto_original = result["text"]

# === PASO 3: Traducir texto al español (si no estaba en español) ===
print("🌎 Traduciendo texto al español...")
texto_traducido = GoogleTranslator(source='auto', target=LANG_TARGET).translate(texto_original)

# === PASO 4: Generar audio traducido con gTTS ===
print("🗣️ Generando audio traducido...")
tts = gTTS(text=texto_traducido, lang=LANG_TARGET)
tts.save(AUDIO_ES)

# === PASO 5: Reemplazar audio en el video ===
print("🎧 Combinando nuevo audio con el video...")
audio_nuevo = AudioFileClip(AUDIO_ES)
video_final = video.with_audio(audio_nuevo)

# === PASO 6: Exportar resultado ===
print("💾 Exportando video final...")
video_final.write_videofile(VIDEO_OUTPUT, codec="libx264", audio_codec="aac")

# === LIMPIEZA ===
video.close()
audio_nuevo.close()
os.remove(AUDIO_TEMP)
os.remove(AUDIO_ES)

print("✅ Proceso finalizado. Video traducido guardado como:", VIDEO_OUTPUT)



🎬 Extrayendo audio del video...
MoviePy - Writing audio in audio_temp.wav


                                                                    

MoviePy - Done.
🧠 Transcribiendo audio (Whisper)...




FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado

In [3]:
import os
from moviepy import VideoFileClip, AudioFileClip
import whisper
from gtts import gTTS
from deep_translator import GoogleTranslator

# === CONFIGURACIÓN ===
BASE_DIR = os.getcwd()
VIDEO_INPUT = os.path.join(BASE_DIR, "index.mp4")
VIDEO_OUTPUT = os.path.join(BASE_DIR, "video_traducido.mp4")
AUDIO_TEMP = os.path.join(BASE_DIR, "audio_temp.wav")
AUDIO_ES = os.path.join(BASE_DIR, "audio_es.wav")
LANG_TARGET = "es"

# === PASO 1: Extraer el audio ===
print("🎬 Extrayendo audio del video...")
video = VideoFileClip(VIDEO_INPUT)
video.audio.write_audiofile(AUDIO_TEMP, fps=16000, logger=None)

# Verificar si se creó
if not os.path.exists(AUDIO_TEMP):
    raise FileNotFoundError("❌ No se pudo generar el archivo de audio temporal.")


# ----------verificacion-------------------

print("\n===== DIAGNÓSTICO DE ARCHIVOS =====")
print("📂 Directorio actual:", os.getcwd())
print("🎵 Ruta esperada del audio:", AUDIO_TEMP)
print("📁 Contenido del directorio actual:")
for f in os.listdir(os.getcwd()):
    print("  -", f)

# Verificamos si el archivo existe realmente
if os.path.exists(AUDIO_TEMP):
    size = os.path.getsize(AUDIO_TEMP)
    print(f"✅ Archivo encontrado: {AUDIO_TEMP} ({round(size/1024,2)} KB)")
else:
    print("❌ El archivo de audio NO existe en la ruta indicada.")
    print("👉 Puede que MoviePy no haya logrado exportar el audio.")
    print("   Verifica que el video tenga pista de audio y que ffmpeg esté instalado correctamente.")
    raise SystemExit("⛔ Interrumpido: No se encontró el archivo de audio.")


# -----------------------------------------



# === PASO 2: Transcripción ===
print("🧠 Transcribiendo audio (Whisper)...")
model = whisper.load_model("base")
result = model.transcribe(AUDIO_TEMP, task="translate")
texto_original = result["text"]


🎬 Extrayendo audio del video...

===== DIAGNÓSTICO DE ARCHIVOS =====
📂 Directorio actual: d:\Desarrollos\traductor_videos
🎵 Ruta esperada del audio: d:\Desarrollos\traductor_videos\audio_temp.wav
📁 Contenido del directorio actual:
  - .env
  - .git
  - .gitignore
  - audio_en.wav
  - audio_temp.wav
  - index.mp4
  - requirements.txt
  - traductor_videos.ipynb
  - videos_originales
✅ Archivo encontrado: d:\Desarrollos\traductor_videos\audio_temp.wav (7138.83 KB)
🧠 Transcribiendo audio (Whisper)...




FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado

In [5]:
import os
from moviepy import VideoFileClip, AudioFileClip
import whisper
from gtts import gTTS
from deep_translator import GoogleTranslator
from pydub import AudioSegment

# === CONFIGURACIÓN ===
BASE_DIR = os.getcwd()
VIDEO_INPUT = os.path.join(BASE_DIR, "index.mp4")
VIDEO_OUTPUT = os.path.join(BASE_DIR, "video_traducido.mp4")
AUDIO_TEMP = os.path.join(BASE_DIR, "audio_temp.wav")
AUDIO_ES = os.path.join(BASE_DIR, "audio_es.wav")
LANG_TARGET = "es"

SEGMENT_MS = 60_000  # 1 minuto en milisegundos

# === 1️⃣ Extraer audio ===
print("🎬 Extrayendo audio del video...")
video = VideoFileClip(VIDEO_INPUT)
video.audio.write_audiofile(AUDIO_TEMP, fps=16000, logger=None)

# Verificar si se creó
if not os.path.exists(AUDIO_TEMP):
    raise FileNotFoundError(f"No se encontró el archivo de audio: {AUDIO_TEMP}")

# === 2️⃣ Cargar Whisper (modelo optimizado para CPU) ===
print("🧠 Cargando modelo Whisper (CPU optimizado)...")
model = whisper.load_model("small")  # tiny, small (CPU), base, medium, large

# === 3️⃣ Transcribir audio por segmentos ===
print("🔊 Dividiendo audio en segmentos para CPU...")
audio = AudioSegment.from_wav(AUDIO_TEMP)
segments = [audio[i:i + SEGMENT_MS] for i in range(0, len(audio), SEGMENT_MS)]

texto_completo = ""
for idx, seg in enumerate(segments):
    temp_seg_path = f"seg_{idx}.wav"
    seg.export(temp_seg_path, format="wav")
    print(f"⏳ Transcribiendo segmento {idx+1}/{len(segments)}...")
    result = model.transcribe(temp_seg_path, task="translate")  # Traduce al inglés si detecta otro idioma
    texto_completo += " " + result["text"]
    os.remove(temp_seg_path)

# === 4️⃣ Traducir al español ===
print("🌎 Traduciendo texto al español...")
texto_traducido = GoogleTranslator(source='auto', target=LANG_TARGET).translate(texto_completo)

# === 5️⃣ Generar audio en español ===
print("🗣️ Generando audio traducido...")
tts = gTTS(text=texto_traducido, lang=LANG_TARGET)
tts.save(AUDIO_ES)

# === 6️⃣ Reemplazar audio en el video ===
print("🎧 Combinando nuevo audio con el video...")
audio_nuevo = AudioFileClip(AUDIO_ES)
video_final = video.with_audio(audio_nuevo)

# === 7️⃣ Exportar video final ===
print("💾 Exportando video final...")
video_final.write_videofile(VIDEO_OUTPUT, codec="libx264", audio_codec="aac")

# === 8️⃣ Limpieza ===
video.close()
audio_nuevo.close()
os.remove(AUDIO_TEMP)
os.remove(AUDIO_ES)

print("✅ Proceso finalizado. Video traducido guardado como:", VIDEO_OUTPUT)


🎬 Extrayendo audio del video...
🧠 Cargando modelo Whisper (CPU optimizado)...
🔊 Dividiendo audio en segmentos para CPU...
⏳ Transcribiendo segmento 1/2...


FileNotFoundError: [WinError 2] El sistema no puede encontrar el archivo especificado