In [2]:
import importlib.metadata as m
import ctranslate2

print("faster-whisper:", m.version("faster-whisper"))
print("ctranslate2:", m.version("ctranslate2"))
print("torch.cuda.is_available():", torch.cuda.is_available())
if torch.cuda.is_available():
    print("GPU torch:", torch.cuda.get_device_name(0))
print("ctranslate2 cuda devices:", ctranslate2.get_cuda_device_count())



faster-whisper: 1.2.1
ctranslate2: 4.6.2
torch.cuda.is_available(): False
ctranslate2 cuda devices: 1


## resumen mejorado

In [None]:
# -*- coding: utf-8 -*-
"""
Notas:
- Si el modelo te corta el JSON, sube OLLAMA_OPTIONS["num_predict"] (p.ej. 2200).
- Si el modelo soporta m√°s contexto, sube num_ctx a 8192 para menos ‚Äúp√©rdida‚Äù en clases largas.
"""

import os
import json
import re
import time
import random
from pathlib import Path
from typing import List, Dict, Optional, Any, Tuple
import inspect
import requests
import boto3
from boto3.s3.transfer import TransferConfig
import ctranslate2
import torch
from faster_whisper import WhisperModel


# ================== CONFIGURACI√ìN S3 ==================

S3_BUCKET = "cun-transcribe-five9"
S3_PREFIX_VIDEOS = "Videos_clase_Profesores/video_12_04_25a/"  # termina en '/'

# Opcional: subir tambi√©n los JSON a S3
UPLOAD_JSON_TO_S3 = False
S3_PREFIX_JSON = "Videos_clase_Profesores/video_12_04_25a/resumenes/"  # carpeta para los JSON

# Cliente S3
s3 = boto3.client("s3")

# Descargas S3 m√°s r√°pidas (ajusta max_concurrency seg√∫n tu red)
S3_DOWNLOAD_CONFIG = TransferConfig(
    multipart_threshold=64 * 1024 * 1024,  # 64MB
    multipart_chunksize=16 * 1024 * 1024,  # 16MB
    max_concurrency=10,
    use_threads=True,
)

VIDEO_EXTS = {".mp4", ".mkv", ".avi", ".mov", ".wmv"}


# ================== CONFIGURACI√ìN LOCAL ==================

LOCAL_VIDEO_DIR = Path(r"C:\videos_clases_s3")
LOCAL_VIDEO_DIR.mkdir(parents=True, exist_ok=True)

TRANSCRIPTS_DIR = Path(r"C:\transcripciones_clases_s3\video_12_04_25a")
TRANSCRIPTS_DIR.mkdir(parents=True, exist_ok=True)

JSON_DIR = Path(r"C:\resumenes_clases_json_s3\12_04_25a")
JSON_DIR.mkdir(parents=True, exist_ok=True)

# Si quieres probar con pocos videos:
LIMIT_VIDEOS: Optional[int] = None  # ej: 2  | None = todos



# ================== WHISPER (TRANSCRIPCI√ìN) ==================

# OJO: faster-whisper usa CTranslate2. Torch puede estar en CPU y aun as√≠ Whisper ir en GPU.
CT2_CUDA_DEVICES = ctranslate2.get_cuda_device_count()
DEVICE = "cuda" if CT2_CUDA_DEVICES > 0 else "cpu"

MODEL_NAME = "medium"
COMPUTE_TYPE = "float16" if DEVICE == "cuda" else "int8"
LANG = "es"

WHISPER_BATCH_SIZE = 16 if DEVICE == "cuda" else 1

print(f"[WHISPER] CT2_CUDA_DEVICES={CT2_CUDA_DEVICES} | DEVICE={DEVICE} | COMPUTE_TYPE={COMPUTE_TYPE} | BATCH={WHISPER_BATCH_SIZE}")



# ================== OBJETIVOS DE ESTUDIO (CONTROL DE LARGO) ==================

RESUMEN_GENERAL_PALABRAS = (150, 220)
RESUMEN_ESTUDIO_PALABRAS = (600, 900)

PUNTOS_CLAVE_CANTIDAD = (10, 16)
TEMAS_PRINCIPALES_CANTIDAD = (6, 10)
GLOSARIO_CANTIDAD = (10, 18)
PREGUNTAS_REPASO_CANTIDAD = (6, 10)


# ================== OLLAMA (RESUMEN) ==================

OLLAMA_URL = os.environ.get("OLLAMA_URL", "http://localhost:11434")
OLLAMA_MODEL = os.environ.get("OLLAMA_MODEL", "qwen2.5:7b-instruct")

OLLAMA_OPTIONS = {
    "temperature": 0.2,
    "top_p": 0.9,
    "num_ctx": 4096,     # si tu modelo lo soporta, prueba 8192
    "num_predict": 2000  # sube a 2000-2400 si el JSON se corta
}

# timeouts: (connect_timeout, read_timeout)
OLLAMA_TIMEOUT: Tuple[int, int] = (10, 1800)  # 10s connect, 30min read
OLLAMA_RETRIES = 3

# Tama√±o m√°ximo por chunk (si hay demasiados chunks, el resumen se vuelve muy lento)
MAX_CHARS_PER_CHUNK = 20000
MAX_CHUNKS_HARD_LIMIT = 8  # si supera, hacemos chunks m√°s grandes autom√°ticamente


# ================== LOG ==================

def log(msg: str):
    ts = time.strftime("%Y-%m-%d %H:%M:%S")
    print(f"[{ts}] {msg}")


# ================== UTILIDADES ==================

def save_text(path: Path, text: str):
    tmp = path.with_suffix(path.suffix + ".tmp")
    tmp.write_text(text, encoding="utf-8")
    tmp.replace(path)

def read_text(path: Path) -> str:
    return path.read_text(encoding="utf-8", errors="ignore")

def safe_json_loads(s: str) -> Optional[dict]:
    try:
        return json.loads(s)
    except Exception:
        return None

def extract_json_fallback(s: str) -> Optional[dict]:
    """
    Fallback por si Ollama devuelve texto alrededor del JSON.
    """
    s = (s or "").strip()
    if not s:
        return None

    # Caso directo
    j = safe_json_loads(s)
    if isinstance(j, dict):
        return j

    # Buscar primer bloque {...}
    start, end = s.find("{"), s.rfind("}")
    if start != -1 and end != -1 and end > start:
        j = safe_json_loads(s[start:end + 1])
        if isinstance(j, dict):
            return j

    m = re.search(r"\{.*\}", s, re.DOTALL)
    if m:
        j = safe_json_loads(m.group(0))
        if isinstance(j, dict):
            return j

    return None

def _ensure_list(x) -> list:
    if x is None:
        return []
    if isinstance(x, list):
        return x
    return [x]

def _ensure_str(x) -> str:
    return "" if x is None else str(x)

def normalize_summary_json(j: Dict[str, Any], video_name: str) -> Dict[str, Any]:
    """
    Asegura que el JSON final tenga TODAS las llaves esperadas y tipos consistentes.
    """
    if not isinstance(j, dict):
        j = {}

    out = {
        "video": video_name,
        "resumen_general": _ensure_str(j.get("resumen_general", "")),
        "resumen_estudio": _ensure_str(j.get("resumen_estudio", "")),
        "puntos_clave": _ensure_list(j.get("puntos_clave", [])),
        "temas_principales": _ensure_list(j.get("temas_principales", [])),
        "conceptos_importantes": _ensure_list(j.get("conceptos_importantes", [])),
        "glosario": _ensure_list(j.get("glosario", [])),
        "preguntas_repaso": _ensure_list(j.get("preguntas_repaso", [])),
        "tareas_o_recomendaciones": _ensure_list(j.get("tareas_o_recomendaciones", [])),
    }

    # Normaliza glosario y preguntas al formato esperado si vienen como strings
    glos = []
    for it in out["glosario"]:
        if isinstance(it, dict):
            glos.append({"termino": _ensure_str(it.get("termino", "")), "definicion": _ensure_str(it.get("definicion", ""))})
        else:
            s = _ensure_str(it).strip()
            if s:
                glos.append({"termino": s, "definicion": ""})
    out["glosario"] = glos

    preg = []
    for it in out["preguntas_repaso"]:
        if isinstance(it, dict):
            preg.append({"pregunta": _ensure_str(it.get("pregunta", "")), "respuesta_corta": _ensure_str(it.get("respuesta_corta", ""))})
        else:
            s = _ensure_str(it).strip()
            if s:
                preg.append({"pregunta": s, "respuesta_corta": ""})
    out["preguntas_repaso"] = preg

    return out


# ================== S3: LISTAR / DESCARGAR / SUBIR ==================

def list_s3_videos(bucket: str, prefix: str) -> List[str]:
    keys: List[str] = []
    paginator = s3.get_paginator("list_objects_v2")
    for page in paginator.paginate(Bucket=bucket, Prefix=prefix):
        for obj in page.get("Contents", []):
            key = obj["Key"]
            if Path(key).suffix.lower() in VIDEO_EXTS:
                keys.append(key)
    return keys

def download_s3_video(bucket: str, key: str, local_dir: Path) -> Path:
    local_path = local_dir / Path(key).name
    if local_path.exists():
        log(f"‚û°Ô∏è Video ya descargado: {local_path.name}")
        return local_path

    local_dir.mkdir(parents=True, exist_ok=True)
    log(f"‚¨áÔ∏è Descargando: s3://{bucket}/{key}")
    s3.download_file(bucket, key, str(local_path), Config=S3_DOWNLOAD_CONFIG)
    log(f"‚úÖ Descargado: {local_path}")
    return local_path

def upload_json_to_s3(local_json: Path, bucket: str, prefix: str):
    key = prefix.rstrip("/") + "/" + local_json.name
    log(f"‚¨ÜÔ∏è Subiendo JSON a S3: s3://{bucket}/{key}")
    s3.upload_file(str(local_json), bucket, key)
    log("‚úÖ JSON subido a S3")


# ================== WHISPER ==================

def load_whisper_model():
    log(f"üîä Cargando Whisper '{MODEL_NAME}' en {DEVICE} (compute_type={COMPUTE_TYPE}) ...")

    kwargs = dict(
        device=DEVICE,
        compute_type=COMPUTE_TYPE,
    )

    # algunas versiones soportan device_index
    import inspect
    sig = inspect.signature(WhisperModel)
    if "device_index" in sig.parameters and DEVICE == "cuda":
        kwargs["device_index"] = 0

    model = WhisperModel(MODEL_NAME, **kwargs)

    log("‚úÖ Whisper cargado.")
    return model


def transcribe_video(model: WhisperModel, video_path: Path, out_txt: Path, force: bool = False) -> Path:
    if out_txt.exists() and not force:
        log(f"‚û°Ô∏è TXT ya existe: {out_txt.name}")
        return out_txt

    log(f"üéß Transcribiendo: {video_path.name} (batch_size={WHISPER_BATCH_SIZE}) ...")
    t0 = time.time()

    # kwargs base (compatibles)
    kwargs = dict(
        language=LANG,
        vad_filter=True,
        vad_parameters=dict(min_silence_duration_ms=400),
        beam_size=1,
        best_of=1,
        temperature=0.0,
        condition_on_previous_text=False,
    )

    # Estos flags no existen en algunas versiones viejas, as√≠ que los agregamos SOLO si est√°n
    sig = inspect.signature(model.transcribe)
    params = sig.parameters

    if "without_timestamps" in params:
        kwargs["without_timestamps"] = True
    if "word_timestamps" in params:
        kwargs["word_timestamps"] = False
    if "batch_size" in params:
        kwargs["batch_size"] = WHISPER_BATCH_SIZE

    segments, info = model.transcribe(str(video_path), **kwargs)

    text = "".join(seg.text for seg in segments).strip()
    save_text(out_txt, text)

    dt = time.time() - t0
    log(f"‚úÖ TXT guardado: {out_txt.name} ({len(text)} chars) | {dt/60:.1f} min")
    return out_txt


# ================== OLLAMA ==================

def call_ollama_json(prompt: str) -> Dict[str, Any]:
    """
    Llama a Ollama forzando salida JSON y con retries.
    """
    payload = {
        "model": OLLAMA_MODEL,
        "prompt": prompt,
        "stream": False,
        "format": "json",
        "keep_alive": "60m",
        "options": OLLAMA_OPTIONS,
    }

    last_err = None
    for attempt in range(1, OLLAMA_RETRIES + 1):
        try:
            resp = requests.post(f"{OLLAMA_URL}/api/generate", json=payload, timeout=OLLAMA_TIMEOUT)
            resp.raise_for_status()
            data = resp.json()
            raw = (data.get("response") or "").strip()

            j = safe_json_loads(raw)
            if isinstance(j, dict):
                return j

            j2 = extract_json_fallback(raw)
            if isinstance(j2, dict):
                return j2

            raise ValueError("Ollama devolvi√≥ respuesta sin JSON v√°lido.")

        except Exception as e:
            last_err = e
            wait = min(20, 2 ** attempt) + random.random()
            log(f"‚ö†Ô∏è Ollama error (intento {attempt}/{OLLAMA_RETRIES}): {e} | reintento en {wait:.1f}s")
            time.sleep(wait)

    raise RuntimeError(f"Fall√≥ Ollama tras {OLLAMA_RETRIES} intentos. √öltimo error: {last_err}")


# ================== PROMPTS ==================

def build_summary_prompt_full(transcript: str, video_name: str) -> str:
    gmin, gmax = RESUMEN_GENERAL_PALABRAS
    emin, emax = RESUMEN_ESTUDIO_PALABRAS
    pmin, pmax = PUNTOS_CLAVE_CANTIDAD
    tmin, tmax = TEMAS_PRINCIPALES_CANTIDAD
    glmin, glmax = GLOSARIO_CANTIDAD
    qmin, qmax = PREGUNTAS_REPASO_CANTIDAD

    return f"""
Eres un asistente experto en educaci√≥n que transforma transcripciones de clases en apuntes para estudiar.

Vas a recibir la transcripci√≥n casi completa de una CLASE en espa√±ol.
Debes devolver SOLO un objeto JSON v√°lido con esta estructura (sin texto adicional):

{{
  "video": "{video_name}",
  "resumen_general": "Resumen r√°pido de {gmin}-{gmax} palabras (1 p√°rrafo).",
  "resumen_estudio": "Apuntes para estudiar de {emin}-{emax} palabras, con subt√≠tulos y vi√±etas cuando aplique. Incluye: (1) qu√© se explic√≥, (2) pasos/procesos, (3) ejemplos si aparecen, (4) conclusiones.",
  "puntos_clave": ["{pmin}-{pmax} bullets, cada bullet 10-18 palabras aprox."],
  "temas_principales": ["{tmin}-{tmax} temas (frases cortas)."],
  "conceptos_importantes": ["lista de conceptos importantes (solo nombres, sin definici√≥n larga)."],
  "glosario": [{{"termino":"...","definicion":"definici√≥n corta 1-2 l√≠neas"}}],  // entre {glmin}-{glmax} items
  "preguntas_repaso": [{{"pregunta":"...","respuesta_corta":"..."}}],            // entre {qmin}-{qmax} items
  "tareas_o_recomendaciones": ["si el profesor dej√≥ tareas o sugerencias; si no, []"]
}}

Reglas:
- El JSON debe ser v√°lido (comillas dobles, sin comentarios).
- Escribe en espa√±ol claro.
- NO agregues nada fuera del JSON.
- Respeta los rangos de palabras y cantidades indicados.

Transcripci√≥n:
--------------------------
{transcript}
--------------------------
""".strip()

def build_chunk_summary_prompt(chunk_text: str, idx: int, total: int, video_name: str) -> str:
    # Para fragmentos, pedimos un resumen ‚Äúdenso‚Äù (ayuda al consolidado)
    return f"""
Est√°s ayudando a resumir una clase larga de video.

Este es el fragmento {idx}/{total} de la transcripci√≥n de la clase "{video_name}".

Devuelve SOLO un objeto JSON v√°lido con esta estructura:

{{
  "fragmento": {idx},
  "resumen_fragmento": "120-180 palabras. Explica qu√© se ense√±√≥ y c√≥mo, con el mayor detalle √∫til.",
  "puntos_clave_fragmento": ["6-10 bullets con ideas accionables / definiciones / pasos"]
}}

Reglas:
- JSON v√°lido (comillas dobles).
- Sin texto adicional fuera del JSON.

Transcripci√≥n del fragmento:
----------------------------
{chunk_text}
----------------------------
""".strip()


# ================== CHUNKING ==================

def chunk_text(text: str, max_chars: int = MAX_CHARS_PER_CHUNK) -> List[str]:
    text = text.strip()
    if len(text) <= max_chars:
        return [text]

    chunks: List[str] = []
    start = 0
    n = len(text)

    while start < n:
        end = min(n, start + max_chars)
        cut = text.rfind(".", start, end)
        if cut == -1 or cut <= start + int(max_chars * 0.6):
            cut = end
        else:
            cut = cut + 1
        chunk = text[start:cut].strip()
        if chunk:
            chunks.append(chunk)
        start = cut

    return chunks


# ================== RESUMEN GLOBAL ==================

def summarize_transcript_with_ollama(transcript: str, video_name: str) -> Dict[str, Any]:
    transcript = (transcript or "").strip()
    if not transcript:
        return normalize_summary_json({}, video_name)

    # Primer chunking
    chunks = chunk_text(transcript, max_chars=MAX_CHARS_PER_CHUNK)

    # Si quedan demasiados chunks, hacemos chunks m√°s grandes para no demorar horas
    if len(chunks) > MAX_CHUNKS_HARD_LIMIT:
        log(f"‚ö†Ô∏è Muchos fragmentos ({len(chunks)}). Aumentando tama√±o de chunk para acelerar...")
        bigger = min(20000, MAX_CHARS_PER_CHUNK * 3)
        chunks = chunk_text(transcript, max_chars=bigger)

    log(f"üß© {video_name}: {len(chunks)} fragmentos")

    # Si hay un solo fragmento: resumen directo
    if len(chunks) == 1:
        t0 = time.time()
        prompt = build_summary_prompt_full(chunks[0], video_name)
        j = call_ollama_json(prompt)
        j = normalize_summary_json(j, video_name)
        log(f"‚úÖ Resumen (1 paso) listo | {(time.time()-t0)/60:.1f} min")
        return j

    # Resumen por fragmentos
    fragment_summaries: List[Dict[str, Any]] = []
    for i, chunk in enumerate(chunks, start=1):
        log(f"   ‚Ü≥ Ollama fragmento {i}/{len(chunks)} ...")
        prompt = build_chunk_summary_prompt(chunk, i, len(chunks), video_name)
        frag = call_ollama_json(prompt)
        if not isinstance(frag, dict):
            frag = {"fragmento": i, "resumen_fragmento": "", "puntos_clave_fragmento": []}
        fragment_summaries.append(frag)

    # Consolidaci√≥n final
    resumenes_txt = []
    for frag in fragment_summaries:
        num = frag.get("fragmento")
        r = frag.get("resumen_fragmento", "")
        pts = frag.get("puntos_clave_fragmento", [])
        resumenes_txt.append(f"Fragmento {num}:\nResumen: {r}\nPuntos clave: {pts}\n")

    texto_para_resumen_final = "\n\n".join(resumenes_txt)

    gmin, gmax = RESUMEN_GENERAL_PALABRAS
    emin, emax = RESUMEN_ESTUDIO_PALABRAS
    pmin, pmax = PUNTOS_CLAVE_CANTIDAD
    tmin, tmax = TEMAS_PRINCIPALES_CANTIDAD
    glmin, glmax = GLOSARIO_CANTIDAD
    qmin, qmax = PREGUNTAS_REPASO_CANTIDAD

    prompt_final = f"""
Eres un asistente experto en educaci√≥n que genera apuntes para estudiar a partir de res√∫menes parciales.

Se te dar√° una serie de res√∫menes por fragmento de la clase "{video_name}".
Con esa informaci√≥n, genera un √∫nico JSON con esta estructura:

{{
  "video": "{video_name}",
  "resumen_general": "Resumen r√°pido de {gmin}-{gmax} palabras (1 p√°rrafo).",
  "resumen_estudio": "Apuntes para estudiar de {emin}-{emax} palabras, con subt√≠tulos y vi√±etas cuando aplique. Incluye: (1) qu√© se explic√≥, (2) pasos/procesos, (3) ejemplos si aparecen, (4) conclusiones.",
  "puntos_clave": ["{pmin}-{pmax} bullets, cada bullet 10-18 palabras aprox."],
  "temas_principales": ["{tmin}-{tmax} temas (frases cortas)."],
  "conceptos_importantes": ["lista de conceptos importantes (solo nombres)."],
  "glosario": [{{"termino":"...","definicion":"definici√≥n corta 1-2 l√≠neas"}}],  // {glmin}-{glmax}
  "preguntas_repaso": [{{"pregunta":"...","respuesta_corta":"..."}}],            // {qmin}-{qmax}
  "tareas_o_recomendaciones": ["tareas o recomendaciones; si no hay, []"]
}}

Reglas:
- Usa SOLO la informaci√≥n de los res√∫menes de fragmento.
- El JSON debe ser v√°lido.
- Todo en espa√±ol.
- Respeta los rangos de palabras y cantidades indicados.
- NO agregues texto fuera del JSON.

Res√∫menes de fragmentos:
------------------------
{texto_para_resumen_final}
------------------------
""".strip()

    log("üß† Consolidando resumen final ...")
    t0 = time.time()
    j_final = call_ollama_json(prompt_final)
    j_final = normalize_summary_json(j_final, video_name)
    log(f"‚úÖ Resumen final listo | {(time.time()-t0)/60:.1f} min")
    return j_final


# ================== PIPELINE PRINCIPAL ==================

def procesar_videos_desde_s3():
    model = load_whisper_model()

    keys = list_s3_videos(S3_BUCKET, S3_PREFIX_VIDEOS)
    if not keys:
        log(f"‚ö†Ô∏è No se encontraron videos en s3://{S3_BUCKET}/{S3_PREFIX_VIDEOS}")
        return

    if LIMIT_VIDEOS is not None:
        keys = keys[:LIMIT_VIDEOS]

    log(f"üé¨ Videos encontrados: {len(keys)}")

    for idx, key in enumerate(keys, start=1):
        video_name = Path(key).name
        stem = Path(key).stem

        txt_path = TRANSCRIPTS_DIR / f"{stem}.txt"
        json_out = JSON_DIR / f"{stem}_resumen.json"

        log("=" * 90)
        log(f"[{idx}/{len(keys)}] ‚ñ∂Ô∏è {video_name}")

        # ‚úÖ Si ya existe el JSON final, saltar todo
        if json_out.exists():
            log(f"‚û°Ô∏è Ya existe JSON: {json_out.name} | Salto.")
            continue

        video_path: Optional[Path] = None
        try:
            # ‚úÖ Si ya existe TXT, no descargamos video
            if txt_path.exists():
                log(f"‚û°Ô∏è TXT ya existe: {txt_path.name} | No descargo video.")
            else:
                # Descargar + transcribir
                t0 = time.time()
                video_path = download_s3_video(S3_BUCKET, key, LOCAL_VIDEO_DIR)
                log(f"‚è±Ô∏è Descarga: {(time.time()-t0)/60:.1f} min")

                transcribe_video(model, video_path, txt_path, force=False)

            transcript = read_text(txt_path)

            # Resumir
            t0 = time.time()
            resumen = summarize_transcript_with_ollama(transcript, video_name)
            log(f"‚è±Ô∏è Resumen total: {(time.time()-t0)/60:.1f} min")

            # Guardar JSON (at√≥mico)
            tmp = json_out.with_suffix(".json.tmp")
            with tmp.open("w", encoding="utf-8") as f:
                json.dump(resumen, f, ensure_ascii=False, indent=2)
            tmp.replace(json_out)
            log(f"üíæ JSON guardado: {json_out}")

            if UPLOAD_JSON_TO_S3:
                upload_json_to_s3(json_out, S3_BUCKET, S3_PREFIX_JSON)

        except Exception as e:
            log(f"‚ùå Error procesando {video_name}: {e}")

        finally:
            # üßπ Borra video SOLO si se descarg√≥ en este ciclo
            if video_path and video_path.exists():
                try:
                    video_path.unlink()
                    log(f"üßπ Video local eliminado: {video_path.name}")
                except Exception as e:
                    log(f"‚ö†Ô∏è No se pudo borrar {video_path}: {e}")


if __name__ == "__main__":
    procesar_videos_desde_s3()


[WHISPER] CT2_CUDA_DEVICES=1 | DEVICE=cuda | COMPUTE_TYPE=float16 | BATCH=16
[2025-12-30 09:10:14] üîä Cargando Whisper 'medium' en cuda (compute_type=float16) ...
[2025-12-30 09:10:17] ‚úÖ Whisper cargado.
[2025-12-30 09:10:19] üé¨ Videos encontrados: 139
[2025-12-30 09:10:19] [1/139] ‚ñ∂Ô∏è FUNDAMENTOS DE CONTABILIDAD TALLER OPCION 1 - 2025_12_03 17_53 GMT-05_00 - Recording.mp4
[2025-12-30 09:10:19] ‚¨áÔ∏è Descargando: s3://cun-transcribe-five9/Videos_clase_Profesores/video_12_04_25a/FUNDAMENTOS DE CONTABILIDAD TALLER OPCION 1 - 2025_12_03 17_53 GMT-05_00 - Recording.mp4
[2025-12-30 09:11:02] ‚úÖ Descargado: C:\videos_clases_s3\FUNDAMENTOS DE CONTABILIDAD TALLER OPCION 1 - 2025_12_03 17_53 GMT-05_00 - Recording.mp4
[2025-12-30 09:11:02] ‚è±Ô∏è Descarga: 0.7 min
[2025-12-30 09:11:02] üéß Transcribiendo: FUNDAMENTOS DE CONTABILIDAD TALLER OPCION 1 - 2025_12_03 17_53 GMT-05_00 - Recording.mp4 (batch_size=16) ...
[2025-12-30 09:15:37] ‚úÖ TXT guardado: FUNDAMENTOS DE CONTABILIDAD TALL