In [None]:
import cv2
import yt_dlp
import os
import time

# --- 1. Obtener la URL del Stream en Directo (sin descargar el vídeo completo) ---

video_url = 'https://www.youtube.com/watch?v=i_jiHI3k8ag'
ydl_opts = {'format': 'best'}

# Usamos yt-dlp para extraer la información del vídeo, incluida la URL del stream
with yt_dlp.YoutubeDL(ydl_opts) as ydl:
    info_dict = ydl.extract_info(video_url, download=False)
    # Buscamos la URL del manifiesto o del stream directo
    stream_url = info_dict.get('url', None)

if not stream_url:
    raise ValueError("No se pudo obtener la URL del stream. El directo podría no estar activo o ser privado.")

print(f"URL del stream obtenida con éxito. Abriendo con OpenCV...")


# --- 2. Capturar un número limitado de fotogramas del Stream ---

# Creamos la carpeta de salida si no existe
output_folder = 'data/raw_images'
if not os.path.exists(output_folder):
    os.makedirs(output_folder)

# Abrimos el stream de vídeo con OpenCV
cap = cv2.VideoCapture(stream_url)

# Número de fotogramas que queremos capturar para nuestra muestra
frames_to_capture = 10
frames_captured = 0

# Damos un pequeño margen para que el stream se cargue
time.sleep(2)

while cap.isOpened() and frames_captured < frames_to_capture:
    success, frame = cap.read()
    
    if not success:
        print("Error al leer el stream. Intentando de nuevo...")
        time.sleep(1) # Esperamos un segundo antes de reintentar
        continue
    
    # Guardamos el fotograma
    image_name = f"sample_frame_{frames_captured:03d}.jpg"
    image_path = os.path.join(output_folder, image_name)
    cv2.imwrite(image_path, frame)
    
    print(f"¡Capturado y guardado! -> {image_path}")
    frames_captured += 1
    
    # Esperamos un par de segundos antes de capturar el siguiente para tener variedad
    time.sleep(2)

# Liberamos el objeto de vídeo
cap.release()

print(f"\nProceso completado. Se capturaron {frames_captured} fotogramas de muestra.")