# An치lisis Exploratorio de Videos

In [1]:
import os
from pathlib import Path
from datetime import datetime
import json

In [2]:
def get_video_files(directory):
    """Obtiene todos los archivos de video en el directorio."""
    video_extensions = ['.mp4', '.avi', '.mov', '.mkv', '.wmv', '.flv']
    videos = []
    
    if not os.path.exists(directory):
        print(f"Directorio no encontrado: {directory}")
        return videos
    
    for root, dirs, files in os.walk(directory):
        for file in files:
            if any(file.lower().endswith(ext) for ext in video_extensions):
                videos.append(os.path.join(root, file))
    
    return videos

In [3]:
def analyze_video_metadata(video_path):
    """Analiza metadatos b치sicos de un archivo de video."""
    stats = os.stat(video_path)
    
    return {
        'nombre': os.path.basename(video_path),
        'ruta': video_path,
        'tama침o_mb': round(stats.st_size / (1024 * 1024), 2),
        'fecha_creacion': datetime.fromtimestamp(stats.st_ctime).strftime('%Y-%m-%d %H:%M:%S'),
        'fecha_modificacion': datetime.fromtimestamp(stats.st_mtime).strftime('%Y-%m-%d %H:%M:%S'),
        'extension': os.path.splitext(video_path)[1]
    }

## Configuraci칩n

Directorio donde est치n los videos:

In [4]:
# Directorio de videos
video_directory = '../data'

## An치lisis de Videos

In [10]:
print("="*70)
print("AN츼LISIS EXPLORATORIO DE VIDEOS")
print("="*70)

# Obtener videos
videos = get_video_files(video_directory)

if not videos:
    print(f"\nNo se encontraron videos en: {video_directory}")
else:
    for video in videos:
        print(os.path.basename(video))
    print(f"\nTotal de videos encontrados: {len(videos)}")
    print("-"*70)

AN츼LISIS EXPLORATORIO DE VIDEOS
Video 12.mp4
Video 13.mp4
Video 11.mp4
Video 10.mp4
Video 14.mp4
Video 15.mp4
Video 17.mp4
Video 16.mp4
Video 8.mp4
Video 9.mp4
Video 1.mp4
Video 2.mp4
Video 3.mp4
Video 7.mp4
Video 6.mp4
Video 4.mp4
Video 5.mp4
Video 18.mp4

Total de videos encontrados: 18
----------------------------------------------------------------------


## An치lisis de Metadatos

In [11]:
if videos:
    # Analizar cada video
    video_data = []
    total_size = 0
    
    for video_path in videos:
        metadata = analyze_video_metadata(video_path)
        video_data.append(metadata)
        total_size += metadata['tama침o_mb']
    
    # Resumen por extensi칩n
    extensions = {}
    for vd in video_data:
        ext = vd['extension']
        extensions[ext] = extensions.get(ext, 0) + 1

## 1. Resumen General

In [12]:
if videos:
    print("\n1. RESUMEN GENERAL")
    print("-"*70)
    print(f"Total de videos: {len(videos)}")
    print(f"Tama침o total: {total_size:.2f} MB ({total_size/1024:.2f} GB)")
    print(f"Tama침o promedio: {total_size/len(videos):.2f} MB")


1. RESUMEN GENERAL
----------------------------------------------------------------------
Total de videos: 18
Tama침o total: 39.78 MB (0.04 GB)
Tama침o promedio: 2.21 MB


## 2. Distribuci칩n por Formato

In [13]:
if videos:
    print("\n2. DISTRIBUCI칍N POR FORMATO")
    print("-"*70)
    for ext, count in sorted(extensions.items()):
        print(f"{ext}: {count} archivos")


2. DISTRIBUCI칍N POR FORMATO
----------------------------------------------------------------------
.mp4: 18 archivos


## 3. Listado Detallado de Videos

In [None]:
if videos:
    print("\n3. LISTADO DETALLADO DE VIDEOS")
    print("-"*70)
    for i, vd in enumerate(video_data, 1):
        print(f"\n{i}. {vd['nombre']}")
        print(f"   Tama침o: {vd['tama침o_mb']} MB")
        print(f"   Formato: {vd['extension']}")
        print(f"   Creado: {vd['fecha_creacion']}")



3. LISTADO DETALLADO DE VIDEOS
----------------------------------------------------------------------

1. Video 12.mp4
   Tama침o: 3.36 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

2. Video 13.mp4
   Tama침o: 1.9 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

3. Video 11.mp4
   Tama침o: 2.74 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

4. Video 10.mp4
   Tama침o: 1.9 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

5. Video 14.mp4
   Tama침o: 2.23 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

6. Video 15.mp4
   Tama침o: 2.15 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

7. Video 17.mp4
   Tama침o: 2.2 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

8. Video 16.mp4
   Tama침o: 2.53 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

9. Video 8.mp4
   Tama침o: 1.81 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

10. Video 9.mp4
   Tama침o: 2.06 MB
   Formato: .mp4
   Creado: 2025-10-17 12:13:06

11. Video 1.mp4
   Tama침o: 2.06 MB
   Formato: .mp4
   Cread

## Guardar Reporte JSON

In [None]:
def export_video_report_to_json(video_directory, videos, video_data, total_size, extensions, output_dir="../results"):
    """
    Exporta el an치lisis de videos a un archivo JSON.
    """
    if not videos:
        print("No hay videos para exportar.")
        return None

    # Crear carpeta de salida si no existe
    os.makedirs(output_dir, exist_ok=True)

    # Nombre del archivo con fecha y hora
    timestamp = datetime.now().strftime("%Y%m%d_%H%M%S")
    output_file = os.path.join(output_dir, f"video_eda_report_{timestamp}.json")

    # Estructura del reporte
    report_data = {
        "fecha_analisis": datetime.now().strftime("%Y-%m-%d %H:%M:%S"),
        "directorio": os.path.abspath(video_directory),
        "total_videos": len(videos),
        "tama침o_total_mb": round(total_size, 2),
        "tama침o_total_gb": round(total_size / 1024, 2),
        "tama침o_promedio_mb": round(total_size / len(videos), 2),
        "formatos": extensions,
        "videos": video_data
    }

    # Guardar como JSON
    with open(output_file, "w", encoding="utf-8") as f:
        json.dump(report_data, f, indent=4, ensure_ascii=False)

    print(f"\n{'='*70}")
    print(f"游늬 Reporte exportado a: {output_file}")
    print("="*70)
    
    return output_file


if videos:
    export_video_report_to_json(video_directory, videos, video_data, total_size, extensions)



游늬 Reporte exportado a: ../results/video_eda_report_20251017_122617.json
