In [1]:
import torch
import time

In [2]:
print(f"Versión de PyTorch instalada: {torch.__version__}")
if "+cu" in torch.__version__:
    print("Análisis: ¡Éxito! La versión de PyTorch ahora tiene soporte para CUDA.")
else:
    print("Análisis: El problema persiste. Verifique la compatibilidad de versiones.")

print(f"Resultado final de torch.cuda.is_available(): {torch.cuda.is_available()}")

Versión de PyTorch instalada: 2.10.0.dev20251004+cu130
Análisis: ¡Éxito! La versión de PyTorch ahora tiene soporte para CUDA.
Resultado final de torch.cuda.is_available(): True


In [4]:
print("--- Prueba de Rendimiento de PyTorch: CPU vs. GPU (CUDA) ---")

# --- PASO 1: Verificación Fundamental ---
if not torch.cuda.is_available():
    print("\n❌ ERROR: PyTorch reporta que CUDA no está disponible.")
    print("   Asegúrate de haber seguido los pasos de reinstalación forzada.")
    # Si no hay CUDA, no tiene sentido continuar. Detengo el script.
    exit()

print("\n✅ Verificación inicial exitosa: PyTorch detecta un dispositivo CUDA.")
gpu_name = torch.cuda.get_device_name(0)
print(f"   Dispositivo detectado: {gpu_name}")

# --- PASO 2: Preparación para la Prueba de Rendimiento ---
tamano_matriz = 5000
print(f"\nSe realizarán multiplicaciones de matrices de tamaño: {tamano_matriz}x{tamano_matriz}")

# Creo dos matrices aleatorias grandes en la CPU.
matriz_a_cpu = torch.randn(tamano_matriz, tamano_matriz)
matriz_b_cpu = torch.randn(tamano_matriz, tamano_matriz)

# --- PASO 3: Prueba de Velocidad en la CPU ---
print("\n[Iniciando prueba en la CPU...]")
tiempo_inicio_cpu = time.time()

# Realizo la multiplicación de matrices en la CPU.
for _ in range(10):
    resultado_cpu = torch.matmul(matriz_a_cpu, matriz_b_cpu)

# Registro el tiempo justo después de terminar.
tiempo_fin_cpu = time.time()
duracion_cpu = tiempo_fin_cpu - tiempo_inicio_cpu
print(f"  -> Tiempo de ejecución en CPU: {duracion_cpu:.4f} segundos.")


# --- PASO 4: Prueba de Velocidad en la GPU (CUDA) ---
print("\n[Iniciando prueba en la GPU...]")

matriz_a_gpu = matriz_a_cpu.to("cuda")
matriz_b_gpu = matriz_b_cpu.to("cuda")

# Registro el tiempo de inicio.
tiempo_inicio_gpu = time.time()

# Realizo exactamente la misma multiplicación, pero ahora con los tensores que están en la GPU.
for _ in range(10):
    resultado_gpu = torch.matmul(matriz_a_gpu, matriz_b_gpu)

torch.cuda.synchronize()

tiempo_fin_gpu = time.time()
duracion_gpu = tiempo_fin_gpu - tiempo_inicio_gpu
print(f"  -> Tiempo de ejecución en GPU: {duracion_gpu:.4f} segundos.")


# --- PASO 5: Conclusión ---
print("\n--- Resultados Finales ---")
print(f"Tiempo en CPU: {duracion_cpu:.4f} segundos.")
print(f"Tiempo en GPU: {duracion_gpu:.4f} segundos.")
print("="*30)
if duracion_gpu < duracion_cpu:
    factor_velocidad = duracion_cpu / duracion_gpu
    print(f"✅ ¡Éxito! La GPU fue aproximadamente {factor_velocidad:.1f} veces más rápida que la CPU.")
else:
    print("⚠️  Atención: La GPU no fue más rápida. Esto puede ocurrir con matrices muy pequeñas")
    print("   o si la GPU es de gama muy baja. Intenta aumentar el 'tamano_matriz'.")

--- Prueba de Rendimiento de PyTorch: CPU vs. GPU (CUDA) ---

✅ Verificación inicial exitosa: PyTorch detecta un dispositivo CUDA.
   Dispositivo detectado: NVIDIA GeForce RTX 3090

Se realizarán multiplicaciones de matrices de tamaño: 5000x5000

[Iniciando prueba en la CPU...]
  -> Tiempo de ejecución en CPU: 6.0088 segundos.

[Iniciando prueba en la GPU...]
  -> Tiempo de ejecución en GPU: 0.2155 segundos.

--- Resultados Finales ---
Tiempo en CPU: 6.0088 segundos.
Tiempo en GPU: 0.2155 segundos.
✅ ¡Éxito! La GPU fue aproximadamente 27.9 veces más rápida que la CPU.
