In [None]:
import torch
from torch import nn, optim
import torchvision
from torchvision import datasets, transforms
from torch.utils.data import DataLoader

# Cargar un modelo preentrenado, por ejemplo, ResNet50
model = torchvision.models.resnet50(pretrained=True)

# Asegúrate de que el modelo esté en la misma ubicación que los datos (en la GPU)
device = torch.device('cuda' if torch.cuda.is_available() else 'cpu')
model = model.to(device)

# Congelar todos los parámetros del modelo
for param in model.parameters():
    param.requires_grad = False

# Ahora, activar los gradientes solo para las capas que quieres entrenar
# Ejemplo: si estamos usando LoRA, activamos los gradientes en las capas modificadas
for param in model.layer4.parameters():  # Asumiendo que layer4 es la capa modificada por LoRA
    param.requires_grad = True

# Imprimir los parámetros que están siendo entrenados
print("Parámetros entrenables:")
for name, param in model.named_parameters():
    if param.requires_grad:
        print(f" - {name}")

# Definir las transformaciones
transform = transforms.Compose([
    transforms.Resize((512, 512)),
    transforms.ToTensor(),
    transforms.Normalize(mean=[0.485, 0.456, 0.406], std=[0.229, 0.224, 0.225])  # Normalización similar a la de ImageNet
])

# Cargar el conjunto de datos
dataset = datasets.CIFAR10(root='Pruebalora2', train=True, download=True, transform=transform)
train_loader = DataLoader(dataset, batch_size=32, shuffle=True)

# Definir el optimizador (aquí estamos entrenando LoRA)
optimizer = optim.Adam(filter(lambda p: p.requires_grad, model.parameters()), lr=1e-4)

# Definir la función de pérdida
criterion = nn.CrossEntropyLoss()

# Ajuste fino (Fine-Tuning)
epochs = 10
for epoch in range(epochs):
    epoch_loss = 0
    model.train()  # Establecer el modelo en modo entrenamiento
    for batch_idx, (images, labels) in enumerate(train_loader):
        
        # Enviar imágenes y etiquetas al dispositivo (si usas GPU)
        images, labels = images.to(device), labels.to(device)

        # Adelante (Forward)
        outputs = model(images)
        loss = criterion(outputs, labels)

        # Retropropagación (Backward)
        loss.backward()
        optimizer.step()
        optimizer.zero_grad()

        epoch_loss += loss.item()

        # Imprimir la pérdida de cada lote
        if (batch_idx + 1) % 10 == 0:  # Imprimir cada 10 lotes
            print(f"Epoch [{epoch+1}/{epochs}], Batch [{batch_idx+1}/{len(train_loader)}], Loss: {loss.item():.4f}")

    # Imprimir la pérdida promedio de la época
    print(f"Epoch {epoch + 1}/{epochs}, Average Loss: {epoch_loss/len(train_loader):.4f}")


In [None]:
# Guardar el modelo entrenado
model_path = 'modelo_entrenado.pth'  # Puedes cambiar el nombre de archivo y la ruta
torch.save(model.state_dict(), model_path)
print(f"Modelo guardado en {model_path}")

In [32]:
import torch
print(torch.cuda.is_available())  # Debería devolver True si CUDA está disponible


True


In [9]:
pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu124

^C
Note: you may need to restart the kernel to use updated packages.


In [None]:
pip list

In [None]:
import torch
print(f"CUDA disponible: {torch.cuda.is_available()}")
print(f"Nombre de la GPU: {t63orch.cuda.get_device_name(0)}")
