# Lightning AI SDXL LoRA Trainer

Este cuaderno prepara un entorno dentro de Lightning AI (ruta raíz ``/teamspace/studios/this_studio``)
y ejecuta el entrenador de LoRA para Stable Diffusion XL incluido en este fork.

Los pasos principales son:

1. Crear/usar un entorno gestionado por [uv](https://github.com/astral-sh/uv).
2. Organizar el dataset en la carpeta `dataset/`, colocando cada imagen junto a un archivo `.txt` con el mismo nombre
   que contenga sus tags/prompts. Puedes definir *activation tags* globales y habilitar el mezclado de tags desde la
   configuración.
3. Instalar las dependencias necesarias.
4. Definir la configuración de entrenamiento (epochs, repeats, tasas de aprendizaje, tags, modelo base, etc.).
5. Ejecutar el entrenamiento calculando automáticamente los *steps* mediante la fórmula requerida.
6. Seleccionar optimizadores personalizados (AdamW8bit, Prodigy, DAdapt*, Lion, etc.) y schedulers (`cosine`, `rex`,
   `cosine_with_restarts`, entre otros) incluidos en este fork.

7. Activa o desactiva los valores recomendados de cada optimizador con `use_optimizer_recommended_args` si quieres aplicar los presets sugeridos (Adafactor, AdamW8bit, Prodigy y CAME) sin tocar manualmente `optimizer_kwargs`.

8. Define el nombre final del archivo LoRA con `lora_name` o la bandera `--lora-name` para controlar el `.safetensors` generado.

Modelos base disponibles (`base_model` o `--base-model`):

- `Pony Diffusion V6 XL` → `PonyDiffusion/Pony-Diffusion-V6-XL`
- `Animagine XL V3` → `cagliostrolab/animagine-xl-3.0`
- `animagine_4.0_zero` → `cagliostrolab/animagine-xl-4.0-zero`
- `Illustrious_0.1` → `stabilityai/illustrious-xl-0.1`
- `Illustrious_2.0` → `stabilityai/illustrious-xl-2.0`
- `NoobAI-XL0.75` → `NoobAI/NoobAI-XL0.75`
- `Stable Diffusion XL 1.0 base` → `stabilityai/stable-diffusion-xl-base-1.0`
- `NoobAIXL0_75vpred` → `NoobAI/NoobAIXL0.75-vPred`
- `RouWei_v080vpred` → `RouWei/RouWei-v0.80-vPred`


In [None]:
from pathlib import Path
import os
import subprocess
import sys

LIGHTNING_ROOT = Path("/teamspace/studios/this_studio")
UV_BIN = Path.home() / ".local" / "bin" / "uv"

if not UV_BIN.exists():
    print("Instalando uv…")
    subprocess.run(
        ["/bin/bash", "-lc", "curl -LsSf https://astral.sh/uv/install.sh | sh"],
        check=True,
    )
else:
    print("uv ya está instalado")

os.environ["PATH"] = f"{UV_BIN.parent}:{os.environ['PATH']}"
os.environ.setdefault("UV_PROJECT_ENVIRONMENT", str(LIGHTNING_ROOT / ".venv"))
print("Entorno de uv:", os.environ["UV_PROJECT_ENVIRONMENT"])

repo_root = Path.cwd().resolve()
if not (repo_root / "lightning_ai").exists():
    candidate = repo_root / "LoRA_Easy_Training_scripts_Backend"
    if candidate.exists():
        repo_root = candidate.resolve()
if not (repo_root / "lightning_ai").exists():
    raise FileNotFoundError("No se encontró la carpeta 'lightning_ai' junto al notebook.")

if str(repo_root) not in sys.path:
    sys.path.insert(0, str(repo_root))
print("Repositorio detectado en:", repo_root)


In [None]:
import subprocess

required_packages = [
    "numpy<2",
    "bitsandbytes",
    "prodigyopt",
    "lion-pytorch",
    "dadaptation",
    "pytorch-optimizer==3.1.2",
    "torch>=2.1",
    "torchvision",
    "accelerate>=0.23",
    "diffusers[torch]>=0.24",
    "transformers>=4.35",
    "peft>=0.7",
    "safetensors",
]

print("Instalando dependencias con uv…")
subprocess.run(["uv", "pip", "install", "--upgrade", *required_packages], check=True)


In [None]:
from pathlib import Path
from lightning_ai.sdxl_lora_trainer import BASE_MODEL_CHOICES, TrainingConfig

base_config = TrainingConfig(
    dataset_dir=Path("dataset"),  # carpeta con imágenes y .txt emparejados
    output_dir=Path("outputs/sdxl_lora_demo"),
    num_epochs=2,
    batch_size=1,
    gradient_accumulation=1,
    num_repeats=2,
    resolution=1024,
    network_rank=64,
    network_alpha=128,
    base_model="Stable Diffusion XL 1.0 base",
    unet_lr=1e-4,
    text_encoder_lr=5e-6,
    optimizer_type="adamw",
    weight_decay=1e-2,
    optimizer_beta1=0.9,
    optimizer_beta2=0.999,
    optimizer_eps=1e-8,
    optimizer_momentum=0.9,
    scheduler_type="cosine",
    lr_warmup_steps=None,
    scheduler_first_cycle_steps=None,
    scheduler_cycle_multiplier=1.0,
    scheduler_gamma=1.0,
    scheduler_min_lr=1e-6,
    scheduler_d=0.9,
    scheduler_power=1.0,
    train_text_encoders=True,
    mixed_precision="fp16",
    shuffle_tags=True,
    activation_tags=("mi_lora",),
    use_optimizer_recommended_args=True,
    lora_name="mi_lora_personalizado",  # la extensión .safetensors se añade si falta
)

print("Modelos base disponibles:")
for name in BASE_MODEL_CHOICES:
    print(f"  - {name}")

config = base_config.normalised_paths()
print("Configuración resuelta:")
for key, value in config.__dict__.items():
    print(f"  {key}: {value}")


In [None]:
import json
from lightning_ai.sdxl_lora_trainer import FolderCaptionDataset, calculate_total_steps

preview_dataset = FolderCaptionDataset(
    dataset_dir=config.dataset_dir,
    resolution=config.resolution,
    activation_tags=config.activation_tags,
    shuffle_tags=config.shuffle_tags,
)

num_images = len(preview_dataset)
steps = calculate_total_steps(
    num_images=num_images,
    num_repeats=config.num_repeats,
    num_epochs=config.num_epochs,
    batch_size=config.batch_size,
)
print(json.dumps(
    {
        "num_images": num_images,
        "num_repeats": config.num_repeats,
        "num_epochs": config.num_epochs,
        "batch_size": config.batch_size,
        "calculated_steps": steps,
    },
    indent=2,
))


In [None]:
from lightning_ai.sdxl_lora_trainer import train

print("Iniciando entrenamiento…")
train(config)