# Kiss3DGen - Pipeline Image to 3D

Este notebook cont칠m todo o c칩digo necess치rio para executar o pipeline Kiss3DGen no Google Colab.

## 游늶 칈ndice
1. Instala칞칚o de Depend칡ncias
2. Configura칞칚o do Ambiente
3. Download de Modelos
4. Execu칞칚o do Pipeline

---


## 1. Instala칞칚o de Depend칡ncias

Primeiro, vamos instalar todas as depend칡ncias necess치rias.


In [None]:
# Verificar Python version
import sys
print(f"Python version: {sys.version}")
print(f"Python path: {sys.executable}")


In [None]:
# Instalar PyTorch com CUDA (Colab geralmente tem CUDA 11.8 ou 12.1)
!pip install torch torchvision torchaudio --index-url https://download.pytorch.org/whl/cu121


In [None]:
# Verificar CUDA
import torch
print(f"PyTorch version: {torch.__version__}")
print(f"CUDA available: {torch.cuda.is_available()}")
if torch.cuda.is_available():
    print(f"CUDA version: {torch.version.cuda}")
    print(f"GPU: {torch.cuda.get_device_name(0)}")
    print(f"VRAM: {torch.cuda.get_device_properties(0).total_memory / 1e9:.2f} GB")


In [None]:
# Instalar depend칡ncias b치sicas do requirements.txt
!pip install einops==0.8.0 imageio==2.36.1 imageio-ffmpeg==0.5.1 Imath==0.0.2
!pip install jaxtyping==0.2.36 kiui==0.2.10 mathutils==3.3.0 matplotlib==3.9.2
!pip install omegaconf==2.3.0 onnxruntime==1.18.0 open3d==0.18.0
!pip install opencv-python==4.10.0.84 opencv-python-headless==4.9.0.80
!pip install OpenEXR==3.3.2 Pillow==11.0.0 plyfile==1.1 PyGLM==2.7.1
!pip install pygltflib==1.16.3 PyMCubes==0.1.4 pymeshlab==2023.12.post1
!pip install PyOpenGL==3.1.0 PyYAML==6.0.1 rembg==2.0.57 scipy==1.13.1
!pip install tqdm==4.66.4 transformers==4.47.1 trimesh==4.4.0
!pip install webdataset==0.2.86 xatlas==0.0.9 ninja
!pip install sentencepiece accelerate huggingface-hub diffusers
!pip install fvcore pytorch-lightning==2.2.0 PEFT==0.10.0 pyrender==0.1.45 timm
!pip install protobuf numpy==1.26.3


In [None]:
# Instalar PyTorch3D
!pip install "git+https://github.com/facebookresearch/pytorch3d.git@stable"


In [None]:
# Instalar nvdiffrast (pode demorar alguns minutos)
!pip install git+https://github.com/NVlabs/nvdiffrast


## 2. Configura칞칚o do Ambiente

Agora vamos configurar o ambiente e clonar o reposit칩rio Kiss3DGen.


In [None]:
# Clonar reposit칩rio Kiss3DGen
import os
from pathlib import Path

# Definir caminhos
WORK_DIR = Path("/content")
KISS3D_ROOT = WORK_DIR / "Kiss3DGen"

# Clonar reposit칩rio se n칚o existir
if not KISS3D_ROOT.exists():
    print("Clonando reposit칩rio Kiss3DGen...")
    !git clone https://github.com/EnVision-Research/Kiss3DGen.git
    print("[OK] Reposit칩rio clonado")
else:
    print(f"[OK] Reposit칩rio j치 existe em {KISS3D_ROOT}")

# Se voc칡 j치 tem os arquivos no Colab em outro local, descomente e ajuste:
# KISS3D_ROOT = Path("/content/drive/MyDrive/kiss3d_reproduction/Kiss3DGen")

print(f"Kiss3DGen root: {KISS3D_ROOT}")
print(f"Existe: {KISS3D_ROOT.exists()}")


In [None]:
# Adicionar ao path do Python
import sys
if str(KISS3D_ROOT) not in sys.path:
    sys.path.insert(0, str(KISS3D_ROOT))
    sys.path.insert(0, str(WORK_DIR))

# Mudar para o diret칩rio do Kiss3DGen
os.chdir(str(KISS3D_ROOT))
print(f"Working directory: {os.getcwd()}")


In [None]:
# Instalar diffusers customizado do Kiss3DGen
custom_diffusers_path = KISS3D_ROOT / "custom_diffusers"
if custom_diffusers_path.exists():
    os.chdir(str(custom_diffusers_path))
    !pip install -e .
    os.chdir(str(KISS3D_ROOT))
    print("[OK] Diffusers customizado instalado")
else:
    print(f"[AVISO] custom_diffusers n칚o encontrado em {custom_diffusers_path}")


In [None]:
# Configurar vari치veis de ambiente
import os
os.environ.setdefault("XFORMERS_FORCE_DISABLE_TRITON", "1")
os.environ.setdefault("PYTORCH_CUDA_ALLOC_CONF", "expandable_segments:True")

print("[OK] Vari치veis de ambiente configuradas")


In [None]:
# Autenticar no HuggingFace (necess치rio para baixar modelos)
from huggingface_hub import login, whoami

try:
    # Verificar se j치 est치 autenticado
    user = whoami()
    print(f"[OK] J치 autenticado como: {user.get('name', 'N/A')}")
except:
    # Se n칚o estiver autenticado, pedir token
    print("Por favor, forne칞a seu token do HuggingFace:")
    print("1. Acesse: https://huggingface.co/settings/tokens")
    print("2. Crie um token com permiss칫es de leitura")
    print("3. Cole o token abaixo")
    
    # Use esta alternativa para colar o token diretamente:
    from getpass import getpass
    HF_TOKEN = getpass("Cole seu token do HuggingFace: ")
    login(token=HF_TOKEN, add_to_git_credential=False)
    print("[OK] Autenticado no HuggingFace")


## 3. Download de Modelos

Agora vamos baixar os modelos necess치rios do HuggingFace.


In [None]:
# Verificar quais modelos j치 est칚o baixados
from huggingface_hub import snapshot_download
import os

REQUIRED_MODELS = {
    "zero123": {
        "repo_id": "sudo-ai/zero123plus-v1.2",
        "description": "Zero123++ para gera칞칚o de multiview",
        "required": True
    },
    "flux": {
        "repo_id": "black-forest-labs/FLUX.1-dev",
        "description": "Flux diffusion model",
        "required": True
    },
    "controlnet": {
        "repo_id": "InstantX/FLUX.1-dev-Controlnet-Union",
        "description": "ControlNet para Flux",
        "required": True
    },
    "redux": {
        "repo_id": "black-forest-labs/FLUX.1-Redux-dev",
        "description": "Flux Prior Redux",
        "required": False
    }
}

def check_model_downloaded(repo_id: str) -> bool:
    """Verifica se um modelo est치 baixado"""
    cache_dir = os.path.expanduser("~/.cache/huggingface/hub")
    model_dir_name = f"models--{repo_id.replace('/', '--')}"
    model_path = os.path.join(cache_dir, model_dir_name)
    return os.path.exists(model_path) and len(os.listdir(model_path)) > 0

print("Verificando modelos...")
for name, info in REQUIRED_MODELS.items():
    repo_id = info["repo_id"]
    if check_model_downloaded(repo_id):
        print(f"[OK] {name}: J치 baixado")
    else:
        print(f"[PENDENTE] {name}: Precisa baixar")


In [None]:
# Baixar modelos necess치rios (isso pode demorar bastante tempo)
print("="*60)
print("DOWNLOAD DE MODELOS")
print("="*60)
print("\nAVISO: Isso pode demorar v치rias horas e requer muito espa칞o em disco!")
print("Modelos grandes ser칚o baixados do HuggingFace.\n")

for name, info in REQUIRED_MODELS.items():
    repo_id = info["repo_id"]
    description = info["description"]
    required = info["required"]
    
    if check_model_downloaded(repo_id):
        print(f"\n[OK] {name} j치 est치 baixado - pulando")
        continue
    
    if not required:
        print(f"\n[AVISO] {name} 칠 opcional - pulando")
        continue
    
    print(f"\n{'='*60}")
    print(f"Baixando: {name}")
    print(f"Reposit칩rio: {repo_id}")
    print(f"Descri칞칚o: {description}")
    print(f"{'='*60}")
    
    try:
        snapshot_download(
            repo_id=repo_id,
            local_dir=None,  # Usar cache padr칚o
            local_dir_use_symlinks=False,
            resume_download=True
        )
        print(f"[OK] {name} baixado com sucesso!")
    except Exception as e:
        print(f"[ERRO] Erro ao baixar {name}: {e}")
        import traceback
        traceback.print_exc()

print("\n" + "="*60)
print("DOWNLOAD CONCLU칈DO")
print("="*60)


In [None]:
# Baixar modelos adicionais do Kiss3DGen (LoRA, checkpoint, etc.)
from huggingface_hub import hf_hub_download
import shutil

print("Baixando modelos adicionais do Kiss3DGen...")

# Criar diret칩rio para checkpoints
checkpoint_dir = KISS3D_ROOT / "checkpoint"
checkpoint_dir.mkdir(parents=True, exist_ok=True)

# LoRA RGB/Normal
lora_path = checkpoint_dir / "flux_lora" / "rgb_normal.safetensors"
lora_path.parent.mkdir(parents=True, exist_ok=True)
if not lora_path.exists():
    print("Baixando LoRA RGB/Normal...")
    hf_hub_download(
        repo_id="LTT/Kiss3DGen",
        filename="rgb_normal.safetensors",
        local_dir=str(lora_path.parent),
        repo_type="model"
    )
    print("[OK] LoRA baixado")
else:
    print("[OK] LoRA j치 existe")

# FlexGen checkpoint para Zero123++
flexgen_path = checkpoint_dir / "zero123++" / "flexgen.ckpt"
flexgen_path.parent.mkdir(parents=True, exist_ok=True)
if not flexgen_path.exists():
    print("Baixando FlexGen checkpoint...")
    hf_hub_download(
        repo_id="LTT/Kiss3DGen",
        filename="flexgen.ckpt",
        local_dir=str(flexgen_path.parent),
        repo_type="model"
    )
    print("[OK] FlexGen checkpoint baixado")
else:
    print("[OK] FlexGen checkpoint j치 existe")

# LRM checkpoint
lrm_path = checkpoint_dir / "lrm" / "final_ckpt.ckpt"
lrm_path.parent.mkdir(parents=True, exist_ok=True)
if not lrm_path.exists():
    print("Baixando LRM checkpoint...")
    hf_hub_download(
        repo_id="LTT/PRM",
        filename="final_ckpt.ckpt",
        local_dir=str(lrm_path.parent),
        repo_type="model"
    )
    print("[OK] LRM checkpoint baixado")
else:
    print("[OK] LRM checkpoint j치 existe")

# Verificar se init_3d_Bundle existe (necess치rio para o pipeline)
init_bundle_dir = KISS3D_ROOT / "init_3d_Bundle"
if not init_bundle_dir.exists() or len(list(init_bundle_dir.glob("*.png"))) == 0:
    print("\n[AVISO] init_3d_Bundle n칚o encontrado ou vazio!")
    print("Este diret칩rio cont칠m imagens template necess치rias para o pipeline.")
    print("Se o reposit칩rio foi clonado corretamente, deve estar presente.")
    print(f"Verificando: {init_bundle_dir}")
    if init_bundle_dir.exists():
        print(f"Arquivos encontrados: {list(init_bundle_dir.glob('*'))}")
else:
    print(f"[OK] init_3d_Bundle encontrado com {len(list(init_bundle_dir.glob('*.png')))} imagens")


In [None]:
# Verificar se os modelos necess치rios est칚o presentes
print("Verificando estrutura do reposit칩rio Kiss3DGen...")

required_dirs = {
    "models/zero123plus": "Modelo Zero123++ para multiview",
    "models/lrm": "Modelo LRM para reconstru칞칚o",
    "models/ISOMER": "Modelo ISOMER para refinamento",
    "pipeline/custom_pipelines": "Pipelines customizados do Flux",
    "pipeline/pipeline_config": "Configura칞칫es do pipeline",
    "utils": "Utilit치rios do Kiss3DGen"
}

missing = []
for dir_name, description in required_dirs.items():
    dir_path = KISS3D_ROOT / dir_name
    if dir_path.exists():
        print(f"[OK] {dir_name}: {description}")
    else:
        print(f"[ERRO] {dir_name} N츾O ENCONTRADO: {description}")
        missing.append(dir_name)

if missing:
    print(f"\n[AVISO] Diret칩rios faltando: {missing}")
    print("Isso pode indicar que o reposit칩rio n칚o foi clonado completamente.")
    print("Tente clonar novamente ou verificar se o reposit칩rio est치 completo.")
else:
    print("\n[OK] Todos os diret칩rios necess치rios est칚o presentes!")


## 4. Execu칞칚o do Pipeline

Agora vamos executar o pipeline completo de Image to 3D. Primeiro, vamos importar o c칩digo necess치rio do reposit칩rio.


In [None]:
# Importar o wrapper do Kiss3DGen diretamente do pipeline
# IMPORTANTE: Garantir que estamos no diret칩rio correto
os.chdir(str(KISS3D_ROOT))

# Adicionar custom_pipelines ao path antes de importar
CUSTOM_PIPELINE_DIR = KISS3D_ROOT / "pipeline" / "custom_pipelines"
if str(CUSTOM_PIPELINE_DIR) not in sys.path:
    sys.path.insert(0, str(CUSTOM_PIPELINE_DIR))

from pipeline.kiss3d_wrapper import init_wrapper_from_config, run_image_to_3d
from pipeline.utils import logger, TMP_DIR, OUT_DIR

# Criar diret칩rios de sa칤da
os.makedirs(TMP_DIR, exist_ok=True)
os.makedirs(OUT_DIR, exist_ok=True)

print(f"[OK] Diret칩rios configurados:")
print(f"  Working directory: {os.getcwd()}")
print(f"  TMP_DIR: {TMP_DIR}")
print(f"  OUT_DIR: {OUT_DIR}")
print(f"  Custom pipelines: {CUSTOM_PIPELINE_DIR}")


In [None]:
# Carregar configura칞칚o
config_path = KISS3D_ROOT / "pipeline" / "pipeline_config" / "default.yaml"

# Se n칚o existir, criar uma configura칞칚o b치sica para Colab
if not config_path.exists():
    print("Criando configura칞칚o padr칚o para Colab...")
    config_path.parent.mkdir(parents=True, exist_ok=True)
    
    config_content = """
flux:
  base_model: "black-forest-labs/FLUX.1-dev"
  dtype: 'bf16'  # Nota: usar 'dtype' n칚o 'flux_dtype'
  lora: "./checkpoint/flux_lora/rgb_normal.safetensors"
  controlnet: "InstantX/FLUX.1-dev-Controlnet-Union"
  redux: "black-forest-labs/FLUX.1-Redux-dev"
  num_inference_steps: 20
  seed: 42
  device: 'cuda:0'

multiview:
  base_model: "sudo-ai/zero123plus-v1.2"
  custom_pipeline: "./models/zero123plus"
  unet: "./checkpoint/zero123++/flexgen.ckpt"
  num_inference_steps: 50
  seed: 42
  device: 'cuda:0'

reconstruction:
  model_config: "./models/lrm/config/PRM_inference.yaml"
  base_model: "./checkpoint/lrm/final_ckpt.ckpt"
  device: 'cuda:0'

caption:
  base_model: "multimodalart/Florence-2-large-no-flash-attn"
  device: 'cuda:0'

llm:
  base_model: "Qwen/Qwen2-7B-Instruct"
  device: 'cpu'  # Usar CPU no Colab para economizar VRAM

use_zero_gpu: false
3d_bundle_templates: './init_3d_Bundle'
"""
    
    with open(config_path, 'w') as f:
        f.write(config_content)
    print(f"[OK] Configura칞칚o criada em {config_path}")
else:
    print(f"[OK] Usando configura칞칚o existente: {config_path}")

print(f"[OK] Configura칞칚o carregada de {config_path}")


In [None]:
# Inicializar o wrapper (isso pode demorar v치rios minutos)
print("Inicializando pipeline Kiss3DGen...")
print("AVISO: Isso pode demorar v치rios minutos para carregar todos os modelos!")

# IMPORTANTE: A fun칞칚o init_wrapper_from_config original s칩 aceita config_path
# Se voc칡 precisar de fast_mode ou outras op칞칫es, edite o config.yaml diretamente
try:
    k3d_wrapper = init_wrapper_from_config(str(config_path))
    print("\n[OK] Pipeline inicializado com sucesso!")
    
    # Verificar se os modelos foram carregados
    if hasattr(k3d_wrapper, 'flux_pipeline') and k3d_wrapper.flux_pipeline is not None:
        print("[OK] Flux pipeline carregado")
    if hasattr(k3d_wrapper, 'multiview_pipeline') and k3d_wrapper.multiview_pipeline is not None:
        print("[OK] Multiview pipeline carregado")
    if hasattr(k3d_wrapper, 'recon_model') and k3d_wrapper.recon_model is not None:
        print("[OK] Reconstruction model carregado")
        
except Exception as e:
    print(f"\n[ERRO] Falha ao inicializar pipeline: {e}")
    import traceback
    traceback.print_exc()
    print("\n[INFO] Verifique:")
    print("  1. Se todos os modelos foram baixados corretamente")
    print("  2. Se o reposit칩rio Kiss3DGen foi clonado completamente")
    print("  3. Se os caminhos no config.yaml est칚o corretos")
    print("  4. Se h치 espa칞o suficiente em disco e VRAM")


In [None]:
# Preparar imagem de entrada
# Voc칡 pode fazer upload de uma imagem ou usar uma URL

from google.colab import files
from PIL import Image
import requests
from io import BytesIO

# Op칞칚o 1: Fazer upload de uma imagem
print("Op칞칚o 1: Fazer upload de uma imagem")
uploaded = files.upload()
input_image_path = list(uploaded.keys())[0] if uploaded else None

# Op칞칚o 2: Usar uma URL (descomente se preferir)
# image_url = "https://example.com/image.jpg"
# response = requests.get(image_url)
# input_image = Image.open(BytesIO(response.content))
# input_image_path = "/tmp/input_image.jpg"
# input_image.save(input_image_path)

if input_image_path:
    print(f"Imagem carregada: {input_image_path}")
    input_image = Image.open(input_image_path)
    display(input_image)
else:
    print("Nenhuma imagem carregada. Por favor, fa칞a upload de uma imagem.")


In [None]:
# Executar pipeline Image to 3D
import time

if 'input_image_path' in locals() and input_image_path:
    print("="*60)
    print("EXECUTANDO PIPELINE IMAGE TO 3D")
    print("="*60)
    print(f"\nInput: {input_image_path}")
    print("\nAVISO: Isso pode demorar v치rios minutos!")
    
    start_time = time.time()
    
    try:
        gen_save_path, recon_mesh_path = run_image_to_3d(
            k3d_wrapper,
            input_image_path,
            enable_redux=True,
            use_mv_rgb=True,
            use_controlnet=True
        )
        
        elapsed_time = time.time() - start_time
        
        print("\n" + "="*60)
        print("PIPELINE CONCLU칈DO!")
        print("="*60)
        print(f"Tempo total: {elapsed_time:.2f} segundos ({elapsed_time/60:.2f} minutos)")
        print(f"\nBundle image: {gen_save_path}")
        print(f"Mesh 3D: {recon_mesh_path}")
        
        # Mostrar resultados
        if os.path.exists(gen_save_path):
            bundle_img = Image.open(gen_save_path)
            display(bundle_img)
        
        print(f"\nMesh 3D salvo em: {recon_mesh_path}")
        
    except Exception as e:
        print(f"\n[ERRO] Falha ao executar pipeline: {e}")
        import traceback
        traceback.print_exc()
else:
    print("Por favor, carregue uma imagem primeiro.")


In [None]:
# Download dos resultados (opcional)
if 'recon_mesh_path' in locals() and os.path.exists(recon_mesh_path):
    print(f"Baixando mesh 3D: {recon_mesh_path}")
    files.download(recon_mesh_path)
    
if 'gen_save_path' in locals() and os.path.exists(gen_save_path):
    print(f"Baixando bundle image: {gen_save_path}")
    files.download(gen_save_path)

print("\n[OK] Downloads conclu칤dos!")
