In [18]:
from dataclasses import dataclass
from pathlib import Path
from typing import Optional
from wdv3_timm import load_labels_hf, pil_ensure_rgb, pil_pad_square, get_tags, LabelData, MODEL_REPO_MAP
import numpy as np
import pandas as pd
import timm
import torch
from huggingface_hub import hf_hub_download
from huggingface_hub.utils import HfHubHTTPError
from PIL import Image
from simple_parsing import field, parse_known_args
from timm.data import create_transform, resolve_data_config
from torch import Tensor, nn
from torch.nn import functional as F
import glob
from pathlib import Path
from PIL import Image
from typing import Optional, Dict
import os



@dataclass
class ScriptOptions:
    ImageFolder: Path = field(positional=True)
    model: str = field(default="vit")
    gen_threshold: float = field(default=0.35)
    char_threshold: float = field(default=0.75)
    batch: int = field(default=1)
    recursive: bool = field(default=False)
    model_folder: Path = field(default="./models/taggers/") 

def ensure_model_folder(folder_path: Path) -> Path:
    """Создает папку для моделей, если она не существует."""
    if not folder_path.exists():
        print(f"Создание папки для моделей: {folder_path}")
        folder_path.mkdir(parents=True, exist_ok=True)
    return folder_path


def download_model_files(repo_id: str, model_folder: Path) -> Dict[str, Path]:
    """Загружает файлы модели в локальную папку."""
    # Создаем подпапку для конкретной модели (например models/wd-vit-tagger-v3)
    model_name = repo_id.split('/')[-1]
    model_specific_folder = model_folder / model_name
    ensure_model_folder(model_specific_folder)
    
    # Файлы, которые нужно загрузить
    files_to_download = [
        "pytorch_model.bin",
        "config.json",
        "model.safetensors",  # Если используется safetensors
        "selected_tags.csv",  # Для тегов
    ]
    
    downloaded_files = {}
    for file in files_to_download:
        try:
            local_file_path = model_specific_folder / file
            # Если файл уже существует, пропускаем загрузку
            if local_file_path.exists():
                print(f"Файл {file} уже существует в {model_specific_folder}")
                downloaded_files[file] = local_file_path
                continue
                
            # Загружаем файл, если он не существует
            downloaded_file = hf_hub_download(
                repo_id=repo_id,
                filename=file,
                local_dir=str(model_specific_folder),
                local_files_only=False
            )
            downloaded_files[file] = Path(downloaded_file)
            print(f"Загружен файл: {downloaded_file}")
        except HfHubHTTPError as e:
            print(f"Не удалось загрузить {file}: {e}")
            # Некоторые файлы могут не существовать, это нормально
            continue
    
    return downloaded_files


def load_model_local_or_remote(repo_id: str, model_folder: Path) -> nn.Module:
    """Загружает модель из локальной папки или с Hugging Face Hub."""
    model_name = repo_id.split('/')[-1]
    model_specific_folder = model_folder / model_name
    
    # Создаем модель через timm
    model: nn.Module = timm.create_model("hf-hub:" + repo_id).eval()
    
    # Пытаемся загрузить состояние модели из локальной папки
    local_state_dict_path = model_specific_folder / "pytorch_model.bin"
    local_safetensors_path = model_specific_folder / "model.safetensors"
    
    if local_state_dict_path.exists() or local_safetensors_path.exists():
        print(f"Загрузка весов модели из локальной папки: {model_specific_folder}")
        try:
            # Загружаем веса из локального файла
            if local_safetensors_path.exists():
                # Если используется формат safetensors
                state_dict = torch.load(local_safetensors_path)
            else:
                # Если используется формат pytorch_model.bin
                state_dict = torch.load(local_state_dict_path)
            
            model.load_state_dict(state_dict)
            return model
        except Exception as e:
            print(f"Ошибка при загрузке локальной модели: {e}")
            print("Попытка загрузки из Hugging Face Hub...")
    
    # Если локальной модели нет или загрузка не удалась, загружаем из Hugging Face Hub
    print(f"Загрузка весов модели из Hugging Face Hub для {repo_id}...")
    state_dict = timm.models.load_state_dict_from_hf(repo_id)
    model.load_state_dict(state_dict)
    
    # Сохраняем модель локально для будущего использования
    ensure_model_folder(model_specific_folder)
    local_save_path = model_specific_folder / "pytorch_model.bin"
    torch.save(state_dict, local_save_path)
    print(f"Веса модели сохранены локально в {local_save_path}")
    
    return model


def load_labels_local_or_remote(repo_id: str, model_folder: Path) -> LabelData:
    """Загружает теги из локальной папки или с Hugging Face Hub."""
    model_name = repo_id.split('/')[-1]
    model_specific_folder = model_folder / model_name
    local_tags_path = model_specific_folder / "selected_tags.csv"
    
    if local_tags_path.exists():
        print(f"Загрузка тегов из локального файла: {local_tags_path}")
        try:
            # Используем возможность передачи пути к CSV файлу
            # Адаптируем для локального использования
            df: pd.DataFrame = pd.read_csv(local_tags_path, usecols=["name", "category"])
            tag_data = LabelData(
                names=df["name"].tolist(),
                rating=list(np.where(df["category"] == 9)[0]),
                general=list(np.where(df["category"] == 0)[0]),
                character=list(np.where(df["category"] == 4)[0]),
            )
            return tag_data
        except Exception as e:
            print(f"Ошибка при загрузке локальных тегов: {e}")
            print("Попытка загрузки из Hugging Face Hub...")
    
    # Если локальных тегов нет или загрузка не удалась, загружаем из Hugging Face Hub
    print(f"Загрузка тегов из Hugging Face Hub для {repo_id}...")
    labels = load_labels_hf(repo_id=repo_id)
    
    # Если папка для модели существует, но CSV файла нет, можно скачать его
    # через hf_hub_download и сохранить локально
    if model_specific_folder.exists() and not local_tags_path.exists():
        try:
            hf_hub_download(
                repo_id=repo_id, 
                filename="selected_tags.csv", 
                local_dir=str(model_specific_folder),
                local_files_only=False
            )
            print(f"Файл тегов сохранен локально в {local_tags_path}")
        except Exception as e:
            print(f"Ошибка при сохранении файла тегов локально: {e}")
    
    return labels





def BatchTagging(opts: ScriptOptions):
    if opts.model not in MODEL_REPO_MAP:
        print(f"Доступные модели: {list(MODEL_REPO_MAP.keys())}")
        raise ValueError(f"Неизвестная модель: {opts.model}")
    
    repo_id = MODEL_REPO_MAP[opts.model]
    image_folder = Path(opts.ImageFolder).resolve()
    if not image_folder.is_dir():
        raise FileNotFoundError(f"Директория не найдена: {image_folder}")
    
    # Создаем папку для моделей, если она не существует
    model_folder = ensure_model_folder(Path(opts.model_folder))
    
    # Загружаем или скачиваем файлы модели
    download_model_files(repo_id, model_folder)
    
    # Загружаем модель из локальной папки или из Hub
    print(f"Загрузка модели '{opts.model}' из '{repo_id}'...")
    model = load_model_local_or_remote(repo_id, model_folder)
    
    # Загружаем теги из локальной папки или из Hub
    print("Загрузка списка тегов...")
    labels = load_labels_local_or_remote(repo_id, model_folder)
    
    print("Создание трансформации данных...")
    transform = create_transform(**resolve_data_config(model.pretrained_cfg, model=model))
    
    # Получаем список изображений
    if opts.recursive:
        image_files = list(image_folder.rglob("*.jpg")) + list(image_folder.rglob("*.jpeg")) + list(image_folder.rglob("*.png"))
    else:
        image_files = list(image_folder.glob("*.jpg")) + list(image_folder.glob("*.jpeg")) + list(image_folder.glob("*.png"))
    
    if not image_files:
        print("Изображения не найдены в указанной директории.")
        return
    
    torch_device = torch.device("cuda" if torch.cuda.is_available() else "cpu")
    
    inputs_list = []
    image_paths = []
    
    print("Загрузка и обработка изображений...")
    for img_path in image_files:
        try:
            img_input: Image.Image = Image.open(img_path)
        except Exception as e:
            print(f"Ошибка загрузки изображения {img_path}: {e}")
            continue
        
        img_input = pil_ensure_rgb(img_input)
        img_input = pil_pad_square(img_input)
        input_tensor = transform(img_input)
        input_tensor = input_tensor[[2, 1, 0], :, :]  # RGB -> BGR
        inputs_list.append(input_tensor)
        image_paths.append(str(img_path))
    
    if not inputs_list:
        print("Не удалось обработать ни одно изображение.")
        return
    
    batch_size = opts.batch
    total_images = len(inputs_list)
    total_batches = (total_images + batch_size - 1) // batch_size
    
    print(f"Всего изображений: {total_images}, обработка в {total_batches} батчах по {batch_size}")
    
    result = []
    for i in range(0, total_images, batch_size):
        batch_tensors = inputs_list[i : i + batch_size]
        batch_image_paths = image_paths[i : i + batch_size]
        batch_inputs = torch.stack(batch_tensors)
        
        print(f"\nЗапуск инференса для батча {i // batch_size + 1} из {total_batches}...")
        with torch.inference_mode():
            if torch_device.type != "cpu":
                model = model.to(torch_device)
                batch_inputs = batch_inputs.to(torch_device)
            outputs = model(batch_inputs)
            outputs = F.sigmoid(outputs)
            if torch_device.type != "cpu":
                outputs = outputs.to("cpu")
                model = model.to("cpu")
        
        for j, out in enumerate(outputs):
            img_path = batch_image_paths[j]
            caption, taglist, ratings, character, general = get_tags(
                probs=out,
                labels=labels,
                gen_threshold=opts.gen_threshold,
                char_threshold=opts.char_threshold,
            )
            
            result.append({
                "image_path": img_path,
                "caption": caption,
                "taglist": taglist,
                "ratings": ratings,
                "character": character,
                "general": general,
            })
            
            print(f"\nОбработка изображения: {img_path}")
            print("--------")
            print(f"Описание: {caption}")
            print(f"Теги: {taglist}")
            print("Рейтинги:")
            for k, v in ratings.items():
                print(f"  {k}: {v:.3f}")
            print(f"Теги персонажей (порог={opts.char_threshold}):")
            for k, v in character.items():
                print(f"  {k}: {v:.3f}")
            print(f"Общие теги (порог={opts.gen_threshold}):")
            for k, v in general.items():
                print(f"  {k}: {v:.3f}")
            print("--------")
    
    print("Готово!")
    return result

In [20]:
test= ScriptOptions(os.path.join(os.getcwd(), 'TestPic'), 'big', batch=2)

In [22]:
test2= BatchTagging(test)

Файл pytorch_model.bin уже существует в models\taggers\wd-eva02-large-tagger-v3
Файл config.json уже существует в models\taggers\wd-eva02-large-tagger-v3
Файл model.safetensors уже существует в models\taggers\wd-eva02-large-tagger-v3
Файл selected_tags.csv уже существует в models\taggers\wd-eva02-large-tagger-v3
Загрузка модели 'big' из 'SmilingWolf/wd-eva02-large-tagger-v3'...
Загрузка весов модели из локальной папки: models\taggers\wd-eva02-large-tagger-v3
Ошибка при загрузке локальной модели: invalid load key, '\xa8'.
Попытка загрузки из Hugging Face Hub...
Загрузка весов модели из Hugging Face Hub для SmilingWolf/wd-eva02-large-tagger-v3...


  state_dict = torch.load(local_safetensors_path)


Веса модели сохранены локально в models\taggers\wd-eva02-large-tagger-v3\pytorch_model.bin
Загрузка списка тегов...
Загрузка тегов из локального файла: models\taggers\wd-eva02-large-tagger-v3\selected_tags.csv
Создание трансформации данных...
Загрузка и обработка изображений...
Всего изображений: 4, обработка в 2 батчах по 2

Запуск инференса для батча 1 из 2...

Обработка изображения: C:\Users\liali\YoloWdTagger\wdv3-timm\TestPic\test1.png
--------
Описание: stairs, long_hair, sitting_on_stairs, blonde_hair, multiple_persona, sitting, very_long_hair, dress, yellow_eyes, doughnut, barefoot, 1girl, food, pointy_ears, shoes, looking_at_viewer, clone, school_uniform, multiple_views, blush_stickers, age_progression, holding, long_legs, legs, black_dress, book, multiple_girls, smile, oshino_shinobu
Теги: stairs, long hair, sitting on stairs, blonde hair, multiple persona, sitting, very long hair, dress, yellow eyes, doughnut, barefoot, 1girl, food, pointy ears, shoes, looking at viewer, clo

In [47]:
type(test2[0]['taglist'])

str