Skip to content

Latest commit

 

History

History
89 lines (73 loc) · 3.69 KB

README.ko.md

File metadata and controls

89 lines (73 loc) · 3.69 KB

Automatic1111 웹UI를 위한 태깅(라벨링) 확장 기능

DeepDanbooru 와 같은 모델을 통해 단일 또는 여러 이미지로부터 부루에서 사용하는 태그를 알아냅니다.

You don't know how to read Korean? Read it in English here!

들어가기 앞서

모델과 대부분의 코드는 제가 만들지 않았고 DeepDanbooru 와 MrSmillingWolf 의 태거에서 가져왔습니다.

설치하기

  1. 확장기능 -> URL로부터 확장기능 설치 -> 이 레포지토리 주소 입력 -> 설치

    • 또는 이 레포지토리를 extensions/ 디렉터리 내에 클론합니다.
      $ git clone https://github.com/toriato/stable-diffusion-webui-wd14-tagger.git extensions/tagger
  2. 모델 추가하기

    • DeepDanbooru

      1. 다양한 모델 파일은 아래 주소에서 찾을 수 있습니다.

      2. 모델과 설정 파일이 포함된 프로젝트 폴더를 models/deepdanbooru 경로로 옮깁니다.

      3. 파일 구조는 다음과 같습니다:

        models/
        └╴deepdanbooru/
          ├╴deepdanbooru-v3-20211112-sgd-e28/
          │ ├╴project.json
          │ └╴...
          │
          ├╴deepdanbooru-v4-20200814-sgd-e30/
          │ ├╴project.json
          │ └╴...
          │
          ├╴e621-v3-20221117-sgd-e32/
          │ ├╴project.json
          │ └╴...
          │
          ...
        
    • MrSmilingWolf's model (a.k.a. Waifu Diffusion 1.4 tagger)

      모델과 추가 학습에 관해선 원작자인 MrSmilingWolf#5991 에게 문의해주세요.

      MrSmilingWolf 의 말:

      Based on validation score I'd say this is pretty much production grade.

      I've launched a longer training run (50 epochs, ETA: 9 days), mainly to check how much more can be squeezed out of it, but I'm fairly confident this can be plugged into a real inference pipeline already.

      I'm also finetuning the ConvNext network, but so far ViT has always coped better with less popular classes, so I'm edging my bets on this one. OTOH, ensembling seems to give a decent boost in validation metrics, so if we ever want to do that, I'll be ready."

      1. 압축된 모델 파일을 받습니다.

        1. SD Training Labs 디스코드 서버에 참가합니다
        2. 이 메세지에서 mega.nz 주소를 찾을 수 있습니다
      2. 클론된 레포지토리 속에 압축을 해제합니다.

      3. 파일 구조는 다음과 같습니다:

        extensions/
        └╴wd14-tagger/
          ├╴2022_0000_0899_6549/
          │ └╴selected_tags.csv
          │
          ├╴networks/
          │ └╴ViTB16_11_03_2022_07h05m53s/
          │   └╴ ...
          │
          ├╴scripts/
          │ └╴tagger.py
          │
          ...
        
  3. 웹UI 를 시작하거나 재시작합니다.

    • 또는 Interrogator 드롭다운 상자 우측에 있는 새로고침 버튼을 누릅니다.

스크린샷

Screenshot

Artwork made by hecattaart

저작권

빌려온 코드(예: dbimutils.py)를 제외하고 모두 Public domain