# Setup

In [1]:
# !pip install -qU gradio diffusers transformers accelerate

In [2]:
# Standard library imports
from io import BytesIO
import os

# Third-party library imports
import gradio as gr
from PIL import Image
import requests
from torch import autocast
import torch

# Machine learning model imports
from diffusers import StableDiffusionXLPipeline

## Biblioteki
* `BytesIO` to narzÄ™dzie, ktÃ³re pozwala nam pracowaÄ‡ z danymi binarnymi w pamiÄ™ci komputera - wyobraÅºmy to sobie jako wirtualny plik, ktÃ³ry istnieje tylko w pamiÄ™ci RAM. Jest to szczegÃ³lnie przydatne gdy przetwarzamy obrazy, poniewaÅ¼ nie musimy zapisywaÄ‡ ich tymczasowo na dysk.
* `Gradio` to narzÄ™dzie, ktÃ³re zamienia nasze modele uczenia maszynowego w przyjazne aplikacje webowe.
* `PIL` (Python Imaging Library) dostarcza nam narzÄ™dzia do manipulacji obrazami, podobnie jak program graficzny, ale sterowany kodem.
* `PyTorch` to framework do uczenia maszynowego, a autocast to mechanizm, ktÃ³ry automatycznie optymalizuje wykorzystanie pamiÄ™ci GPU podczas obliczeÅ„.
* `StableDiffusionXLPipeline` z biblioteki diffusers. To najnowsza wersja modelu Stable Diffusion, zaprojektowana do generowania wysokiej jakoÅ›ci obrazÃ³w.
   * Pipeline w nazwie oznacza, Å¼e zawiera wszystkie potrzebne komponenty poÅ‚Ä…czone w jeden sprawnie dziaÅ‚ajÄ…cy system - jak linia produkcyjna, gdzie tekst wchodzi na poczÄ…tku, a na koÅ„cu otrzymujemy gotowy obraz.

In [3]:
os.environ["HF_HUB_ENABLE_HF_TRANSFER"] = "1"

In [15]:
class CFG:
    model = "stabilityai/stable-diffusion-xl-base-1.0"
    device = 'cpu'
    dtype = torch.float16
    variant = "fp16"

if torch.backends.mps.is_available():
    CFG.device = "mps"
if torch.cuda.is_available():
    CFG.device = "cuda"

print("CUDA: ", torch.cuda.is_available())
print("MPS: ", torch.backends.mps.is_available())
print("Device: ", CFG.device)

CUDA:  True
MPS:  False
Device:  cuda


`model` wskazuje na konkretnÄ… wersjÄ™ modelu Stable Diffusion XL - jest to "stabilityai/stable-diffusion-xl-base-1.0", czyli bazowy model SDXL w wersji 1.0 stworzony przez Stability AI. Ten model jest znany z generowania obrazÃ³w w wysokiej rozdzielczoÅ›ci.

`dtype` okreÅ›la format danych jako torch.bfloat16 - jest to specjalny format liczb zmiennoprzecinkowych, ktÃ³ry zapewnia dobry kompromis miÄ™dzy precyzjÄ… obliczeÅ„ a zuÅ¼yciem pamiÄ™ci. Format bfloat16 wykorzystuje 16 bitÃ³w na liczbÄ™, ale inaczej rozkÅ‚ada bity miÄ™dzy czÄ™Å›Ä‡ caÅ‚kowitÄ… i uÅ‚amkowÄ… niÅ¼ standardowy float16.
> MusiaÅ‚em zmienic na float16 z racji bÅ‚Ä™du `expected mat1 and mat2 to have the same dtype`

`variant` ustawiony na "fp16" informuje, Å¼e model bÄ™dzie dziaÅ‚aÅ‚ w trybie poÅ‚owicznej precyzji (16-bitowej). Jest to zgodne z wczeÅ›niejszym ustawieniem dtype i pozwala na szybsze obliczenia przy akceptowalnej utracie precyzji.

# Funkcje

In [5]:
def create_image(prompt):
    image = pipe(prompt=prompt).images[0]
    return image

# Aplikacja

In [9]:
pipe = StableDiffusionXLPipeline.from_pretrained(
      CFG.model,
      torch_dtype= CFG.dtype,
      variant = CFG.variant,
      use_safetensors=True).to(CFG.device)


Loading pipeline components...:   0%|          | 0/7 [00:00<?, ?it/s]

> Tworzenie zdjecia moze potrwac nawet z kilka minut na CPU. Na GPU powinno to trwaÄ‡ znaczÄ…co szybciej. ðŸ’ª

In [10]:
demo = gr.Interface(fn=create_image, inputs="text", outputs="image")

demo.launch(debug = True)

Running Gradio in a Colab notebook requires sharing enabled. Automatically setting `share=True` (you can turn this off by setting `share=False` in `launch()` explicitly).

Colab notebook detected. This cell will run indefinitely so that you can see errors and logs. To turn off, set debug=False in launch().
* Running on public URL: https://58bc1841cd378ee71b.gradio.live

This share link expires in 72 hours. For free permanent hosting and GPU upgrades, run `gradio deploy` from the terminal in the working directory to deploy to Hugging Face Spaces (https://huggingface.co/spaces)


  0%|          | 0/50 [00:00<?, ?it/s]

Keyboard interruption in main thread... closing server.
Killing tunnel 127.0.0.1:7860 <> https://58bc1841cd378ee71b.gradio.live


