# Stable diffusion (w Hugginface)

Poniżej przedstawiono przykład generowania grafik przy użyciu modelu Stable Diffusion. W tym przypadku korzystamy z modelu hostowanego w Hugging Face inference endpoints.

### Czym jest Stable Diffusion?

Stable Diffusion to model sztucznej inteligencji typu "text-to-image" (tekst na obraz), który pozwala generować wysokiej jakości obrazy na podstawie opisu tekstowego. Model wykorzystuje technologię dyfuzji, która stopniowo przekształca szum losowy w obrazy o coraz wyższej jakości. Stable Diffusion został opracowany przez Stability AI i jest jednym z najpopularniejszych modeli do generowania obrazów dostępnych publicznie.

### Czym są Hugging Face inference endpoints?

Hugging Face inference endpoints to usługa, która umożliwia łatwe i szybkie korzystanie z modeli AI bez konieczności ich lokalnego uruchamiania. Dzięki temu możemy m.in. generować obrazy bezpośrednio z kodu Python, bez potrzeby posiadania własnych zasobów obliczeniowych (GPU) i bez instalowania dodatkowych bibliotek.

### Jak skorzystać z Hugging Face inference endpoints?

1. Należy utworzyć konto na platformie Hugging Face (huggingface.co)
2. Wygenerować token dostępu w ustawieniach konta
3. Zainstalować bibliotekę `huggingface_hub` za pomocą pip
4. Skonfigurować token jako zmienną środowiskową lub użyć go bezpośrednio w kodzie
5. Użyć klasy `InferenceClient` do komunikacji z wybranym modelem

W poniższych przykładach pokazano, jak za pomocą prostych instrukcji tekstowych wygenerować różnorodne obrazy, a także jak manipulować parametrami generacji, takimi jak wartość seed czy wzmacnianie/osłabianie określonych cech za pomocą operatorów `+++` oraz `---`, które podnoszą lub obnizaja znaczenie danego fragmentu prompta.

In [None]:
from huggingface_hub import InferenceClient
import os

auth_token = os.getenv('HUGGINGFACE_HUB_TOKEN')
client = InferenceClient("stabilityai/stable-diffusion-3.5-large", token=auth_token)

# output is a PIL.Image object
image = client.text_to_image(
    #"oil painting of sunset beach, waves, impressionist style",
    #"A photorealistic image of a cat sitting on a windowsill, lit by the light of the setting sun",
    #"Peppa the Pig and Pikachu drinking vodka from a glass, unreal engine 5 render, photo",
    #"Aleksander Kwaśniewski pijący drinka w sejmowym barze",
    #negative_prompt="distorted, distorted face, deformed, bad anatomy, disfigured, poorly drawn face, pixelart, 2D graphics",
    "(Strawberry knight)++ with an asparagus sword",
    negative_prompt="armored knight",
    #num_inference_steps=20,
    #width=1280,
    #height=960,
    seed=2
)

In [None]:
image