Görüntü Üretme ve Diffusion Modelleri

# Görüntü Üretme ve Diffusion Modelleri

Bu notebook, metin-görüntü dönüşümü yapan diffusion modellerini ve görüntü üretme tekniklerini incelemektedir.

## Neler Öğreneceğiz?
- Diffusion modelleri nasıl çalışır?
- Metin-görüntü dönüşümü nasıl yapılır?
- Stable Diffusion modeli nedir?
- Görüntü üretme parametreleri (guidance scale, steps, seed)
- Prompt mühendisliğinin görüntü üretmedeki önemi

## Diffusion Modelleri Nedir?

Diffusion modelleri, bir görüntüyü adım adım gürültüden arındırarak oluşturan generatif modellerdir. Bu süreç, rastgele gürültüden başlayıp, her adımda gürültüyü azaltarak istenilen görüntüyü oluşturur.

### Yaygın Görüntü Üretme Modelleri
- Stable Diffusion
- DALL-E
- Midjourney
- Imagen

## Metin Tabanlı Görüntü Üretme

Metin tabanlı görüntü üretme, kullanıcının yazdığı metne (prompt) göre görüntüler oluşturan bir teknolojidir. Bu teknoloji, metin anlama ve görüntü üretme modellerini birleştirerek çalışır.

In [None]:
# Diffusers kütüphanesini kullanarak Stable Diffusion ile görüntü üretme
!pip install diffusers transformers accelerate

import torch
from diffusers import StableDiffusionPipeline
from PIL import Image
import matplotlib.pyplot as plt

# Model yükleme (daha küçük bir model)
model_id = "runwayml/stable-diffusion-v1-5"
pipe = StableDiffusionPipeline.from_pretrained(
    model_id,
    torch_dtype=torch.float16 if torch.cuda.is_available() else torch.float32
)

if torch.cuda.is_available():
    pipe = pipe.to("cuda")

# Görüntü üretme fonksiyonu
def generate_image(prompt, negative_prompt="", height=512, width=512, steps=30, guidance_scale=7.5):
    image = pipe(
        prompt=prompt,
        negative_prompt=negative_prompt,
        height=height,
        width=width,
        num_inference_steps=steps,
        guidance_scale=guidance_scale
    ).images[0]

    return image

# Görüntü gösterme fonksiyonu
def show_image(image):
    plt.figure(figsize=(8, 8))
    plt.imshow(image)
    plt.axis('off')
    plt.show()

# Birkaç farklı prompt deneyelim
prompts = [
    "Gün batımında bir deniz manzarası, gerçekçi fotoğraf",
    "Futuristik bir şehir manzarası, dijital sanat",
    "Akıllı robotlar ve insanlar bir arada çalışıyor, konsept sanatı"
]

for prompt in prompts:
    print(f"Prompt: {prompt}")
    image = generate_image(prompt)
    show_image(image)

Collecting nvidia-cuda-nvrtc-cu12==12.4.127 (from torch>=2.0.0->accelerate)
  Downloading nvidia_cuda_nvrtc_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-runtime-cu12==12.4.127 (from torch>=2.0.0->accelerate)
  Downloading nvidia_cuda_runtime_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cuda-cupti-cu12==12.4.127 (from torch>=2.0.0->accelerate)
  Downloading nvidia_cuda_cupti_cu12-12.4.127-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cudnn-cu12==9.1.0.70 (from torch>=2.0.0->accelerate)
  Downloading nvidia_cudnn_cu12-9.1.0.70-py3-none-manylinux2014_x86_64.whl.metadata (1.6 kB)
Collecting nvidia-cublas-cu12==12.4.5.8 (from torch>=2.0.0->accelerate)
  Downloading nvidia_cublas_cu12-12.4.5.8-py3-none-manylinux2014_x86_64.whl.metadata (1.5 kB)
Collecting nvidia-cufft-cu12==11.2.1.3 (from torch>=2.0.0->accelerate)
  Downloading nvidia_cufft_cu12-11.2.1.3-py3-none-manylinux2014_x86_64.wh

The secret `HF_TOKEN` does not exist in your Colab secrets.
To authenticate with the Hugging Face Hub, create a token in your settings tab (https://huggingface.co/settings/tokens), set it as secret in your Google Colab and restart your session.
You will be able to reuse this secret in all of your notebooks.
Please note that authentication is recommended but still optional to access public models or datasets.


model_index.json:   0%|          | 0.00/541 [00:00<?, ?B/s]

Fetching 15 files:   0%|          | 0/15 [00:00<?, ?it/s]

scheduler_config.json:   0%|          | 0.00/308 [00:00<?, ?B/s]

preprocessor_config.json:   0%|          | 0.00/342 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/4.72k [00:00<?, ?B/s]

special_tokens_map.json:   0%|          | 0.00/472 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/617 [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/492M [00:00<?, ?B/s]

tokenizer_config.json:   0%|          | 0.00/806 [00:00<?, ?B/s]

config.json:   0%|          | 0.00/743 [00:00<?, ?B/s]

vocab.json:   0%|          | 0.00/1.06M [00:00<?, ?B/s]

config.json:   0%|          | 0.00/547 [00:00<?, ?B/s]

diffusion_pytorch_model.safetensors:   0%|          | 0.00/3.44G [00:00<?, ?B/s]

merges.txt:   0%|          | 0.00/525k [00:00<?, ?B/s]

model.safetensors:   0%|          | 0.00/1.22G [00:00<?, ?B/s]

diffusion_pytorch_model.safetensors:   0%|          | 0.00/335M [00:00<?, ?B/s]

Loading pipeline components...:   0%|          | 0/7 [00:00<?, ?it/s]

Prompt: Gün batımında bir deniz manzarası, gerçekçi fotoğraf


  0%|          | 0/30 [00:00<?, ?it/s]