# Görüntü Oluşturma Uygulaması Geliştirme

LLM’ler sadece metin üretmekle sınırlı değil. Metin açıklamalarından görüntü üretmek de mümkün. Görüntülerin bir mod olarak kullanılması, MedTech’ten mimariye, turizme, oyun geliştirmeye kadar birçok alanda oldukça faydalı olabilir. Bu bölümde, en popüler iki görüntü üretme modeli olan DALL-E ve Midjourney’i inceleyeceğiz.

## Giriş

Bu derste şunları ele alacağız:

- Görüntü üretimi ve neden faydalı olduğu.
- DALL-E ve Midjourney, nedirler ve nasıl çalışırlar.
- Bir görüntü üretme uygulaması nasıl geliştirilir.

## Öğrenme Hedefleri

Bu dersi tamamladıktan sonra şunları yapabileceksiniz:

- Bir görüntü üretme uygulaması geliştirmek.
- Uygulamanız için meta istemlerle sınırlar belirlemek.
- DALL-E ve Midjourney ile çalışmak.

## Neden bir görüntü üretme uygulaması geliştirmelisiniz?

Görüntü üretme uygulamaları, Üretici Yapay Zekâ’nın yeteneklerini keşfetmek için harika bir yoldur. Örneğin:

- **Görüntü düzenleme ve sentezi**. Farklı kullanım senaryoları için görüntüler üretebilirsiniz, örneğin görüntü düzenleme ve görüntü sentezi gibi.

- **Çeşitli sektörlerde uygulanabilir**. Medtech, Turizm, Oyun geliştirme gibi birçok sektörde görüntü üretmek için de kullanılabilirler.

## Senaryo: Edu4All

Bu ders kapsamında, Edu4All girişimimizle çalışmaya devam edeceğiz. Öğrenciler, değerlendirmeleri için görüntüler oluşturacaklar; hangi görüntüleri oluşturacakları tamamen onlara bağlı, örneğin kendi masalları için illüstrasyonlar yapabilir, hikayelerine yeni bir karakter ekleyebilir veya fikirlerini ve kavramlarını görselleştirmelerine yardımcı olabilirler.

Örneğin, Edu4All öğrencileri sınıfta anıtlar üzerine çalışırken şunları üretebilirler:

![Edu4All girişimi, anıtlar dersi, Eyfel Kulesi](../../../../translated_images/startup.94d6b79cc4bb3f5afbf6e2ddfcf309aa5d1e256b5f30cc41d252024eaa9cc5dc.tr.png)

şu tür bir istemle

> "Sabahın erken saatlerinde Eyfel Kulesi’nin yanında bir köpek"

## DALL-E ve Midjourney nedir?

[DALL-E](https://openai.com/dall-e-2?WT.mc_id=academic-105485-koreyst) ve [Midjourney](https://www.midjourney.com/?WT.mc_id=academic-105485-koreyst) en popüler iki görüntü üretme modelidir; istemler kullanarak görüntü oluşturmanıza olanak tanırlar.

### DALL-E

Önce DALL-E ile başlayalım. DALL-E, metin açıklamalarından görüntü üreten bir Üretici Yapay Zekâ modelidir.

> [DALL-E, iki modelin birleşimidir: CLIP ve diffused attention](https://towardsdatascience.com/openais-dall-e-and-clip-101-a-brief-introduction-3a4367280d4e?WT.mc_id=academic-105485-koreyst).

- **CLIP**, görüntülerden ve metinden sayısal veri temsilleri (embedding) oluşturan bir modeldir.

- **Diffused attention**, embedding’lerden görüntü üreten bir modeldir. DALL-E, görüntüler ve metinlerden oluşan bir veri seti üzerinde eğitilmiştir ve metin açıklamalarından görüntü üretmek için kullanılabilir. Örneğin, DALL-E bir şapka takan kedi ya da mohawk saçlı bir köpek görüntüsü oluşturabilir.

### Midjourney

Midjourney de DALL-E’ye benzer şekilde çalışır; metin istemlerinden görüntü üretir. Midjourney ile de “şapka takan bir kedi” veya “mohawk saçlı bir köpek” gibi istemlerle görüntü oluşturabilirsiniz.

![Midjourney tarafından üretilen görüntü, mekanik güvercin](https://upload.wikimedia.org/wikipedia/commons/thumb/8/8c/Rupert_Breheny_mechanical_dove_eca144e7-476d-4976-821d-a49c408e4f36.png/440px-Rupert_Breheny_mechanical_dove_eca144e7-476d-4976-821d-a49c408e4f36.png?WT.mc_id=academic-105485-koreyst)

*Görsel kaynağı: Wikipedia, Midjourney tarafından üretilmiştir*

## DALL-E ve Midjourney Nasıl Çalışır?

Öncelikle [DALL-E](https://arxiv.org/pdf/2102.12092.pdf?WT.mc_id=academic-105485-koreyst). DALL-E, *autoregressive transformer* mimarisine sahip bir Üretici Yapay Zekâ modelidir.

Bir *autoregressive transformer*, modelin metin açıklamalarından görüntü üretme şeklini tanımlar; görüntüyü birer piksel olarak üretir ve üretilen pikselleri bir sonraki pikseli oluşturmak için kullanır. Sinir ağında birden fazla katmandan geçerek, görüntü tamamlanana kadar bu işlem devam eder.

Bu süreç sayesinde DALL-E, oluşturduğu görüntüdeki öznitelikleri, nesneleri, karakteristikleri ve daha fazlasını kontrol edebilir. Ancak DALL-E 2 ve 3, üretilen görüntü üzerinde daha fazla kontrol sunar,


## İlk görsel oluşturma uygulamanızı oluşturmak

Peki bir görsel oluşturma uygulaması geliştirmek için ne gerekir? Şu kütüphanelere ihtiyacınız olacak:

- **python-dotenv**, gizli anahtarlarınızı koddan ayrı tutmak için *.env* dosyasında saklamanızı şiddetle öneririz.
- **openai**, OpenAI API ile etkileşim kurmak için bu kütüphaneyi kullanacaksınız.
- **pillow**, Python'da görsellerle çalışmak için gereklidir.
- **requests**, HTTP istekleri yapmanıza yardımcı olur.


1. Aşağıdaki içerikle bir *.env* dosyası oluşturun:

    ```text
    OPENAI_API_KEY='<add your OpenAI key here>'
    ```


1. Yukarıdaki kütüphaneleri *requirements.txt* adlı bir dosyada aşağıdaki gibi toplayın:

    ```text
    python-dotenv
    openai
    pillow
    requests
    ```


1. Sonra, sanal bir ortam oluşturun ve kütüphaneleri yükleyin:


In [None]:
# create virtual env
! python3 -m venv venv
# activate environment
! source venv/bin/activate
# install libraries
# pip install -r requirements.txt, if using a requirements.txt file 
! pip install python-dotenv openai pillow requests

> [!NOTE]
> Windows için sanal ortamınızı oluşturmak ve etkinleştirmek için aşağıdaki komutları kullanın:

    ```bash
    python3 -m venv venv
    venv\Scripts\activate.bat
    ```

1. *app.py* adında bir dosyaya aşağıdaki kodu ekleyin:

    ```python
    import openai
    import os
    import requests
    from PIL import Image
    import dotenv

    # import dotenv
    dotenv.load_dotenv()

    # Create OpenAI object
    client = OpenAI()


    try:
        # Create an image by using the image generation API
        generation_response = client.images.generate(
            model="dall-e-3",
            prompt='Bunny on horse, holding a lollipop, on a foggy meadow where it grows daffodils',    # Enter your prompt text here
            size='1024x1024',
            n=1
        )
        # Set the directory for the stored image
        image_dir = os.path.join(os.curdir, 'images')

        # If the directory doesn't exist, create it
        if not os.path.isdir(image_dir):
            os.mkdir(image_dir)

        # Initialize the image path (note the filetype should be png)
        image_path = os.path.join(image_dir, 'generated-image.png')

        # Retrieve the generated image
        print(generation_response)

        image_url = generation_response.data[0].url # extract image URL from response
        generated_image = requests.get(image_url).content  # download the image
        with open(image_path, "wb") as image_file:
            image_file.write(generated_image)

        # Display the image in the default image viewer
        image = Image.open(image_path)
        image.show()

    # catch exceptions
    except client.error.InvalidRequestError as err:
        print(err)

    ```

Bu kodu açıklayalım:

- Öncelikle ihtiyacımız olan kütüphaneleri içe aktarıyoruz. Bunlar arasında OpenAI kütüphanesi, dotenv kütüphanesi, requests kütüphanesi ve Pillow kütüphanesi bulunuyor.

    ```python
    import openai
    import os
    import requests
    from PIL import Image
    import dotenv 
    ```

- Sonrasında, API anahtarını ``.env`` dosyanızdan alacak olan nesneyi oluşturuyoruz.

    ```python
        # Create OpenAI object
        client = OpenAI()
    ```

- Ardından, görseli oluşturuyoruz:

    ```python
    # Create an image by using the image generation API
    generation_response = client.images.generate(
        model="dall-e-3",
        prompt='Bunny on horse, holding a lollipop, on a foggy meadow where it grows daffodils',    # Enter your prompt text here
        size='1024x1024',
        n=1
    )
    ```

    Yukarıdaki kod, oluşturulan görselin URL’sini içeren bir JSON nesnesi döndürür. Bu URL’yi kullanarak görseli indirip bir dosyaya kaydedebiliriz.

- Son olarak, görseli açıp standart görsel görüntüleyici ile gösteriyoruz:

    ```python
    image = Image.open(image_path)
    image.show()
    ```

### Görsel oluşturma hakkında daha fazla detay

Görseli oluşturan kodu daha ayrıntılı inceleyelim:

```python
generation_response = client.images.generate(
        model="dall-e-3",
        prompt='Bunny on horse, holding a lollipop, on a foggy meadow where it grows daffodils',    # Enter your prompt text here
        size='1024x1024',
        n=1
    )
```

- **prompt**, görseli oluşturmak için kullanılan metin istemidir. Bu örnekte, "Bunny on horse, holding a lollipop, on a foggy meadow where it grows daffodils" istemini kullanıyoruz.
- **size**, oluşturulan görselin boyutudur. Bu örnekte, 1024x1024 piksel boyutunda bir görsel oluşturuyoruz.
- **n**, oluşturulan görsel sayısıdır. Bu örnekte iki görsel oluşturuyoruz.

Görsellerle ilgili daha fazla işlemi bir sonraki bölümde ele alacağız.

## Görsel oluşturmanın ek yetenekleri

Şimdiye kadar, Python’da birkaç satır kodla nasıl görsel oluşturabileceğimizi gördük. Ancak, görsellerle yapabileceğiniz daha fazla şey var.

Ayrıca şunları da yapabilirsiniz:

- **Düzenleme yapın**. Var olan bir görsele bir maske ve bir istem vererek görseli değiştirebilirsiniz. Örneğin, bir görselin bir bölümüne bir şey ekleyebilirsiniz. Tavşan görselimizi düşünün, tavşana bir şapka ekleyebilirsiniz. Bunu yapmak için görseli, değişiklik yapılacak alanı belirten bir maske ve ne yapılacağını belirten bir metin istemi sağlamanız gerekir.

    ```python
    response = openai.images.edit(
      image=open("base_image.png", "rb"),
      mask=open("mask.png", "rb"),
      prompt="An image of a rabbit with a hat on its head.",
      n=1,
      size="1024x1024"
    )
    image_url = response.data[0].url
    ```

    Temel görselde sadece tavşan olurdu, ancak son görselde tavşanın üzerinde bir şapka olurdu.

- **Varyasyonlar oluşturun**. Buradaki fikir, var olan bir görseli alıp ondan farklı varyasyonlar oluşturmaktır. Bir varyasyon oluşturmak için bir görsel, bir metin istemi ve aşağıdaki gibi bir kod sağlarsınız:

    ```python
    response = openai.images.create_variation(
      image=open("bunny-lollipop.png", "rb"),
      n=1,
      size="1024x1024"
    )
    image_url = response.data[0].url
    ```



---

**Feragatname**:
Bu belge, AI çeviri hizmeti [Co-op Translator](https://github.com/Azure/co-op-translator) kullanılarak çevrilmiştir. Doğruluk için çaba göstersek de, otomatik çevirilerde hata veya yanlışlıklar bulunabileceğini lütfen unutmayın. Belgenin orijinal diliyle hazırlanmış hali esas alınmalıdır. Kritik bilgiler için profesyonel insan çevirisi önerilir. Bu çevirinin kullanımından doğabilecek yanlış anlama veya yanlış yorumlamalardan sorumlu değiliz.
