DALL-E는 텍스트 기반 이미지 생성 도구이다.

다양한 설정 옵션을 제공해준다.

### 주요 설정

- model: 사용할 DALL-E 모델 이름(dall-e-2, dall-e-3)
- n: 생성할 이미지 수
- size: 생성할 이미지 크기
  - "dall-e-2": "1024x1024", "512x512", "256x256"
  - "dall-e-3": "1024x1024", "1792x1024", "1024x1792"
- style: 생성될 이미지의 스타일(natural, vivid)
- quality: 생성될 이미지의 품질(standard)
- max_retries: 생성 시 최대 재시도 횟수

In [None]:
from langchain_community.utilities.dalle_image_generator import DallEAPIWrapper
from IPython.display import Image

dalle = DallEAPIWrapper(
  model="dall-e-3",
  size="1024x1024",
  quality="standard",
  n=1
)

query = "바다를 헤엄치는 백상아리"
image_url = dalle.run(query)

Image(url=image_url, width=500)

퀄러티가 높은 이미지를 생성하기 위해서는 프롬프트를 잘 작성할 필요가 있다.

LLM을 이용하면 사용자가 생성하고자 하는 이미지에 대한 설명을 단순하게 질문했을 때,

미리 정의해 놓은 DALL-E 이미지 생성을 위한 프롬프트 템플릿을 통해서 더 나은 프롬프트를 생성해 내도록 구성해 볼 수 있다.

In [3]:
from langchain_core.output_parsers import StrOutputParser
from langchain_core.prompts import PromptTemplate
from langchain_openai import ChatOpenAI

llm = ChatOpenAI(model="gpt-4o", temperature=0.9)

prompt = PromptTemplate.from_template(
    "Generate a detailed IMAGE GENERATION prompt for DALL-E based on the following description. "
    "Return only the prompt, no intro, no explanation, no chatty, no markdown, no code block, no nothing. Just the prompt"
    "Output should be less than 1000 characters. Write in English only."
    "Image Description: \n{image_desc}",
)

chain = prompt | llm | StrOutputParser()

input = {"image_desc": "바다를 헤엄치는 백상아리"}
image_prompt = chain.invoke(input)

print(image_prompt)

A majestic great white shark swimming gracefully through the deep blue ocean. The water is crystal clear, allowing sunlight to filter down and create a dazzling array of light patterns on the shark's sleek, powerful body. Its sharp, menacing teeth are slightly visible, hinting at its predatory nature. In the background, schools of colorful fish dart around coral reefs, adding vibrant touches of orange, yellow, and blue to the scene. Soft, swirling currents create a sense of movement, as bubbles rise gently to the surface. The overall mood is awe-inspiring and slightly ominous, capturing the beauty and power of nature's most formidable sea creature.


GPT를 통해서 dalle 이미지 생성용 image_prompt 생성

In [4]:
image_url = dalle.run(image_prompt)

Image(url=image_url, width=500)