## 부록 1. 이미지 생성 및 이미지 분석하기

In [2]:
!pip install openai
!pip install httpx==0.27.2



### A. DALL-E로 이미지 생성

In [3]:
import os
from openai import OpenAI

def init_api():
    with open("chatgpt.env") as env:
        for line in env:
            key, value = line.strip().split("=")
            os.environ[key] = value

init_api()

# OpenAI 클라이언트 초기화
client = OpenAI(api_key  = os.environ.get("API_KEY"))

In [4]:
kwargs = {
    "prompt": "A beautiful landscape."
}

# 이미지 생성
im = client.images.generate(**kwargs)
print(im)



ImagesResponse(created=1757906687, background=None, data=[Image(b64_json=None, revised_prompt=None, url='https://oaidalleapiprodscus.blob.core.windows.net/private/org-PW6GdpgJTc9X6BCJjiewEQ9b/user-SsNy4lyFPH2jMavAJVQrW8Rt/img-w6MPZeWCvbtxgVARxvXGzkmX.png?st=2025-09-15T02%3A24%3A47Z&se=2025-09-15T04%3A24%3A47Z&sp=r&sv=2024-08-04&sr=b&rscd=inline&rsct=image/png&skoid=8b33a531-2df9-46a3-bc02-d4b1430a422c&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2025-09-14T15%3A36%3A07Z&ske=2025-09-15T15%3A36%3A07Z&sks=b&skv=2024-08-04&sig=qyA4PrHQr7Y%2BNZOK6QEFR%2BKOR%2BYiUcMjyuS8CW3xqpk%3D')], output_format=None, quality=None, size=None, usage=None)


In [7]:
from IPython.display import Image, display

display(Image(url=im.data[0].url))

In [9]:
# 이미지 생성
response = client.images.generate(
    model="gpt-image-1",  # 또는 "dall-e-3"
    prompt="해가 지는 미래 도시 풍경, 네온 불빛과 비행 자동차 포함",
    size="1024x1024",
    n=1
)

# 결과 출력
image_url = response.data[0].url
print("생성된 이미지 URL:", image_url)

display(Image(url=im.data[0].url))

PermissionDeniedError: Error code: 403 - {'error': {'message': 'Your organization must be verified to use the model `gpt-image-1`. Please go to: https://platform.openai.com/settings/organization/general and click on Verify Organization. If you just verified, it can take up to 15 minutes for access to propagate.', 'type': 'invalid_request_error', 'param': None, 'code': None}}

### 이미지 생성 예제 2 - Dall-e-3

In [12]:
response = client.images.generate(
    model="dall-e-3",
    prompt="귀여운 고양이가 컴퓨터로 코딩하는 모습",
    size="1024x1024",
    quality="standard",
    n=1
)

image_url = response.data[0].url
print(f"생성된 이미지 URL: {image_url}")

생성된 이미지 URL: https://oaidalleapiprodscus.blob.core.windows.net/private/org-PW6GdpgJTc9X6BCJjiewEQ9b/user-SsNy4lyFPH2jMavAJVQrW8Rt/img-fEV9taxQgZT0nhb75SMkFiSW.png?st=2025-09-15T02%3A31%3A46Z&se=2025-09-15T04%3A31%3A46Z&sp=r&sv=2024-08-04&sr=b&rscd=inline&rsct=image/png&skoid=cc612491-d948-4d2e-9821-2683df3719f5&sktid=a48cca56-e6da-484e-a814-9c849652bcb3&skt=2025-09-14T09%3A29%3A31Z&ske=2025-09-15T09%3A29%3A31Z&sks=b&skv=2024-08-04&sig=U1I428nzgSa36nARGwvJ%2BIc59z4%2BR71KLzWUkEP81Rw%3D


In [14]:
display(Image(url=image_url))

### B. 이미지의 내용을 API를 활용하여 분석

-  분석 이미지 링크
- https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/cat_computer.png

In [18]:
image_url = "https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/cat_computer.png"
display(Image(url=image_url))

- 이미지 분석

In [25]:
img_url = "https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/cat_computer.png"

# 최신 모델명 사용
response = client.chat.completions.create(
    model="gpt-4o-mini",
    messages=[
        {
            "role": "user",
            "content": [
                {
                    "type": "text",
                    "text": "이 이미지에 무엇이 있는지 자세히 설명해주세요."
                },
                {
                    "type": "image_url",
                    "image_url": {
                        "url": img_url,
                        "detail": "high"  # "low", "high", "auto" 중 선택
                    }
                }
            ]
        }
    ],
    max_tokens=500
)

print(response.choices[0].message.content)

이미지에는 컴퓨터 앞에 앉아 있는 귀여운 고양이가 보입니다. 고양이는 눈이 크고 귀여운 외모를 가지고 있으며, 키보드 위에 두 앞발을 올리고 있는 모습입니다. 컴퓨터 화면에는 코드가 표시되어 있고, 코드의 일부는 다양한 색상으로 강조되어 있습니다. 

고양이 옆에는 귀여운 인형이 있어 화면 쪽을 보고 있는 듯합니다. 배경에는 식물과 정리된 책장이 있어 아늑한 작업 환경을 연출하고 있습니다. 고양이와 사용하는 사람의 손이 보이며, 마우스도 컴퓨터 주변에 있습니다. 전반적으로 따뜻하고 창의적인 분위기의 이미지입니다.


### C. 다중 이미지 분석 예제

```
https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/bird_Gen4.png
https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/cat_computer.png
https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/edu_webtoon.png
https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/truth_01.png
```

In [27]:
def analyze_multiple_images(image_urls, prompt):
    content = [{"type": "text", "text": prompt}]

    for url in image_urls:
        content.append({
            "type": "image_url",
            "image_url": {"url": url, "detail": "high"}
        })

    response = client.chat.completions.create(
        model="gpt-4o-mini",
        messages=[{"role": "user", "content": content}],
        max_tokens=1000
    )

    return response.choices[0].message.content

# 사용 예제
urls = [
    "https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/bird_Gen4.png",
    "https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/cat_computer.png",
    "https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/edu_webtoon.png",
    "https://ldjwj.github.io/SOURCE_VideoSoraGen3Etc/img/truth_01.png"
]

result = analyze_multiple_images(urls, "이 네 이미지를 초보자에게 분석해서 설명해 주세요")

In [28]:
print(result)

물론입니다! 각각의 이미지를 초보자에게 분석해 설명해 볼게요.

1. **새와 기타**
   - 이 이미지는 나무로 된 기타 위에 작은 새가 있는 장면입니다. 새는 기타의 줄 위를 걷고 있으며, 이 장면은 음악과 자연의 조화를 나타냅니다. 기타의 나뭇결과 색상은 따뜻하고 부드러운 느낌을 줍니다. 새의 모습은 귀엽고 생동감 넘치며, 일상에서 만날 수 있는 소소한 행복을 상징하는 것 같습니다.

2. **고양이와 컴퓨터**
   - 이 이미지에서는 한 사람이 컴퓨터를 사용하고 있고, 그 앞에 귀여운 고양이가 앉아 있습니다. 화면에는 코드가 보이고, 고양이의 호기심 많은 표정은 귀여운 분위기를 자아냅니다. 이 장면은 현대적인 생활에서의 동물 애정과 함께 작업이나 프로그래밍을 하는 일상의 모습을 보여줍니다.

3. **프레젠테이션을 하는 사람**
   - 이 이미지는 사람 앞에 있는 큰 보드에 다양한 그래프, 차트, 메모가 그려져 있습니다. 이 사람은 손에 펜을 들고 이를 설명하고 있는 것처럼 보입니다. 이 장면은 아이디어를 전달하고 데이터를 분석하는 활동을 표현하며, 비즈니스나 학술적 환경에서 흔히 볼 수 있는 모습을 묘사합니다.

4. **기대를 상징하는 그림**
   - 이 이미지에서는 절벽 위에 서 있는 한 사람이 "Faith"(믿음)이라는 깃발을 들고 있습니다. 배경은 부드럽고 따뜻한 색조로 그림이 그려져 있으며, 이는 희망이나 긍정적인 메시지를 전달하는 느낌을 줍니다. 이 장면은 어려운 상황에서도 믿음을 가지고 나아가야 한다는 주제를 시각적으로 표현하고 있습니다.

각 이미지는 서로 다른 주제와 감정을 전달하며, 일상 생활, 현대 기술, 비즈니스, 신념 등의 다양한 내용을 담고 있습니다.
