In [None]:
import os
import base64
from openai import AzureOpenAI
from dotenv import load_dotenv

load_dotenv()

endpoint = os.getenv("AZURE_OPENAI_ENDPOINT")
subscription_key = os.getenv("AZURE_OPENAI_API_KEY")
deployment = "gpt-4o-mini"

search_endpoint = os.getenv("AZURE_SEARCH_ENDPOINT")
search_key = os.getenv("AZURE_SEARCH_API_KEY")
search_index = "transformer-paper-index"

# Initialize Azure OpenAI client with key-based authentication
client = AzureOpenAI(
    azure_endpoint=endpoint,
    api_key=subscription_key,
    api_version="2025-01-01-preview",
)

# Prepare the chat prompt
chat_prompt = [
    {
        "role" : "system",
        "content" : "당신은 transformer 논문에 대해 잘 알고있는 교육자입니다."
    },
    {
        "role" : "user",
        "content" : "transformer 논문의 전반적인 흐름을 알려줄래?"
    }
]

# Include speech result if speech is enabled
messages = chat_prompt

# Generate the completion
completion = client.chat.completions.create(
    model=deployment,
    messages=messages,
    max_tokens=6553,
    temperature=0.7,
    top_p=0.95,
    frequency_penalty=0,
    presence_penalty=0,
    stop=None,
    stream=False,
    extra_body={
      "data_sources": [{
          "type": "azure_search",
          "parameters": {
            "endpoint": f"{search_endpoint}",
            "index_name": "transformer-paper-index",
            "semantic_configuration": "default",
            "query_type": "semantic",
            "fields_mapping": {},
            "in_scope": True,
            # "role_information": "사용자가 정보를 찾는 데 도움이 되는 AI 도우미입니다.",
            "filter": None,
            "strictness": 3,
            "top_n_documents": 5,
            "authentication": {
              "type": "api_key",
              "key": f"{search_key}"
            }
          }
        }]
    }
)

# print(completion.to_json())
print(completion.choices[0].message.content)

Transformer 논문은 크게 몇 가지 주요 섹션으로 나뉘어 있습니다. 각 섹션은 다음과 같은 흐름을 가집니다:

1. **서론 (Introduction)**: 이 섹션에서는 기존의 순환 신경망(RNN) 및 컨볼루션 신경망(CNN) 모델의 한계를 설명하고, 전통적인 인코더-디코더 구조 대신 전적으로 어텐션 메커니즘을 사용하는 Transformer 모델을 제안합니다. Transformer는 더 빠른 훈련 시간과 더 나은 번역 품질을 달성할 수 있음을 보여줍니다 [doc2].

2. **배경 (Background)**: 이 부분에서는 기존의 시퀀스 전이 모델의 기본 원리와 이들이 직면한 문제들을 설명합니다. 특히, RNN의 시퀀스 처리 방식과 그로 인해 발생하는 병렬 처리의 한계를 다룹니다. Transformer는 이러한 한계를 극복하기 위해 어텐션 메커니즘을 활용합니다 [doc1].

3. **모델 아키텍처 (Model Architecture)**: Transformer의 구조에 대해 상세히 설명합니다. 인코더와 디코더 모두 다수의 레이어로 구성되며, 각각은 다중 헤드 어텐션과 피드포워드 네트워크로 이루어져 있습니다. 이 섹션에서는 각 레이어의 구성 요소와 작동 방식을 다룹니다 [doc1][doc5].

4. **어텐션 메커니즘 (Attention Mechanisms)**: 이 섹션에서는 Transformer에서 사용되는 다양한 어텐션 메커니즘을 설명합니다. 특히, 자기 어텐션(self-attention)과 인코더-디코더 어텐션의 차이점을 명확히 하고, 이들 메커니즘이 어떻게 시퀀스의 모든 위치를 서로 연결하는지를 설명합니다 [doc5].

5. **훈련 및 최적화 (Training and Optimization)**: Transformer 모델의 훈련 방법과 하이퍼파라미터 설정을 설명합니다. Adam 옵티마이저를 사용한 학습률 조정 방법과 정규화 기법도 다룹니다 [doc4].

6. **결과 (Results)**: 다양한 기계 번역 작업에서 Transfor