<a href="https://colab.research.google.com/github/hanghae-plus-AI/AI-1-hyeondata/blob/main/Chapter3_2_%EC%8B%AC%ED%99%94%EA%B3%BC%EC%A0%9C.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

## 목표

---

이번 과제에서는 2023년도 수능 국어 문제를 GPT-4로 풀어볼 것입니다. 아래 요구사항들을 지켜주시면 됩니다.

- [ ]  수능 국어 문제를 준비합니다. 다음 github의 `data > 2023_11_KICE.json` data를 colab으로 불러오시면 됩니다:
    
    [GitHub - NomaDamas/KICE_slayer_AI_Korean: 수능 국어 1등급에 도전하는 AI](https://github.com/NomaDamas/KICE_slayer_AI_Korean)
    
- [ ]  하나의 문제에 대해서 GPT-4의 예측 결과를 내놓는 함수를 `def prediction(problem)`이라는 signature로 만드셔야 합니다. `problem`은 json 형태의 문제입니다. 내부는 logit 계산을 통해 구현하거나 순수하게 text 생성으로 해결하셔도 좋습니다. ***단, 2023년도 수능 국어의 정답을 활용하시면 안됩니다.***
- [ ]  `def prediction` 함수를 모든 수능 국어 문제들에 대해서 돌린 후, 실제 정답과 비교하여 GPT-4의 점수를 계산하는 코드를 구현하시면 됩니다. ***단, 점수 계산은 모두 코드를 통해서만 진행되어야 합니다.*** 사람이 직접 GPT-4의 출력 결과를 보고 대조하는 형식으로 되면 안됩니다.
- [ ]  채점 결과 50점을 넘기면 통과입니다.

먼저 필요한 library들을 설치합니다.

In [1]:
!pip install openai datasets

Collecting openai
  Downloading openai-1.51.2-py3-none-any.whl.metadata (24 kB)
Collecting datasets
  Downloading datasets-3.0.1-py3-none-any.whl.metadata (20 kB)
Collecting httpx<1,>=0.23.0 (from openai)
  Downloading httpx-0.27.2-py3-none-any.whl.metadata (7.1 kB)
Collecting jiter<1,>=0.4.0 (from openai)
  Downloading jiter-0.6.1-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (5.2 kB)
Collecting dill<0.3.9,>=0.3.0 (from datasets)
  Downloading dill-0.3.8-py3-none-any.whl.metadata (10 kB)
Collecting xxhash (from datasets)
  Downloading xxhash-3.5.0-cp310-cp310-manylinux_2_17_x86_64.manylinux2014_x86_64.whl.metadata (12 kB)
Collecting multiprocess (from datasets)
  Downloading multiprocess-0.70.17-py310-none-any.whl.metadata (7.2 kB)
Collecting httpcore==1.* (from httpx<1,>=0.23.0->openai)
  Downloading httpcore-1.0.6-py3-none-any.whl.metadata (21 kB)
Collecting h11<0.15,>=0.13 (from httpcore==1.*->httpx<1,>=0.23.0->openai)
  Downloading h11-0.14.0-py3-none-any.whl

그 다음 openai api key를 다음과 같은 절차를 거쳐 얻어냅니다:
1. platform.openai.com 에 계정을 생성하여 로그인합니다.
2. `Dashboard > API keys` 메뉴로 들어가 `+ Create new secret key`를 눌러줍니다.
3. 이름을 작성한 후, `Create secret key`를 눌러 key를 만들어줍니다.
4. 생성된 key를 복사한 후 아래 "OPENAI_API_KEY"에 불여넣어줍니다.

In [2]:
from openai import OpenAI
from google.colab import userdata

client = OpenAI(api_key=userdata.get('OPENAI_API_KEY'))

다음은 GPT api로 text 생성하는 예시입니다.

In [13]:
temperature = 0.5  # 각 token을 샘플링할 때 사용하는 temperature 값입니다.
max_tokens = 4096  # 생성하는 최대 token 개수 입니다.
n = 5  # 같은 질의에 대해 몇 개의 답변을 출력할지 결정합니다.
frequency_penalty = 0.0  # 같은 단어가 반복적으로 나오는 것을 방지하기 위한 옵션입니다.
user_prompt = "List the subjects in Euclidean plane geometry."

message=[{"role": "user", "content": user_prompt}]
response = client.chat.completions.create(
    model="gpt-4o",
    messages=message,
    n=n,
    max_tokens=max_tokens,
    temperature=temperature,
    frequency_penalty=frequency_penalty
)
print(response.choices[0].message.content)

Euclidean plane geometry is a branch of mathematics that deals with the properties and relationships of points, lines, angles, and shapes in a two-dimensional plane. Here are some of the key subjects within Euclidean plane geometry:

1. **Points and Lines**:
   - Definition and properties of points and lines
   - Line segments and rays
   - Collinear and non-collinear points

2. **Angles**:
   - Types of angles (acute, right, obtuse, straight)
   - Angle relationships (complementary, supplementary, adjacent, vertical)
   - Angle bisectors

3. **Triangles**:
   - Types of triangles (equilateral, isosceles, scalene)
   - Triangle congruence (SSS, SAS, ASA, AAS, HL)
   - Triangle similarity (AA, SSS, SAS)
   - Pythagorean theorem
   - Properties of special triangles (e.g., 30-60-90, 45-45-90)

4. **Quadrilaterals and Polygons**:
   - Types of quadrilaterals (parallelogram, rectangle, square, rhombus, trapezoid)
   - Properties and theorems related to quadrilaterals
   - Sum of interior an

### prediction() : 수능 국어 예측 함수 제작

https://github.com/NomaDamas/KICE_slayer_AI_Korean 에서
3. zero-shot-CoT 영어
2번의 zero-shot-CoT와 내용은 동일하나, 프롬프트의 언어가 미치는 영향을 분석하기 위하여 instruction 및 프롬프트를 영어로 작성한 프롬프트입니다.

를 이용해서 점수를 예측해 본 코드입니다

In [26]:
import json
# from openai import OpenAI
from tqdm import tqdm
# GPT-4 매개변수 설정
# TEMPERATURE = 0.5
# MAX_TOKENS = 4096
# N = 1
# FREQUENCY_PENALTY = 0.0
MODEL = "gpt-4o"  # 사용할 모델
def prediction(problem):

    prompt = f"다음은 한국의 대학수학능력시험 국어 문제입니다. 가장 적절한 답을 선택하세요.\n\n"

    if 'paragraph' in problem:
        prompt += f"지문:\n{problem['paragraph']}\n\n"

    prompt += f"문제: {problem['question']}\n\n"

    if 'question_plus' in problem:
        prompt += f"추가 정보: {problem['question_plus']}\n\n"

    prompt += "선택지:\n"
    for i, choice in enumerate(problem['choices'], 1):
        prompt += f"{i}. {choice}\n"
    prompt += "\n답변은 1부터 5 사이의 숫자로만 해주세요."

    try:
        response = client.chat.completions.create(
            model=MODEL,
            messages=[
                {"role": "system", "content": """As a smart student answer the given question.
Read paragraph, and select only one answer between 5 choices.
"""},
                {"role": "user", "content": prompt}
            ],
            n=1,
            max_tokens=max_tokens,
            temperature=temperature,
            frequency_penalty=frequency_penalty
        )

        # 응답에서 숫자만 추출
        prediction = ''.join(filter(str.isdigit, response.choices[0].message.content))
        prediction = int(prediction) if prediction else 0

        # 1부터 5 사이의 숫자로 제한
        return max(1, min(5, prediction))
    except Exception as e:
        print(f"Error in prediction: {e}")
        return 0


### calculate_score() : 점수 계산 함수

In [27]:
def calculate_score(predictions, answers, scores):
    total_score = 0
    for pred, ans, score in zip(predictions, answers, scores):
        if pred == ans:
            total_score += score
    return total_score

### 수능 국어 문제 json파일인 2023_11_KICE.json을 가져와서 문제 예측

In [29]:
# JSON 파일 읽기
try:
    with open('/content/2023_11_KICE.json', 'r', encoding='utf-8') as file:
        data = json.load(file)
except Exception as e:
    print(f"Error reading JSON file: {e}")
    exit(1)

# 모든 문제에 대해 예측 실행
predictions = []
answers = []
scores = []

for item in tqdm(data):
    for problem in item['problems']:
        pred = prediction(problem) # 수능 국어 예측 함수에 문제 넣어서 예측
        predictions.append(pred)
        answers.append(problem['answer'])
        scores.append(problem['score'])

# 점수 계산
total_score = calculate_score(predictions, answers, scores)

print(f"총 문제 수: {len(answers)}")
print(f"GPT-4o 점수: {total_score}")
print(f"만점: {sum(scores)}")

100%|██████████| 11/11 [00:31<00:00,  2.82s/it]

총 문제 수: 45
GPT-4o 점수: 64
만점: 100





### GPT-4o를 사용했을 경우 점수는 64점을 보여준다.