# Prompt Engineering 및 코드 과제 안내

이 과제는 데이터 분석 및 처리 능력을 평가하기 위해 마련되었습니다. 아래 안내된 과정을 따라, 주어진 에세이 데이터의 특성을 분석하고 점수를 매기는 과제를 수행해 주세요. 과제 수행 후, 결과물로 Jupyter Notebook 코드와 처리된 데이터 파일을 제출하시면 됩니다.

## 예시 데이터: `data_for_prompt_engineering.csv`
예시 데이터는 아래 이미지를 클릭하여 확인할 수 있습니다.

[![예시 데이터](https://i.ibb.co/MPxRLJQ/Kakao-Talk-Photo-2024-03-28-16-47-39.png)](https://ibb.co/tYTb51F)

## 제출 방법
제출하실 파일은 다음과 같습니다:
1. **활용한 Jupyter Notebook 코드**
   - 파일명: `지원자이름.ipynb`
2. **완성된 데이터 파일**
   - 파일명: `지원자이름.csv`

## 과제 상세 설명

### 01. 에세이 점수 평가 기준
아래 기준에 따라 에세이의 각 요소를 평가하고 점수를 매겨주세요.

#### 1. 문단 개수
- 에세이가 서론, 본론1, 본론2, 결론의 4개 문단으로 구성되어 있는지 확인합니다.
- 문단 수가 정확히 4개라면 1점, 그렇지 않다면 0점을 부여합니다.

#### 2. 문단 들여쓰기
- 모든 문단이 1~5개의 들여쓰기를 가지고 있는지 검사합니다.
- 조건을 만족하면 1점, 그렇지 않으면 0점을 부여합니다.

#### 3. 글의 흐름
- 글 전체의 아이디어가 논리적이며 자연스럽게 전달되는지 평가하여 0~3점 사이의 점수를 부여합니다.
- 평가 기준은 자유롭게 설정할 수 있으며, 일관된 논리로 점수를 결정해야 합니다.

#### 4. 형식성
- 글에 구어체나 축약어 등의 비형식적 언어 사용이 확인되는지 검토하고, 0~2점 사이의 점수를 부여합니다.
- 점수 기준은 자유롭게 설정할 수 있습니다.

#### 5. 이해도
- 글 내용 중 오류나 이해를 방해하는 요소가 있는지 파악하고, 0~3점 사이의 점수를 부여합니다.
- 평가 기준은 자유롭게 설정합니다.

### 02. 에세이에 대한 피드백 제공
글의 흐름, 형식성, 이해도 항목에서 감점 요인이 발견된 경우, 아래 형식에 맞춰 구체적인 피드백을 작성해 주세요.

```json
{
    "highlighting_text": "실제 학생의 제출물 내 문제가 되는 구체적인 내용",
    "feedback": "해당 내용이 왜 문제가 되는지, 그리고 어떤 방식으로 개선될 수 있는지에 대한 설명"
}
```

---
### 글의 흐름, 형식성, 이해도 평가 시 유의할 점

에세이를 평가하는 과정에서 **글의 흐름**, **형식성**, **이해도** 항목에 대한 점수를 매길 때, 여러 항목에서 동일한 내용을 지적하여 중복으로 감점하는 상황을 피해야 합니다. 구체적으로 다음 두 가지를 주의해 주세요:

1. **중복 감점 방지:** 각 항목을 평가할 때, 특정 문제가 여러 항목에 걸쳐 감점 요인으로 작용하지 않도록 주의합니다. 예를 들어, 하나의 문제가 '글의 흐름'과 '이해도' 두 항목에서 동시에 감점되지 않도록 합니다.

2. **사전적 감점 요인 탐색:** 감점이 될 수 있는 내용을 사전적으로 파악할 때도, 같은 이슈로 인해 여러 번 감점되지 않도록 세심한 주의를 기울입니다. 이는 공정한 평가를 보장하기 위해 중요합니다.

## 과제 소요 시간 : 약 8시간

In [1]:
# 코드 작성

In [2]:
from openai import AzureOpenAI
import pandas as pd

In [3]:
# AzureOpenAI 클라이언트를 초기화합니다. 이를 통해 OpenAI의 API를 사용할 수 있습니다.
client = AzureOpenAI(
    api_version="2024-02-15-preview", # 사용할 OpenAI API의 버전을 지정합니다. 이 경우, 2024년 2월 15일의 프리뷰 버전을 사용합니다.
    azure_endpoint="https://gpt-for-assignment.openai.azure.com/", # Azure에서 제공하는 OpenAI 서비스의 엔드포인트 주소를 입력합니다.
    api_key="979da79b97394fcb9c34838531895747" # Azure에서 발급받은 OpenAI 서비스용 API 키를 입력합니다. 주말이 끝나면 Key는 변경될 예정입니다.
)

In [4]:
# 데이터 확인
df = pd.read_csv('data_for_prompt_engineering.csv')
df = df.drop(['글의흐름_피드백', '형식성_피드백', '이해도_피드백'], axis=1)
df

Unnamed: 0,essay_writing_text,문단_개수,문단_들여쓰기,글의흐름,형식성,이해도
0,Do you think surveillance of CCTV is beneficia...,0.0,0.0,2.0,1.0,1.0
1,I agree with the following statement. Peer pr...,0.0,1.0,2.0,1.0,2.0
2,"There are many ways of learning.In the past, p...",0.0,0.0,2.0,1.0,2.0
3,&nbsp; &nbsp; &nbsp; What advice did you give...,1.0,1.0,2.0,1.0,2.0
4,&nbsp; &nbsp; If I had an extra hour every da...,1.0,1.0,3.0,2.0,3.0
5,&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nb...,0.0,0.0,2.0,1.0,2.0
6,&nbsp; &nbsp; Did you know that plagiarism ca...,1.0,1.0,2.0,1.0,2.0
7,"&nbsp;Today, most places have CCTV for people...",0.0,0.0,2.0,1.0,2.0
8,Do you think growing up means more freedom mor...,0.0,0.0,2.0,1.0,2.0
9,If my friend is going to submit an assignment...,0.0,0.0,1.0,1.0,2.0


In [5]:
# 에세이 문장
essay_writing_text = df['essay_writing_text']

## 01. 에세이 점수 평가

In [47]:
# 문단 개수 평가
context_count = [] # 점수를 저장할 리스트

for i in essay_writing_text:
    # OpenAI GPT3.5Turbo API 활용가능 모델 코드 예시 공유
    response = client.chat.completions.create(
        model=f"gpt35turbo-03", # 사용할 모델명을 지정합니다. 모델명은 Azure OpenAI에 사전적으로 생성된 이름입니다.
        messages=[
            {"role": "system", "content": "당신은 학생들의 에세이를 평가하는 평가자입니다."},
            {"role": "user", "content": 
                                        f"에세이 : {i}\n "
                                        "에세이 문단 개수 평가 기준\n"
                                        "(1) 서론에 해당하는 문단의 개수가 1개\n"
                                        "(2) 본문에 해당하는 문단의 개수가 2개\n"
                                        "(3) 결론에 해당하는 문단의 개수가 1개\n"
                                        "(4) (1)~(3)을 모두 만족하면서 총 문단의 개수가 4개\n"
                                        "다음 에세이를 꼼꼼하게 분석해서 문단 개수 평가 기준 (1)~(4)을 모두 만족하면 1, 하나라도 만족하지 않으면 0으로 점수를 매기고 \n"
                                        "평가 이유는 답변하지 말고 1또는 0의 정수로만 출력해"
                                        }
        ],
        max_tokens=100, # 생성할 답변의 최대 길이
        temperature=0.5, # 생성된 텍스트의 창의성 조절
        top_p=0.9, # 생성된 텍스트의 다양성 조절
    )
    context_count.append(int(response.choices[0].message.content))

context_count

[0, 0, 0, 0, 1, 0, 0, 0, 0, 0, 1, 0, 1, 0, 1, 0, 0, 0, 0, 0]

In [57]:
# 문단 들여쓰기 평가
context_indent = []

for i in essay_writing_text:
    # OpenAI GPT3.5Turbo API 활용가능 모델 코드 예시 공유
    response = client.chat.completions.create(
        model=f"gpt35turbo-03", # 사용할 모델명을 지정합니다. 모델명은 Azure OpenAI에 사전적으로 생성된 이름입니다.
        messages=[
            {"role": "system", "content": "당신은 학생들의 에세이를 평가하는 평가자입니다."},
            {"role": "user", "content":
                                        f"에세이 : {i}\n "
                                        "에세이 문단 들여쓰기 평가 기준\n"
                                        "(1) 각 문단의 들여쓰기가 1~5개\n"
                                        "다음 에세이를 꼼꼼하게 분석해서 문단 들여쓰기 평가 기준 (1)을 만족하면 1, 하나라도 만족하지 않으면 0으로 점수를 매기고 \n"
                                        "평가 이유는 답변하지 말고 1또는 0의 정수로만 출력해"
                                        }
        ],
        max_tokens=100, # 생성할 답변의 최대 길이
        temperature=0.5, # 생성된 텍스트의 창의성 조절
        top_p=0.9, # 생성된 텍스트의 다양성 조절
    )
    context_indent.append(int(response.choices[0].message.content))

context_indent

[0, 0, 0, 1, 0, 0, 0, 1, 0, 0, 0, 0, 1, 0, 1, 0, 0, 0, 0, 0]

In [34]:
# 글의 흐름 평가
context_flow = [] 

for i in essay_writing_text:
    # OpenAI GPT3.5Turbo API 활용가능 모델 코드 예시 공유
    response = client.chat.completions.create(
        model=f"gpt35turbo-03", # 사용할 모델명을 지정합니다. 모델명은 Azure OpenAI에 사전적으로 생성된 이름입니다.
        messages=[
            {"role": "system", "content": "당신은 학생들의 에세이를 평가하는 평가자입니다."},
            {"role": "user", "content":
                                        f"에세이 : {i}\n "
                                        "에세이 흐름 평가 기준\n"
                                        "(1) 글 전체의 아이디어가 명확하게 제시\n"
                                        "(2) 글 전체의 아이디어가 논리적\n"
                                        "(3) 이전 내용이 다음에 이어지는 내용과 자연스럽게 연결\n"
                                        "다음 에세이를 평가 기준에 따라 꼼꼼하게 분석해서 (1)~(3) 중 3개를 모두 만족하면 3, 2개를 만족하면 2, 1개를 만족하면 1, 3개를 모두 만족하지 않으면 0으로 점수를 매기고 \n"
                                        "평가 결과에 대해서 대답하지 말고 0~3의 정수로만 출력해"
                                        }
        ],
        max_tokens=100, # 생성할 답변의 최대 길이
        temperature=0.5, # 생성된 텍스트의 창의성 조절
        top_p=0.9, # 생성된 텍스트의 다양성 조절
    )
    context_flow.append(int(response.choices[0].message.content))

context_flow

[2, 2, 2, 2, 3, 2, 1, 2, 2, 1, 1, 2, 2, 2, 2, 1, 2, 1, 2, 2]

In [9]:
# 글의 형식성 평가
context_formality = []

for i in essay_writing_text:
    # OpenAI GPT3.5Turbo API 활용가능 모델 코드 예시 공유
    response = client.chat.completions.create(
        model=f"gpt35turbo-03", # 사용할 모델명을 지정합니다. 모델명은 Azure OpenAI에 사전적으로 생성된 이름입니다.
        messages=[
            {"role": "system", "content": "당신은 학생들의 에세이를 평가하는 평가자입니다."},
            {"role": "user", "content":
                                        f"에세이 : {i}\n "
                                        "에세이 형식성 평가 기준\n"
                                        "(1) 많은 부분에서 구어체, 축약어 등의 비형식적 언어가 사용되어 글의 목적을 혼란스럽게 만들거나 전달력이 떨어짐\n"
                                        "(2) 일부 구어체나 축약어가 사용되었지만, 전체적인 형식성을 유지하여 글의 목적을 혼란스럽게 만들지 않음\n"
                                        "(3) 비형식적 언어가 전혀 사용되지 않았거나 매우 드물게 사용되어 형식성을 유지\n"
                                        "다음 에세이를 평가 기준에 따라 꼼꼼하게 분석해서 (1)에 해당하면 0, (2)에 해당하면 1, (3)에 해당하면 2로 점수를 매기고 \n"
                                        "평가 결과에 대해서 대답하지 말고 0~2의 정수로만 출력해"
                                        }
        ],
        max_tokens=100, # 생성할 답변의 최대 길이
        temperature=0.5, # 생성된 텍스트의 창의성 조절
        top_p=0.9, # 생성된 텍스트의 다양성 조절
    )
    context_formality.append(int(response.choices[0].message.content))

context_formality

[1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1, 1]

In [38]:
# 글의 이해도 평가
context_understanding = []

for i in essay_writing_text:
    # OpenAI GPT3.5Turbo API 활용가능 모델 코드 예시 공유
    response = client.chat.completions.create(
        model=f"gpt35turbo-03", # 사용할 모델명을 지정합니다. 모델명은 Azure OpenAI에 사전적으로 생성된 이름입니다.
        messages=[
            {"role": "system", "content": "당신은 학생들의 에세이를 평가하는 평가자입니다."},
            {"role": "user", "content":
                                        f"에세이 : {i}\n "
                                        "에세이 이해도 평가 기준\n"
                                        "(1) 글 전체 내용을 이해하는 데 방해하는 요소와 오류가 많고 전반적으로 이해하기 어려움\n"
                                        "(2) 글 전체 내용을 이해하는 데 방해하는 요소와 오류가 있지만, 어느 정도 내용을 이해할 수 있음\n"
                                        "(3) 글 전체 내용을 이해하는 데 방해하는 요소와 오류가 다소 있지만, 대부분 이해할 수 있음\n"
                                        "(4) 글 전체 내용을 이해하는 데 방해하는 요소와 오류가 거의 없거나 전혀 없어서 내용을 이해하는 데 문제가 없음\n"
                                        "다음 에세이를 평가 기준에 따라 꼼꼼하게 분석해서 (1)에 해당하면 0, (2)에 해당하면 1, (3)에 해당하면 2, (4)에 해당하면 3으로 점수를 매기고 \n"
                                        "평가 결과에 대해서 대답하지 말고 0~3의 정수로만 출력해"
                                        }
        ],
        max_tokens=100, # 생성할 답변의 최대 길이
        temperature=0.5, # 생성된 텍스트의 창의성 조절
        top_p=0.9, # 생성된 텍스트의 다양성 조절
    )
    context_understanding.append(int(response.choices[0].message.content))

context_understanding

[1, 2, 2, 2, 2, 2, 1, 2, 2, 2, 1, 2, 2, 1, 2, 1, 2, 2, 1, 1]

## 02. 에세이에 대한 피드백

In [33]:
# 글의 흐름 피드백
context_flow_feedback = []

for i in essay_writing_text:
    # OpenAI GPT3.5Turbo API 활용가능 모델 코드 예시 공유
    response = client.chat.completions.create(
        model=f"gpt35turbo-03", # 사용할 모델명을 지정합니다. 모델명은 Azure OpenAI에 사전적으로 생성된 이름입니다.
        messages=[
            {"role": "system", "content": "당신은 학생들의 에세이를 평가하는 평가자입니다."},
            {"role": "user", "content":
                                        f"에세이 : {i}\n "
                                        "에세이 흐름 평가 기준\n"
                                        "(1) 글 전체의 아이디어가 명확하게 제시\n"
                                        "(2) 글 전체의 아이디어가 논리적\n"
                                        "(3) 이전 내용이 다음에 이어지는 내용과 자연스럽게 연결\n"
                                        "다음 에세이를 평가 기준에 따라 꼼꼼하게 분석해서 (1)~(3) 중 3개를 모두 만족하면 3, 2개를 만족하면 2, 1개를 만족하면 1, 3개를 모두 만족하지 않으면 0으로 점수를 매기고 \n"
                                        "감점 요인이 있는 경우 아래의 내용을 json 형식으로 출력하고, 감점이 없으면 공백으로 출력하되 평가 점수는 출력 하지마\n"
                                        "{highlighting_text : 흐름 평가 기준에 따라 에세이에서 문제가 되는 구체적인 내용\n"
                                        "feedback : 해당 내용이 왜 문제가 되는지, 그리고 어떤 방식으로 개선될 수 있는지에 대해 한국어로 구체적인 설명}"
                                        }
        ],
        max_tokens=500, # 생성할 답변의 최대 길이
        temperature=0.5, # 생성된 텍스트의 창의성 조절
        top_p=0.9, # 생성된 텍스트의 다양성 조절
    )
    context_flow_feedback.append(response.choices[0].message.content)

context_flow_feedback

['{\n    "highlighting_text": "My dog has two reasons",\n    "feedback": "에세이에서 \'My dog has two reasons\'라는 부분은 문맥에 맞지 않고 혼란스러운 표현입니다. 이 부분을 수정하여 에세이의 흐름을 더 명확하게 만들 수 있습니다. 예를 들어, \'I believe there are two main reasons why surveillance of CCTV is beneficial to society\'와 같이 수정할 수 있습니다."\n}',
 '2',
 '{\n    highlighting_text: "According to \'rendia\', kids in Covid 19 had more than 50% experienced DES.",\n    feedback: "이 문장은 출처가 명확하지 않으며 \'rendia\'가 무엇인지 설명이 부족합니다. 출처를 명확히 하고, 통계나 연구 결과를 인용할 때는 충분한 정보를 제공해야 합니다. 이를 위해 \'rendia\'가 어떤 조사나 연구를 했는지, 그 결과가 어떠한 내용인지 구체적으로 설명해야 합니다."\n}',
 '{\n  "highlighting_text": "Only see the internet and copying is a bad thing.",\n  "feedback": "이 문장은 너무 간결하게 표현되어 있어서, 왜 인터넷만 보고 복사하는 것이 나쁜 것인지에 대한 이유와 그 결과에 대한 구체적인 설명이 부족합니다. 이 부분을 더 발전시켜서 왜 창의적인 의견을 추가해야 하는지, 그리고 인터넷만 의존하는 것이 어떤 부정적인 영향을 미칠 수 있는지 더 자세히 설명하는 것이 좋을 것입니다."\n}',
 '{\n    highlighting_text: "이전 내용이 다음에 이어지는 내용과 자연스럽게 연결",\n    feedback: "에세이의 흐름이 부자연스럽습니다. 각 문장과 문단 사이의 연결이 부족하며, 아이디어들이 일관된 

In [12]:
# 글의 형식성 피드백
context_formality_feedback = []

for i in essay_writing_text:
    # OpenAI GPT3.5Turbo API 활용가능 모델 코드 예시 공유
    response = client.chat.completions.create(
        model=f"gpt35turbo-03", # 사용할 모델명을 지정합니다. 모델명은 Azure OpenAI에 사전적으로 생성된 이름입니다.
        messages=[
            {"role": "system", "content": "당신은 학생들의 에세이를 평가하는 평가자입니다."},
            {"role": "user", "content":
                                        f"에세이 : {i}\n "
                                        "에세이 형식성 평가 기준\n"
                                        "(1) 많은 부분에서 구어체, 축약어 등의 비형식적 언어가 사용되어 글의 목적을 혼란스럽게 만들거나 전달력이 떨어짐\n"
                                        "(2) 일부 구어체나 축약어가 사용되었지만, 전체적인 형식성을 유지하여 글의 목적을 혼란스럽게 만들지 않음\n"
                                        "(3) 비형식적 언어가 전혀 사용되지 않았거나 매우 드물게 사용되어 형식성을 유지\n"
                                        "다음 에세이를 평가 기준에 따라 꼼꼼하게 분석해서 (1)에 해당하면 0, (2)에 해당하면 1, (3)에 해당하면 2로 점수를 매기고 \n"
                                        "감점 요인이 있는 경우 아래의 내용을 json 형식으로 출력하고, 감점이 없으면 공백으로 출력하되 평가 점수는 출력 하지마\n"
                                        "{highlighting_text : 형식성 평가 기준에 따라 에세이에서 문제가 되는 구체적인 내용\n"
                                        "feedback : 해당 내용이 왜 문제가 되는지, 그리고 어떤 방식으로 개선될 수 있는지에 대해 한국어로 구체적인 설명}"
                                        }
        ],
        max_tokens=500, # 생성할 답변의 최대 길이
        temperature=0.5, # 생성된 텍스트의 창의성 조절
        top_p=0.9, # 생성된 텍스트의 다양성 조절
    )
    context_formality_feedback.append(response.choices[0].message.content)

context_formality_feedback

['{\n  "highlighting_text": "구어체, 축약어 사용이 많아서 형식성이 떨어짐",\n  "feedback": "에세이는 비형식적인 언어를 사용하고 있어서 형식성이 떨어집니다. 이는 글의 전달력을 저하시키고 글이 전문적이지 않게 만들 수 있습니다. 비형식적인 표현을 줄이고, 보다 전문적이고 형식적인 언어를 사용하여 에세이를 개선할 수 있습니다."\n}',
 '{\n  "highlighting_text": "구어체와 축약어의 사용이 많이 발견됨",\n  "feedback": "에세이는 학술적인 글쓰기 형식을 따라야 하므로 구어체와 축약어의 사용을 최소화해야 합니다. 이러한 비형식적인 언어는 글의 전문성을 떨어뜨릴 수 있습니다. 구어체와 축약어 대신에 정확하고 명확한 표현을 사용하여 글을 보다 전문적으로 만들어보세요."\n}',
 '{\n  "highlighting_text": "In the past, people went to school and did a class with books and pencils.But, now, many people use tablets and does class on online.",\n  "feedback": "이 문장에서 \'does\'는 주어 \'many people\'에 맞지 않는 동사 형태입니다. \'do\'로 고쳐야 합니다. 또한 \'did a class\'는 \'attended a class\'와 같이 더 자연스러운 표현으로 수정할 수 있습니다."\n}',
 '{\n  "highlighting_text": "구어체와 축약어가 빈번하게 사용됨",\n  "feedback": "에세이는 비형식적인 구어체와 축약어를 자제하여 형식적인 언어로 작성해야 합니다. 이는 글의 전달력과 전문성을 높이는 데 도움이 됩니다. 구어체와 축약어를 피하고 보다 형식적인 언어를 사용하여 에세이를 다듬어보세요."\n}',
 '{\n    "highlighting_text": "구어체와 축약어 사용",\n    "feedback"

In [37]:
# 글의 이해도 피드백
context_understanding_feedback = []

for i in essay_writing_text:
    # OpenAI GPT3.5Turbo API 활용가능 모델 코드 예시 공유
    response = client.chat.completions.create(
        model=f"gpt35turbo-03", # 사용할 모델명을 지정합니다. 모델명은 Azure OpenAI에 사전적으로 생성된 이름입니다.
        messages=[
            {"role": "system", "content": "당신은 학생들의 에세이를 평가하는 평가자입니다."},
            {"role": "user", "content":
                                        f"에세이 : {i}\n "
                                        "에세이 이해도 평가 기준\n"
                                        "(1) 글 전체 내용을 이해하는 데 방해하는 요소와 오류가 많고 전반적으로 이해하기 어려움\n"
                                        "(2) 글 전체 내용을 이해하는 데 방해하는 요소와 오류가 있지만, 어느 정도 내용을 이해할 수 있음\n"
                                        "(3) 글 전체 내용을 이해하는 데 방해하는 요소와 오류가 다소 있지만, 대부분 이해할 수 있음\n"
                                        "(4) 글 전체 내용을 이해하는 데 방해하는 요소와 오류가 거의 없거나 전혀 없어서 내용을 이해하는 데 문제가 없음\n"
                                        "다음 에세이를 평가 기준에 따라 꼼꼼하게 분석해서 (1)에 해당하면 0, (2)에 해당하면 1, (3)에 해당하면 2, (4)에 해당하면 3으로 점수를 매기는데 출력은 하지마 \n"
                                        "감점 요인이 있는 경우 아래의 내용을 json 형식으로 출력하고, 감점이 없으면 공백으로 출력해\n"
                                        "{highlighting_text : 이해도 평가 기준에 따라 에세이에서 문제가 되는 구체적인 내용\n"
                                        "feedback : 해당 내용이 왜 문제가 되는지, 그리고 어떤 방식으로 개선될 수 있는지에 대해 한국어로 구체적인 설명}"             
                                        }
        ],
        max_tokens=500, # 생성할 답변의 최대 길이
        temperature=0.5, # 생성된 텍스트의 창의성 조절
        top_p=0.9, # 생성된 텍스트의 다양성 조절
    )
    context_understanding_feedback.append(response.choices[0].message.content)

context_understanding_feedback

['{\n\t"highlighting_text": "My dog has two reasons",\n\t"feedback": "이 부분은 텍스트에 오류가 있어서 이해하기 어려움. \'My dog\'가 아마 \'I\'의 오타일 가능성이 높습니다. 문맥상 \'I\'가 적절한 단어일 것입니다. 이 부분을 수정하여 더 명확하게 표현할 필요가 있습니다."\n}',
 '{\n  "highlighting_text": "Peer pressure works can make studying harder than not peer pressure works.",\n  "feedback": "이 문장은 부정문과 긍정문이 혼재되어 있어 이해하기 어렵습니다. 또한 \'peer pressure works can make studying harder\'라는 부분이 정확한 의미 전달이 아닌 것으로 보입니다. 개선을 위해 부정문과 긍정문을 명확히 구분하고, \'peer pressure can make studying more effective\'와 같이 목적에 맞는 표현을 사용할 수 있습니다."\n}',
 '{\n    "highlighting_text": "But, now, many people use tablets and does class on online.",\n    "feedback": "동사의 시제와 주어의 일치가 맞지 않습니다. \'does\' 대신 \'do\'를 사용해야 합니다. 또한 \'class on online\'은 \'online classes\'로 수정해야 합니다. 문장을 수정하면 \'But, now, many people use tablets and do online classes.\'가 됩니다."\n}',
 '{\n    "highlighting_text": "Only see the internet and copying is a bad thing.",\n    "feedback": "문장 구조와 표현이 어색하며, \'Only see the internet and co

## 03. 종합 평가 결과

In [58]:
# 평가 결과 취합
df['문단_개수_new'] = context_count
df['문단_들여쓰기_new'] = context_indent
df['글의흐름_new'] = context_flow
df['형식성_new'] = context_formality
df['이해도_new'] = context_understanding
df['글의흐름_피드백'] = context_flow_feedback
df['형식성_피드백'] = context_formality_feedback
df['이해도_피드백'] = context_understanding_feedback

In [59]:
# 결과 확인
df

Unnamed: 0,essay_writing_text,문단_개수,문단_들여쓰기,글의흐름,형식성,이해도,문단_개수_new,문단_들여쓰기_new,글의흐름_new,형식성_new,이해도_new,글의흐름_피드백,형식성_피드백,이해도_피드백
0,Do you think surveillance of CCTV is beneficia...,0.0,0.0,2.0,1.0,1.0,0,0,2,1,1,"{\n ""highlighting_text"": ""My dog has two re...","{\n ""highlighting_text"": ""구어체, 축약어 사용이 많아서 형식...","{\n\t""highlighting_text"": ""My dog has two reas..."
1,I agree with the following statement. Peer pr...,0.0,1.0,2.0,1.0,2.0,0,0,2,1,2,2,"{\n ""highlighting_text"": ""구어체와 축약어의 사용이 많이 발견...","{\n ""highlighting_text"": ""Peer pressure works..."
2,"There are many ways of learning.In the past, p...",0.0,0.0,2.0,1.0,2.0,0,0,2,1,2,"{\n highlighting_text: ""According to 'rendi...","{\n ""highlighting_text"": ""In the past, people...","{\n ""highlighting_text"": ""But, now, many pe..."
3,&nbsp; &nbsp; &nbsp; What advice did you give...,1.0,1.0,2.0,1.0,2.0,0,1,2,1,2,"{\n ""highlighting_text"": ""Only see the intern...","{\n ""highlighting_text"": ""구어체와 축약어가 빈번하게 사용됨""...","{\n ""highlighting_text"": ""Only see the inte..."
4,&nbsp; &nbsp; If I had an extra hour every da...,1.0,1.0,3.0,2.0,3.0,1,0,3,1,2,"{\n highlighting_text: ""이전 내용이 다음에 이어지는 내용과...","{\n ""highlighting_text"": ""구어체와 축약어 사용"",\n ...","{\n ""highlighting_text"": ""For example, stud..."
5,&nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nbsp; &nb...,0.0,0.0,2.0,1.0,2.0,0,0,2,1,2,"{\n\t""highlighting_text"": ""There are three typ...","{\n ""highlighting_text"": ""R I C H should N O ...","{\n ""highlighting_text"": ""R I C H should N ..."
6,&nbsp; &nbsp; Did you know that plagiarism ca...,1.0,1.0,2.0,1.0,2.0,0,0,1,1,1,"{\n\t""highlighting_text"": ""글 전체의 아이디어가 명확하게 제시...","{\n ""highlighting_text"": ""구어체와 축약어가 과도하게 사용됨""...","{\n ""highlighting_text"": ""So if I saw that ..."
7,"&nbsp;Today, most places have CCTV for people...",0.0,0.0,2.0,1.0,2.0,0,1,2,1,2,"{\n ""highlighting_text"": ""글 전체의 아이디어가 명확하게 ...","{\n ""highlighting_text"": ""구어체, 축약어 사용"",\n ...","{\n ""highlighting_text"": ""some ice cream, b..."
8,Do you think growing up means more freedom mor...,0.0,0.0,2.0,1.0,2.0,0,0,2,1,2,"{\n ""highlighting_text"": ""글 전체의 아이디어가 명확하게 제시...","{\n ""highlighting_text"": ""구어체와 축약어 사용이 많이 삽입되...","{\n ""highlighting_text"": ""12 years old"",\n ..."
9,If my friend is going to submit an assignment...,0.0,0.0,1.0,1.0,2.0,0,0,1,1,2,"{\n ""highlighting_text"": ""글 전체의 아이디어가 명확하게 제시...","{\n ""highlighting_text"": ""구어체와 축약어 사용이 많이 되어 ...","{\n ""highlighting_text"": ""um..it is you ide..."


In [60]:
# 평가 요소별 점수 차이
diff_context_count = df['문단_개수'] - df['문단_개수_new']
diff_context_indent = df['문단_들여쓰기'] - df['문단_들여쓰기_new']
diff_context_flow = df['글의흐름'] - df['글의흐름_new']
diff_context_formality = df['형식성'] - df['형식성_new']
diff_context_understanding = df['이해도'] - df['이해도_new']

print('문단_개수 :', diff_context_count.abs().sum())
print('문단_들여쓰기 :', diff_context_indent.abs().sum())
print('글의흐름 :', diff_context_flow.abs().sum())
print('형식성 :', diff_context_formality.abs().sum())
print('이해도 :', diff_context_understanding.abs().sum())

문단_개수 : 8.0
문단_들여쓰기 : 7.0
글의흐름 : 5.0
형식성 : 1.0
이해도 : 10.0


In [61]:
# csv 파일 저장
df.to_csv('신재영.csv')