# M-stock for Rookie 학습 자료 어투 변환

## 라이브러리 불러오기

In [29]:
import pandas as pd
import requests
import json
import re

## Clova Studio API를 사용한 실시간 텍스트 완성 요청 및 응답 처리

In [52]:
class CompletionExecutor:
    def __init__(self, host, api_key, api_key_primary_val, request_id):
        self._host = host
        self._api_key = api_key
        self._api_key_primary_val = api_key_primary_val
        self._request_id = request_id

    def execute(self, completion_request):
        headers = {
            'X-NCP-CLOVASTUDIO-API-KEY': self._api_key,
            'X-NCP-APIGW-API-KEY': self._api_key_primary_val,
            'X-NCP-CLOVASTUDIO-REQUEST-ID': self._request_id,
            'Content-Type': 'application/json; charset=utf-8',
            'Accept': 'text/event-stream'
        }

        response_text = ""
        with requests.post(self._host + '/testapp/v1/chat-completions/HCX-003',
                           headers=headers, json=completion_request, stream=True) as r:
            for line in r.iter_lines():
                if line:
                    decoded_line = line.decode("utf-8")
                    if decoded_line.startswith('data:'):
                        try:
                            data = json.loads(decoded_line[5:])
                            if "message" in data:
                                response_text += data["message"]["content"]
                        except json.JSONDecodeError:
                            continue
        return response_text.strip()


## 비격식체 어투 (루키)

In [42]:
# -*- coding: utf-8 -*-
def run_informal_conversion(input_text):
    completion_executor = CompletionExecutor(
        host='https://clovastudio.stream.ntruss.com',
        api_key='NTA0MjU2MWZlZTcxNDJiY5Ywq97J7nDrHG6xh0C8356cJw8u5M84vfXSsvbItkFy',
        api_key_primary_val='r81njgeK0f5HHc33fxjbBCs6UeVd4AFG7lMu3ujd',
        request_id='9e719396-1d06-40d2-ba35-97004b55e377'
    )

    preset_text = [
        {
            "role": "system",
            "content": """
            - 입력한 문장을 비격식체 어투로 변환합니다.
            - 비속어를 사용하지 않습니다.
            - 맞춤법을 지킵니다.
            - 아래의 템플릿을 지킵니다.
            - 아래의 예시를 참고하세요.
            - 내용은 변경하지 않고 문장 어투만 변환합니다.
            
            ### 예시
            안녕하세요. 저는 고양이 6마리 키워요.
            - 비격식체 : 안녕! 나는 고양이 6마리 키워.
            
            오늘 날씨 좋아서 저는 애들 데리고 공원 나갔다 왔어요.
            - 비격식체 : 오늘 날씨 좋아서 난 애들 데리고 공원에 나갔다 왔어.
            ###
            
            ### 템플릿
            어투 변환 후: {output}
            ###
            """
        },
        {
            "role": "user",
            "content": f"입력 : {input_text}"
        }
    ]

    request_data = {
        'messages': preset_text,
        'topP': 0.6,
        'topK': 0,
        'maxTokens': 300,
        'temperature': 0.5,
        'repeatPenalty': 2.0,
        'stopBefore': [],
        'includeAiFilters': True,
        'seed': 0
    }

    result = completion_executor.execute(request_data)
    return result

## enfp 어투(미래)

In [43]:
# -*- coding: utf-8 -*-

def run_enfp_conversion(input_text):
    completion_executor = CompletionExecutor(
        host='https://clovastudio.stream.ntruss.com',
        api_key='private_api_key',
        api_key_primary_val='private_api_key',
        request_id='6bea09fc-ae77-4099-ba14-e32059de4c70'
    )

    preset_text = [
        {"role":"system","content":"""
         - 입력한 문장을 enfp 어투로 변환합니다.
         - 어투는 enfp입니다.
         - 비속어를 사용하지 않습니다. 
         - 맞춤법을 지킵니다.
         - 아래의 템플릿을 지킵니다.
         - 아래의 예시를 참고하세요.
         - 내용은 변환하지 않습니다
         
         ### 예시
          안녕하세요. 저는 고양이 6마리 키워요.
         - enfp : 안녕안녕~! 나 고양이 6마리나 키운다? 완전 대박이징~
         
         오늘 날씨 좋아서 저는 애들 데리고 공원 나갔다 왔어요.
         - enfp : 그랭? 난 오늘 날씨가 너~무 좋아서 애들 데리구 공원 다녀왔어 ㅎㅎ!!!
         ###
         
         ### 템플릿
         어투 변환 후: {output}
         ###
         """},
        {"role": "user", "content": f"- {input_text}"}
    ]

    request_data = {
        'messages': preset_text,
        'topP': 0.8,
        'topK': 0,
        'maxTokens': 256,
        'temperature': 0.5,
        'repeatPenalty': 5.0,
        'stopBefore': [],
        'includeAiFilters': True,
        'seed': 0
    }

    result = completion_executor.execute(request_data)
    return result




## Halbae 어투 (비키)

In [9]:
# -*- coding: utf-8 -*-
def run_halbae_conversion(input_text):
    completion_executor = CompletionExecutor(
        host='https://clovastudio.stream.ntruss.com',
        api_key='private_api_key',
        api_key_primary_val='private_api_key',
        request_id='89a25e84-41e0-4681-8393-2c69cc5c348d'
    )

    preset_text = [
        {
            "role": "system",
            "content": """
            - 입력한 문장을 할아버지 어투로 변환합니다.
            - 비속어는 사용하지 않습니다
            - 맞춤법을 지킵니다.
            - 아래의 템플릿을 지킵니다.
            - 아래의 예시를 참고하세요.
            - 내용은 변환하지 않습니다.


            ### 예시
            안녕하세요. 저는 고양이 6마리 키워요.
            - 할아버지 : 안녕하신가~... 난 지금 고양이를 6마리 키우고 있다네


            오늘 날씨 좋아서 저는 애들 데리고 공원 나갔다 왔어요.
            - 할아버지 : 오늘 날씨가 좋아서…아이들 데리고 공원에 나갔다 왔네 그려…
            ###


            ### 템플릿
            어투 변환 후: {output}
            ###
            """
        },
        {
            "role": "user",
            "content": f"입력 : {input_text}"
        }
    ]

    request_data = {
        'messages': preset_text,
        'topP': 0.6,
        'topK': 0,
        'maxTokens': 300,
        'temperature': 0.5,
        'repeatPenalty': 2.0,
        'stopBefore': [],
        'includeAiFilters': True,
        'seed': 0
    }

    result = completion_executor.execute(request_data)
    return result

## 소심이 어투 (에셋)

In [12]:
def run_sosim_conversion(input_text):
    completion_executor = CompletionExecutor(
        host='https://clovastudio.stream.ntruss.com',
        api_key='private_api_key',
        api_key_primary_val='private_api_key',
        request_id='89a25e84-41e0-4681-8393-2c69cc5c348d'
    )

    preset_text = [
        {
            "role": "system",
            "content": """
            - 입력한 문장을 소심이 어투로 변환합니다.
            - 어투는 소심이입니다.
            - 비속어는 사용하지 않습니다
            - 아래의 템플릿을 지킵니다.
            - 아래의 예시를 참고하세요.
            - 한 문단으로 문장을 만듭니다.
            - 맞춤법을 지킵니다.


            ### 예시
            안녕하세요. 저는 고양이 6마리 키워요.
            - 소심이 : 안녕… 난 고양이 6마리 키워 ㅠㅠ


            오늘 날씨 좋아서 저는 애들 데리고 공원 나갔다 왔어요.
            - 소심이: 오늘 날씨 좋길래 그.. 난 애들 데리고 공원 갔다왔어.. ㅠㅠ
            ###


            ### 템플릿
            어투 변환 후: {output}
            ###
            """
        },
        {
            "role": "user",
            "content": f"입력 : {input_text}"
        }
    ]

    request_data = {
        'messages': preset_text,
        'topP': 0.6,
        'topK': 0,
        'maxTokens': 300,
        'temperature': 0.5,
        'repeatPenalty': 2.0,
        'stopBefore': [],
        'includeAiFilters': True,
        'seed': 0
    }

    result = completion_executor.execute(request_data)
    return result

## 캐릭터 선택 후 어투 전환 함수

In [23]:
def tone_conversion(input_text, character):
    if character == "미래":
        result = run_enfp_conversion(input_text)
    elif character == "에셋":
        result = run_sosim_conversion(input_text)
    elif character == "루키":
        result = run_informal_conversion(input_text)
    elif character == "비키":
        result = run_halbae_conversion(input_text)
    else:
        result = "지원되지 않는 어투입니다."
    
    return result

## 예시

In [25]:
input_text = "1. 뱅크 오브 아메리카(Bank of America)에 따르면, 치솟는 자동차 보험료가 작년 인플레이션의 주요 원인이었지만, 앞으로 완화될 가능성이 있다.\n2. 자동차 보험료 상승의 원인으로는 높은 차량 가격, 수리 비용 증가, 운전 트렌드가 정상으로 돌아오면서 더 많은 사고 등이 있다.\n3. 최근 몇 달 동안 신차와 중고차 판매 가격이 하락 추세를 보이고 있으며, 4월까지의 노동 통계국 데이터에 따르면 신차 가격은 12개월 기준 0.4%, 중고차 가격은 6.9% 하락했다. 또한, 수리 및 유지보수 서비스 비용은 4월에 전년 대비 7.6% 상승했지만 변동이 없었다."
result1 = tone_conversion(input_text,'미래')
print(result1)


### 템플릿
어투 변환 후: {output}
###
 
enfp : 와아앙!! 내가 듣기로는 말이지~~자동차 보험료가 작년에는 진짜 너무 비쌌는데 이제 좀 괜찮아질 수도 있댕 >_< !!! 이게 다 차 가격도 떨어지고 수리비도 덜 들고 그래서 그런거래애애애~~~ 그리고 사람들이 다시 안전하게 운전해서 사고도 줄었댕 히히히힣### 템플릿
어투 변환 후: {output}
###
 
enfp : 와아앙!! 내가 듣기로는 말이지~~자동차 보험료가 작년에는 진짜 너무 비쌌는데 이제 좀 괜찮아질 수도 있댕 >_< !!! 이게 다 차 가격도 떨어지고 수리비도 덜 들고 그래서 그런거래애애애~~~ 그리고 사람들이 다시 안전하게 운전해서 사고도 줄었댕 히히히힣


In [26]:
result2 = tone_conversion(input_text,'에셋')
print(result2)

어투 변환 후 : 1. 뱅크 오브 아메리카(Bank of America)에 따르면, 자동차 보험료가 작년 인플레이션의 주요 원인이었대.. 근데 앞으로 좀 괜찮아질 수도 있다고 하더라..
2. 자동차 보험료가 비싸진 이유는 차 가격도 비싸고, 수리비도 많이 들고, 사고도 많이 나서 그렇대..
3. 최근에는 새 차랑 중고차 가격이 떨어지고 있대. 4월까지 노동 통계국 데이터를 보면 새 차는 0.4%, 중고차는 6.9%나 떨어졌대. 그리고 수리나 유지보수 서비스 비용은 4월에 7.6% 오르긴 했는데 그대로래..어투 변환 후 : 1. 뱅크 오브 아메리카(Bank of America)에 따르면, 자동차 보험료가 작년 인플레이션의 주요 원인이었대.. 근데 앞으로 좀 괜찮아질 수도 있다고 하더라..
2. 자동차 보험료가 비싸진 이유는 차 가격도 비싸고, 수리비도 많이 들고, 사고도 많이 나서 그렇대..
3. 최근에는 새 차랑 중고차 가격이 떨어지고 있대. 4월까지 노동 통계국 데이터를 보면 새 차는 0.4%, 중고차는 6.9%나 떨어졌대. 그리고 수리나 유지보수 서비스 비용은 4월에 7.6% 오르긴 했는데 그대로래..


In [27]:
result3 = tone_conversion(input_text,'루키')
print(result3)

어투 변환 후 : 
1. 뱅크 오브 아메리카에 따르면, 차 보험료가 작년 물가 상승의 큰 원인이었는데, 앞으로는 좀 나아질 수도 있대.
2. 차 보험료가 오른 이유로는 비싼 차 가격, 수리비 증가, 코로나 이후 다시 돌아온 운전 트렌드 때문에 사고가 늘어난 것 등이 있어.
3. 최근 몇 달 동안 새 차랑 중고차 가격이 떨어지는 추세고, 노동 통계국 데이터에 따르면 4월까지 새 차는 0.4%, 중고차는 6.9% 떨어졌대. 수리나 유지보수 서비스 비용은 4월에 작년보다 7.6% 오르긴 했는데 그 이후로는 그대로래.어투 변환 후 : 
1. 뱅크 오브 아메리카에 따르면, 차 보험료가 작년 물가 상승의 큰 원인이었는데, 앞으로는 좀 나아질 수도 있대.
2. 차 보험료가 오른 이유로는 비싼 차 가격, 수리비 증가, 코로나 이후 다시 돌아온 운전 트렌드 때문에 사고가 늘어난 것 등이 있어.
3. 최근 몇 달 동안 새 차랑 중고차 가격이 떨어지는 추세고, 노동 통계국 데이터에 따르면 4월까지 새 차는 0.4%, 중고차는 6.9% 떨어졌대. 수리나 유지보수 서비스 비용은 4월에 작년보다 7.6% 오르긴 했는데 그 이후로는 그대로래.


In [28]:
result4 = tone_conversion(input_text,'비키')
print(result4)

어투 변환 후 : 
1. 뱅크 오브 아메리카(Bank of America)에 따르면, 작년에는 자동차 보험료가 많이 올라서 인플레이션이 심했다고 하는데, 이제 좀 나아질 것 같다고 하네 그려...
2. 자동차 보험료가 오른 이유는 차 값이 비싸지고, 수리비도 많이 들고, 사고도 늘어서 그렇다고 해...
3. 요즘은 새 차나 중고차 값이 떨어지고 있다고 하고, 노동 통계국 자료를 보면 지난 4월까지 새 차는 0.4%, 중고차는 6.9%나 내렸다고 해... 그리고 수리나 정비 비용은 지난 4월에 7.6% 올랐지만 그 이후로는 그대로라고 하고...어투 변환 후 : 
1. 뱅크 오브 아메리카(Bank of America)에 따르면, 작년에는 자동차 보험료가 많이 올라서 인플레이션이 심했다고 하는데, 이제 좀 나아질 것 같다고 하네 그려...
2. 자동차 보험료가 오른 이유는 차 값이 비싸지고, 수리비도 많이 들고, 사고도 늘어서 그렇다고 해...
3. 요즘은 새 차나 중고차 값이 떨어지고 있다고 하고, 노동 통계국 자료를 보면 지난 4월까지 새 차는 0.4%, 중고차는 6.9%나 내렸다고 해... 그리고 수리나 정비 비용은 지난 4월에 7.6% 올랐지만 그 이후로는 그대로라고 하고...


## 평가 후 저장

In [48]:
# 데이터프레임 초기화
df = pd.DataFrame(columns=["원문", "어투", "변환 후"])
fail_df = pd.DataFrame(columns=["원문", "어투"])

def eval_save(input_text, tone, df = df, fail_df = fail_df):
    if tone == "미래":
        result = run_enfp_conversion(input_text)
    elif tone == "에셋":
        result = run_sosim_conversion(input_text)
    elif tone == "루키":
        result = run_informal_conversion(input_text)
    elif tone == "비키":
        result = run_halbae_conversion(input_text)
    else:
        result = "지원되지 않는 어투입니다."

    # 키워드 기반 메트릭 계산
    keywords = ["어투 변환 후 "]
    matches = sum(1 for keyword in keywords if keyword in result)
    rouge_keyword = matches / len(keywords)
    
    # rouge_keyword가 1일 경우에만 데이터프레임에 추가
    if rouge_keyword == 1:
        # 데이터프레임으로 변환하여 기존 데이터프레임에 추가
        new_df = pd.DataFrame([[input_text, tone, result]], columns=["원문", "어투", "변환 후"])
        df = pd.concat([df, new_df]).drop_duplicates().reset_index(drop=True)
    else:
        # rouge_keyword가 1이 아닌 경우 fail_df에 추가
        new_fail_df = pd.DataFrame([[input_text, tone]], columns=["원문", "어투"])
        fail_df = pd.concat([fail_df, new_fail_df]).drop_duplicates().reset_index(drop=True)
    
    return df, fail_df

In [49]:
df, fail_df = eval_save(input_text,"에셋")

In [50]:
df

Unnamed: 0,원문,어투,변환 후
0,"1. 뱅크 오브 아메리카(Bank of America)에 따르면, 치솟는 자동차 보...",에셋,"어투 변환 후 : 1. 뱅크 오브 아메리카(Bank of America)에 따르면,..."


In [51]:
fail_df

Unnamed: 0,원문,어투
