In [None]:
import json
import openai
import time
from typing import List, Dict, Any

class RMOpenAIEnhancer:
    def __init__(self, api_key: str, model: str = "gpt-4o"):
        self.api_key = api_key
        self.model = model
        self.client = openai.OpenAI(api_key=api_key)
    
    def load_rm_data(self, file_path: str) -> List[Dict[str, Any]]:
        """RM JSONL 파일을 읽어서 데이터를 로드합니다."""
        with open(file_path, 'r', encoding='utf-8') as f:
            content = f.read().strip()
            # JSON 배열 형태인 경우
            if content.startswith('[') and content.endswith(']'):
                return json.loads(content)
            # JSONL 형태인 경우
            else:
                data = []
                for line in content.split('\n'):
                    if line.strip():
                        data.append(json.loads(line))
                return data
    
    def generate_openai_completion(self, prompt: str, system_prompt: str = None) -> str:
        """OpenAI API를 사용해 응답을 생성합니다."""
        try:
            messages = []
            if system_prompt:
                messages.append({"role": "system", "content": system_prompt})
            messages.append({"role": "user", "content": prompt})
            
            response = self.client.chat.completions.create(
                model=self.model,
                messages=messages,
                max_tokens=500,
                temperature=0.7
            )
            
            return response.choices[0].message.content.strip()
        
        except Exception as e:
            print(f"API 호출 중 오류 발생: {e}")
            return f"오류: {str(e)}"
    
    def shift_rankings(self, ranking: List[int]) -> List[int]:
        """기존 랭킹을 한 단계씩 뒤로 밀기 (0->1, 1->2, 2->3)"""
        return [rank + 1 for rank in ranking]
    
    def process_rm_data(self, data: List[Dict[str, Any]], system_prompt: str = None, delay: float = 1.0) -> List[Dict[str, Any]]:
        """RM 데이터에 OpenAI completion과 새로운 랭킹을 추가합니다."""
        processed_data = []
        
        for i, item in enumerate(data):
            print(f"처리 중... {i+1}/{len(data)}: {item['prompt'][:30]}...")
            
            # OpenAI API로 새로운 completion 생성
            new_completion = self.generate_openai_completion(item['prompt'], system_prompt)
            
            # 기존 랭킹을 한 단계씩 뒤로 밀기
            shifted_ranking = self.shift_rankings(item['ranking'])
            
            # 새로운 completion_4를 0위(최고 순위)로 추가
            new_ranking = shifted_ranking + [0]  # completion_4는 0위
            
            # 새로운 데이터 구성
            new_item = {
                "prompt": item['prompt'],
                "completion_0": item['completion_0'],
                "completion_1": item['completion_1'],
                "completion_2": item['completion_2'],
                "completion_4": new_completion,  # OpenAI API 응답
                "ranking": new_ranking
            }
            
            processed_data.append(new_item)
            
            # API rate limit 방지를 위한 딜레이
            time.sleep(delay)
        
        return processed_data
    
    def save_results(self, data: List[Dict[str, Any]], output_path: str, format_type: str = "json"):
        """결과를 파일로 저장합니다."""
        if format_type == "jsonl":
            with open(output_path, 'w', encoding='utf-8') as f:
                for item in data:
                    f.write(json.dumps(item, ensure_ascii=False) + '\n')
        else:  # JSON 배열 형태
            with open(output_path, 'w', encoding='utf-8') as f:
                json.dump(data, f, ensure_ascii=False, indent=2)
        
        print(f"결과가 {output_path}에 저장되었습니다.")
    
    def preview_changes(self, original_item: Dict[str, Any], new_item: Dict[str, Any]):
        """변경사항을 미리보기로 보여줍니다."""
        print(f"프롬프트: {original_item['prompt']}")
        print(f"원본 랭킹: {original_item['ranking']}")
        print(f"새로운 랭킹: {new_item['ranking']}")
        print(f"추가된 completion_4: {new_item['completion_4'][:80]}...")
        print("-" * 50)

def main():
    # 설정
    API_KEY = "your-openai-api-key-here"  # 실제 API 키로 변경
    INPUT_FILE = "kochatgpt_2_RM.jsonl"
    OUTPUT_FILE = "kochatgpt_2_RM_enhanced.json"
    
    # 최신 모델 선택
    SELECTED_MODEL = "gpt-4o"  # 또는 "gpt-4o-mini"
    
    # 시스템 프롬프트
    SYSTEM_PROMPT = """당신은 정확하고 도움이 되는 한국어 AI 어시스턴트입니다. 
사용자의 질문에 간결하고 정확한 답변을 제공해주세요. 
불확실한 정보에 대해서는 추측하지 말고 모른다고 답하세요."""
    
    # RMOpenAIEnhancer 인스턴스 생성
    enhancer = RMOpenAIEnhancer(API_KEY, model=SELECTED_MODEL)
    
    try:
        # 1. 기존 RM 데이터 로드
        print("기존 RM 데이터를 로드하는 중...")
        original_data = enhancer.load_rm_data(INPUT_FILE)
        print(f"총 {len(original_data)}개의 항목을 발견했습니다.")
        
        # 2. OpenAI API로 completion_4 추가 및 랭킹 조정
        print("OpenAI API를 사용해 새로운 응답을 생성하고 랭킹을 조정하는 중...")
        enhanced_data = enhancer.process_rm_data(
            original_data, 
            system_prompt=SYSTEM_PROMPT,
            delay=1.0  # 1초 딜레이
        )
        
        # 3. 변경사항 미리보기 (첫 번째 항목만)
        if enhanced_data:
            print("\n=== 첫 번째 항목 변경사항 미리보기 ===")
            enhancer.preview_changes(original_data[0], enhanced_data[0])
        
        # 4. 결과 저장
        enhancer.save_results(enhanced_data, OUTPUT_FILE)
        
        # 5. 최종 결과 요약
        print("\n=== 처리 완료 ===")
        print(f"총 {len(enhanced_data)}개 항목 처리 완료")
        print("변경사항:")
        print("- 기존 랭킹: 0, 1, 2 → 새로운 랭킹: 1, 2, 3")
        print("- completion_4 추가 (랭킹 0위 - 최고 순위)")
        print("- 새로운 랭킹 배열 길이: 4개")
        
        # 랭킹 분포 확인
        print("\n=== 새로운 랭킹 구조 확인 ===")
        for i, item in enumerate(enhanced_data[:2]):  # 처음 2개만 보여주기
            print(f"{i+1}번째 항목:")
            print(f"  completion_0: {item['ranking'][0]}위")
            print(f"  completion_1: {item['ranking'][1]}위") 
            print(f"  completion_2: {item['ranking'][2]}위")
            print(f"  completion_4: {item['ranking'][3]}위 (OpenAI)")
    
    except Exception as e:
        print(f"처리 중 오류 발생: {e}")

# 비동기 버전 (더 빠른 처리)
import asyncio
import aiohttp

class AsyncRMOpenAIEnhancer:
    def __init__(self, api_key: str, model: str = "gpt-4o", max_concurrent: int = 3):
        self.api_key = api_key
        self.model = model
        self.max_concurrent = max_concurrent
        self.semaphore = asyncio.Semaphore(max_concurrent)
    
    async def generate_openai_completion_async(self, session: aiohttp.ClientSession, prompt: str, system_prompt: str = None) -> str:
        """비동기로 OpenAI completion을 생성합니다."""
        async with self.semaphore:
            headers = {
                "Authorization": f"Bearer {self.api_key}",
                "Content-Type": "application/json"
            }
            
            messages = []
            if system_prompt:
                messages.append({"role": "system", "content": system_prompt})
            messages.append({"role": "user", "content": prompt})
            
            payload = {
                "model": self.model,
                "messages": messages,
                "max_tokens": 500,
                "temperature": 0.7
            }
            
            try:
                async with session.post(
                    "https://api.openai.com/v1/chat/completions",
                    headers=headers,
                    json=payload
                ) as response:
                    result = await response.json()
                    return result["choices"][0]["message"]["content"].strip()
            except Exception as e:
                return f"오류: {str(e)}"
    
    async def process_rm_data_async(self, data: List[Dict[str, Any]], system_prompt: str = None) -> List[Dict[str, Any]]:
        """비동기로 RM 데이터를 처리합니다."""
        async with aiohttp.ClientSession() as session:
            tasks = []
            for item in data:
                task = self.generate_openai_completion_async(session, item['prompt'], system_prompt)
                tasks.append(task)
            
            print("모든 API 호출을 시작합니다...")
            new_completions = await asyncio.gather(*tasks)
            
            processed_data = []
            for item, new_completion in zip(data, new_completions):
                # 기존 랭킹을 한 단계씩 뒤로 밀기
                shifted_ranking = [rank + 1 for rank in item['ranking']]
                new_ranking = shifted_ranking + [0]  # completion_4는 0위
                
                new_item = {
                    "prompt": item['prompt'],
                    "completion_0": item['completion_0'],
                    "completion_1": item['completion_1'],
                    "completion_2": item['completion_2'],
                    "completion_4": new_completion,
                    "ranking": new_ranking
                }
                processed_data.append(new_item)
            
            return processed_data

# 비동기 실행 함수
async def main_async():
    API_KEY = "your-openai-api-key-here"
    INPUT_FILE = "kochatgpt_2_RM.jsonl"
    OUTPUT_FILE = "kochatgpt_2_RM_enhanced_async.json"
    
    SELECTED_MODEL = "gpt-4o-mini"  # 더 빠른 처리를 위해
    
    enhancer = AsyncRMOpenAIEnhancer(API_KEY, model=SELECTED_MODEL, max_concurrent=3)
    
    # 동기 버전으로 데이터 로드
    sync_enhancer = RMOpenAIEnhancer(API_KEY, model=SELECTED_MODEL)
    original_data = sync_enhancer.load_rm_data(INPUT_FILE)
    
    # 비동기 처리
    enhanced_data = await enhancer.process_rm_data_async(original_data)
    
    # 저장
    sync_enhancer.save_results(enhanced_data, OUTPUT_FILE)

# Jupyter에서 실행하려면:
# await main_async()

if __name__ == "__main__":
    main()