## 자기반성을 위한 프롬프트 설계

In [None]:
def Reflection_prompt(task, initial_response):
    prompt = f"""과업: {task}

초기 응답:
{initial_response}

이제 자기반성을 해보자:

1. 초기 응답의 장점과 단점을 평가한다.
2. 오류, 비일관적 요소, 개선이 필요한 부분을 식별한다.
3. 응답을 향상시키기 위한 구체적인 방법을 제안한다.
4. 수정되고 개선된 응답 버전을 제공한다.

자기반성과 개선된 응답:
"""
    return prompt

# 사용 예
task = "고등학생에게 양자 얽힘의 개념을 설명하라."
initial_response = "양자 얽힘은 두 입자가 연결되어 있어, 하나를 측정하면 얼마나 멀리 떨어져 있든지 간에 다른 하나에 즉시 영향을 미치는 현상입니다."

prompt = Reflection_prompt(task, initial_response)
print(prompt)


## 반복적 개선 구현

In [None]:
from transformers import AutoModelForCausalLM, AutoTokenizer

def iterative_Reflection(model, tokenizer, task, max_iterations=3):
    response = generate_initial_response(model, tokenizer, task)
    for i in range(max_iterations):
        prompt = Reflection_prompt(task, response)
        inputs = tokenizer(prompt, return_tensors="pt")
        outputs = model.generate(
            inputs, max_length=1000, num_return_sequences=1
        )
        reflection = tokenizer.decode(outputs[0],
            skip_special_tokens=True)

        # 반성에서 개선된 응답을 추출
        response = extract_improved_response(reflection)
        if is_satisfactory(response):
            break

    return response


In [None]:
def generate_initial_response(model, tokenizer, task):
    prompt = f"과업: {task}\n\n응답:"
    inputs = tokenizer(prompt, return_tensors="pt")
    outputs = model.generate(inputs, max_length=500, num_return_sequences=1)
    return tokenizer.decode(outputs[0], skip_special_tokens=True)

def extract_improved_response(reflection):
    # 반성에서 향상된 응답을 추출하는 로직을 구현한다
    # 이는 텍스트 구문 분석이나 생성된 텍스트의 마커 사용을 포함할 수 있다
    pass

def is_satisfactory(response):
    # 응답이 품질 기준을 충족하는지 판단하는 로직을 구현한다
    # 이는 길이 검사, 키워드 존재 여부, 또는 더 고급 지표를 포함할 수 있다
    pass


In [None]:
model_name = "gpt2-large"  # 선호하는 모델로 교체
model = AutoModelForCausalLM.from_pretrained(model_name)
tokenizer = AutoTokenizer.from_pretrained(model_name)
task = "식물에서 광합성 과정을 설명하라."
final_response = iterative_Reflection(model, tokenizer, task)
print(final_response)


## 오류 수정

In [None]:
def error_correction_Reflection(model, tokenizer, task, initial_response, known_errors):
    prompt = f"""과업: {task}

초기 응답:
{initial_response}

알려진 오류:
{' '.join(f'- {error}' for error in known_errors)}

초기 응답을 반성해 알려진 오류를 수정하는 데 중점을 두어라. 이러한 문제를 해결한 개선된 응답을 제공해라.

수정된 응답:
"""

    inputs = tokenizer(prompt, return_tensors="pt")
    outputs = model.generate(inputs, max_length=1000, num_return_sequences=1)
    corrected_response = tokenizer.decode(outputs[0], skip_special_tokens=True)
    return corrected_response

# 사용 예
task = "원자의 구조를 설명해라."
initial_response = "원자는 양성자와 중성자를 포함하는 핵과, 그 주위를 고정된 원형 궤도로 도는 전자로 구성됩니다."
known_errors = [
    "전자는 고정된 원형 경로로 돌지 않는다",
    "설명에 전자 껍질이나 에너지 준위가 언급되지 않았다"
]

corrected_response = error_correction_Reflection(
    model, tokenizer, task, initial_response, known_errors
)
print(corrected_response)


## 반성의 영향 평가

In [None]:
def evaluate_Reflection_impact(initial_response, Reflection_response, criteria):
    initial_scores = evaluate_response(initial_response, criteria)
    Reflection_scores = evaluate_response(Reflection_response, criteria)
    impact = {
        criterion: Reflection_scores[criterion] - initial_scores[criterion]
        for criterion in criteria
    }
    return {
        "initial_scores": initial_scores,
        "Reflection_scores": Reflection_scores,
        "impact": impact
    }

def evaluate_response(response, criteria):
    scores = {}
    for criterion in criteria:
        # 기준별 평가 논리를 구현
        scores[criterion] = evaluate_criterion(response, criterion)
    return scores

def evaluate_criterion(response, criterion):
    # 기준별 평가를 위한 자리표시자
    # 실제로는 NLP 기법, 루브릭 기반 평가 또는 다른 LLM을 포함할 수 있다
    return 0  # 자리표시자 반환

# 사용 예
criteria = ["Accuracy", "Clarity", "Completeness", "Conciseness"]

evaluation = evaluate_Reflection_impact(initial_response, corrected_response, criteria)
print("평가 결과:")
print(f"초기 점수: {evaluation['initial_scores']}")
print(f"반성 점수: {evaluation['Reflection_scores']}")
print(f"영향: {evaluation['impact']}")


## 효과적인 반성 구현의 과제

In [None]:
def controlled_Reflection(
    model, tokenizer, task, max_iterations=3, improvement_threshold=0.1
):
    response = generate_initial_response(model, tokenizer, task)
    previous_score = evaluate_response(response, ["Overall_Quality"])["Overall_Quality"]

    for i in range(max_iterations):
        improved_response = apply_Reflection(model, tokenizer, task, response)
        current_score = evaluate_response(
            improved_response, ["Overall_Quality"]
        )["Overall_Quality"]

        if current_score - previous_score < improvement_threshold:
            break

        response = improved_response
        previous_score = current_score

    return response

def apply_Reflection(model, tokenizer, task, response):
    # 반성의 단일 패스를 구현
    pass

# 사용 예시
task = "상대성 이론을 설명하라."
final_response = controlled_Reflection(model, tokenizer, task)
print(final_response)


## 미래 방향

In [None]:
def multi_agent_Reflection(
    models, tokenizers, task, num_agents=3
):
    responses = [
        generate_initial_response(
            models[i], tokenizers[i], task
        )
        for i in range(num_agents)
    ]

    for _ in range(3):  # 반성 횟수
        Reflections = []
        for i in range(num_agents):
            other_responses = responses[:i] + responses[i+1:]
            reflection = generate_Reflection(
                models[i], tokenizers[i], task,
                responses[i], other_responses
            )
            Reflections.append(Reflection)

        responses = [extract_improved_response(Reflection)
            for reflection in Reflections]
    return select_best_response(responses)


In [None]:
def generate_Reflection(
    model, tokenizer, task, own_response, other_responses
):
    prompt = f"""과업: {task}

당신의 응답:
{own_response}

다른 응답들:
{' '.join(f'- {response}' for response in other_responses)}

다른 응답들을 고려해 자신의 응답을 반성하라. 각 접근 방식의 장점과 단점을 식별하고 모든 관점에서 최고의 요소들을 통합한 개선된 응답을 제안하라.

당신의 반성과 개선된 응답:
"""
    inputs = tokenizer(prompt, return_tensors="pt")
    outputs = model.generate(
        inputs, max_length=1500, num_return_sequences=1
    )
    return tokenizer.decode(outputs[0], skip_special_tokens=True)

def select_best_response(responses):
    # 여러 응답들에서 최고의 요소들을 선택하거나 결합하는 논리를 구현
    pass


In [None]:
task = "도시 교통 혼잡을 줄이기 위한 솔루션을 제안하라."
final_response = multi_agent_Reflection(models, tokenizers, task)
print(final_response)
