### 면접 답변 평가 모델
샘플링한 데이터셋으로 학습 목적에 맞게 맞춤형 데이터셋 만들기

In [None]:
from typing import TypedDict, List, Optional
from dotenv import load_dotenv
from langchain_google_genai import ChatGoogleGenerativeAI
from google import genai

In [None]:
# api client 
try:
    client = genai.Client(api_key=os.getenv('GOOGLE_API_KEY'),)

except Exception as e:
    print(f"API 키 설정 중 오류가 발생했습니다. 키를 올바르게 입력했는지 확인해주세요. 오류: {e}")
    exit()

In [None]:
# 최종 데이터셋
'''
input: 질문: {} 상황: {} 답변: {}
output: 점수: {} 피드백: {} 개선점: {}
점수는 1.0 ~ 5.0
'''
class FinalDataSet(TypedDict):
    input: str
    output: str

In [None]:
# 피드백
class FeedbackItem(TypedDict):
    question: str   # 질문
    scenario: str   # 상황
    answer_text: str    # 답변
    score: Optional[float]  # 점수 (1.0 ~ 5.0)
    feedback: Optional[dict]    # 피드백
    is_validated: bool = False  # 유효성 검증

In [None]:
# 답변 생성 상태
class GenerationState(TypedDict):
    original_question: str    # 입력

    is_experience: str
    
    # 중간 결과물
    good_answer: Optional[str]
    average_answer: Optional[str]
    bad_answer: Optional[str]
    
    final_dataset: List[FinalDataSet]   # 최종 결과물을 담을 리스트

In [None]:
# 노드 1 : 질문 생성 노드 (좋음, 평범함, 나쁨 3개 생성)
def generate_answers(state: GenerationState) -> GenerationState:
    question = state['original_question']
    if not question:
        raise ValueError("질문이 비어있습니다. state['original_question']을 확인해주세요.")
    is_experience = state['is_experience']
    if not is_experience:
        is_experience = "신입"
    if is_experience == "EXPERIENCED":
        is_experience = "경력"
    if is_experience == "NEW":
        is_experience = "신입"

    prompt = f"""
        당신은 15년차 IT 기업의 시니어 채용 매니저이자 기술 면접관입니다. 당신은 지원자의 답변을 듣고 논리성, 구체성, 직무 적합성, 성장 가능성을 종합적으로
         평가하여 날카로운 피드백을 제공하는 전문가입니다.

        # 과업 (Task)
        아래 면접 질문에 대해, 당신이 면접에서 실제로 들어봤을 법한 서로 다른 수준의 지원자 답변 시나리오 3개를 생성해 주세요.

        # 답변 기준
        1. **매우 좋은 답변 (Good Answer)**: 질문의 핵심을 정확히 파악하고, 자신의 경험과 기술을 구체적인 예시(예: 프로젝트 경험, 사용 기술, 결과 수치)를 들어 논리적으로 설명하는 답변입니다. 직무에 대한 높은 이해도와 성장 가능성이 엿보여야 합니다.
        2. **평범한 답변 (Average Answer)**: 질문에 대한 답변은 하지만, 내용이 추상적이거나 일반적인 수준에 그치는 답변입니다. 구체적인 경험이나 자신만의 생각이 부족하여 깊은 인상을 주지 못합니다.
        3. **매우 나쁜 답변 (Bad Answer)**: 질문의 의도를 전혀 파악하지 못했거나, 동문서답을 하는 답변입니다. 논리적이지 않고, 근거 없는 주장을 하거나, 기술적 이해도가 매우 부족해 보이는 답변입니다.

        # 면접 질문
        {question}

        # 경력 유무
        {is_experience}

        # 출력 형식
        반드시 아래와 같은 JSON 형식으로만 답변하고, 그 외의 다른 설명은 절대로 추가하지 마세요.
        ```json
        {{
        "good_answer": "여기에 '매우 좋은 답변'을 작성하세요.",
        "average_answer": "여기에 '평범한 답변'을 작성하세요.",
        "bad_answer": "여기에 '매우 나쁜 답변'을 작성하세요."
        }} 
        """
    
    # response 결과
#     sdk_http_response=HttpResponse(
#   headers=<dict len=11>
# ) candidates=[Candidate(
#   content=Content(
#     parts=[
#       Part(
#         text="""```json
# {
# "good_answer": "제가 지원한 백엔드 개발 직무는 서비스의 핵심 비즈니스 로직을 설계하고 구현하며, 대용량 트래픽과 데이터를 안정적으로 처리하는 시스템을 구축하는 역할이라고 이해하고 있습니다. 특히, 사용자 요청에 대한 빠른 응답과 데이터 무결성 보장을 위해 API 설계, 데이터베이스 최적화, 그리고 분산 시스템 아키텍처 구현이 중요하다고 생각합니다. 저는 이전 프로젝트에서 전자상거래 플랫폼의 주문 및 결제 시스템을 개발하며 Spring Boot, Kafka, Redis를 활용하여 초당 1만 건 이상의 동시 주문을 처리할 수 있는 아키텍처를 구축한 경험이 있습니다. 이 과정에서 병목 현상 발생 시 DB 락 경합 문제를 해결하기 위해 비관적 락 대신 낙관적 락을 도입하고 비동기 메시지 큐를 활용하여 시스템 처리율을 30% 개선했습니다. 이러한 경험을 통해 귀사 서비스의 안정성과 확장성에 기여하고, 더 나아가 MSA 전환과 같은 기술적인 도전에 적극적으로 참여하여 서비스의 지속적인 성장을 이끌고 싶습니다.",
# "average_answer": "제가 지원한 백엔드 개발 직무는 서비스의 서버와 데이터베이스를 담당하며, 사용자들이 보지 못하는 부분에서 시스템이 잘 작동하도록 만드는 역할이라고 알고 있습니다. 주로 API를 개발하고 데이터를 관리하는 업무를 하는 것으로 이해하고 있습니다. 학교 프로젝트나 개인 스터디를 통해 자바와 스프링 프레임워크를 이용해 간단한 서버를 구축하고 데이터 연동을 해본 경험이 있습니다. 이러한 경험을 바탕으로 회사에 필요한 개발자가 되기 위해 노력하고 싶습니다.",
# "bad_answer": "네, 백엔드 개발자 직무는 음... 컴퓨터와 관련된 일을 하는 것이라고 알고 있습니다. 제가 예전에 게임을 많이 해봐서 컴퓨터를 잘 다루고, 새로운 기술을 배우는 데는 자신이 있습니다. 그리고 포토샵이나 영상 편집도 좀 할 줄 알아서 만약 개발이 아니더라도 다른 쪽으로도 도움이 될 수 있을 것 같습니다. 잘 모르지만 시켜주시면 뭐든 열심히 하겠습니다."
# }
# ```"""
    
    response = client.models.generate_content(
                model='gemini-2.5-flash', contents=prompt
            )

    # 필요한 정보만 남기기
    try:
        response_text = response.text.strip().replace("```json", "").replace("```", "").strip()
        answers = json.loads(response_text)
        
        # 상태에 업데이트
        state['good_answer'] = answers.get("good_answer")
        state['average_answer'] = answers.get("average_answer")
        state['bad_answer'] = answers.get("bad_answer")

    except (json.JSONDecodeError, AttributeError, KeyError) as e:
        print(f"LLM 응답 파싱 실패: {e}")
        print(f"수신된 텍스트: {response.text}")
        # 실패 시 상태의 해당 필드를 None으로 설정
        state['good_answer'] = None
        state['average_answer'] = None
        state['bad_answer'] = None

    # 상태 출력
    print(state)

    # 수정된 상태(state) 객체 전체를 반환
    return state


In [None]:
# 노드 2: 생성된 각 답변((질문, 답변) 쌍)에 대해 점수를 매기고, 구체적인 피드백을 생성
def evaluate_and_feedback(state: GenerationState) -> GenerationState:
    question = state['original_question']
    if not question:
        raise ValueError("질문이 비어있습니다. state['original_question']을 확인해주세요.")

    # llm = get_llm()

     # 평가할 답변 시나리오와 텍스트를 딕셔너리로 준비
    answer_scenarios = {
        "good_answer": state.get('good_answer'),
        "average_answer": state.get('average_answer'),
        "bad_answer": state.get('bad_answer'),
    }

    try:
        # The client gets the API key from the environment variable `GEMINI_API_KEY`.
        client = genai.Client(api_key='AIzaSyDyvTifvlGNP96GDhQ7BcHMpHTM0FKFLi8',)

    except Exception as e:
        print(f"API 키 설정 중 오류가 발생했습니다. 키를 올바르게 입력했는지 확인해주세요. 오류: {e}")
        exit()

    # 각 시나리오 별로 점수, 피드백 생성
    for scenario_name, answer_text in answer_scenarios.items():
        if not answer_text:
            print(f"'{scenario_name}'에 대한 답변이 없어 평가를 건너뜁니다.")
            continue # 다음 루프로 넘어감

        # 프롬프트
        prompt = f"""
            당신은 15년차 IT 기업의 시니어 채용 매니저이자 기술 면접관입니다. 당신은 지원자의 답변을 듣고 논리성, 구체성, 직무 적합성, 성장 가능성을 종합적으로 평가하여 날카로운 피드백을 제공하는 전문가입니다.

            # 평가 기준 (Scoring Criteria)
            - **논리성 및 구조성 (50%):** 답변이 체계적인가? (예: STAR 기법) 주장이 명확하고 근거가 타당한가?
            - **구체성 및 진정성 (30%):** 실제 경험에 기반한 구체적인 예시가 있는가? 수치나 결과를 제시하는가?
            - **직무/회사 연관성 (20%):** 답변 내용이 지원한 직무나 회사 비전과 잘 연결되는가?

            # 면접 질문
            {question}

            # 지원자 답변 (Scenario: {scenario_name})
            {answer_text}

            # 과업 (Task)
            위 면접 질문에 대한 주어진 지원자의 답변을 위 평가 기준에 따라 1.0점에서 5.0점 사이의 점수를 매기고, 구체적인 피드백을 작성해 주세요.

            # 출력 형식 (Output Format)
            반드시 아래의 JSON 형식으로만 답변하고, 그 외의 다른 설명은 절대로 추가하지 마세요.
            ```json
            {{
            "question": "{question}",
            "scenario": "{scenario_name}",
            "answer_text": "{answer_text}",
            "score": (1.0 ~ 5.0 사이의 float 값),
            "feedback": {{
                "positive": "(이 답변의 칭찬할 점, 해당 없으면 '해당 없음'으로 기재)",
                "to_improve": "(더 개선할 점 또는 보완할 점, 해당 없으면 '완벽합니다' 등으로 기재)"
            }}
            }}
        """

        try:
            print(f"--- 답변 평가 중 ---\n질문: {question[:30]}...\n답변: {answer_text[:50]}...\n")
            response = generate_content_with_retry(client, 'gemini-2.5-flash', prompt)

            response_text = response.text.strip().replace("```json", "").replace("```", "").strip()
            answers = json.loads(response_text)

            # feedback: FeedbackItem = {
            #     'question': answers.get("question"),
            #     'scenario': answers.get("scenario"),
            #     'answer_text': answers.get("answer_text"),
            #     'score': answers.get("score"),
            #     'feedback' : answers.get("feedback"),
            #     'is_validated': False
            # }
            # print(feedback)

            question = answers.get("question")
            scenario= answers.get("scenario")
            answer_text=answers.get("answer_text")
            score=answers.get("score")
            positive = answers.get("feedback").get("positive")
            to_improve = answers.get("feedback").get("to_improve")

            data : FinalDataSet = {
                'input': f"질문: {question} 상황: {scenario} 답변: {answer_text}",
                'output': f"점수: {score} 피드백: {positive} 개선점: {to_improve}"
            }

            # 리스트에 추가
            # state['final_dataset'].append(feedback)
            state['final_dataset'].append(data)
            

        except (json.JSONDecodeError, AttributeError, KeyError) as e:
            print(f"LLM 응답 파싱 실패: {e}")
            print(f"수신된 텍스트: {response.text}")
            # 실패 시 상태의 해당 필드를 None으로 설정
            state['good_answer'] = None
            state['average_answer'] = None
            state['bad_answer'] = None

        time.sleep(1)

    return state

    

In [None]:
# 그래프 객체 생성
workflow = StateGraph(GenerationState)

workflow.add_node("generate_answers", generate_answers)
workflow.add_node("evaluate_and_feedback", evaluate_and_feedback)

workflow.add_edge(START, "generate_answers")
workflow.add_edge("generate_answers", "evaluate_and_feedback")
workflow.add_edge("evaluate_and_feedback", END)

In [None]:
graph = workflow.compile()

In [None]:
# 최종 csv 저장
def append_list_of_dicts_to_csv(file_path: str, data_to_append: list[dict]):
    """
    딕셔너리로 구성된 리스트를 CSV 파일에 추가합니다.
    파일이 없으면 새로 생성하고 헤더를 추가하며, 파일이 있으면 데이터만 뒤에 추가합니다.
    """
    if not data_to_append:
        print("추가할 데이터가 없어 CSV 저장을 건너뜁니다.")
        return

    # 파일 존재 여부를 확인하여 헤더 작성 여부를 결정합니다.
    write_header = not os.path.exists(file_path)

    # 데이터의 헤더(키)를 첫 번째 딕셔너리에서 가져옵니다.
    fieldnames = data_to_append[0].keys()

    # 파일을 추가 모드('a')로 엽니다.
    with open(file_path, mode='a', newline='', encoding='utf-8-sig') as csvfile:
        writer = csv.DictWriter(csvfile, fieldnames=fieldnames)

        if write_header:
            writer.writeheader()
        
        writer.writerows(data_to_append)

    print(f"'{file_path}' 파일에 {len(data_to_append)}개의 행이 성공적으로 추가되었습니다.")

In [None]:
output_csv_path = '.\\final_interview_dataset.csv'

In [None]:
# 샘플링된 질문 목록 로드

questions_df = pd.read_csv('.\\sampling_data\\train_question_sample.csv')
questions_list = questions_df.to_dict('records')

# 최종 질문 + 답변 + 점수 + 피드백 csv에 저장

for question in questions_list:
    q = question["question"]
    e = question['is_experience']

    initial_state = {"original_question": q, "is_experience": e ,"final_dataset": []}

    final_state = graph.invoke(initial_state)

    dataset_to_save = final_state.get('final_dataset')

    if dataset_to_save:
        append_list_of_dicts_to_csv(output_csv_path, dataset_to_save)
    else:
        print("결과에 'final_dataset'이 없거나 비어있어 저장하지 않습니다.")

    # print("--- 최종 결과 ---")
    # print(json.dumps(final_state, indent=2, ensure_ascii=False))

