<a href="https://colab.research.google.com/github/Rojojun/GPT-MINE/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [15]:
from google.colab import files, userdata
from google import genai

# Google API 키 설정 부분
def setup_gemini():
    try:
        # Colab userdata에서 API 키 가져오기
        GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY')

        if not GOOGLE_API_KEY:
            # userdata에 없는 경우 사용자 입력 요청
            GOOGLE_API_KEY = input("Google API 키를 입력해주세요: ")
            if not GOOGLE_API_KEY:
                print("[?WARN] API 키가 필요합니다")

        # 클라이언트 초기화
        global client
        client = genai.Client(api_key=GOOGLE_API_KEY)

        # 간단한 테스트로 API 연결 확인
        try:
            response = client.models.generate_content(
                model="gemini-2.5-flash",
                contents=[{
                    "role": "user",
                    "parts": [{"text": "Hello"}]
                }]
            )
            print("[SUCCESS] Gemini API 연결 성공!")
        except Exception as e:
            print(f"[!!ERROR] API 연결 테스트 실패: {e}")

    except Exception as e:
        print(f"[!!ERROR] Gemini API 설정 실패: {e}")

In [16]:
setup_gemini()

[SUCCESS] Gemini API 연결 성공!


In [17]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import io
import json
import re
import time
import random
from IPython.display import display, HTML, clear_output
import ipywidgets as widgets
from IPython.display import display

# ipywidgets 설치 확인 (필요시 설치)
try:
    import ipywidgets as widgets
except ImportError:
    !pip install ipywidgets -q
    import ipywidgets as widgets

# 1. 페르소나 데이터 로드
def load_personas():
    print("[Log] 페르소나 데이터를 로드합니다...")

    try:
        # /content/fashion_data.csv에서 데이터 직접 로드
        personas_df = pd.read_csv('/content/fashion_data.csv')

        # 데이터 확인 및 전처리
        required_columns = ['id', 'name', 'age', 'gender', 'height', 'body_type', 'preferred_style',
                           'occupation', 'shopping_frequency', 'monthly_fashion_budget',
                           'online_shopping_experience', 'main_fashion_concerns']

        missing_columns = [col for col in required_columns if col not in personas_df.columns]
        if missing_columns:
            print(f"[?WARN] 다음 필수 컬럼이 없습니다: {missing_columns}")
            return None

        print(f"[SUCCESS] 페르소나 데이터 로드 완료 (총 {len(personas_df)}명)")
        return personas_df

    except Exception as e:
        print(f"[!!ERROR] 페르소나 데이터 로드 실패! (계속 오류가 발생하면 주변 Organizer or Staff에게 문의해주세요): {e}")
        return None

# 2. CLI 기반 설문지 작성
def create_survey_improved():
    print("\n" + "="*50)
    print("설문지 작성")
    print("="*50)
    print("객관식 및 주관식 문항을 포함하여 최소 1개 이상 작성해주세요.")
    print("명령어:")
    print("- 'obj': 객관식 문항 추가")
    print("- 'subj': 주관식 문항 추가")
    print("- 'list': 현재 작성된 문항 목록 보기")
    print("- 'del N': N번 문항 삭제")
    print("- 'finish': 설문 작성 완료")
    print("-" * 50)

    questions = []

    while True:
        print(f"\n현재 작성된 문항: {len(questions)}개")
        command = input("명령어를 입력하세요 (obj/subj/list/del/finish): ").strip().lower()

        if command == 'obj':
            # 객관식 문항 추가
            print("\n[객관식 문항 추가]")
            question_text = input("질문 내용: ").strip()
            if not question_text:
                print("[!!ERROR] 질문 내용을 입력해주세요.")
                continue

            options = []
            print("선택지를 입력하세요 (최소 2개, 빈 줄 입력시 완료):")
            while True:
                option = input(f"선택지 {len(options)+1}: ").strip()
                if not option:
                    break
                options.append(option)

            if len(options) < 2:
                print("[!!ERROR] 객관식 문항은 최소 2개 이상의 선택지가 필요합니다.")
                continue

            questions.append({
                'id': len(questions) + 1,
                'type': 'multiple_choice',
                'text': question_text,
                'options': options
            })
            print(f"[SUCCESS] Q{len(questions)} 객관식 문항이 추가되었습니다.")

        elif command == 'subj':
            # 주관식 문항 추가
            print("\n[주관식 문항 추가]")
            question_text = input("질문 내용: ").strip()
            if not question_text:
                print("[!!ERROR] 질문 내용을 입력해주세요.")
                continue

            questions.append({
                'id': len(questions) + 1,
                'type': 'open_ended',
                'text': question_text
            })
            print(f"[SUCCESS] Q{len(questions)} 주관식 문항이 추가되었습니다.")

        elif command == 'list':
            # 문항 목록 보기
            if not questions:
                print("작성된 문항이 없습니다.")
            else:
                print("\n[작성된 문항 목록]")
                print("-" * 50)
                for q in questions:
                    q_type = "객관식" if q['type'] == 'multiple_choice' else "주관식"
                    print(f"Q{q['id']} ({q_type}): {q['text']}")
                    if q['type'] == 'multiple_choice':
                        for i, option in enumerate(q['options']):
                            print(f"    {i+1}. {option}")
                    print()

        elif command.startswith('del'):
            # 문항 삭제
            try:
                parts = command.split()
                if len(parts) != 2:
                    print("[!!ERROR] 사용법: del [문항번호]")
                    continue

                q_num = int(parts[1])
                if 1 <= q_num <= len(questions):
                    removed_q = questions.pop(q_num - 1)
                    # ID 재정렬
                    for i, q in enumerate(questions):
                        q['id'] = i + 1
                    print(f"[SUCCESS] Q{q_num} 문항이 삭제되었습니다.")
                else:
                    print(f"[!!ERROR] 올바른 문항 번호를 입력하세요 (1-{len(questions)})")
            except ValueError:
                print("[!!ERROR] 올바른 숫자를 입력하세요.")

        elif command == 'finish':
            if len(questions) < 1:
                print(f"[!!ERROR] 최소 1개 문항이 필요합니다. 현재 {len(questions)}개 작성됨.")
                continue

            print(f"\n[SUCCESS] 설문지 작성 완료 (총 {len(questions)}개 문항)")

            # 여기서 설문지 작성이 완료되면 다음 단계로 진행
            run_survey_with_questions(questions)
            return questions

        else:
            print("[!!ERROR] 올바른 명령어를 입력하세요 (obj/subj/list/del/finish)")

# 3. 페르소나별 자연스러운 응답 생성 (완전 CLI 버전)
def generate_responses(personas_df, questions, sample_size=100):
    print(f"\n[Log] {sample_size}명의 페르소나에 대한 응답을 생성합니다...")

    if sample_size > len(personas_df):
        sample_size = len(personas_df)
        print(f"[?WARN] 설정한 샘플 크기가 페르소나 전체 수보다 큽니다. {sample_size}명으로 조정합니다.")

    # Gemini API가 설정되어 있는지 확인
    try:
        # 전역 변수로 선언된 client 확인
        client
    except NameError:
        print("[?WARN] Gemini API가 설정되어 있지 않습니다. setup_gemini() 함수를 먼저 실행해주세요.")
        return None

    # 샘플 페르소나 선택
    sampled_personas = personas_df.sample(sample_size)

    # 결과를 저장할 데이터프레임 초기화
    responses_df = pd.DataFrame(index=sampled_personas.index)
    responses_df['persona_id'] = sampled_personas['id']
    responses_df['persona_name'] = sampled_personas['name']

    # 진행 상황 표시를 위한 변수 (CLI 버전)
    total = len(sampled_personas)

    # 다양한 언어 스타일과 말투 정의
    speech_styles = [
        "자연스럽게 대화하듯이 응답해주세요.",
        "약간 격식있는 말투로, 하지만 딱딱하지 않게 응답해주세요. '~합니다', '~이에요' 같은 존댓말을 사용하세요.",
        "친구와 대화하듯 편안하게 답변해주세요.",
        "간결하고 명료하게 응답해주세요. 불필요한 설명은 생략하고 핵심만 말해주세요.",
    ]

    # 응답 패턴 다양화를 위한 피드백 스타일 정의
    feedback_styles = [
        "질문에 대한 개인적인 경험이나 사례를 먼저 이야기한 후 답변을 제공해주세요.",
        "질문에 직접적으로 답하고, 그 이유나 배경을 간략히 덧붙여주세요.",
        "자신의 취향이나 선호도를 강조하면서 답변해주세요.",
        "다른 사람들의 의견과 자신의 의견을 비교하며 답변해주세요.",
        "질문에 대해 약간 고민하는 듯한 뉘앙스로 답변해주세요.",
        "답변 중간에 작은 농담이나 유머를 섞어도 좋습니다."
    ]

    for i, (idx, persona) in enumerate(sampled_personas.iterrows()):
        # CLI 진행률 표시 (막대 그래프 스타일)
        progress_percent = ((i + 1) / total) * 100
        bar_length = 20
        filled_length = int(bar_length * (i + 1) // total)
        bar = '█' * filled_length + '░' * (bar_length - filled_length)
        print(f"\r[Log] 진행률: [{bar}] {i+1}/{total} ({progress_percent:.1f}%) - {persona['name']}", end='', flush=True)

        # 이 페르소나의 성격 특성 랜덤 선택 (다양한 응답 패턴 생성)
        personality_traits = np.random.choice([
            "신중하고 계획적인", "즉흥적이고 활발한", "내성적이고 생각이 많은",
            "외향적이고 사교적인", "창의적이고 독특한", "실용적이고 현실적인",
            "꼼꼼하고 신중한", "대담하고 모험적인", "합리적이고 논리적인",
            "감성적이고 감정표현이 풍부한"
        ], 2, replace=False)  # 두 가지 특성 선택

        # 이 페르소나의 언어 스타일 랜덤 선택
        speech_style = np.random.choice(speech_styles)
        feedback_style = np.random.choice(feedback_styles)

        # 각 질문에 대한 응답 생성 (모든 질문에 확실히 응답하도록 보장)
        num_questions = len(questions)
        for q_idx, question in enumerate(questions, 1):
            q_id = f"Q{question['id']}"
            q_text = question['text']
            q_type = question['type']

            # 질문별 진행률도 표시
            question_progress = f" (질문 {q_idx}/{num_questions})"

            answer = None
            max_retries = 3  # 최대 3번 재시도
            retry_count = 0

            while answer is None and retry_count < max_retries:
                try:
                    if q_type == 'multiple_choice':
                        # 객관식 문항 처리
                        prompt = f"""
                        당신은 20대~40대 한국 남성 페르소나 역할을 맡아 패션 관련 설문조사에 응답해야 합니다.

                        당신의 페르소나 정보는 다음과 같습니다:
                        - 이름: {persona['name']}
                        - 나이: {persona['age']}세
                        - 성별: {persona['gender']}
                        - 키: {persona['height']}cm
                        - 체형: {persona['body_type']}
                        - 선호 스타일: {persona['preferred_style']}
                        - 직업: {persona['occupation']}
                        - 쇼핑 빈도: {persona['shopping_frequency']}
                        - 월 패션 예산: {persona['monthly_fashion_budget']}
                        - 주요 패션 관심사: {persona['main_fashion_concerns']}

                        당신은 {personality_traits[0]}면서도 {personality_traits[1]} 성격을 가지고 있습니다.

                        다음 객관식 질문에 답변해주세요:
                        질문: {q_text}

                        다음 보기 중에서 당신의 페르소나 특성에 가장 적합한 한 가지만 선택하세요:
                        {', '.join(question['options'])}

                        무조건 보기 중에서 정확한 한 가지만 출력해주세요.
                        """

                        # Gemini API 호출
                        response = client.models.generate_content(
                            model="gemini-2.0-flash-lite",
                            contents=[{
                                "role": "user",
                                "parts": [{"text": prompt}]
                            }]
                        )

                        # 응답 텍스트 추출
                        answer_text = response.candidates[0].content.parts[0].text.strip()

                        # 선택지 중에 정확히 있는지 확인
                        if answer_text in question['options']:
                            answer = answer_text
                        else:
                            # 부분 매칭 시도
                            for option in question['options']:
                                if option in answer_text or answer_text in option:
                                    answer = option
                                    break

                            # 여전히 매칭되지 않으면 재시도
                            if answer is None:
                                retry_count += 1
                                if retry_count < max_retries:
                                    # 진행률 막대 업데이트 (재시도 중)
                                    progress_percent = ((i + 1) / total) * 100
                                    bar_length = 20
                                    filled_length = int(bar_length * (i + 1) // total)
                                    bar = '█' * filled_length + '░' * (bar_length - filled_length)
                                    print(f"\r[Log] 진행률: [{bar}] {i+1}/{total} ({progress_percent:.1f}%) - {persona['name']}{question_progress} [재시도 {retry_count}]", end='', flush=True)
                                    time.sleep(1)
                                    continue

                    else:  # 주관식
                        prompt = f"""
                        당신은 20대~40대 한국 남성 페르소나 역할을 맡아 패션 관련 설문조사에 응답해야 합니다.
                        실제 사람이 응답한 것처럼 자연스럽고 다양한 어투와 표현으로 답변해주세요.

                        당신의 페르소나 정보는 다음과 같습니다:
                        - 이름: {persona['name']}
                        - 나이: {persona['age']}세
                        - 성별: {persona['gender']}
                        - 키: {persona['height']}cm
                        - 체형: {persona['body_type']}
                        - 선호 스타일: {persona['preferred_style']}
                        - 직업: {persona['occupation']}
                        - 쇼핑 빈도: {persona['shopping_frequency']}
                        - 월 패션 예산: {persona['monthly_fashion_budget']}
                        - 주요 패션 관심사: {persona['main_fashion_concerns']}

                        당신은 {personality_traits[0]}면서도 {personality_traits[1]} 성격을 가지고 있습니다.
                        {speech_style}
                        {feedback_style}

                        질문: {q_text}

                        1-3문장으로 자연스럽게 응답해주세요. 페르소나 특성을 반영하여 실제 사람이 답변하는 것처럼 해주세요.
                        """

                        # Gemini API 호출
                        response = client.models.generate_content(
                            model="gemini-2.0-flash-lite",
                            contents=[{
                                "role": "user",
                                "parts": [{"text": prompt}]
                            }]
                        )

                        # 응답 텍스트 추출
                        answer_candidate = response.candidates[0].content.parts[0].text.strip()

                        # 주관식은 비어있지 않으면 OK
                        if answer_candidate and len(answer_candidate) > 0:
                            answer = answer_candidate
                        else:
                            retry_count += 1
                            if retry_count < max_retries:
                                print(f"[?WARN] {persona['name']} - Q{question['id']} 빈 응답, 재시도 ({retry_count}/{max_retries})")
                                time.sleep(1)
                                continue

                except Exception as e:
                    retry_count += 1
                    if retry_count < max_retries:
                        print(f"[?WARN] {persona['name']} - Q{question['id']} API 오류, 재시도 ({retry_count}/{max_retries}): {str(e)[:50]}")
                        time.sleep(2)  # 오류 시 더 긴 딜레이
                        continue

            # 모든 재시도 실패 시 기본값 사용 (반드시 응답하도록 보장)
            if answer is None:
                if q_type == 'multiple_choice':
                    # 페르소나 특성을 반영한 선택지 우선순위 설정
                    answer = question['options'][0]  # 기본적으로 첫 번째 선택지
                    print(f"[?WARN] {persona['name']} - Q{question['id']} 모든 재시도 실패, 기본값 사용: {answer}")
                else:
                    # 페르소나 특성을 반영한 기본 주관식 응답
                    basic_responses = [
                        f"{persona['preferred_style']} 스타일을 선호하는 편입니다.",
                        f"제 직업({persona['occupation']})의 특성상 중요하다고 생각해요.",
                        f"월 {persona['monthly_fashion_budget']} 정도의 예산 범위에서 고려합니다.",
                        f"{persona['body_type']} 체형이라 잘 맞는 옷을 찾기가 중요해요.",
                        f"주로 {persona['shopping_frequency']} 정도 쇼핑하는 편입니다.",
                        f"패션에서는 {persona['main_fashion_concerns']}를 가장 신경써요."
                    ]
                    answer = np.random.choice(basic_responses)
                    print(f"[?WARN] {persona['name']} - Q{question['id']} 모든 재시도 실패, 기본 응답 사용")

            # 데이터프레임에 응답 저장 (반드시 저장됨)
            responses_df.loc[idx, q_id] = answer

            # API 호출 속도 제한 대응
            time.sleep(0.5)

    print(f"\n[SUCCESS] {total}명의 페르소나에 대한 응답 생성 완료!")
    return responses_df

# 4. 설문 결과 요약 분석 (주관식 응답 2개 표시 추가)
def analyze_survey_results_summary(responses_df, questions):
    print("\n[Log] 설문 결과를 분석합니다...")

    results = {}

    # 문항별 분석
    for question in questions:
        q_id = f"Q{question['id']}"
        q_text = question['text']
        q_type = question['type']

        if q_type == 'multiple_choice':
            # 객관식 문항 분석 - 결과 저장
            value_counts = responses_df[q_id].value_counts()
            percentage = value_counts / len(responses_df) * 100

            results[q_id] = {
                'question': q_text,
                'type': 'multiple_choice',
                'counts': value_counts.to_dict(),
                'percentages': percentage.to_dict()
            }

        else:  # open_ended
            # 주관식 문항 분석 - 샘플 2개 표시 (추가된 부분)
            sample_responses = responses_df[q_id].sample(min(2, len(responses_df))).tolist()

            results[q_id] = {
                'question': q_text,
                'type': 'open_ended',
                'sample_responses': responses_df[q_id].sample(min(10, len(responses_df))).to_list()
            }

    # 결과 저장
    save_results(responses_df, questions, results)

    # 결과 요약 - 간단하게 표시 (모든 질문 순서대로 표시)
    print("\n설문 결과 요약:")

    for q in questions:
        q_id = f"Q{q['id']}"
        q_text = q['text']
        q_type = q['type']

        print(f"\n{q_id}: {q_text}")
        if q_type == 'multiple_choice':
            # 객관식 문항은 결과 표시
            for option, percentage in results[q_id]['percentages'].items():
                print(f"  - {option}: {percentage:.1f}%")
        else:  # open_ended (추가된 부분)
            # 주관식 문항은 샘플 2개만 표시
            sample_responses = responses_df[q_id].sample(min(2, len(responses_df))).tolist()
            print("응답 샘플:")
            for i, resp in enumerate(sample_responses):
                print(f"{i+1}. {resp}")

    print("\n[SUCCESS] 설문 시뮬레이션이 완료되었습니다!")

    return results

# 5. 결과 저장
def save_results(responses_df, questions, results):
    # 응답 데이터 CSV로 저장
    responses_df.to_csv('survey_responses.csv', index=False)

    # 질문과 분석 결과 JSON으로 저장
    output = {
        'questions': questions,
        'analysis': results
    }

    with open('survey_results.json', 'w', encoding='utf-8') as f:
        json.dump(output, f, ensure_ascii=False, indent=2)

# 샘플 크기 선택 (CLI 버전)
def select_sample_size(personas_df, questions):
    max_size = len(personas_df)

    print(f"\n설문 진행할 페르소나 수를 선택해주세요 (최대 {max_size}명)")

    while True:
        try:
            sample_size = int(input(f"인원 수 (1-{max_size}): "))
            if 1 <= sample_size <= max_size:
                break
            else:
                print(f"[!!ERROR] 1부터 {max_size} 사이의 숫자를 입력해주세요.")
        except ValueError:
            print("[!!ERROR] 올바른 숫자를 입력해주세요.")

    print(f"[Log] {sample_size}명의 페르소나에게 설문을 진행합니다...")

    # 응답 생성 및 요약 분석 진행
    responses_df = generate_responses(personas_df, questions, sample_size)
    results = analyze_survey_results_summary(responses_df, questions)

# 설문 문항 작성 후 진행 함수
def run_survey_with_questions(questions):
    personas_df = load_personas()
    if personas_df is None:
        return

    select_sample_size(personas_df, questions)

# 전체 실행 함수
def run_survey_simulation():
    print("=" * 50)
    print("남성 패션 페르소나 설문 시뮬레이션")
    print("=" * 50)

    # 개선된 UI로 설문지 작성
    create_survey_improved()

In [18]:
run_survey_simulation()

남성 패션 페르소나 설문 시뮬레이션

설문지 작성
객관식 및 주관식 문항을 포함하여 최소 1개 이상 작성해주세요.
명령어:
- 'obj': 객관식 문항 추가
- 'subj': 주관식 문항 추가
- 'list': 현재 작성된 문항 목록 보기
- 'del N': N번 문항 삭제
- 'finish': 설문 작성 완료
--------------------------------------------------

현재 작성된 문항: 0개
명령어를 입력하세요 (obj/subj/list/del/finish): subj

[주관식 문항 추가]
질문 내용: 옷을 살 때 가장 고려하는 요소는 무엇인가요?
[SUCCESS] Q1 주관식 문항이 추가되었습니다.

현재 작성된 문항: 1개
명령어를 입력하세요 (obj/subj/list/del/finish): finish

[SUCCESS] 설문지 작성 완료 (총 1개 문항)
[Log] 페르소나 데이터를 로드합니다...
[SUCCESS] 페르소나 데이터 로드 완료 (총 100명)

설문 진행할 페르소나 수를 선택해주세요 (최대 100명)
인원 수 (1-100): 20
[Log] 20명의 페르소나에게 설문을 진행합니다...

[Log] 20명의 페르소나에 대한 응답을 생성합니다...
[Log] 진행률: [████████████████████] 20/20 (100.0%) - 정한울
[SUCCESS] 20명의 페르소나에 대한 응답 생성 완료!

[Log] 설문 결과를 분석합니다...

설문 결과 요약:

Q1: 옷을 살 때 가장 고려하는 요소는 무엇인가요?
응답 샘플:
1. 음, 옷 살 때는 당연히 '핏'이 제일 중요하죠. 아무리 디자인이 힙해도 핏이 망하면 끝이잖아요? 그리고 가격도 무시 못하죠. 가성비 좋은 옷을 찾으려고 노력하는 편이에요.
2. 아, 옷을 살 때 가장 중요하게 생각하는 요소 말인가요? 음... 아무래도 제일 먼저는 '핏'을 보게 되는 것 같아요. 아무리 예쁜 옷이라도 저한테 안 어울리면 손이 안 가더라고요. 그다음은 아무