<a href="https://colab.research.google.com/github/Rojojun/GPT-MINE/blob/main/Untitled0.ipynb" target="_parent"><img src="https://colab.research.google.com/assets/colab-badge.svg" alt="Open In Colab"/></a>

In [None]:
from google.colab import files, userdata
from google import genai

# Google API 키 설정 부분
def setup_gemini():
    try:
        # Colab userdata에서 API 키 가져오기
        GOOGLE_API_KEY = userdata.get('GOOGLE_API_KEY')

        if not GOOGLE_API_KEY:
            # userdata에 없는 경우 사용자 입력 요청
            GOOGLE_API_KEY = input("Google API 키를 입력해주세요: ")
            if not GOOGLE_API_KEY:
                print("[?WARN] API 키가 필요합니다")

        # 클라이언트 초기화
        global client
        client = genai.Client(api_key=GOOGLE_API_KEY)

        # 간단한 테스트로 API 연결 확인
        try:
            response = client.models.generate_content(
                model="gemini-2.5-flash",
                contents=[{
                    "role": "user",
                    "parts": [{"text": "Hello"}]
                }]
            )
            print("[SUCCESS] Gemini API 연결 성공!")
        except Exception as e:
            print(f"[!!ERROR] API 연결 테스트 실패: {e}")

    except Exception as e:
        print(f"[!!ERROR] Gemini API 설정 실패: {e}")

In [None]:
setup_gemini()

[SUCCESS] Gemini API 연결 성공!


In [None]:
import pandas as pd
import numpy as np
import matplotlib.pyplot as plt
import seaborn as sns
import io
import json
import re
import time
import random
from IPython.display import display, HTML, clear_output
import ipywidgets as widgets
from IPython.display import display

# ipywidgets 설치 확인 (필요시 설치)
try:
    import ipywidgets as widgets
except ImportError:
    !pip install ipywidgets -q
    import ipywidgets as widgets

# 1. 페르소나 데이터 로드
def load_personas():
    print("[Log] 페르소나 데이터를 로드합니다...")

    try:
        # /content/fashion_data.csv에서 데이터 직접 로드
        personas_df = pd.read_csv('/content/fashion_data.csv')

        # 데이터 확인 및 전처리
        required_columns = ['id', 'name', 'age', 'gender', 'height', 'body_type', 'preferred_style',
                           'occupation', 'shopping_frequency', 'monthly_fashion_budget',
                           'online_shopping_experience', 'main_fashion_concerns']

        missing_columns = [col for col in required_columns if col not in personas_df.columns]
        if missing_columns:
            print(f"[?WARN] 다음 필수 컬럼이 없습니다: {missing_columns}")
            return None

        print(f"[SUCCESS] 페르소나 데이터 로드 완료 (총 {len(personas_df)}명)")
        return personas_df

    except Exception as e:
        print(f"[!!ERROR] 페르소나 데이터 로드 실패! (계속 오류가 발생하면 주변 Organizer or Staff에게 문의해주세요): {e}")
        return None

# 2. CLI 기반 설문지 작성
def create_survey_improved():
    print("\n" + "="*50)
    print("설문지 작성")
    print("="*50)
    print("객관식 및 주관식 문항을 포함하여 최소 3개 이상 작성해주세요.")
    print("명령어:")
    print("- 'obj': 객관식 문항 추가")
    print("- 'subj': 주관식 문항 추가")
    print("- 'list': 현재 작성된 문항 목록 보기")
    print("- 'del N': N번 문항 삭제")
    print("- 'finish': 설문 작성 완료")
    print("-" * 50)

    questions = []

    while True:
        print(f"\n현재 작성된 문항: {len(questions)}개")
        command = input("명령어를 입력하세요 (obj/subj/list/del/finish): ").strip().lower()

        if command == 'obj':
            # 객관식 문항 추가
            print("\n[객관식 문항 추가]")
            question_text = input("질문 내용: ").strip()
            if not question_text:
                print("[!!ERROR] 질문 내용을 입력해주세요.")
                continue

            options = []
            print("선택지를 입력하세요 (최소 2개, 빈 줄 입력시 완료):")
            while True:
                option = input(f"선택지 {len(options)+1}: ").strip()
                if not option:
                    break
                options.append(option)

            if len(options) < 2:
                print("[!!ERROR] 객관식 문항은 최소 2개 이상의 선택지가 필요합니다.")
                continue

            questions.append({
                'id': len(questions) + 1,
                'type': 'multiple_choice',
                'text': question_text,
                'options': options
            })
            print(f"[SUCCESS] Q{len(questions)} 객관식 문항이 추가되었습니다.")

        elif command == 'subj':
            # 주관식 문항 추가
            print("\n[주관식 문항 추가]")
            question_text = input("질문 내용: ").strip()
            if not question_text:
                print("[!!ERROR] 질문 내용을 입력해주세요.")
                continue

            questions.append({
                'id': len(questions) + 1,
                'type': 'open_ended',
                'text': question_text
            })
            print(f"[SUCCESS] Q{len(questions)} 주관식 문항이 추가되었습니다.")

        elif command == 'list':
            # 문항 목록 보기
            if not questions:
                print("작성된 문항이 없습니다.")
            else:
                print("\n[작성된 문항 목록]")
                print("-" * 50)
                for q in questions:
                    q_type = "객관식" if q['type'] == 'multiple_choice' else "주관식"
                    print(f"Q{q['id']} ({q_type}): {q['text']}")
                    if q['type'] == 'multiple_choice':
                        for i, option in enumerate(q['options']):
                            print(f"    {i+1}. {option}")
                    print()

        elif command.startswith('del'):
            # 문항 삭제
            try:
                parts = command.split()
                if len(parts) != 2:
                    print("[!!ERROR] 사용법: del [문항번호]")
                    continue

                q_num = int(parts[1])
                if 1 <= q_num <= len(questions):
                    removed_q = questions.pop(q_num - 1)
                    # ID 재정렬
                    for i, q in enumerate(questions):
                        q['id'] = i + 1
                    print(f"[SUCCESS] Q{q_num} 문항이 삭제되었습니다.")
                else:
                    print(f"[!!ERROR] 올바른 문항 번호를 입력하세요 (1-{len(questions)})")
            except ValueError:
                print("[!!ERROR] 올바른 숫자를 입력하세요.")

        elif command == 'finish':
            if len(questions) < 3:
                print(f"[!!ERROR] 최소 3개 문항이 필요합니다. 현재 {len(questions)}개 작성됨.")
                continue

            print(f"\n[SUCCESS] 설문지 작성 완료 (총 {len(questions)}개 문항)")

            # 여기서 설문지 작성이 완료되면 다음 단계로 진행
            run_survey_with_questions(questions)
            return questions

        else:
            print("[!!ERROR] 올바른 명령어를 입력하세요 (obj/subj/list/del/finish)")

# 3. 페르소나별 자연스러운 응답 생성 (Gemini API 활용)
def generate_responses(personas_df, questions, sample_size=100):
    print(f"\n[Log] {sample_size}명의 페르소나에 대한 응답을 생성합니다...")

    if sample_size > len(personas_df):
        sample_size = len(personas_df)
        print(f"[?WARN] 설정한 샘플 크기가 페르소나 전체 수보다 큽니다. {sample_size}명으로 조정합니다.")

    # Gemini API가 설정되어 있는지 확인
    try:
        # 전역 변수로 선언된 client 확인
        client
    except NameError:
        print("[?WARN] Gemini API가 설정되어 있지 않습니다. setup_gemini() 함수를 먼저 실행해주세요.")
        return None

    # 샘플 페르소나 선택
    sampled_personas = personas_df.sample(sample_size)

    # 결과를 저장할 데이터프레임 초기화
    responses_df = pd.DataFrame(index=sampled_personas.index)
    responses_df['persona_id'] = sampled_personas['id']
    responses_df['persona_name'] = sampled_personas['name']

    # 진행 상황 표시를 위한 변수
    total = len(sampled_personas)

    # 진행 상황 표시 위젯
    progress = widgets.IntProgress(
        value=0,
        min=0,
        max=total,
        description='진행률:',
        bar_style='info',
        orientation='horizontal'
    )

    progress_text = widgets.HTML(value=f"0/{total} 완료")

    display(widgets.VBox([progress, progress_text]))

    # 다양한 언어 스타일과 말투 정의
    speech_styles = [
        "자연스럽게 대화하듯이 응답해주세요.",
        "약간 격식있는 말투로, 하지만 딱딱하지 않게 응답해주세요. '~합니다', '~이에요' 같은 존댓말을 사용하세요.",
        "친구와 대화하듯 편안하게 답변해주세요.",
        "간결하고 명료하게 응답해주세요. 불필요한 설명은 생략하고 핵심만 말해주세요.",
    ]

    # 응답 패턴 다양화를 위한 피드백 스타일 정의
    feedback_styles = [
        "질문에 대한 개인적인 경험이나 사례를 먼저 이야기한 후 답변을 제공해주세요.",
        "질문에 직접적으로 답하고, 그 이유나 배경을 간략히 덧붙여주세요.",
        "자신의 취향이나 선호도를 강조하면서 답변해주세요.",
        "다른 사람들의 의견과 자신의 의견을 비교하며 답변해주세요.",
        "질문에 대해 약간 고민하는 듯한 뉘앙스로 답변해주세요.",
        "답변 중간에 작은 농담이나 유머를 섞어도 좋습니다."
    ]

    for i, (idx, persona) in enumerate(sampled_personas.iterrows()):
        # 진행 상황 업데이트
        progress.value = i + 1
        progress_text.value = f"{i+1}/{total} 완료 - 페르소나: {persona['name']} ({persona['age']}세, {persona['occupation']})"

        # 이 페르소나의 성격 특성 랜덤 선택 (다양한 응답 패턴 생성)
        personality_traits = np.random.choice([
            "신중하고 계획적인", "즉흥적이고 활발한", "내성적이고 생각이 많은",
            "외향적이고 사교적인", "창의적이고 독특한", "실용적이고 현실적인",
            "꼼꼼하고 신중한", "대담하고 모험적인", "합리적이고 논리적인",
            "감성적이고 감정표현이 풍부한"
        ], 2, replace=False)  # 두 가지 특성 선택

        # 이 페르소나의 언어 스타일 랜덤 선택
        speech_style = np.random.choice(speech_styles)
        feedback_style = np.random.choice(feedback_styles)

        # 각 질문에 대한 응답 생성
        for question in questions:
            q_id = f"Q{question['id']}"
            q_text = question['text']
            q_type = question['type']

            # 여기서 실제 API 호출로 응답 생성
            if q_type == 'multiple_choice':
                # 객관식 문항은 선택지 중에서 선택 (Gemini에게 물어보기)
                try:
                    # 페르소나 정보와 질문, 선택지를 프롬프트로 작성
                    prompt = f"""
                    당신은 20대~40대 한국 남성 페르소나 역할을 맡아 패션 관련 설문조사에 응답해야 합니다.

                    당신의 페르소나 정보는 다음과 같습니다:
                    - 이름: {persona['name']}
                    - 나이: {persona['age']}세
                    - 성별: {persona['gender']}
                    - 키: {persona['height']}cm
                    - 체형: {persona['body_type']}
                    - 선호 스타일: {persona['preferred_style']}
                    - 직업: {persona['occupation']}
                    - 쇼핑 빈도: {persona['shopping_frequency']}
                    - 월 패션 예산: {persona['monthly_fashion_budget']}
                    - 주요 패션 관심사: {persona['main_fashion_concerns']}

                    당신은 {personality_traits[0]}면서도 {personality_traits[1]} 성격을 가지고 있습니다.

                    다음 객관식 질문에 답변해주세요:
                    질문: {q_text}

                    다음 보기 중에서  당신의 페르소나 특성에 가장 적합한 한 가지만 선택하세요.
                    {', '.join(question['options'])}

                    무조건 보기를 선택한 이유에 대한 설명 없이 보기 중에서 한 가지를 선택한 내용을 출력해주세요.
                    """

                    # Gemini API 호출
                    response = client.models.generate_content(
                        model="gemini-2.0-flash-lite",
                        contents=[{
                            "role": "user",
                            "parts": [{"text": prompt}]
                        }]
                    )

                    # 응답 텍스트 추출
                    answer_text = response.candidates[0].content.parts[0].text.strip()

                    # 선택지 중에 있는지 확인
                    if answer_text in question['options']:
                        answer = answer_text
                    else:
                        # 선택지에 없는 응답이 나온 경우 첫 번째 선택지로 대체
                        print(f"[?WARN] 선택지에 없는 응답이 생성되었습니다: '{answer_text}'. 기본값으로 대체합니다.")
                        answer = question['options'][0]

                except Exception as e:
                    # API 오류 시 랜덤 선택
                    print(f"[?WARN] API 오류: {e} - 랜덤 응답으로 대체합니다.")
                    answer = np.random.choice(question['options'])

            else:  # open_ended (주관식)
                try:
                    # 더 다양하고 실제 사람같은 응답을 위한 프롬프트 작성
                    prompt = f"""
                    당신은 20대~40대 한국 남성 페르소나 역할을 맡아 패션 관련 설문조사에 응답해야 합니다.
                    실제 사람이 응답한 것처럼 자연스럽고 다양한 어투와 표현으로 답변해주세요.

                    당신의 페르소나 정보는 다음과 같습니다:
                    - 이름: {persona['name']}
                    - 나이: {persona['age']}세
                    - 성별: {persona['gender']}
                    - 키: {persona['height']}cm
                    - 체형: {persona['body_type']}
                    - 선호 스타일: {persona['preferred_style']}
                    - 직업: {persona['occupation']}
                    - 쇼핑 빈도: {persona['shopping_frequency']}
                    - 월 패션 예산: {persona['monthly_fashion_budget']}
                    - 주요 패션 관심사: {persona['main_fashion_concerns']}

                    당신은 {personality_traits[0]}면서도 {personality_traits[1]} 성격을 가지고 있습니다.
                    {speech_style}
                    {feedback_style}

                    다음 주관식 질문에 답변해주세요:
                    질문: {q_text}

                    다음 사항을 고려하여 실제 사람이 답변한 것처럼 자연스럽게 응답해주세요:
                    1. 생각을 정리하는 듯한 표현("음...", "글쎄요...", "그러니까...")을 사용해도 좋습니다.
                    2. 문장 구조나 어투는 다양하게 사용하고, 패턴화된 응답은 피해주세요.
                    3. 직업과 관련된 경험이나 패션 예산, 체형 등 페르소나 특성을 자연스럽게 반영해주세요.
                    4. 불필요하게 긴 설명은 피하고, 1-3문장으로 자연스럽게 답변해주세요.
                    5. 설문지에 응답하는 상황이므로, 지나치게 긴 서술은 피해주세요.

                    실제 소비자가 설문에 응답하는 것처럼 자연스럽게 작성해주세요.
                    """

                    # Gemini API 호출
                    response = client.models.generate_content(
                        model="gemini-2.0-flash-lite",
                        contents=[{
                            "role": "user",
                            "parts": [{"text": prompt}]
                        }]
                    )

                    # 응답 텍스트 추출
                    answer = response.candidates[0].content.parts[0].text.strip()

                except Exception as e:
                    # API 오류 시 기본 응답 사용
                    print(f"[?WARN] API 오류: {e} - 기본 응답으로 대체합니다.")
                    basic_responses = [
                        f"{persona['preferred_style']} 스타일을 선호하는 편입니다.",
                        f"제 직업({persona['occupation']})의 특성상 중요합니다.",
                        f"월 {persona['monthly_fashion_budget']} 정도 지출하는데, 합리적인 가격이 중요합니다.",
                        f"{persona['body_type']}이라 잘 맞는 옷을 찾기가 어렵습니다.",
                        f"주로 {persona['shopping_frequency']} 쇼핑을 합니다.",
                        f"패션에서 가장 신경쓰는 부분은 {persona['main_fashion_concerns']}입니다."
                    ]
                    answer = np.random.choice(basic_responses)

            # 데이터프레임에 응답 저장
            responses_df.loc[idx, q_id] = answer

            # API 호출 속도 제한 대응을 위한 딜레이
            time.sleep(0.5)

    clear_output()
    print(f"[SUCCESS] {total}명의 페르소나에 대한 응답 생성 완료!")
    return responses_df

# 4. 설문 결과 요약 분석 (주관식 응답 2개 표시 추가)
def analyze_survey_results_summary(responses_df, questions):
    print("\n[Log] 설문 결과를 분석합니다...")

    results = {}

    # 문항별 분석
    for question in questions:
        q_id = f"Q{question['id']}"
        q_text = question['text']
        q_type = question['type']

        if q_type == 'multiple_choice':
            # 객관식 문항 분석 - 결과 저장
            value_counts = responses_df[q_id].value_counts()
            percentage = value_counts / len(responses_df) * 100

            results[q_id] = {
                'question': q_text,
                'type': 'multiple_choice',
                'counts': value_counts.to_dict(),
                'percentages': percentage.to_dict()
            }

        else:  # open_ended
            # 주관식 문항 분석 - 샘플 2개 표시 (추가된 부분)
            sample_responses = responses_df[q_id].sample(min(2, len(responses_df))).tolist()

            results[q_id] = {
                'question': q_text,
                'type': 'open_ended',
                'sample_responses': responses_df[q_id].sample(min(10, len(responses_df))).to_list()
            }

    # 결과 저장
    save_results(responses_df, questions, results)

    # 결과 요약 - 간단하게 표시 (모든 질문 순서대로 표시)
    print("\n설문 결과 요약:")

    for q in questions:
        q_id = f"Q{q['id']}"
        q_text = q['text']
        q_type = q['type']

        print(f"\n{q_id}: {q_text}")
        if q_type == 'multiple_choice':
            # 객관식 문항은 결과 표시
            for option, percentage in results[q_id]['percentages'].items():
                print(f"  - {option}: {percentage:.1f}%")
        else:  # open_ended (추가된 부분)
            # 주관식 문항은 샘플 2개만 표시
            sample_responses = responses_df[q_id].sample(min(2, len(responses_df))).tolist()
            print("응답 샘플:")
            for i, resp in enumerate(sample_responses):
                print(f"{i+1}. {resp}")

    print("\n[SUCCESS] 설문 시뮬레이션이 완료되었습니다!")

    return results

# 5. 결과 저장
def save_results(responses_df, questions, results):
    # 응답 데이터 CSV로 저장
    responses_df.to_csv('survey_responses.csv', index=False)

    # 질문과 분석 결과 JSON으로 저장
    output = {
        'questions': questions,
        'analysis': results
    }

    with open('survey_results.json', 'w', encoding='utf-8') as f:
        json.dump(output, f, ensure_ascii=False, indent=2)

# 샘플 크기 선택 UI
def select_sample_size(personas_df, questions):
    max_size = len(personas_df)

    sample_label = widgets.HTML(value=f"<h3>설문 진행할 페르소나 수 선택</h3><p>최대 {max_size}명까지 선택 가능합니다.</p>")

    sample_slider = widgets.IntSlider(
        value=min(20, max_size),
        min=1,
        max=max_size,
        step=1,
        description='인원 수:',
        style={'description_width': 'initial'},
        layout=widgets.Layout(width='50%')
    )

    confirm_btn = widgets.Button(
        description='설문 시작',
        button_style='primary',
        icon='play'
    )

    sample_container = widgets.VBox([sample_label, sample_slider, confirm_btn])

    def on_confirm(b):
        sample_container.layout.display = 'none'
        clear_output()
        print(f"[Log] {sample_slider.value}명의 페르소나에게 설문을 진행합니다...")

        # 응답 생성 및 요약 분석 진행
        responses_df = generate_responses(personas_df, questions, sample_slider.value)
        results = analyze_survey_results_summary(responses_df, questions)

    confirm_btn.on_click(on_confirm)
    display(sample_container)

# 설문 문항 작성 후 진행 함수
def run_survey_with_questions(questions):
    personas_df = load_personas()
    if personas_df is None:
        return

    select_sample_size(personas_df, questions)

# 전체 실행 함수
def run_survey_simulation():
    print("=" * 50)
    print("남성 패션 페르소나 설문 시뮬레이션")
    print("=" * 50)

    # 개선된 UI로 설문지 작성
    create_survey_improved()

In [None]:
run_survey_simulation()

[SUCCESS] 10명의 페르소나에 대한 응답 생성 완료!

[Log] 설문 결과를 분석합니다...

설문 결과 요약:

Q1: 옷을 구매하는 이유는 무엇인가요?
응답 샘플:
1. 음... 옷을 구매하는 이유요? 글쎄요, 딱 잘라서 말하기는 좀 어렵네요. 

그러니까, 기본적으로는 '일' 때문이죠. 제 직업이 사람을 대하는 일이다 보니, 깔끔하고 신뢰감 있는 이미지를 주는 게 중요하거든요. (저도 압니다, 옷 잘 입는다고 다 되는 건 아니지만, 그래도 긍정적인 첫인상을 주는 데 도움은 되잖아요? 😉)

그리고... 사실, 옷을 사는 건 저한테 일종의 '투자' 같은 거예요. 좋은 옷 몇 벌 사두면, 두고두고 오래 입을 수 있고, 또 그만큼 제 자존감도 채워주는 느낌이랄까요? 아, 물론 와이프 눈치도 좀 보면서 삽니다...😅
2. 음... 옷을 사는 이유는 딱 두 가지인 것 같아요. 첫 번째는 당연히 '입을 옷이 없어서'죠. 옷장에 옷은 많은데, 막상 입을 만한 옷이 없다고 느껴질 때가 있잖아요? 특히 저는 체형 때문에 옷 고르기가 쉽지 않아서, 딱 맞는 옷을 찾기가 어렵더라고요. 그래서 주로 기본템 위주로 사는데, 그럼에도 불구하고 뭔가 부족한 느낌이 들 때가 많아요.

그리고 두 번째는, "기분 전환"이랄까? 스트레스 받거나 우울할 때, 옷 하나 사면 기분이 좀 나아지잖아요. 특히 저는 병원 행정직이라서 매일 똑같은 유니폼을 입고 일하거든요. 주말에 옷을 고르면서 나만의 스타일을 완성하는 재미를 느끼는 것 같아요. 월급날 맞춰서 옷을 사는 편인데, 15~25만원 예산 안에서 최대한 괜찮은 옷들을 찾으려고 노력하죠!

Q2: 여성 브랜드에서 옷을 산다면 선호하시나요?
응답 샘플:
1. 음... 여성 브랜드에서 옷을 산다구요? 글쎄요... 솔직히 말하면, 썩 선호하는 편은 아니에요. 아무래도 제 체형이 좀 있다 보니까, 여성 의류는 핏이 안 맞을 때가 많더라고요.

그러니까, 가끔 셔츠나 티셔츠 같은, 핏에 크게 구애받지 않는 기본템을 살 때, 예쁜 디자인 있으