Skip to content

cometJang/project_team1

Repository files navigation

환승연애2 데이터 기반 심리·관계 분석 및 AI 기반 재결합 예측 연구

1. 프로젝트 기본 정보

항목 내용
프로젝트명 환승연애2 데이터 기반 심리·관계 분석, AI기반 재결합 예측 연구
팀원 2명 (협업 프로젝트)
진행 기간 2026년 1월 14일 ~ 1월 16일 (3일)
분석 대상 환승연애 시즌2 (에피소드 20개, 대화 데이터 807개, 출연자 10명)

2. 문제 정의 (Why)

해결하고자 하는 문제

연애 리얼리티 콘텐츠에서 왜 어떤 커플은 재결합하고 어떤 커플은 실패할까요? 기존 미디어 분석은 주로 정성적 해석에 의존했지만, 이 프로젝트는 출연자의 성격(MBTI), 감정 변화, 관계 선택 행동 간의 연관성을 데이터 기반으로 구조화합니다. 특히 감정 흐름과 행동 선택이 시청자 반응을 어떻게 증폭시키는지에 대한 정량적 분석 사례가 부족합니다. 본 프로젝트는 감정 서사를 데이터로 변환하여 콘텐츠 기획·편집·마케팅 전략에 활용할 수 있는 실증적 근거를 제공합니다.

왜 이 문제가 중요한가?

OTT 플랫폼의 경쟁이 심화되면서 콘텐츠 기획 단계에서 데이터 기반의 의사결정이 필수입니다. 감정 서사의 어느 지점이 시청자 몰입을 최대화하는지, 어떤 성격 조합이 재결합 가능성을 높이는지 알 수 있다면 다음 시즌의 캐스팅, 편집, 클립 전략을 과학적으로 수립할 수 있습니다. 또한 이는 정성적 콘텐츠를 정량적으로 분석하는 실전 사례를 제시함으로써 미디어·콘텐츠 분석 분야에 시사점을 제공합니다.

타겟 사용자

  • OTT 콘텐츠 기획자 및 제작 PD
  • 유튜브·OTT 클립 마케팅 담당자
  • 미디어·콘텐츠 데이터 분석가
  • MBTI 기반 인간행동 분석에 관심 있는 교육기관 및 인재육성기관

핵심 질문 (3개)

  1. 성격 유형(MBTI)에 따라 이별 이후 감정 회복 패턴은 어떻게 다른가?
  2. 감정 반전이 발생한 서사 구간에서 시청자 반응은 실제로 급증하는가?
  3. 관계 선택을 번복하는 출연자는 더 부정적인 여론에 노출되는가?

3. 데이터 소스 및 수집 방법

데이터 출처

방송 기반 데이터 (나무위키, 방송 요약 유튜브 영상, 자막 기반 수작업 태깅)

데이터 볼륨

  • 에피소드: 20개
  • 대화 데이터: 807개
  • 출연자: 10명

수집 및 변환 프로세스

방송 영상의 대화를 AI 음성 인식 도구(Clipto)를 사용하여 1차 텍스트로 변환한 후, 발화자(Speaker) 식별 및 정확도 검증을 위해 수동 검증 작업을 진행했습니다. 초기에는 발화자 분류 기준이 팀 내에서 상이하여 (출연자 이름 vs. Speaker ID), 최종적으로 출연자 정보 테이블의 인덱스 번호를 기준으로 통일했습니다. 추가로 각 대화마다 confidence 컬럼을 도입하여 발화자 분류 정확도를 수치화했습니다.

API/파일 형식

  • Google Gemini 2.0 Flash (감정 분석)
  • YouTube Data API v3 (JSON)
  • 방송 기반 데이터 (txt, csv)

4. 프로젝트 진행 과정

Day 1 (1월 14일) - 문제 정의 및 기획 단계

프로젝트 시작 당일, 초기 주제가 변경되었습니다. 원래 계획했던 "서울시 지하철 노후도에 따른 기상악화 시 지연 정도 분석"에서 임팩트 있는 결과를 도출하기 어렵다고 판단하여 흥미도 중심의 주제 재검토를 진행했고, 최종적으로 "환승연애 데이터 기반 심리·관계 분석"으로 방향을 수정했습니다. 이로 인해 첫 날은 기획 단계에서 상당한 시간이 소요되었습니다.

Day 2 (1월 15일) - 데이터 검증 및 라벨링

하루 종일 Clipto 도구로 변환된 텍스트 파일의 정확도 검증에 시간이 집중됐습니다. 다음과 같은 문제들이 발생했습니다:

  • 발화자 식별 오류: 패널, 스태프 등 출연자가 아닌 인물이 Speaker로 인식됨
  • 발화자 순서 뒤섞임: 대화의 순서가 뒤바뀌어 있던 경우 발생

주요 이슈는 팀 내 라벨링 기준의 불일치였습니다. 한 팀원은 출연자 이름으로 직접 구분하고 있었고, 다른 팀원은 Speaker1, Speaker3 같은 ID 기반 분류 방식으로 구분하고 있었습니을 거쳐 출연자 정보 테이블의 인덱스 번호를 통일 기준으로 설정하고, confidence 메트릭을 추가하여 분류 정확도를 추적하도록 코드를 수정했습니다.

Day 3 (1월 16일) - 분석, 시각화, 발표

분석 결과 정리, 인사이트 도출, 시각화 및 발표 자료 작성을 완료했습니다. 시간 제약으로 인해 YouTube Data API를 활용한 시청자 반응 분석은 미실시했습니다.


5. 주요 성과 및 결과

대화 텍스트 기반 재결합 패턴 분석

image

발표자료

재결합 성공 케이스: 이나연·남희두 커플

  • 두 출연자 모두 P 성격(인식형) 으로, 분쟁이 발생해도 즉시 해결하는 성향을 보였습니다.
  • 상호 간 관심 표현의 균형이 잘 맞추어져 있었습니다.

환승 성공 케이스: 성해은·정현규 커플

  • 기존 관계 대신 새로운 관계로 전환한 사례입니다.

재결합 실패 케이스: 성해은·정규민 커플

  • 정규민은 결국 혼자 남게 되었습니다.

감정 분석을 통한 핵심 인사이트

807개 대화에서 감성 분석 키워드 사전('보고싶다', '그립다', '못잊어', '후회돼', '아쉽다' 등)을 활용한 결과, 성해은 출연자가 가장 높은 미련도를 보였습니다.

MBTI 성격 유형의 영향:

성해은이 정규민과의 이별 과정에서 보여준 패턴은 성격 유형과 밀접한 관련이 있습니다.

  • 정규민(J 성격 - 판단형): 주도적으로 "그만 끝내자"며 이별을 통보
  • 성해은(P 성격 - 인식형): 수동적으로 받아들여 감정적 마무리가 미흡

반면 두 사람 모두 P 성격인 이나연·남희두 커플즉각적인 갈등 해결로 미련 최소화에 성공했습니다.

MBTI 성격 유형과 감정 패턴의 상관성

  • 감정형(F) vs. 사고형(T): 감정형이 이별 후 감정 변동성이 더 크게 나타났습니다.
  • 판단형(J) vs. 인식형(P): J는 결정을 주도적으로 내리고 마무리하는 경향이 있으며, P는 수동적 수용 후 미련이 남는 경향을 보였습니다.

재결합 성공 요인 분석 - 5각형 모델

종합 분석 결과, 재결합에 성공한 커플은 다음 5가지 특성이 균형있게 발달한 오각형을 형성했습니다:

  1. 관심의 균형: 상호 간 관심 표현 수준이 유사
  2. 대화 주도성: 일방적이지 않은 상호 주도적 대화
  3. 감정 강도: 적절한 수준의 감정 표현
  4. 미련도: 완벽한 마무리로 인한 미련 최소화
  5. 상호성: 대화와 행동에서 상호 호응성

이 다섯 요소가 고르게 점수를 받은 커플이 재결합에 성공했으며, 하나 이상의 요소가 약했던 커플은 실패하거나 환승했습니다.

속마음 문자 트래킹 결과

균형있는 서로간의 관심 표현이 재결합의 결정적 요인으로 작용함을 확인했습니다. 속마음 문자를 추적하여 상호 관심도의 불균형 정도를 측정한 결과, 이것이 관계 지속 여부와 강한 상관성을 보였습니다.


6. 팀 협업 과정 및 교훈

협업 다이나믹

3일간의 긴밀한 협업 과정에서 팀원들은 상황에 따라 리더와 팔로워 역할을 유동적으로 수행했습니다. 업무가 벅찰 때는 상대가 지원했고, 여유가 생기면 전체 진행 상황을 조감하는 안목을 유지하려 노력했습니다.

갈등 해결 및 소통

초기에 발화자 라벨링 기준 불일치로 인한 작은 마찰이 있었지만, 명확한 기준 수립(인덱스 번호 통일)신뢰도 메트릭 도입으로 빠르게 해결했습니다.

발표 후 저녁에 진행한 마무리 회고에서는 다시 한번 프로젝트를 시작한 이유(Why), 데이터 선택 배경을 되짚으며 서로에 대한 감사와 개선 피드백을 솔직하게 나눴습니다. 이 과정에서 업무 수행 중 미처 표현하지 못한 감사와 미안함을 전하면서 팀 관계를 더욱 공고히 할 수 있었습니다.

핵심 교훈

1. 전체 시퀀스의 중요성

프로젝트 실행도 중요하지만, 시작 전 사전 준비(데이터 검증, 기준 정의 등)와 완료 후 정리(회고, 피드백, 아카이빙) 가 하나의 완전한 시퀀스를 형성해야 함을 깨달았습니다.

2. 템플릿화와 아카이빙

프로젝트마다 반복되는 패턴(데이터 검증, 라벨링 기준, 협업 프로세스 등)을 템플릿화하여 향후 프로젝트에 재사용할 수 있도록 체계화해야 합니다.

3. 시간 부족 시 팀 안목 유지

짧은 일정 속에서도 "큰 그림"을 주기적으로 점검하는 것이 중요합니다. 세부 작업에 빠져 있을 때 팀원이 전체 진행 상황을 조감하면서 우선순위를 재조정할 수 있도록 배려하는 인력이 필요합니다.


7. 목표 달성도 및 제약사항

달성한 목표

  • ✅ 출연자 대화 데이터 기반 감정 분석 완료
  • ✅ MBTI 성격 유형과 감정 반응의 상관성 분석 완료
  • ✅ 재결합 성공 요인 데이터 기반 규명 완료
  • ✅ 5각형 모델을 통한 관계 성공 패턴 시각화 완료

미달성 목표

  • ❌ YouTube Data API를 활용한 시청자 반응 분석 (일정 제약)
    • 계획했던 감정 반전 구간 vs. 유튜브 반응(Scatter Plot) 분석 미실시

제약사항 및 원인

3일이라는 짧은 프로젝트 기간과 2명 인원 구성이 주요 제약이었습니다.

  • Day 1: 프로젝트 주제 변경으로 기획안 구성과 ERD 구조 파악
  • Day 2: 영상에서 텍스트 데이터 추출 후 수동 검증 및 라벨링
  • Day 3: 심층분석, 시각화, 발표 자료 작성, 발표까지 모두 진행

결과적으로 YouTube API 분석은 우선순위 상 보류하기로 결정하였습니다.


8. 예상 결과물 (완성 현황)

시각화 대시보드

  • 출연자별 감정 타임라인 (Line Chart) - ✅ 완성
  • MBTI 유형별 감정 반응 비교 (Bar Chart) - ✅ 완성
  • 재결합 성공 요인 5각형 모델 (Radar Chart) - ✅ 완성
  • 문자 발송 기반 관계 네트워크 (Table) - ✅ 부분 완성
  • 감정 반전 구간 vs. 유튜브 반응 (Scatter Plot) - ❌ 미완성

비즈니스 임팩트

  • 연애 리얼리티 과몰입 요인을 데이터 기반으로 규명하여 콘텐츠 흡입력 분석 가능
  • 차기 시즌 캐스팅 단계에서 성격 조합의 과학적 검증 근거 제공
  • 편집 및 클립 전략 수립 시 감정 반전 구간을 우선 추출하는 데이터 기반 가이드라인 수립 가능
  • 정성적 서사를 정량 분석으로 전환한 미디어 콘텐츠 분석의 실전 사례 제시

9. 향후 개선 방안

데이터 검증 프로세스 최적화

현재는 AI 1차 변환 후 인간이 전체를 수동 검증했는데, 향후에는 다음과 같은 반복 검증 방식을 도입할 것을 권장합니다:

AI 1차 변환 → 인간 30% 검증 → AI 개선 검증(전체) → 인간 확인(문제 구간만) → 반복(2-3회)

이를 통해 검증 시간을 단축하면서도 정확도를 유지할 수 있을 것으로 예상됩니다.

YouTube Data API 분석 실행

다음 단계에서는 영상 제목, 조회수, 좋아요수, 댓글수 등을 YouTube Data API를 통해 추출하여, 감정 반전 구간과 시청자 반응 간의 상관성을 정량적으로 검증해야 합니다. 이를 통해 "감정 반전이 발생한 서사 구간에서 시청자 반응은 실제로 급증하는가?"라는 핵심 질문에 명확한 답을 제공할 수 있습니다.

다중 플랫폼 확장

현재 분석은 환승연애 시즌2에 한정되어 있으나, 환승연애 시즌4, 나는 솔로, 솔로지옥 등 다른 연애 리얼리티 프로그램으로 확대하면 더욱 일반화된 인사이트를 도출할 수 있습니다.


10. 결론

본 프로젝트는 3일간의 집중적인 협업을 통해 연애 리얼리티 콘텐츠의 재결합 성공 요인을 데이터 기반으로 규명했습니다.
MBTI 성격 유형, 감정 변화, 관계 선택 행동 간의 연관성을 수량화함으로써 정성적 콘텐츠를 정량적으로 분석하는 실전 사례를 제시했습니다.

특히 재결합 성공 커플이 보여주는 "5각형 모델"(관심의 균형, 대화 주도성, 감정 강도, 미련도, 상호성)은 향후 리얼리티 콘텐츠 제작, 마케팅, 시청자 참여 전략 수립에 직접 활용 가능한 실증적 근거를 제공합니다.

짧은 기간의 제약에도 불구하고 팀원과의 신뢰 기반 협업, 명확한 소통, 그리고 발표 후 성찰적 회고를 통해 프로젝트를 의미 있게 마무리할 수 있었습니다.
향후에는 데이터 검증 프로세스 최적화, YouTube 반응 분석, 다중 플랫폼 확대 등을 통해 분석의 깊이와 일반화 가능성을 높일 수 있을 것으로 기대합니다.

About

No description, website, or topics provided.

Resources

Stars

Watchers

Forks

Releases

No releases published

Packages

No packages published

Contributors 3

  •  
  •  
  •