In [1]:
import pandas as pd
from urllib.parse import urlparse, parse_qs

# 🔧 분석용 함수 정의
def quantify_youtube_metrics(df, label):
    df = df.copy()
    df['comment_len'] = df['comment'].astype(str).apply(len)
    df['counts'] = pd.to_numeric(df['counts'], errors='coerce')
    df['likes_count'] = pd.to_numeric(df['likes_count'], errors='coerce')
    df['comment_count'] = pd.to_numeric(df['comment_count'], errors='coerce')

    summary = {
        '분석 대상': label,
        '영상 수': df['videoId'].nunique(),
        '전체 댓글 수': len(df),
        '평균 댓글 길이': round(df['comment_len'].mean(), 2),
        '평균 댓글 수(영상별)': round(df.groupby('videoId')['comment'].count().mean(), 2),
        '평균 조회수': round(df.groupby('videoId')['counts'].first().mean(), 2),
        '평균 좋아요 수': round(df.groupby('videoId')['likes_count'].first().mean(), 2),
        '평균 댓글 수(메타 기준)': round(df.groupby('videoId')['comment_count'].first().mean(), 2)
    }
    return summary

# 🔽 입력 파일 (경로 수정 가능)
kim_file = 'youtube_통합분석_김문수_후보_등록.csv'
lee_file = 'youtube_통합분석_이재명_전남_방문.csv'

# 🔽 데이터 로딩
df_kim = pd.read_csv(kim_file)
df_lee = pd.read_csv(lee_file)

# ✅ 정량 분석 실행
summary_kim = quantify_youtube_metrics(df_kim, '김문수')
summary_lee = quantify_youtube_metrics(df_lee, '이재명')

df_summary = pd.DataFrame([summary_kim, summary_lee])

# ✅ 저장
df_summary.to_csv('youtube_정량분석_요약.csv', index=False, encoding='utf-8-sig')
print("✅ 유튜브 정량 분석 완료 → youtube_정량분석_요약.csv")
print(df_summary)


✅ 유튜브 정량 분석 완료 → youtube_정량분석_요약.csv
  분석 대상  영상 수  전체 댓글 수  평균 댓글 길이  평균 댓글 수(영상별)    평균 조회수  평균 좋아요 수  \
0   김문수    35      766     34.41         21.80  44798.63   1090.67   
1   이재명    35      988     37.14         28.09  35405.97   2342.53   

   평균 댓글 수(메타 기준)  
0           40.19  
1          111.06  
