#### 가설 1. 준비된 영화가 많은 장르일수록 사람들의 관심을 받기 힘들 것이다(블루오션, 레드오션 효과)

In [1]:
import pandas as pd

In [2]:
data = pd.read_csv('preprocessed_SeriesOn.csv')

In [3]:
# 각 장르별 영화 수 계산
genres = ['is_action', 'is_comedy', 'is_drama', 'is_melo', 'is_horror', 'is_fantasy', 'is_animation', 'is_DQ', 'is_indie', 'is_concert']
genre_counts = data[genres].sum().reset_index()
genre_counts.columns = ['genre', 'movie_count']

In [4]:
# 각 장르별 관심도 합산 (평점, 좋아요, 댓글 수)
genre_interest = data.melt(id_vars=['rating', 'like', 'comment'], value_vars=genres, var_name='genre', value_name='is_genre')
genre_interest = genre_interest[genre_interest['is_genre'] == 1].groupby('genre')[['rating', 'like', 'comment']].mean().reset_index()

In [5]:
# 데이터 병합
final_data = pd.merge(genre_counts, genre_interest, on='genre')

In [6]:
# CSV 파일로 저장
final_data.to_csv('genre_analysis.csv', index=False)

#### 가설 2. 대여 기간이 길수록 좋아요 수가 높을 것이다

In [8]:
# 'period' 필드를 숫자형 '일' 단위로 변환
def convert_period_to_days(period):
    if period == '제한 없음':
        return 0
    elif '일' in period:
        return int(period.replace('일', ''))
    elif '년' in period:
        return int(period.replace('년', '')) * 365
    else:
        return pd.NA

data['period_days'] = data['period'].apply(convert_period_to_days)

In [9]:
# 필요한 필드만 선택
rent_data = data[['period_days', 'like']]

# NaN 값 제거
rent_data = rent_data.dropna()

In [10]:
# CSV 파일로 저장
rent_data.to_csv('rent_analysis_with_years.csv', index=False)