In [None]:
# 필요한 라이브러리 설치:
!pip install google-play-scraper
!pip install konlpy
!pip uninstall JPype1-py3
!pip install JPype1


In [None]:
import re
from google_play_scraper import reviews, Sort
from konlpy.tag import Okt
from collections import Counter

def fetch_reviews(app_id, total_reviews=500):
    """Google Play Store에서 total_reviews 수 만큼 리뷰를 가져옵니다."""
    all_reviews = []
    count = 100  # 한 번에 요청할 리뷰 개수
    token = None

    while len(all_reviews) < total_reviews:
        result, token = reviews(
            app_id,
            lang='ko',
            country='kr',
            sort=Sort.NEWEST,
            count=count,
            continuation_token=token
        )
        all_reviews.extend(result)
        if token is None:
            break  # 더 이상 리뷰가 없으면 종료
    return all_reviews[:total_reviews]

def analyze_reviews(review_list):
    """리뷰 목록에서 텍스트를 결합하여 명사를 추출한 후 빈도 상위 10개 단어를 반환합니다."""
    okt = Okt()
    # 모든 리뷰의 텍스트를 하나의 문자열로 결합
    all_text = " ".join([review['content'] for review in review_list])
    # 한글과 공백을 제외한 문자 제거
    all_text = re.sub(r'[^가-힣\s]', '', all_text)
    
    # 명사 추출
    nouns = okt.nouns(all_text)
    
    # 불용어 처리 (필요에 따라 추가 가능)
    stopwords = set(['이', '그', '저', '것', '들', '의', '있', '하', '되', '수'])
    # 한 글자 단어 및 불용어 제거
    nouns = [noun for noun in nouns if noun not in stopwords and len(noun) > 1]
    
    counter = Counter(nouns)
    top_10 = counter.most_common(10)
    return top_10

if __name__ == "__main__":
    # 중고나라 앱의 패키지명 (실제 앱의 패키지명으로 변경하세요)
    app_id = 'com.joongonara'
    
    print("리뷰를 수집 중입니다...")
    reviews_data = fetch_reviews(app_id, total_reviews=500)
    print(f"{len(reviews_data)}개의 리뷰를 수집했습니다.")
    
    top_words = analyze_reviews(reviews_data)
    print("가장 많이 나온 단어 TOP 10:")
    for rank, (word, freq) in enumerate(top_words, start=1):
        print(f"{rank}위: {word} - {freq}회")