## 頻出単語計算


In [None]:
import pandas as pd
from janome.tokenizer import Tokenizer
from collections import Counter

# --- 準備 ---
# CSVファイルを読み込む
try:
    df = pd.read_csv('odaiba_reviews.csv')
except FileNotFoundError:
    print("エラー: 'odaiba_reviews.csv'が見つかりません。")
    df = pd.DataFrame()

# JanomeのTokenizerを準備
t = Tokenizer()

# ストップワード（分析に不要な一般的な単語）を定義
stop_words = ['こと', 'もの', 'それ', 'これ', 'さん', 'よう', 'ため', 'こちら', 'ところ', '感じ','...']

# --- 実行 ---
if not df.empty:
    # 1. 店舗名でグループ分け
    grouped = df.groupby('shop_name')

    # 各店舗ごとに処理
    for shop_name, group in grouped:
        print(f"\n--- 【{shop_name}】の頻出名詞 TOP 5 ---")

        # 2. その店舗の全口コミを一つに連結
        all_reviews_text = ' '.join(group['review_text'].dropna())

        # 3. 形態素解析で名詞を抽出
        nouns = []
        for token in t.tokenize(all_reviews_text):
            # 品詞が名詞で、ストップワードに含まれていない単語のみを抽出
            if token.part_of_speech.startswith('名詞') and token.surface not in stop_words:
                nouns.append(token.surface)
        
        # 4. 単語の出現回数をカウントし、ランキングを作成
        word_counts = Counter(nouns)
        
        # 最も多く出現した5つの単語を表示
        for word, count in word_counts.most_common(5):
            print(f"{word}: {count}回")


--- 【1129 by Ogawa】の頻出名詞 TOP 5 ---
...: 355回
ハンバーグ: 210回
台場: 192回
店: 180回
席: 142回

--- 【82 築地店】の頻出名詞 TOP 5 ---
築地: 45回
...: 42回
店: 40回
ビール: 14回
パブ: 12回

--- 【ABURI 百貫 有明ガーデン店】の頻出名詞 TOP 5 ---
寿司: 142回
...: 134回
回転: 85回
店: 76回
有明: 63回

--- 【ARIAKE ARENA CAFE】の頻出名詞 TOP 5 ---
アリーナ: 15回
...: 12回
有明: 11回
ライブ: 9回
の: 6回

--- 【ARIAKE ARENA DINING MOON RIVER】の頻出名詞 TOP 5 ---
...: 8回
アリーナ: 7回
店: 6回
有明: 6回
カフェ: 5回

--- 【AkeruE】の頻出名詞 TOP 5 ---
国際: 1回
展示: 1回
場: 1回
駅: 1回
左手: 1回

--- 【Ariake Miraie】の頻出名詞 TOP 5 ---
...: 9回
カフェ: 7回
中: 7回
トヨタ: 5回
ディーラー: 5回

--- 【BBQ PLAY GROUND お台場デックス東京ビーチ店】の頻出名詞 TOP 5 ---
...: 20回
台場: 11回
BBQ: 11回
持ち込み: 8回
の: 8回

--- 【BISTRO うしすけ】の頻出名詞 TOP 5 ---
...: 110回
店: 79回
犬: 63回
台場: 53回
ランチ: 47回

--- 【BLUE TABLE Odaiba】の頻出名詞 TOP 5 ---
...: 23回
台場: 11回
店: 10回
海: 8回
ランチ: 8回

--- 【Bistro961】の頻出名詞 TOP 5 ---
...: 18回
店: 15回
ワイン: 14回
階: 11回
2: 9回

--- 【Bomb! Dogs】の頻出名詞 TOP 5 ---
ポテト: 2回
ソース: 2回
店: 2回
ランチ: 1回
飛び込み: 1回

--- 【Brew33 Bar】の頻出名詞 TOP 5 ---
ダイニング: 1回
レストラン: 1回
様: 1回
カジュアル: 1回