In [None]:
import pandas as pd
from janome.tokenizer import Tokenizer

# --- 準備 ---
# 上記の atmosphere_dictionary をここに貼り付け
atmosphere_dictionary = {
    'quiet': ['静か', '落ち着く', '穏やか', '静寂', 'ゆっくり', 'ひっそり'],
    'lively': ['賑やか', 'にぎやか', 'ガヤガヤ', '活気', 'ワイワイ', '盛り上がる'],
    'stylish': ['おしゃれ', 'オシャレ', 'スタイリッシュ', 'モダン', '洗練', 'デザイン'],
    'cozy': ['アットホーム', '隠れ家', 'こぢんまり', 'アットホーム', '温かい'],
    'formal': ['高級', 'ラグジュアリー', 'フォーマル', '贅沢', '記念日', '接待'],
}

try:
    df = pd.read_csv('/Users/dangararara/lecture/miraisouzou/csv/odaiba_reviews.csv')
except FileNotFoundError:
    print("エラー: 'odaiba_reviews.csv'が見つかりません。")
    exit()

# --- メイン処理 ---
if __name__ == '__main__':
    # 店舗ごとに口コミを一つの文章にまとめる
    shop_docs = df.groupby('shop_name')['review_text'].apply(lambda x: ' '.join(x.dropna())).reset_index()

    # スコアを格納するためのリストを準備
    atmosphere_scores = []
    total_shops = len(shop_docs)
    
    print("各店舗の雰囲気スコアを計算中...")

    # 1店舗ずつ処理
    for index, row in shop_docs.iterrows():
        shop_name = row['shop_name']
        review_text = row['review_text']
        
        # この店舗のスコアを記録する辞書
        scores = {'shop_name': shop_name}
        
        # レビューの総文字数を計算（スコアの正規化のため）
        total_length = len(review_text)
        if total_length == 0:
            total_length = 1 # ゼロ除算を避ける

        # atmosphere_dictionaryの各カテゴリについてスコアを計算
        for category, keywords in atmosphere_dictionary.items():
            count = 0
            # カテゴリ内の各キーワードが、口コミに何回出現するかを数える
            for keyword in keywords:
                count += review_text.count(keyword)
            
            # 出現回数を総文字数で割り、スコアとする（出現密度）
            # 1000を掛けて、スコアの桁を分かりやすく調整
            scores[category + '_score'] = (count / total_length) * 1000

        atmosphere_scores.append(scores)
        print(f"  [{index + 1}/{total_shops}] {shop_name} のスコア計算完了．")

    # 結果を新しいDataFrameに変換
    df_atmosphere = pd.DataFrame(atmosphere_scores)

    print("\n--- 雰囲気スコア計算結果（上位5店舗）---")
    print(df_atmosphere.head())

    # 結果をCSVに保存
    df_atmosphere.to_csv('csv/shop_atmosphere_scores.csv', index=False, encoding='utf-8-sig')
    print("\n計算結果を「shop_atmosphere_scores.csv」に保存しました。")

各店舗の雰囲気スコアを計算中...
  [1/563] 1129 by Ogawa のスコア計算完了．
  [2/563] 82 築地店 のスコア計算完了．
  [3/563] ABURI 百貫 有明ガーデン店 のスコア計算完了．
  [4/563] ARIAKE ARENA CAFE のスコア計算完了．
  [5/563] ARIAKE ARENA DINING MOON RIVER のスコア計算完了．
  [6/563] AkeruE のスコア計算完了．
  [7/563] Ariake Miraie のスコア計算完了．
  [8/563] BBQ PLAY GROUND お台場デックス東京ビーチ店 のスコア計算完了．
  [9/563] BISTRO うしすけ のスコア計算完了．
  [10/563] BLUE TABLE Odaiba のスコア計算完了．
  [11/563] Bistro961 のスコア計算完了．
  [12/563] Bomb! Dogs のスコア計算完了．
  [13/563] Brew33 Bar のスコア計算完了．
  [14/563] CAFE TERIA BLUE のスコア計算完了．
  [15/563] Cha pi のスコア計算完了．
  [16/563] Chez コバラヘッタ 有明ガーデン店 のスコア計算完了．
  [17/563] CoCo壱番屋 ワンザ有明店 のスコア計算完了．
  [18/563] Cuore のスコア計算完了．
  [19/563] D-ラウンジ のスコア計算完了．
  [20/563] DAIBA のスコア計算完了．
  [21/563] DOG DEPT お台場東京ビーチ店 のスコア計算完了．
  [22/563] DOLCE VITA のスコア計算完了．
  [23/563] Deli&Cafe Uran のスコア計算完了．
  [24/563] Domino's Pizza  ARIAKE GARDEN のスコア計算完了．
  [25/563] Eat it! 東京ビッグサイト店 のスコア計算完了．
  [26/563] FARMS' KITCHEN MIKIKE TOKYO ODAIBA のスコア計算完了．
  [27/563] GODIVA アクアシティお台場店 のスコア計算完了．
 