In [3]:
import pandas as pd
from gensim import corpora, models
from gensim.models.ldamodel import LdaModel
import pyLDAvis.gensim_models as gensimvis
import pyLDAvis
import numpy as np
import re
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from tqdm import tqdm

# 加载Excel文件
file_path = '/data1/dxw_data/llm/RAG-mkt-kmeans/data1/cleaned_comments_dianping_hotpot.xlsx'
df = pd.read_excel(file_path)

# 文本预处理函数
def preprocess_text(text):
    # 移除标点符号和数字
    text = re.sub(r'\d+', '', text)
    text = re.sub(r'[^\w\s]', '', text)
    # 转小写
    text = text.lower()
    # 分词
    tokens = word_tokenize(text)
    # 移除停用词
    tokens = [word for word in tokens if word not in stopwords.words('chinese')]
    return tokens

# 对每条评论进行预处理
tqdm.pandas(desc="Preprocessing comments")
df['cleaned_tokens'] = df['cleaned_comment'].progress_apply(preprocess_text)

# 创建词典和语料库
dictionary = corpora.Dictionary(df['cleaned_tokens'])
corpus = [dictionary.doc2bow(tokens) for tokens in df['cleaned_tokens']]

# 训练LDA模型
lda_model = LdaModel(corpus, num_topics=10, id2word=dictionary, passes=15)

# 输出主题
for idx, topic in lda_model.print_topics(-1):
    print(f"Topic: {idx}\nWords: {topic}\n")



Preprocessing comments: 100%|██████████| 962/962 [00:00<00:00, 3576.31it/s]


Topic: 0
Words: 0.005*"过生日朋友非要请吃饭看多非要海底捞说嗨嗨吃环境环境干净座位很大空间挺舒服服务海底捞服务不用说一流哥哥没带蛋糕送蛋糕送面条送娃娃挺满意喔下次还会来过生日" + 0.005*"吃回海底捞集合图方式发出菜品不错最最感谢服务员每次赠送果盘服务蛮还会收到小朋友玩具不倒翁飞机化妆镜有时候还会收到土味情话哈哈哈" + 0.005*"烤肉好吃小菜免费续店员哥哥全场帮烤" + 0.005*"闺蜜约壹海城看海先吃个烤肉环境不错坐外面风景位置服务小姐姐不错帮忙烤肉薄五花小菜海带汤肉品质不错小菜任吃喜欢吃花生糯糯好吃" + 0.005*"烤牛排烤羊排味道不错坐靠窗位置栈道走累慢慢吃个烤肉舒服好吃小菜好吃随意续调料不错点两个肉感觉就够五花肉没吃饱环境环境舒适适合情侣朋友家服务服务不错小哥小姐姐" + 0.005*"雪花牛肉小菜烤卷五花肉石锅拌饭老实说第一次好吃肉没新鲜感觉变价格偏高总体满意盐田找不到烤肉店真的只能罗湖盐田吃" + 0.005*"店里肉牛舌好好好好吃泡菜饼五花肉小菜好吃芝士鸡蛋免费加环境工作人员帮忙烤肉" + 0.005*"推荐吃烤肉首选态度环境舒服适合聚餐烤肉好吃美滋滋" + 0.005*"亲家环境不错舒适感觉家服务到位我能感觉贴心愉快家口味非常适合味蕾点荤素搭配符合吃海底捞氛围下次吃满意衷心感谢舒适环境友好服务热情如火难忘回去回忆起美食这是海底捞带给" + 0.005*"蹭仙女棒海底捞"

Topic: 1
Words: 0.006*"壹海城服务态度不错" + 0.006*"小菜土豆泥泡白菜泡萝卜酱花生凉皮豆芽菜服务不错帮忙烤肉免费生菜三个女孩同行点双人套餐一份炒饭吃饱牛肉不错五花肉差点" + 0.006*"难吃吓人假冒姜虎东白丁服务肉跟不上泡菜好像碎片丁丁" + 0.006*"朋友海底捞新出菜品尝试蛮不错爱牛蛙回来真的希望恢复菜品服务依旧夸一夸服务员彭荣明亲和力认真负责五分好评" + 0.006*"事单人套餐干完元吃撑绝绝子菜品求安利人去吃海底捞感觉太棒了对面还放一只橘发娃娃调好吃蘸料必点菜品清油麻辣锅火锅牛排虾滑新尝试无骨鸭掌不错牛蛙奶酪鱼柳啥时候服务哥哥帮儿童套餐改那天阴暗心情曙光真幸运蜡笔小新电视支架特地煮一盅番茄汤上香菜牛肉粒绝绝子西瓜爱好撑海底捞喜欢" + 0.006*"八块钱甩面小哥来到面前甩个一分钟面饭后做手部护

In [None]:
# Preprocessing comments: 100%|██████████| 962/962 [00:00<00:00, 3576.31it/s]
# Topic: 0
# Words: 0.005*"过生日朋友非要请吃饭看多非要海底捞说嗨嗨吃环境环境干净座位很大空间挺舒服服务海底捞服务不用说一流哥哥没带蛋糕送蛋糕送面条送娃娃挺满意喔下次还会来过生日" + 0.005*"吃回海底捞集合图方式发出菜品不错最最感谢服务员每次赠送果盘服务蛮还会收到小朋友玩具不倒翁飞机化妆镜有时候还会收到土味情话哈哈哈" + 0.005*"烤肉好吃小菜免费续店员哥哥全场帮烤" + 0.005*"闺蜜约壹海城看海先吃个烤肉环境不错坐外面风景位置服务小姐姐不错帮忙烤肉薄五花小菜海带汤肉品质不错小菜任吃喜欢吃花生糯糯好吃" + 0.005*"烤牛排烤羊排味道不错坐靠窗位置栈道走累慢慢吃个烤肉舒服好吃小菜好吃随意续调料不错点两个肉感觉就够五花肉没吃饱环境环境舒适适合情侣朋友家服务服务不错小哥小姐姐" + 0.005*"雪花牛肉小菜烤卷五花肉石锅拌饭老实说第一次好吃肉没新鲜感觉变价格偏高总体满意盐田找不到烤肉店真的只能罗湖盐田吃" + 0.005*"店里肉牛舌好好好好吃泡菜饼五花肉小菜好吃芝士鸡蛋免费加环境工作人员帮忙烤肉" + 0.005*"推荐吃烤肉首选态度环境舒服适合聚餐烤肉好吃美滋滋" + 0.005*"亲家环境不错舒适感觉家服务到位我能感觉贴心愉快家口味非常适合味蕾点荤素搭配符合吃海底捞氛围下次吃满意衷心感谢舒适环境友好服务热情如火难忘回去回忆起美食这是海底捞带给" + 0.005*"蹭仙女棒海底捞"

# Topic: 1
# Words: 0.006*"壹海城服务态度不错" + 0.006*"小菜土豆泥泡白菜泡萝卜酱花生凉皮豆芽菜服务不错帮忙烤肉免费生菜三个女孩同行点双人套餐一份炒饭吃饱牛肉不错五花肉差点" + 0.006*"难吃吓人假冒姜虎东白丁服务肉跟不上泡菜好像碎片丁丁" + 0.006*"朋友海底捞新出菜品尝试蛮不错爱牛蛙回来真的希望恢复菜品服务依旧夸一夸服务员彭荣明亲和力认真负责五分好评" + 0.006*"事单人套餐干完元吃撑绝绝子菜品求安利人去吃海底捞感觉太棒了对面还放一只橘发娃娃调好吃蘸料必点菜品清油麻辣锅火锅牛排虾滑新尝试无骨鸭掌不错牛蛙奶酪鱼柳啥时候服务哥哥帮儿童套餐改那天阴暗心情曙光真幸运蜡笔小新电视支架特地煮一盅番茄汤上香菜牛肉粒绝绝子西瓜爱好撑海底捞喜欢" + 0.006*"八块钱甩面小哥来到面前甩个一分钟面饭后做手部护理工作日美甲吃海底捞服务智能化点单小姐姐还会讲别点太多哥哥很帅颜值高吃得开心看着开心套路管理确实海底捞学" + 0.006*"冬天真的太冷好久没回家带奶奶试试海底捞每次吃海底捞这星悦天地这家排队排一个多小时哭做手部护理美滋滋菜品一如继往好吃虾滑肥牛鸭肠无骨鸭掌每次必点还用捞币换菜品服务员哥哥服务不错" + 0.006*"服务不行吃中午发现十分钟小菜都还没人手情况分配服务区域坐地方服务员餐台坐满人手做借口希望改进盐田这家韩餐口味不错老板不来盯盯服务太行" + 0.006*"地铁口海山站商城楼上好找味道不错环境挺" + 0.006*"深圳冷冷的约小伙伴火锅走海底捞服务不用说一如既往锅底必点番茄锅自制番茄牛肉汤猪肚鸡汤锅不错料小吃喜欢现炸酥肉菜推荐剥皮鱼耗儿鱼本来想点猪脑可惜吃火锅最怕吃完一身味海底捞不用担心"

# Topic: 2
# Words: 0.006*"张明聪哥哥好评棒棒哒加油งง" + 0.006*"吃几次海底捞老人家满意服务态度实在太好了带老人送礼品老人自然欢喜家里人过生日疫情情况长寿面" + 0.006*"星期三吃烤肉位置不用烤服务员考肉还点雪花牛肉好吃帶朋友吃" + 0.006*"环境拥挤桌子全是油渍很脏纸擦一遍抽油烟机往下滴黑油服务员擦桌子敷衍了事服务说实在话没感受服务自助第一次年轻弟弟没听到看桌需求告诉听看桌好像隔壁两桌服务对象烤肉加小菜这桌隔壁看桌反正吃服务员问一句加菜消失不见明白周末人多真的敷衍感觉店里年轻临时工店里收餐阿姨服务意识太掉分桌子真的很油麻烦擦一擦干净" + 0.006*"味道不错一家烤肉店" + 0.006*"晚上朋友生日聚餐晚不用排队超级喜欢大片毛肚涮好翠翠扒皮鱼喜欢吃完半分一份有个疑惑扒皮鱼小黄鱼服务一如既往热心小姐姐生日送礼物海底捞小吃" + 0.006*"环境干净整体符合韩式料理风格菜品好吃踩雷店员烤肉技术很香好吃进店用餐结束愉快心情下次" + 0.006*"跟着朋友试一下这家烤肉进门比较简单装修惊喜刚坐下满满一桌小菜哈哈哈重点吃完续加哈哈哈爱爱上菜服务员帮忙烤肉坐等吃还会光顾满意体验踩雷" + 0.006*"趣生活代言真的每到一段时间摧一吃真很久没吃点番茄火锅泰式冬阴功锅底两个清水汤底点面筋适合吸汁想试试冬阴功味道番茄好吃还点捞派沙鱼真的意外不错酥肉煮番茄汤底里好吃ω怕太腻点个金银馒头吃发现不用点太多自助凉菜小吃水果饱味道不错服务蛮出名" + 0.006*"这家烤肉不错服务帮忙烤肉有求必应生意太好忙不过来负责几桌老担心烤糊喜欢牛肉羊肉自创吃法烤肉裹满满的芝士沾干辣椒孜然真的高热量吃法腻时包生菜吃吃肉想减肥事快乐减半"

# Topic: 3
# Words: 0.006*"行感觉座位油腻腻周末价格行一试" + 0.006*"晚下班想吃火锅唯一想到没关门海底捞棒爱海底捞牛油渣虾滑永远挚爱永远好吃响铃喜欢入味很辣爱牛肉太喜欢点错再点不太感觉老长牛肉卷酥肉一点点失望好像香湿润感觉" + 0.006*"环境挺舒适服务超好重点前菜好吃特别点赞小菜系列饭团口感入口海苔甜酱蜂蜜芥辣酱口味夹特别不腻小孩估计超爱味道" + 0.006*"味道棒值得推荐小吃肉新新朋友每次盐田吃" + 0.006*"猪肚鸡汤底味道服务热情周到特别小琴妹妹服务态度超级" + 0.006*"地铁口走米位置好找服务员态度真的很细鑫调料台东西自由搭配很棒每次必点番茄锅底酸甜口感适中不腻特别捞面煮口感真的太好强烈推荐豆花入味口感整体体验感十足" + 0.006*"盐田排队时间长一家店感觉仿照一家店做味道差距蛮大价格差距并不大海鲜豆腐汤烤肉行凑合吃盐田吃烤肉地方冷面味道" + 0.006*"菜品特色多种多样好吃专人烤肉服务不错" + 0.006*"全家吃服务热情味道很赞" + 0.006*"烤肉不错服务态度不行几个阿姨加点小菜磨磨叽叽说说吃完烤肉帮忙看着烤糊"

# Topic: 4
# Words: 0.006*"吃开心天气冷吃热乎乎火锅太服务员哥哥小豪非常热心好玩还给摆牙签小游戏小游戏脑洞可爱玩偶" + 0.006*"价格优惠双人餐两个吃饱饱小菜生菜免费限量供应环境壹海城二楼通往天桥位置石锅拌饭拌饭超级美味烤原味猪颈肉嫩嫩滑滑烤滋滋香鸡蛋液喜欢一圈鸡蛋液芝士" + 0.006*"环境海底捞环境真的没得讲肉眼地方干净卫生服务服务员太热心有时候不好意思就行了社恐有点儿些许捞派鸭肠鸭肠火锅必点闭眼点捞派毛肚必点菌汤锅底不太能吃辣爱锅底" + 0.006*"朋友聚餐烤肉不错吃第三次服务态度满意环境推介试试" + 0.006*"吃火锅首选海底捞服务真的惊人价格贵到哪去礼品调料区水果牛肉粒挺值三个吃菜点半份够吃番茄汤底绝一口汤泡牛肉粒服务真的上头怪不好意思吃挺过瘾满意" + 0.006*"雪花牛肉真肉胸叉肉合成拼接痕迹太烤后肉两种肉颜色咬不动服务员换一盘肉再也" + 0.006*"依旧想好评一家店这才心目中烤肉模样下单套餐贼划算单点牛雪花饱到扶墙走每片肉贼新鲜哥哥负责烤肉负责吃小菜无限续家泡菜真的入味新鲜吃烤肉喜欢生菜叶夹肉泡菜吃绝绝子唯一不好点这家店真的远每次想吃想到跑盐田劝退味道真的很棒" + 0.006*"烤肉挺好吃服务态度吃炒年糕值得推荐" + 0.006*"环境干净整洁自助蘸料区时不时哥哥小姐姐擦擦擦服务服务真的习惯周到夸夸哥哥辛苦帮虾滑塞进豆腐泡静静小姐姐帮做手部护理脾气好好体验一把海底捞过生日终于围观围观差距送玩具开心" + 0.006*"服务不行韩式烤肉小料免费续加喊服务员半天没上菜很慢烤肉"

# Topic: 5
# Words: 0.006*"坐靠窗位置风景特别蓝天白云早店里没什么体验感很棒特别服务员哥哥特别耐心烤肉帮续小菜看着分量很大很顶饱女孩子刚刚门口免费老冰棍吃" + 0.006*"深圳出名刷分捞最差服务态度跪区别对待国人店员虚假海底捞店长最会刷分海底捞分店" + 0.006*"前两天吃烤肉两人份套餐份量够每次吃撑小菜烤调味牛肋条青菜小料吃完加挺喜欢芝士烤肉吃味道很棒环境感觉陈旧好多年升级改造更好总体不错推荐" + 0.006*"买三人套餐三个份量刚刚小菜续烤肉孜然味味道很赞烤五花肉滋滋冒油看着就让想吃冲动想着快点烤快点吃是我太饿原因哈哈哈五花肉包着生菜吃解腻单独吃油石锅拌饭葱油饼不错海带汤吃完肉喝口汤完美噢单独点一份鳗鱼烤鳗鱼好吃下次吃人均一百多" + 0.006*"搬到布吉没吃海底捞偶然间路过发现大芬地铁站这家海底捞欣喜若狂冲着海底捞服务想吃火锅想到海底捞好似没做手部护理地方眼瞎有时候享受网上提到超级到位服务火锅届服务排第一" + 0.006*"味道商圈里唯一一家规模烤肉店多人排队上次吃小菜里毛服务员想端走说没碰过免费小菜没空闲时间搞事情想愉快吃饭消费者不让服务员端走希望端一份新这份拿走服务态度不好我要拍照服务员急说不让拍照纳闷儿态度经理出面带厨师道歉舒服一点点桌点很多很多菜结账经理打了个折算是希望店里错误勇敢承认担心客户拍照发评论客户最终态度消费者心情愉快" + 0.006*"朋友吃韩国烤肉看不起不错商场门口烤肉好吃不错选择打卡" + 0.006*"服务真的一般般叫个水没人水答应没人水人员紧缺理解第一次希望重视" + 0.006*"海底捞地方服务朋友聚餐好去处" + 0.006*"壹海城特色一家店烤肉好吃调料更入味完美总体不错踩坑"

# Topic: 6
# Words: 0.005*"好吃每次聚餐选这家烤肉店好评店里员工服务超级棒下次还来" + 0.005*"晚上盐田找吃临时试试赶上节假日排队自然少不了买双人套餐还会担心说会吃肉好像每盘发现分量足够肉品质不错用餐味觉体验满意唯一提醒感觉人一多服务吃力跟不上适合年轻人小聚地方" + 0.005*"这家烤肉店噜疫情生意不好做原因老板成本控制这方面把握越来越紧餐前送小料品种越来越少土豆泥一血萝卜丝泡菜包肉蔬菜生菜黄瓜胡萝卜孤零零生菜主动招手大半天服务员坐下老半天服务员想配个小料辣椒蒜头完一会儿新沙头角一家韩式烤肉" + 0.005*"下班剪头发时间晚营业凌晨七点海底捞环境环境深圳家分店喜欢吃火锅大部分火锅店吃海底捞服务贴心楠火锅很火排队好久大龙燚火锅吃拉肚子肠胃家火锅下次分享服务服务员啊炜态度细心猪脑花好吃每次吃必点酸奶小兔兔兔兔可爱吃兔兔送鱼籽福袋好吃煮辣味道临走时送零食" + 0.005*"海底捞服务一向出了名这家例外每次服务态度小食好吃每次临走送一袋说菜品感觉挺新鲜挺卫生喜欢吃虾滑好吃不腻每次必点鸭肠不错涮几秒吃" + 0.005*"过生日海底捞热闹开心老人家喜欢满意反正平时花钱节省老人家海底捞优惠性价比高过生日真心推荐海底捞汽车送报备鸡蛋羹送小宝贝很爽周末做指甲可惜" + 0.005*"好吃已經來朋友吃" + 0.005*"晚上九点多去吃不用排队服务店海底捞太店服务下次想这家不怎么样感觉全程收盘子食材新鲜分店座位旁边贴食材煮几分钟服务员服务员说煮几分钟环境还行服务店食材新鲜外面火锅店价格便宜海底捞主打服务无感第二次生蚝缩水特别很小很小一粒油条下锅煮硬邦邦的" + 0.005*"海底捞吃选每次扶墙出门每次必点脆毛肚血旺豆腐肥牛当天胃口没喝他家啤酒试桂花啤酒味道清香好喝一个月吃两次还会送一张代金券不错服务态度他家特色大人小孩照顾小孩每次开心礼物收" + 0.005*"烤肉味道服务员态度冰激凌送小菜比肉好吃"

# Topic: 7
# Words: 0.006*"挺地方很大服务不错东西挺好吃环境不错店面尝一尝丹竹头地铁站星悦天地一楼整层一半面积海底捞地铁站出口走商场推荐吃牛肚超级好吃" + 0.006*"环境韩式风格烤肉店壹海城二楼热闹客流量生意服务服务员小姐姐人美心善全程帮忙烤肉添茶倒水丝毫犹豫服务老板得加鸡腿点牛肋条厚切五花肉猪颈肉海鲜炒饭炒饭吃太快忘记拍照普普通通食材能炒好吃很棒小菜无限添加烤肉店比不上喜欢这家菜品服务价格成正比下次吃烤肉一件幸福事" + 0.006*"韩国烤肉美味满溢精选肉质鲜嫩多汁火红炭火烧烤扑鼻品味香气口感醇厚调味酱料搭配独特烹饪技艺精湛亲朋好友共享盛宴热情服务待客如亲融合风味留连忘返韩国烤肉陶醉永远爱韩国烤肉令人陶醉嫩肉入口滋味绵长炭火烧烤香气四溢辣椒酱料调味得当独特风味饕客称赞用料考究品质保证服务周到笑容可掬韩国文化烤肉代表与友共聚快乐满盈热闹气氛情谊升温欢声笑语乐在其中韩国烤肉美食之王无与伦比值得追捧" + 0.006*"周末惬意事约三五好友吃火锅吖犹豫不决再三之下选择吃海底捞听同事说海底捞服务体验名不虚传工作人员热情脸上面对微笑一种亲切感觉戴眼镜免费帮忙清洗免费护理指甲排队排久" + 0.006*"烤肉不错肉种类挺食材新鲜价格高服务态度" + 0.006*"味道服务满意" + 0.006*"图二生菜没无限吃生菜自助餐肉份量不算少肉人吃足够位置壹海城二期天桥第一家咯" + 0.006*"春节前约姐妹吃心心念念海底捞喜欢吃东西点全服务员提醒两个吃权衡删掉吃巨撑酥肉一般般肥牛虾滑鸭肠毛肚太爱锅底建议二分之一辣锅服务太到位喜欢吃爆米花临走零食爆米花居多卫生间漱口水回家单蛮美甲" + 0.006*"三个人点套餐肉新鲜五花肉端上来皮呈现一种紧缩状态服务专业烤完肉收回带油烤盘服务员导致带油烤盘溅脸上离谱客观说海带汤小菜免费补充服务员一盘花生说花生走传菜台花生" + 0.006*"味道小哥帮忙烤肉菜品新鲜肉大块配菜泡菜炒饭好吃海鲜豆腐脑辣汤好吃五星推荐好极了好极了好极了推荐吃卫生干净放心小菜无限续加服务态度适合聚餐"

# Topic: 8
# Words: 0.006*"好吃点全肉套餐两个份量" + 0.006*"这家出乎意料好吃大份端午节老虎涧玩完壹海城吃饭无意选这家肉质分量足吃调味牛肋条牛舌五花肉年糕海鲜饼冷面踩雷配蘸料味道年糕选不辣好吃娃吃送雪糕折不到块市区划算太多盐田还会来吃" + 0.006*"沙头角人民烤肉食堂小朋友想吃烤肉想到性价比不错" + 0.006*"丹竹头店服务态度没得说热情招待下菜加汤印象最深菜品他家滑虾好吃不错三个人多吃饱他家平时美甲周六日手部护理吃完做护理感觉棒棒哒" + 0.006*"环境坐在窗边舒服环境不错服务服务有求必应还会帮忙烤肉小菜小菜款式韩式泡菜饼吃更好吃海鲜豆腐脑辣汤很辣汤泡饭绝雪花牛肉牛肉很嫩烤卷五花肉五花肉很棒必点整体不错" + 0.006*"美团大众点评活动太给力单点姐妹三百左右双人套餐三个肉饭才不到二百环境不错伴有音乐推荐推荐推荐" + 0.006*"出差跑中午找店吃饭环境烤肉店服务选择烤帮忙烤味道烤肉好吃小菜里泡青瓜好吃解腻吃肉包很棒" + 0.006*"带家婆海底捞哈哈哈海底捞脆皮肠好好吃免费送一份孕妇送礼物吃小孩子送酸奶奶牛布丁零食玩具小姐姐耐心服务一如既往" + 0.006*"南山这家店跑这家店前年朋友带去吃吃无法自拔心中烤肉拖真的好吃服务吃刚刚赶上壹海城停电焦虑吃店长大大的赞服务员口中店长应急环境方式算得当布丁哈哈哈哈环境建议白天靠窗刚刚草坪想想看着草坪嬉笑打闹吃烤肉真的幸福坐靠窗全程朋友帅哥吃烤肉帅哥幸福感真的推荐任何人不去难过拜托疫情快点结束太馋" + 0.006*"服务态度点辣锅特意送银耳解辣"

# Topic: 9
# Words: 0.006*"位置丹竹头出口一家海底捞小时营业晚上点没什么现炸酥肉额说不脆酥肉不脆好吃冰皮麻薯真的太甜好吃菜品中规中矩吃个火锅至少十人过生日唱生日歌服务这方面真的吃几家海底捞服务最差一家坐久杯子喊杯子锅底久沸腾一会上菜搞不懂二十四小时营业点关灯没走灯关剩下一桌开着灯" + 0.006*"环境不错捞派鸭肠好吃好吃好吃好吃好吃好吃服务服务没法说超级不愧餐饮行业老大吃吃完服务员服务不好意思走送礼品更好一段甩来甩面第一次见到哈哈哈农村成长见识少莫怪哈哈哈想吃服务超级全国餐饮海底捞" + 0.006*"春节壹海城这家烤肉店不错不错很棒吃几回赞赞赞" + 0.006*"环境不错一楼挺找到位置服务很棒特别服务桌哥哥嘻嘻招牌虾滑每次点现炸酥肉火锅没熟先吃点小吃嘻嘻捞派毛肚脆嚼劲有空带上哥哥小姐姐打卡" + 0.006*"丹竹头海底捞环境环境中规中矩店弄生日更氛围一点贴几个位置生日气氛气球服务海底捞服务不用质疑消费服务成奈斯朋友昨天生日吃海底捞谢谢小姐姐帮忙拍照片特别好看成品桌子小花蛮不错第一次海底捞体验过生日感觉尴尬尴尬太可爱番茄火锅番茄汤底真的贼好喝每次海底捞必点店口味相差越煮越浓越煮越香太赞不错" + 0.006*"服务员热情态度店内环境很棒菜品超级好吃" + 0.006*"服务太好了特别谢谢小慧热情满满的正能量" + 0.006*"爱番茄锅味道一级棒服务没话说杠杠哥哥谭琦长好看可爱爱服务爱爱海底捞服务态度希望每次指定服务" + 0.006*"真的很差这家店东西少要死贵千万别来图点肉" + 0.006*"饭店客流量顾及理解这桌阿姨服务真的一言难尽肉明明烤非要堆叠烤跑火太大烤糊无奈之下只能试着翻烤一会阿姨烤盘黑乎乎照样烤发了脾气慢吞吞换烤盘第二次真实用餐体验"



In [5]:
import pandas as pd
from gensim import corpora, models
from gensim.models.ldamodel import LdaModel
import pyLDAvis.gensim_models as gensimvis
import pyLDAvis
import numpy as np
import re
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from tqdm import tqdm

# 加载Excel文件
file_path = '/data1/dxw_data/llm/RAG-mkt-kmeans/data2/cleaned_comments_dianping_barbecue.xlsx'
df = pd.read_excel(file_path)

# 文本预处理函数
def preprocess_text(text):
    # 移除标点符号和数字
    text = re.sub(r'\d+', '', text)
    text = re.sub(r'[^\w\s]', '', text)
    # 转小写
    text = text.lower()
    # 分词
    tokens = word_tokenize(text)
    # 移除停用词
    tokens = [word for word in tokens if word not in stopwords.words('chinese')]
    return tokens

# 对每条评论进行预处理
tqdm.pandas(desc="Preprocessing comments")
df['cleaned_tokens'] = df['cleaned_comment'].progress_apply(preprocess_text)

# 创建词典和语料库
dictionary = corpora.Dictionary(df['cleaned_tokens'])
corpus = [dictionary.doc2bow(tokens) for tokens in df['cleaned_tokens']]

# 训练LDA模型
lda_model = LdaModel(corpus, num_topics=10, id2word=dictionary, passes=15)

# 输出主题
for idx, topic in lda_model.print_topics(-1):
    print(f"Topic: {idx}\nWords: {topic}\n")



Preprocessing comments: 100%|██████████| 790/790 [00:00<00:00, 3546.74it/s]


Topic: 0
Words: 0.007*"吃烤肉味道不错哥哥小姐姐热情" + 0.007*"环境壹海城二期二楼一家烧烤店人气旺盛雪花牛肉小菜烤卷五花肉烤调味牛肋条烤牛舌烤原味猪颈肉烤鸡蛋液烤鳗鱼芝士碎薄五花小哥负责烤到位吃开心味道不错坐位靠近窗户户外风景美" + 0.007*"朋友吃烤肉环境服务员帮忙烤肉点雪花牛肉泡菜饼好吃带朋友家人吃选择下次有空打卡" + 0.007*"环境环境优美第一次吃烤肉上菜速度挺快服务店员服务态度不错" + 0.007*"南山这家店跑这家店前年朋友带去吃吃无法自拔心中烤肉拖真的好吃服务吃刚刚赶上壹海城停电焦虑吃店长大大的赞服务员口中店长应急环境方式算得当布丁哈哈哈哈环境建议白天靠窗刚刚草坪想想看着草坪嬉笑打闹吃烤肉真的幸福坐靠窗全程朋友帅哥吃烤肉帅哥幸福感真的推荐任何人不去难过拜托疫情快点结束太馋" + 0.007*"大半个钟没上菜漏单" + 0.007*"价格便宜环境差份量接受难吃牛板腱一点牛肉味道血水吃最差烤肉店" + 0.007*"年第一顿烤肉韩国传统烤肉先点雪花牛肉五花肉牛肉口感真不错酱汤好多料豆腐好软蛤蜊瓜类炒年糕试试有辣有不辣真的喜欢软软糯糯口感店里安排韩国哥哥烤肉吃韩料仪式感" + 0.007*"第二次吃服务帮忙烤生菜免费续" + 0.007*"服务饭好吃环境蛮"

Topic: 1
Words: 0.007*"整体贵味道用餐等待时间长" + 0.007*"点两份五六十元圆烤肉牛肋条肉质惊艳与众不同感觉小菜很棒石锅拌饭要加调料酱味道很淡加拌饭酱味道黄头发服务员小姐姐贴心有问必答菜品介绍详细帮烤帮切主动添加喜欢小菜两个人用一张抵优惠券总共花费吃很饱" + 0.007*"菜品口味不错确认眼神喜欢吃烤肉送韩国饮料好喝葡萄果粒饮料烤肉好吃店里生意提前排队等待美味东西值得等待小吃小菜好吃续上店里冰淇淋免费喜欢" + 0.007*"环境刚开业期间拍沙头角烤肉想吃烤肉沙头角吃终于烤肉开进沙头角味道不错小菜吃烤肉前吃饱五花肉值得推荐剪完一条烤熟一点吃好吃" + 0.007*"推荐真的好吃希望多开分店开南山" + 0.007*"恋上烤肉韩国传统烤肉模式现场火爆好多排队个餐小时肚子饿扁一口气点雪花龙牛肉雪花牛肉牛肉粒芝士炒年糕石锅拌饭碟子菇技术不太好服务员太忙没办法照顾牛肉没烤出应有水平太浪费年糕味道不错吃饱饱" + 0.007*"点二人套

In [None]:
# Preprocessing comments: 100%|██████████| 790/790 [00:00<00:00, 3546.74it/s]
# Topic: 0
# Words: 0.007*"吃烤肉味道不错哥哥小姐姐热情" + 0.007*"环境壹海城二期二楼一家烧烤店人气旺盛雪花牛肉小菜烤卷五花肉烤调味牛肋条烤牛舌烤原味猪颈肉烤鸡蛋液烤鳗鱼芝士碎薄五花小哥负责烤到位吃开心味道不错坐位靠近窗户户外风景美" + 0.007*"朋友吃烤肉环境服务员帮忙烤肉点雪花牛肉泡菜饼好吃带朋友家人吃选择下次有空打卡" + 0.007*"环境环境优美第一次吃烤肉上菜速度挺快服务店员服务态度不错" + 0.007*"南山这家店跑这家店前年朋友带去吃吃无法自拔心中烤肉拖真的好吃服务吃刚刚赶上壹海城停电焦虑吃店长大大的赞服务员口中店长应急环境方式算得当布丁哈哈哈哈环境建议白天靠窗刚刚草坪想想看着草坪嬉笑打闹吃烤肉真的幸福坐靠窗全程朋友帅哥吃烤肉帅哥幸福感真的推荐任何人不去难过拜托疫情快点结束太馋" + 0.007*"大半个钟没上菜漏单" + 0.007*"价格便宜环境差份量接受难吃牛板腱一点牛肉味道血水吃最差烤肉店" + 0.007*"年第一顿烤肉韩国传统烤肉先点雪花牛肉五花肉牛肉口感真不错酱汤好多料豆腐好软蛤蜊瓜类炒年糕试试有辣有不辣真的喜欢软软糯糯口感店里安排韩国哥哥烤肉吃韩料仪式感" + 0.007*"第二次吃服务帮忙烤生菜免费续" + 0.007*"服务饭好吃环境蛮"

# Topic: 1
# Words: 0.007*"整体贵味道用餐等待时间长" + 0.007*"点两份五六十元圆烤肉牛肋条肉质惊艳与众不同感觉小菜很棒石锅拌饭要加调料酱味道很淡加拌饭酱味道黄头发服务员小姐姐贴心有问必答菜品介绍详细帮烤帮切主动添加喜欢小菜两个人用一张抵优惠券总共花费吃很饱" + 0.007*"菜品口味不错确认眼神喜欢吃烤肉送韩国饮料好喝葡萄果粒饮料烤肉好吃店里生意提前排队等待美味东西值得等待小吃小菜好吃续上店里冰淇淋免费喜欢" + 0.007*"环境刚开业期间拍沙头角烤肉想吃烤肉沙头角吃终于烤肉开进沙头角味道不错小菜吃烤肉前吃饱五花肉值得推荐剪完一条烤熟一点吃好吃" + 0.007*"推荐真的好吃希望多开分店开南山" + 0.007*"恋上烤肉韩国传统烤肉模式现场火爆好多排队个餐小时肚子饿扁一口气点雪花龙牛肉雪花牛肉牛肉粒芝士炒年糕石锅拌饭碟子菇技术不太好服务员太忙没办法照顾牛肉没烤出应有水平太浪费年糕味道不错吃饱饱" + 0.007*"点二人套餐划算吃得饱饱菜品新鲜小菜免费续还会光顾" + 0.007*"团团购真的划算两个吃得饱饱小菜海藻好吃" + 0.007*"几次小菜特别好吃不错" + 0.007*"饭点挺服务员勤快需求吃口味偏淡一家烤肉店唯一这碗冷面荞麦味不重酸甜合适夏天吃舒服招商银行好像试一下"

# Topic: 2
# Words: 0.007*"服务态度人员少烤肉动手增加趣味性口味不错推荐推荐服务" + 0.007*"好吃喜欢下次还会来喜欢喜欢" + 0.007*"吃烤肉位置哥哥小姐姐帮烧肉味道環境风景优美" + 0.007*"不错不错好吃性价比高少" + 0.007*"第一次慕名吃小两口屁颠屁颠第一感觉环境不错肉质感觉蛮新鲜味道不错枉特地跑过来吃服务周到好吃小吃蛮符合口味赠饮不错老板韩国中文蛮" + 0.007*"壹海城一家店距离近环境不错店内放歌曲韩国街边味道烤肉好吃小料全" + 0.007*"环境烤肉店位于壹海城二楼天桥接口处好找主打韩国烤肉工作日团购石锅拌饭券吃服务吃石锅拌饭三个开胃小前菜续水挺菜品点牛肉石锅拌饭配料感觉拌饭酱料味道腻开胃小前菜吃开心海带汤挺不错" + 0.007*"服务态度环境不错菜品好吃" + 0.007*"玩回来下午一点点好菜半天没说扫二维码上菜专人切肉询问喜欢生一点熟一点不错肉质量味道价格合适" + 0.007*"距离上次记不住朋友吃份黄金拼盘肉类类别挺吃完停车票免费停车小时坐电梯靠近角落位置好找走路天桥第一家吃完蒙牛布丁吃嘞"

# Topic: 3
# Words: 0.007*"盐田壹海城韩国烤肉整体菜品风格偏某虎东雪花牛肉烤卷五花肉烤猪前瘦肉雪花牛肉肉质烤完缩水肉中规中矩泡菜饼本来想着泡菜饼踩雷没想到泡菜饼真的饼面粉泡菜口感炒年糕炒年糕点辣感觉不辣行儿烤盘旁边芝士加感觉芝士口感入口想奶粉坨整体吃性价比不高小菜无限加菜品特别好吃服务" + 0.007*"烤肉不错肉种类挺食材新鲜价格高服务态度" + 0.007*"有个吴镇哥哥服务特别没东西提醒人来帮烤真的不错" + 0.007*"周末深圳盐田玩这家烤肉店评价整体不错巨想试试没想到偏地方排队吃肉瞬间治愈真的爱两个人眼大肚子点人餐吃撑一桌必备鸡蛋液烤芝士喜欢裹芝士吃炒年糕炒年糕真的疯狂推荐芝士味太浓郁年糕软软糯糯有弹性裹拉丝芝士真的太爽肉放进去裹吃超级美味吃" + 0.007*"好吃选择干净卫生选择吃很饱物美价廉极品" + 0.007*"朋友吃点一百多套餐分量挺足店员小姐姐上菜帮烤肉途中一点慢催很快回应上菜调味料自助生菜黄瓜续加土豆泥好吃泡菜开胃下次" + 0.007*"总体不错肉品质不错服务员帮忙烤肉店里生意感觉服务员忙不过来人均丰俭由人环境挺盐田第一家算是不错烤肉挺推荐小菜免费续加烤盘芝士免费加" + 0.007*"每次路过排队店去试只能说值得排太久队去吃" + 0.007*"环境不错小菜烤肉有人烤负责吃味道" + 0.007*"味道不错服务值得推荐好评"

# Topic: 4
# Words: 0.007*"环境壹海城平时饭点好多排队环境不错服务服务员帮烤肉小菜无限你续烤精品大肠肥肠无敌好吃喜欢吃" + 0.007*"位置好找商场二楼味道份量足" + 0.007*"他家烤肉吃好吃烤肉关键芝士免费吃芝士爱好者无限诱惑超级优秀" + 0.007*"服务员热情态度店内环境很棒菜品超级好吃" + 0.007*"环境环境韩国烤肉店感觉装修比较简单服务服务服务员帮忙烤肉换烤碟挺快人多顾不过来两个男生点店里套餐刚刚好吃饱分量不错芝士蛋液生菜玉米续蘸料吧台调" + 0.007*"网上有个博主推荐尝试体验烤肉挺好吃菜品不错踩雷刚一进店感觉好像一看服务没想店里小姐姐服务态度专业讲话温温柔柔的一顿吃开心哈哈哈" + 0.007*"环境环境真的一言难尽店超大烟感觉排地面超级油后厨哪一块更是垃圾堆满很油服务假期排队等位打折送饮料服务不错烤肉小弟弟服务不错牛肋骨不错我点一块肉眼精品肉眼貌似真的推荐点烤感觉肉要散开点冰箱解冻懂薄缘故烤一会吃干肉变柴烤牛舌份量真的绝賊切薄一次性烤干咬不动石锅拌饭这家店价格真的便宜份量真的足烤肉高推荐" + 0.007*"深圳天气时好时坏一场雨打破计划唯独打破吃烤肉冲动回到盐田约几个朋友叙叙旧身边小姐出门在外面朋友照顾未满半岁小朋友说这家烤肉店盐田数好吃烤肉店回来吃烤肉进店问过服务员套餐可用服务员态度挺帮忙照顾小朋友还给挑拥挤位置雪花牛肉出场肯定家招牌雪花牛肉旁边服务员帮忙烤牛雪花点两份雪花肉吃说烤香喷喷沾烤肉酱一口真的冷面冷面很感兴趣评价朋友说好吃牛板腱记得服务员会帮烤剪一小块夹青菜包一口咬嘴里回味" + 0.007*"图一小吃吃续烤肉不错无烟店铺整体服务水平有待提高疫情采用隔桌坐客人店员很慢服务久动手地板油腻留心滑倒" + 0.007*"味道服务满意"

# Topic: 5
# Words: 0.007*"情人节当天没到点商场门口大排长龙一个个排队号开门一窝蜂抢位置一脸懵逼过年节日一下子进客太多店员忙不过来服务不到理解牛雪花肉质偏软鲜嫩多汁烤调味胸叉肉肉质偏硬烤精品大肠最爱烤肥肠烤好吃越嚼越有味下咽冷面冷面爱好者平常冷面醋店家白醋冷面汤汁做捏服务鸡蛋液芝士无限续加爱爱店里烤肉酱调料酱油胡椒盐想吃原汁原味稍微遗憾" + 0.007*"位置找环境装修不错韩式主题三个人点套餐肉质新鲜现场赶上周末人数上菜时间相对来说比较慢口罩员工数量排烟设备最佳状态空气相比肉质空气整体影响很大" + 0.007*"味道不错正宗韩式烤肉周日排对等位没吃中午不用等位环境不错" + 0.007*"来到盐田区这家韩国烤肉店小姐姐服务耐心帮烤肉小菜免费续哟" + 0.007*"环境环境韩国烤肉店装修坐位置不算宽敞泡菜饼好吃好多泡菜不像店面粉泡菜石锅拌饭不错中规中矩烤调味牛排牛肉不错挺新鲜服务服务不错小菜无限加工作人员帮忙烤肉" + 0.007*"韩式烤肉刚开业菜品免费美团劵合挺划算人均雪花牛肉牛舌牛肉新鲜滋香五花肉肥女生不太接受菇类烤起来挺鲜小菜丰盛每样好吃耶茶好喝环境韩式咯服务员感觉忙不过来商家雇点嘻嘻今日热量超标更卖力健身" + 0.007*"吃几次这家烤肉店点拼盘好像不太够还加几个菜拼盘性价比不高哈泡菜饼超级好吃推荐每次吃必点道菜小菜不错吃无限续哟服务时好时不好吃帮烤肉不见导致肉烤太老" + 0.007*"好日子来到壹海城逛逛天桥第一家烤肉店回想起上次吃商场逛一圈幸运回来不用排队好多好吃小菜无限续打卡好吃雪花牛肉字绝" + 0.007*"服务差慢上菜上桌半小时不来菜店员不拿正脸" + 0.007*"壹海城特色一家店烤肉好吃调料更入味完美总体不错踩坑"

# Topic: 6
# Words: 0.008*"烤肉好吃开在壹海城商场打卡点推荐韩国烤肉老板韩国真香他家小菜特别好吃" + 0.008*"第一次这家店盐田烤肉第一排名期待心情吃点评上团套餐换份石锅拌饭饭好奇没肉吃了饭坐一会服务员烤肉说炭没烧烤肉真的口感没特色蘸酱料自取包肉青菜倒黄瓜条真的干老刚到店里人不多吃饭越来越店里云烟雾绕吵真的吵只想赶紧吃赶紧走那种整体评价真的情况那种店感谢小姐姐帮柠檬水" + 0.008*"肉质还好调味有点咸酱料不用粘配生菜吃小哥服务烤肉泡菜饼味道配鸡蛋羹芝士加肉一卷有种感觉小菜总体平馋肉补" + 0.008*"环境环境优美干净卫生有种舒服感觉服务待客有道店里服务生超赞帮烤晚上肉值得点赞招牌雪花牛肉忘怀第一次喝韩国饮料与众不同口感忘记可乐味" + 0.008*"门口排长队好奇真的好吃大失所望推荐再来感觉感觉没什么竞争人才第一家韩国烤肉环境乱坐圆桌真的太小地方放服务还好地方炭火走不太碰撞价格还好挺优惠份量足味道油烟味太大吃完回家满头味道" + 0.008*"沙头角发现一家新开韩料馆没吃过试试味道真的一般般泡菜饼年糕好吃肉类中规中矩唯一喜欢免费续芝士很能拉丝鸡蛋羹确实不错一般般价格偏高性价比不高" + 0.008*"体验感差性价比低带朋友坐下东西服务员鸡蛋羹芝士炉子剪刀小菜说服务体验感极差推荐" + 0.008*"聚餐小菜精致特别沙拉开胃喜欢吃口味五花肉好大很厚超乎预想" + 0.008*"排队久饮料送一点真的不错送小菜味道不错续加泡菜饼强推泡菜饼薄薄的煎脆脆真的好吃烤肉中规中矩唯一美中不足店内服务员真的太少帮忙烤肉小姐姐负责区域真的忙不过来" + 0.008*"大鹏回来盐田吃天桥进商场第一家烤肉试试下午一点半左右挺多人点烤肉套餐炒粉丝牛骨汤忙店员帮忙烤肉味道服务挺免费雪糕小不丁"

# Topic: 7
# Words: 0.007*"环境壹海城走廊位置边上开车停商场服务服务真的超级服务帮忙加料烤肉石锅拌饭顶饱味道不错鸡蛋芝士小菜随便加肉拼盘肉挺新鲜套餐巨划算海边栈道走完路真的适合恰肉补充" + 0.007*"感谢大众点评家门口吃一顿霸王餐喜欢烤肉疯狂点赞雪花牛肉真的真的太好吃超级嫩小菜丰盛吃完想要加些忙忘泡菜饼泡菜拼在一起好吃酱汤送饭烤猪颈肉蛮香饭一根布丁很巴适号告诉两个号号纸写忙有时候难免会忘记告诉顾客时间" + 0.007*"不错性价比高极力推荐" + 0.007*"周末朋友盐田玩逛街韩式烤肉店想试一下周末壹海城真的好多点排队说桌分钟小时还行女生点双人套餐本来想着说单点发现够吃再点跟点喝杯奶茶夸夸小菜续太棒土豆泥萝卜辣白菜好吃续次生菜续拼盘慢哥哥帮忙烤肉服务不错肉剩下点没吃完太饱朋友试一下" + 0.007*"推荐菜品牛肉好吃原始炭火感觉真不错还会莱服务" + 0.007*"住一站地铁这是好吃烤肉解馋神器四个人点好多肉零星拍一点没拍下锅还点份石锅拌饭一份酱汤忘点反正好多牛肉粒推荐腌制入味烤腥味硬五花肉推荐没味道调味牛排推荐石锅拌饭好吃环境韩式布局装修蛮新挺舒适服务哥哥热情帮着烤肉人多时会忙不过来" + 0.007*"工作室楼下韩国烤肉店周末排队工作日空荡烤肉吸引各式各样小吃泡菜国先看泡菜好吃点双人套餐实惠吃撑不用烦恼点上肉开烤火候旺烤味十足环境典型韩国烤肉店服务烤肉烤体力活多点笑容食客更吃欢喔想吃烤肉烤烤味道小菜不错" + 0.007*"呜呜吃完喉咙痛烤肉背锅好久吃平台购买套餐挺划算两个刚刚门店六个小菜挺好吃厚脸皮问续一点泡萝卜真的好吃饮料好喝草莓味" + 0.007*"第一次壹海城商场楼有餐饮店铺点多到烤肉店人不多过点上人服务跟不上泡菜饼一般般烤原味猪颈肉挺薄口感牛肉石锅拌饭冷面口味算总体性价比不高女服务员爱理不理" + 0.007*"肉好吃服务态度特别下次家人"

# Topic: 8
# Words: 0.007*"下班同事先美团上取号一个多钟真的总体感觉不错泡菜好吃肉不错估计点剩服务态度帮忙烤肉小姐姐试一下" + 0.007*"味道不错烤肉小哥服务超级" + 0.007*"味道品质场内油烟较大有位姐姐急肉烤烤慢一点很不愿吃慢肉放久干好吃一位哥哥态度服务不错服务好不好看人" + 0.007*"小料台脏兮兮补货半天周末忙提前准备桌子特别很挤" + 0.007*"刚开韩式烤肉店结婚周年老公特别吃排队一个多小时味道不错等待超过三十分钟赠送饮料等待时长免单菜品欣慰店内环境不错空间很大感觉拥挤人多原因点三份肉饼一份汤两个吃撑小菜生菜芝士鸡蛋糕免费续超棒食材新鲜服务员主动帮忙烤肉排队没毛病" + 0.007*"芝士自助真的好吃服务到位" + 0.007*"新开业光顾几次地理位置号召二楼生意火爆排队分钟送韩国果汁推荐橙汁好喝不用担心手残烤不好工作人员帮忙烤氛围不错情侣约会同事聚餐亲子活动合适送餐前小吃有种韩国泡菜好吃沙拉豆芽两个人吃份肉会很饱肉肉看着厚实撑肚子" + 0.007*"朋友买个个双人套餐两个吃肉吃饱小菜生菜续店内服务员人手不太够照顾有个哥哥帮换烤盘热闹排队号点炒年糕拉面炒年糕炒年糕好吃偏酸朋友喜欢吃秘制肥牛饭肥牛饭套餐包含本来选择饭服务员说两款酱做不了只能随便一款挺好吃吃剩朋友一桌一桌客人服务员着急想下班碳拿走" + 0.007*"总体不错口味中国适合国人口胃寻找纯韩口味哥哥小姐姐考虑一下咯芝士免费加加分吴世勋手绘加分哈哈哈哈有人烤肉挺盐田不错" + 0.007*"好吃一顿烤肉服务员服务星期六晚上要排久上菜速度很快特别雪花牛肉很嫩五花肉很香服务员热情帮忙烤吃完服务员问需不需要雪糕"

# Topic: 9
# Words: 0.006*"出差跑中午找店吃饭环境烤肉店服务选择烤帮忙烤味道烤肉好吃小菜里泡青瓜好吃解腻吃肉包很棒" + 0.006*"位于壹海城二期二楼一百多平方人多空调不给力油烟抽走一身烤肉味服务员小姐姐烤肉肉但太忙好吃店独有酱料调爱吃酱料小菜免费吃最爱芝士免费加值得" + 0.006*"吃几次小姐姐国庆实在太多建议平时" + 0.006*"环境不错看海顺便吃服务态度满分哥哥帮忙烤肉下次套餐优惠" + 0.006*"路过这家店好几次终于找到时间吃烤肉冷面不错哥哥帮烤芝士卷吃蛋液熟捞起来单独吃小吃苹果泡茶萝卜凉皮类似雪花牛肉很内瘦前猪肉五花肉肥啖啖肉好吃" + 0.006*"盐田仅烤肉环境壹海城楼天桥旁边周六中午尴尬接待全程找服务员问有没有位置没坐满忙烧炭哥哥找到小姐姐带入座用餐过程服务烤肉小姐姐帮烤手法熟练泡菜吃一碟一碟说实话吃烤肉太腻适合吃几块吃点套餐拌饭不错朋友说泡萝卜咸吃三碗饭哈哈哈" + 0.006*"服务明明空位服务员人去收外面干半天上菜催两秒非要催肯做事" + 0.006*"牛肉粒真的差评肥牛大小不一脱肉价格菜单最贵" + 0.006*"姐妹约饭一家烤肉店店铺装修环境不错小料味道分量不错总体体验一家店美团代金券抵扣总体尝试" + 0.006*"总体排队排特别久味道不错烤肉烟很大送饮料"



In [4]:
import pandas as pd
from gensim import corpora, models
from gensim.models.ldamodel import LdaModel
import pyLDAvis.gensim_models as gensimvis
import pyLDAvis
import numpy as np
import re
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from tqdm import tqdm

# 加载Excel文件
file_path = '/data1/dxw_data/llm/RAG-mkt-kmeans/data1/cleaned_comments_dianping_hotpot.xlsx'
df = pd.read_excel(file_path)

# 文本预处理函数
def preprocess_text(text):
    # 移除标点符号和数字
    text = re.sub(r'\d+', '', text)
    text = re.sub(r'[^\w\s]', '', text)
    # 转小写
    text = text.lower()
    # 分词
    tokens = word_tokenize(text)
    # 移除停用词
    tokens = [word for word in tokens if word not in stopwords.words('chinese')]
    return tokens

# 对每条评论进行预处理
tqdm.pandas(desc="Preprocessing comments")
df['cleaned_tokens'] = df['comment'].progress_apply(preprocess_text)

# 创建词典和语料库
dictionary = corpora.Dictionary(df['cleaned_tokens'])
corpus = [dictionary.doc2bow(tokens) for tokens in df['cleaned_tokens']]

# 训练LDA模型
lda_model = LdaModel(corpus, num_topics=10, id2word=dictionary, passes=15)

# 输出主题
for idx, topic in lda_model.print_topics(-1):
    print(f"Topic: {idx}\nWords: {topic}\n")



Preprocessing comments: 100%|██████████| 962/962 [00:00<00:00, 1085.83it/s]


Topic: 0
Words: 0.028*"服务" + 0.025*"环境" + 0.002*"招牌虾滑" + 0.002*"番茄火锅" + 0.002*"绝了" + 0.002*"推荐" + 0.001*"很好" + 0.001*"整体来说很不错" + 0.001*"海底捞丹竹头店就在家楼下" + 0.001*"它们就是以服务为主的"

Topic: 1
Words: 0.007*"服务" + 0.004*"环境" + 0.003*"服务很好" + 0.001*"非常好吃" + 0.001*"还不错" + 0.001*"比较浓厚的汤" + 0.001*"很入味" + 0.001*"蟹柳也是我爱点的" + 0.001*"而且不会煮没一下子就烂了" + 0.001*"看起来不多"

Topic: 2
Words: 0.006*"服务" + 0.004*"滴" + 0.004*"环境" + 0.003*"很惊讶" + 0.003*"感觉差点意思" + 0.002*"烤卷五花肉" + 0.002*"位置很好找" + 0.002*"石锅拌饭" + 0.002*"非常不错" + 0.002*"但是负责我们这一桌的小姐姐很醒目"

Topic: 3
Words: 0.003*"环境" + 0.002*"真的很不错" + 0.002*"软绵绵的那种" + 0.002*"配上牛肉粒每次都要喝个两三碗" + 0.002*"加浓" + 0.002*"加番茄" + 0.002*"每条酥肉里都是有肉的" + 0.002*"现炸酥肉吃过很多家店的酥肉" + 0.002*"酸酸甜甜的好开胃" + 0.002*"但我觉得有点辣"

Topic: 4
Words: 0.021*"服务" + 0.018*"环境" + 0.003*"很好吃" + 0.003*"菜品" + 0.003*"环境不错" + 0.001*"肥牛" + 0.001*"公众号排队" + 0.001*"我就无语了" + 0.001*"还是很可以的" + 0.001*"火锅标配"

Topic: 5
Words: 0.011*"服务" + 0.008*"环境" + 0.002*"招牌虾滑" + 0.002*"番茄火锅" + 0.002*"现炸酥肉" + 0.002*"口感很赞" + 0.002*"捞派毛肚" + 0.002*"虾滑

In [None]:
# Preprocessing comments: 100%|██████████| 962/962 [00:00<00:00, 1085.83it/s]
# Topic: 0
# Words: 0.028*"服务" + 0.025*"环境" + 0.002*"招牌虾滑" + 0.002*"番茄火锅" + 0.002*"绝了" + 0.002*"推荐" + 0.001*"很好" + 0.001*"整体来说很不错" + 0.001*"海底捞丹竹头店就在家楼下" + 0.001*"它们就是以服务为主的"

# Topic: 1
# Words: 0.007*"服务" + 0.004*"环境" + 0.003*"服务很好" + 0.001*"非常好吃" + 0.001*"还不错" + 0.001*"比较浓厚的汤" + 0.001*"很入味" + 0.001*"蟹柳也是我爱点的" + 0.001*"而且不会煮没一下子就烂了" + 0.001*"看起来不多"

# Topic: 2
# Words: 0.006*"服务" + 0.004*"滴" + 0.004*"环境" + 0.003*"很惊讶" + 0.003*"感觉差点意思" + 0.002*"烤卷五花肉" + 0.002*"位置很好找" + 0.002*"石锅拌饭" + 0.002*"非常不错" + 0.002*"但是负责我们这一桌的小姐姐很醒目"

# Topic: 3
# Words: 0.003*"环境" + 0.002*"真的很不错" + 0.002*"软绵绵的那种" + 0.002*"配上牛肉粒每次都要喝个两三碗" + 0.002*"加浓" + 0.002*"加番茄" + 0.002*"每条酥肉里都是有肉的" + 0.002*"现炸酥肉吃过很多家店的酥肉" + 0.002*"酸酸甜甜的好开胃" + 0.002*"但我觉得有点辣"

# Topic: 4
# Words: 0.021*"服务" + 0.018*"环境" + 0.003*"很好吃" + 0.003*"菜品" + 0.003*"环境不错" + 0.001*"肥牛" + 0.001*"公众号排队" + 0.001*"我就无语了" + 0.001*"还是很可以的" + 0.001*"火锅标配"

# Topic: 5
# Words: 0.011*"服务" + 0.008*"环境" + 0.002*"招牌虾滑" + 0.002*"番茄火锅" + 0.002*"现炸酥肉" + 0.002*"口感很赞" + 0.002*"捞派毛肚" + 0.002*"虾滑很嫩" + 0.002*"全部都有人跟进" + 0.002*"果然很靠谱哦"

# Topic: 6
# Words: 0.019*"环境" + 0.018*"服务" + 0.003*"服务不错" + 0.001*"很好" + 0.001*"牛肋条不ok" + 0.001*"一个豆腐汤" + 0.001*"很多筋" + 0.001*"前菜很多" + 0.001*"豆腐汤喜欢" + 0.001*"猪排"

# Topic: 7
# Words: 0.017*"服务" + 0.013*"环境" + 0.004*"很喜欢" + 0.003*"环境不错" + 0.003*"菜品" + 0.003*"点赞" + 0.001*"很好吃" + 0.001*"味道指数" + 0.001*"营业时间周一至周日" + 0.001*"今日语录"

# Topic: 8
# Words: 0.029*"环境" + 0.027*"服务" + 0.002*"gogiya韩国传统烤肉盐田壹海城店" + 0.001*"而且很窄" + 0.001*"服务态度一般" + 0.001*"人很多" + 0.001*"在冬至这天来跟家人一起打卡" + 0.001*"还行吧" + 0.001*"要叫好几次才会拿" + 0.001*"然后桌子很密集"

# Topic: 9
# Words: 0.023*"服务" + 0.020*"环境" + 0.003*"海底捞" + 0.003*"烤调味牛肋条" + 0.003*"小菜" + 0.003*"点赞" + 0.001*"菜品" + 0.001*"捞派毛肚" + 0.001*"豆腐" + 0.001*"招牌虾滑"



In [None]:
# 从您提供的主题和关键词中，我总结出的主要主题类别如下：

# 1. **服务**：
#    - 服务态度好
#    - 服务态度一般
#    - 具体服务体验

# 2. **环境**：
#    - 环境好
#    - 环境一般

# 3. **食物质量**：
#    - 食物品质好
#    - 食物品质一般

# 4. **特定菜品**：
#    - 招牌虾滑
#    - 番茄火锅
#    - 现炸酥肉
#    - 烤调味牛肋条
#    - 捞派毛肚
#    - 石锅拌饭

# 5. **总体评价**：
#    - 推荐
#    - 非常好
#    - 中规中矩

# 6. **用餐体验**：
#    - 餐厅整体体验
#    - 具体体验描述


In [7]:
import pandas as pd
from gensim import corpora, models
from gensim.models.ldamodel import LdaModel
import pyLDAvis.gensim_models as gensimvis
import pyLDAvis
import numpy as np
import re
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from tqdm import tqdm

# 加载Excel文件
file_path = '/data1/dxw_data/llm/RAG-mkt-kmeans/data2/cleaned_comments_dianping_barbecue.xlsx'
df = pd.read_excel(file_path)

# 文本预处理函数
def preprocess_text(text):
    # 移除标点符号和数字
    text = re.sub(r'\d+', '', text)
    text = re.sub(r'[^\w\s]', '', text)
    # 转小写
    text = text.lower()
    # 分词
    tokens = word_tokenize(text)
    # 移除停用词
    tokens = [word for word in tokens if word not in stopwords.words('chinese')]
    return tokens

# 对每条评论进行预处理
tqdm.pandas(desc="Preprocessing comments")
df['cleaned_tokens'] = df['comment'].progress_apply(preprocess_text)

# 创建词典和语料库
dictionary = corpora.Dictionary(df['cleaned_tokens'])
corpus = [dictionary.doc2bow(tokens) for tokens in df['cleaned_tokens']]

# 训练LDA模型
lda_model = LdaModel(corpus, num_topics=10, id2word=dictionary, passes=15)

# 输出主题
for idx, topic in lda_model.print_topics(-1):
    print(f"Topic: {idx}\nWords: {topic}\n")



Preprocessing comments: 100%|██████████| 790/790 [00:00<00:00, 1175.68it/s]


Topic: 0
Words: 0.004*"环境不错" + 0.004*"mall二楼" + 0.002*"环境" + 0.002*"开心" + 0.002*"非常不错" + 0.002*"爱理不理" + 0.002*"炒饭湿乎乎的" + 0.002*"烤肉手法相当粗糙" + 0.002*"夹子一扬会溅油那种" + 0.002*"很老"

Topic: 1
Words: 0.010*"环境" + 0.010*"服务" + 0.006*"不错" + 0.002*"环境还不错" + 0.002*"小菜可以免费续加" + 0.002*"坐在靠床边" + 0.002*"就是中规中矩吧" + 0.002*"很巴适" + 0.002*"仅限客人使用" + 0.002*"就在one"

Topic: 2
Words: 0.009*"环境" + 0.009*"服务" + 0.002*"gogiya韩国传统烤肉盐田壹海城店" + 0.002*"菜品大多数都是比较中规中矩的" + 0.002*"要排队" + 0.002*"参鸡汤" + 0.002*"桌子之间不会太挤" + 0.002*"买单后可以吃免费的雪糕" + 0.002*"店铺比较大" + 0.002*"总体还是很舒适的"

Topic: 3
Words: 0.006*"环境不错" + 0.004*"烤卷五花肉" + 0.004*"雪花牛肉" + 0.004*"服务态度很好" + 0.002*"服务" + 0.002*"过来一站地铁" + 0.002*"环境韩式布局装修都蛮新的挺舒适" + 0.002*"五花肉不推荐" + 0.002*"忘了都点的啥" + 0.002*"反正好多"

Topic: 4
Words: 0.026*"环境" + 0.022*"服务" + 0.003*"菜品" + 0.003*"很好吃" + 0.003*"mall二楼" + 0.002*"推荐" + 0.002*"这个还可以" + 0.002*"肉很香" + 0.002*"牛尾汤这个汤还可以" + 0.002*"稍微排了一会儿队"

Topic: 5
Words: 0.005*"很喜欢" + 0.004*"感觉差点意思" + 0.004*"肉质新鲜" + 0.002*"服务" + 0.002*"牛肋条" + 0.002*"本来想吃烤大肠的" + 0

In [None]:
# Preprocessing comments: 100%|██████████| 790/790 [00:00<00:00, 1175.68it/s]
# Topic: 0
# Words: 0.004*"环境不错" + 0.004*"mall二楼" + 0.002*"环境" + 0.002*"开心" + 0.002*"非常不错" + 0.002*"爱理不理" + 0.002*"炒饭湿乎乎的" + 0.002*"烤肉手法相当粗糙" + 0.002*"夹子一扬会溅油那种" + 0.002*"很老"

# Topic: 1
# Words: 0.010*"环境" + 0.010*"服务" + 0.006*"不错" + 0.002*"环境还不错" + 0.002*"小菜可以免费续加" + 0.002*"坐在靠床边" + 0.002*"就是中规中矩吧" + 0.002*"很巴适" + 0.002*"仅限客人使用" + 0.002*"就在one"

# Topic: 2
# Words: 0.009*"环境" + 0.009*"服务" + 0.002*"gogiya韩国传统烤肉盐田壹海城店" + 0.002*"菜品大多数都是比较中规中矩的" + 0.002*"要排队" + 0.002*"参鸡汤" + 0.002*"桌子之间不会太挤" + 0.002*"买单后可以吃免费的雪糕" + 0.002*"店铺比较大" + 0.002*"总体还是很舒适的"

# Topic: 3
# Words: 0.006*"环境不错" + 0.004*"烤卷五花肉" + 0.004*"雪花牛肉" + 0.004*"服务态度很好" + 0.002*"服务" + 0.002*"过来一站地铁" + 0.002*"环境韩式布局装修都蛮新的挺舒适" + 0.002*"五花肉不推荐" + 0.002*"忘了都点的啥" + 0.002*"反正好多"

# Topic: 4
# Words: 0.026*"环境" + 0.022*"服务" + 0.003*"菜品" + 0.003*"很好吃" + 0.003*"mall二楼" + 0.002*"推荐" + 0.002*"这个还可以" + 0.002*"肉很香" + 0.002*"牛尾汤这个汤还可以" + 0.002*"稍微排了一会儿队"

# Topic: 5
# Words: 0.005*"很喜欢" + 0.004*"感觉差点意思" + 0.004*"肉质新鲜" + 0.002*"服务" + 0.002*"牛肋条" + 0.002*"本来想吃烤大肠的" + 0.002*"点了三份烤肉" + 0.002*"口感不行" + 0.002*"牛舌" + 0.002*"可是当天没有"

# Topic: 6
# Words: 0.029*"服务" + 0.024*"环境" + 0.004*"鸡蛋液" + 0.002*"极力推荐" + 0.002*"烤精品大肠推荐好吃的大肠" + 0.002*"肉类的话感觉过得去" + 0.002*"小菜豆芽好吃" + 0.002*"这个烤肉店一般般" + 0.002*"点了两个肉" + 0.002*"和朋友共同感觉"

# Topic: 7
# Words: 0.002*"mall" + 0.002*"真的很不错" + 0.002*"阿姨一直帮助我们解决我们的各种需求" + 0.002*"在商场的位置也很不错" + 0.002*"小菜非常丰富哦" + 0.002*"一直关注我们的各种问题" + 0.002*"我们人很多" + 0.002*"深圳的烤肉店很多" + 0.002*"不过这里的服务真的很好" + 0.002*"环境也很不错哦"

# Topic: 8
# Words: 0.045*"服务" + 0.043*"环境" + 0.003*"石锅拌饭" + 0.003*"很好吃" + 0.003*"烤调味牛肋条" + 0.003*"人很多" + 0.002*"烤牛舌" + 0.002*"烤卷五花肉可以烤的脆一点" + 0.002*"牛排骨汤口味特别清淡" + 0.002*"把汤泡进饭里"

# Topic: 9
# Words: 0.015*"服务" + 0.015*"环境" + 0.004*"服务很好" + 0.004*"很推荐" + 0.004*"点赞" + 0.002*"环境没有说特别大" + 0.002*"牛筋也很充足" + 0.002*"其实烤起来吃敲好吃的" + 0.002*"但是发现很好喝诶" + 0.002*"只剩下这个"



In [None]:
# 根据上述内容，可以将其分为以下几个主题：

# 1. **环境**
#    - 环境不错
#    - 环境拥挤
#    - 环境韩式布局装修舒适
#    - 店铺比较大
#    - 环境还不错
#    - 环境非常不错

# 2. **服务**
#    - 服务态度很好
#    - 服务员爱理不理
#    - 服务效率较低
#    - 服务态度不认真
#    - 服务很推荐
#    - 服务很好

# 3. **菜品质量**
#    - 菜品中规中矩
#    - 食材质量不理想
#    - 食物味道和份量问题
#    - 牛尾汤、参鸡汤
#    - 雪花牛肉、五花肉
#    - 小菜可以免费续加

# 4. **价格**
#    - 价格较高，性价比不高
#    - 用户希望有更实惠的选择

# 5. **推荐菜品**
#    - 对推荐菜品不满意
#    - 烤肉加小菜的组合不够理想
#    - 烤卷五花肉、烤精品大肠、石锅拌饭、烤牛舌

# 6. **其他**
#    - 点了三份烤肉
#    - 极力推荐
#    - 服务员推荐的菜品组合不理想
#    - 感觉差点意思


In [1]:
import pandas as pd
from gensim import corpora, models
from gensim.models.ldamodel import LdaModel
import pyLDAvis.gensim_models as gensimvis
import pyLDAvis
import numpy as np
import re
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from tqdm import tqdm

# 加载Excel文件
file_path = '/data1/dxw_data/llm/RAG-mkt-kmeans/data3/cleaned_comments_dianping_cake.xlsx'
df = pd.read_excel(file_path)

# 文本预处理函数
def preprocess_text(text):
    # 移除标点符号和数字
    text = re.sub(r'\d+', '', text)
    text = re.sub(r'[^\w\s]', '', text)
    # 转小写
    text = text.lower()
    # 分词
    tokens = word_tokenize(text)
    # 移除停用词
    tokens = [word for word in tokens if word not in stopwords.words('chinese')]
    return tokens

# 对每条评论进行预处理
tqdm.pandas(desc="Preprocessing comments")
df['cleaned_tokens'] = df['cleaned_comment'].progress_apply(preprocess_text)

# 创建词典和语料库
dictionary = corpora.Dictionary(df['cleaned_tokens'])
corpus = [dictionary.doc2bow(tokens) for tokens in df['cleaned_tokens']]

# 训练LDA模型
lda_model = LdaModel(corpus, num_topics=10, id2word=dictionary, passes=15)

# 输出主题
for idx, topic in lda_model.print_topics(-1):
    print(f"Topic: {idx}\nWords: {topic}\n")



Preprocessing comments: 100%|██████████| 800/800 [00:00<00:00, 3283.04it/s]


Topic: 0
Words: 0.006*"听说此店久离上梅林站出口不远走几分鈡路太热没人排队买店面细细做好原味香芋味味道一个多小时香芋热應新鲜出炉足料芋泥满满蛋糕松软价格贵性价比挺下次试试味道" + 0.006*"总体不及预期抹茶红豆红豆硬芋泥蛋糕糕体松软芋泥味道厦门吃那家想念一万年" + 0.006*"买芋泥巧克力味两种不算现做出餐挺慢" + 0.006*"口味买芋泥口味原料芋泥很足香甜性价比重量三十五元一斤环境小店没什么环境排队买带走" + 0.006*"芋泥蛋糕太甜软棉棉口感吃" + 0.006*"想吃这家蛋糕周末加班老公跑买原味芋泥巧克力咸蛋黄都买最先吃巧克力巧克力控受不住诱惑流心巧克力外面巧克力豆增加口感巧克力味好浓爱吃巧克力老公忍不住吃好多芋泥芋泥真的扎实不甜不腻香芋头味道细心蛋糕体芋头颗粒很小很小一吃那种香精芋头咸蛋黄蛋糕体是带甜味道咸蛋黄带点咸味带有丢丢吃芝士感觉搭配刚刚原味蛋香味很浓蛋糕体都软乎乎真的古早蛋糕味外表朴素用料实在那种跑买蛋糕回购" + 0.006*"口味巧克力咸蛋黄芋泥三款各买方块大小环境店面很小买完即走那种小桌子两个凳子原料正好赶上刚出锅几款玻璃橱窗里雾气腾腾蛋糕松软买完后坐店里尝几口巧克力味能接受咸蛋黄咸甜搭配蛋糕芋泥口味选择吃甜味普普通通性价比主打真材实料不卖蛋糕味道没想象吃一口那么回事蛋糕" + 0.006*"算是网红火好多年它家外卖过好很香甜度适中蛋糕体湿润绵密喜欢软乎乎口感香芋味好吃浓郁巧克力更流心更好推荐加热吃微波炉叮更美味豆乳盒子很香过甜豆乳黄豆粉绝配" + 0.006*"妥妥小店产品硬实力产品做口碑选择半块更选择" + 0.006*"每次排队一家店没果断拿下买推荐芋泥巧克力味真的超级好吃软馅料特别甜不用特地排久队买芋泥蛋糕芋泥馅不错吃得出来新鲜做放多点更好爆浆巧克力巧克力表面巧克力豆有种吃超软版趣感觉"

Topic: 1
Words: 0.007*"梅林排队王古早味蛋糕芋泥脑袋赶紧入坑不亏排队吃不二首选" + 0.007*"中午买中张张面包顺便买古早原味买三个口味貌似招牌总体蛋糕体都松软略有一股鸡蛋味道不甜芋泥蛋糕芋泥控喜欢夹厚一层芋泥酱芋泥酱放糖感觉清新爆浆巧克力一般来说巧克力出品很甜这家刚刚撒巧克力豆好吃原味蛋糕原味蛋糕不错推荐试一下芋泥巧克力原味我觉某汤" + 0.007*"这家店真的很火小小的门脸儿挤满

In [None]:
# Preprocessing comments: 100%|██████████| 800/800 [00:00<00:00, 3283.04it/s]
# Topic: 0
# Words: 0.006*"听说此店久离上梅林站出口不远走几分鈡路太热没人排队买店面细细做好原味香芋味味道一个多小时香芋热應新鲜出炉足料芋泥满满蛋糕松软价格贵性价比挺下次试试味道" + 0.006*"总体不及预期抹茶红豆红豆硬芋泥蛋糕糕体松软芋泥味道厦门吃那家想念一万年" + 0.006*"买芋泥巧克力味两种不算现做出餐挺慢" + 0.006*"口味买芋泥口味原料芋泥很足香甜性价比重量三十五元一斤环境小店没什么环境排队买带走" + 0.006*"芋泥蛋糕太甜软棉棉口感吃" + 0.006*"想吃这家蛋糕周末加班老公跑买原味芋泥巧克力咸蛋黄都买最先吃巧克力巧克力控受不住诱惑流心巧克力外面巧克力豆增加口感巧克力味好浓爱吃巧克力老公忍不住吃好多芋泥芋泥真的扎实不甜不腻香芋头味道细心蛋糕体芋头颗粒很小很小一吃那种香精芋头咸蛋黄蛋糕体是带甜味道咸蛋黄带点咸味带有丢丢吃芝士感觉搭配刚刚原味蛋香味很浓蛋糕体都软乎乎真的古早蛋糕味外表朴素用料实在那种跑买蛋糕回购" + 0.006*"口味巧克力咸蛋黄芋泥三款各买方块大小环境店面很小买完即走那种小桌子两个凳子原料正好赶上刚出锅几款玻璃橱窗里雾气腾腾蛋糕松软买完后坐店里尝几口巧克力味能接受咸蛋黄咸甜搭配蛋糕芋泥口味选择吃甜味普普通通性价比主打真材实料不卖蛋糕味道没想象吃一口那么回事蛋糕" + 0.006*"算是网红火好多年它家外卖过好很香甜度适中蛋糕体湿润绵密喜欢软乎乎口感香芋味好吃浓郁巧克力更流心更好推荐加热吃微波炉叮更美味豆乳盒子很香过甜豆乳黄豆粉绝配" + 0.006*"妥妥小店产品硬实力产品做口碑选择半块更选择" + 0.006*"每次排队一家店没果断拿下买推荐芋泥巧克力味真的超级好吃软馅料特别甜不用特地排久队买芋泥蛋糕芋泥馅不错吃得出来新鲜做放多点更好爆浆巧克力巧克力表面巧克力豆有种吃超软版趣感觉"

# Topic: 1
# Words: 0.007*"梅林排队王古早味蛋糕芋泥脑袋赶紧入坑不亏排队吃不二首选" + 0.007*"中午买中张张面包顺便买古早原味买三个口味貌似招牌总体蛋糕体都松软略有一股鸡蛋味道不甜芋泥蛋糕芋泥控喜欢夹厚一层芋泥酱芋泥酱放糖感觉清新爆浆巧克力一般来说巧克力出品很甜这家刚刚撒巧克力豆好吃原味蛋糕原味蛋糕不错推荐试一下芋泥巧克力原味我觉某汤" + 0.007*"这家店真的很火小小的门脸儿挤满芋泥卖完一盘出锅吃热乎芋泥蛋糕爆浆巧克力伤心芋泥蛋糕芋泥超级好吃芋泥脑袋错过原味蛋糕原味扎实配水喝顶饱" + 0.007*"隐藏广厦路一间小店每次排长队蛋糕出炉原味蛋糕爆浆巧克力芝士味蛋糕芋泥蛋糕枣泥蛋糕重量计算单价原味便宜芋泥最贵芋泥蛋糕这店爆款每款好吃踩雷多人排队值得推荐" + 0.007*"这家实话火久古早味蛋糕真的吃吃不腻每次路过梅林瞅瞅几十分钟挺值得运气不算不算差排长龙一锅芋泥一锅巧克力买到最厚半块巧克力卡分钟锅芋泥买开心芋泥刚出炉香好吃滴回家冰一种风味" + 0.007*"好吃不腻软软糯糯绵密蛋糕体芋泥太甜香" + 0.007*"这家芋泥蛋糕实在太出名几次大排长龙有时候碰上刚出炉实在太幸运店里好几种口味选超级弹芋泥绵密很甜一整块切成份吃放在冰箱里芋泥口感更好" + 0.007*"芋泥蛋糕芋泥太甜味道行很腻吃完口干原味蛋糕原味性价比元一整块软糯可口拿在手上晃俗称抖臀蛋糕总体这家蛋糕不错排队购买" + 0.007*"爆浆巧克力口味真的绝绝子感觉比芋泥好吃每次排大长队群众眼光雪亮新鲜现做热吃真的很香软糯排队买只怪排时间太长上班" + 0.007*"芋泥好吃很香原味芝士味生意一出锅快卖光巧克力下次试试看"

# Topic: 2
# Words: 0.006*"芋泥蛋糕慕名而来每次吃不到朋友约朋友龙岗南山出发这芋泥蛋糕买到那一刻激动松软蛋糕夹芋泥香精味很甜适合喜欢蛋糕喜欢太甜" + 0.006*"几天腰疼下班梅林约按摩结束路过有人排队招牌没开好奇卖卖蛋糕没产品三个口味蛋糕多人排队排上重量称重一块板块称半块元平时买蛋糕价格合适出门迫不及待打开试吃两杯一口味道不错热呼呼很重芋头味道甜适合口味好吃有人排队" + 0.006*"年回来几天放假时间上班预约社康疫苗完疫苗时间早打开大众点评美食这家蛋糕店刷走买香芋味称重售卖半块块鸡蛋味特别香香芋味很浓整体不错" + 0.006*"芋泥细腻甜腻偏清淡口喜欢味道外面蛋糕体松软第一口爱浙江吃过芋泥古早蛋糕不枉华南城特意跑打卡想长居深圳光顾" + 0.006*"爱巧克力味很甜热吃芋泥味卖奥利奥雪媚娘" + 0.006*"每次路过买蛋糕店不大原味芋泥咸蛋黄肉松顺利打卡最爱芋泥芋泥扑出来特别刚出炉热热推荐第一次尝试朋友咸蛋黄肉松平平奇料不算原味" + 0.006*"晚上排队仔细找不到店买芋泥口味芋泥原味切半买按斤称拿到手热坐快小时车到家温巨好吃吃一口后悔买半块太远店家开连锁" + 0.006*"生日前来吃哈哈哈心愿特地蛇口跨越半个城市刚到老板说分钟说可不可以先付款说不行溜达一圈回来排一群排队可太刺激眼看蛋糕一块一块变少生怕买不到一块哈哈哈哈买走咯真的幸运开心超级开心福田卓越女举着一块蛋糕美滋滋咧着嘴笑哈哈哈哈芋泥甜味芋头味道蛋糕软得不行喜欢吃甜食啃半块满分福田居民尝尝特地来" + 0.006*"周六下午路过排小时买出品慢芋泥蛋糕一斤买一半半斤刚出锅温热蛋糕体软乎乎芋泥顺滑整体口味偏清淡味道不错下次特意路过排队试试" + 0.006*"芋泥味招牌吃好吃爆浆巧克力蛋糕发现梅林同款驱车小时吃被芋泥味惊艳芋泥蛋糕块精华芋泥馅细腻有点像麻薯状态口感麻薯口感轻甜芋头香味松软蛋糕搭爆浆巧克力块蛋糕体松软有空感巧克力没能沁透面包体服务分钟出炉一锅中午点半到排队蛋糕剩环境小桌子堂食计费切件称重计费老板说少一点"

# Topic: 3
# Words: 0.007*"松软可口梅林古早界地位浪得虚名工作日周末下班时段排队" + 0.007*"选香芋芝恋爆浆巧克力它家称重计价一块买半块试一下蛋糕体松软馅料算足甜腻刚出炉时香气十足" + 0.007*"款蛋糕質感綿密這點沒話說朱古力味不夠濃郁香芋沒甜味味道好不好看個口味" + 0.007*"芋泥香芋类馅料甜品无发抗拒这家芋泥蛋糕不错不算很甜蛋糕体湿润" + 0.007*"两款强烈推荐下次还会" + 0.007*"蛋糕口感味道不错买三种尝尝喜欢口味顺序肉松巧克力芋泥店顾客好像冲着芋泥买排队长现做蛋糕刚很快卖光店面两个座位尝口味排队队伍找店员买" + 0.007*"第二次第一次太晚没店排队越来越蛋糕味香芋泥蛋糕芋泥蛋糕好吃不愧招牌芋泥馅蛋糕体加芋泥做原味蛋糕原味蛋糕松软香" + 0.007*"芋泥脑搜这家芋泥蛋糕不错路过顺便尝早下午三点半才出炉做个核酸吃点小吃回来排队蛋糕刚出炉热气腾腾迫不及待尝一口外脆内软芋泥一层偏甜一点整体做街坊生意做这么久原因口味没买路过试一下蛋糕一半块" + 0.007*"古早味味觉记忆坊梅林店推荐前阵子广州打卡尝蛋糕真的惊艳蛋糕刚出炉软糯得晃晃悠悠弹十足真的抗拒店里芋泥巧克力蛋糕更是垂涎欲滴一尝爱提醒吃刚出炉蛋糕真的美味无比热吃芋泥巧克力爆浆口感无与伦比" + 0.007*"环境梅林前几次排队等待小时半小时出炉数量时间久芋泥蛋糕芋泥顺滑很甜健康糕体松软爆浆巧克力巧克力会甜一点工业化甜接受排队味道不错买排半小时小时感觉没"

# Topic: 4
# Words: 0.007*"蛋糕排队很香买芋泥巧克力半份依旧很大" + 0.007*"天亮排天黑架子空空如也每次出炉不到分钟抢完男朋友说这家小店霸气芋泥蛋糕外皮底部一层略带脆脆口感蛋糕体是空气感蓬松夹一层芋泥淡奶油馅芋泥细腻入口化微微甜芋泥味道浓厚整体不错买一半男票一口气吃完听到等会出锅芝士男票说犹豫果断排队芝士味蛋糕芝士味略带一点点咸口外皮不算很脆蛋糕体绵软偏一点湿润薄薄的芝士吃丢丢腻下次试试巧克力咸蛋黄" + 0.007*"超级喜欢芋泥红枣味道腻推荐" + 0.007*"买次吃过芋泥巧克力味芋泥真的永远回购一块太适合不爱吃甜吃芋泥巨绵密蛋糕表面脆脆巧克力味不错甜口那种微微发苦价格贵吃品质感觉" + 0.007*"看着一家小店装修老旧光线暗店员回购吃出朴素幸福感芋泥蛋糕称半块芋泥口味每次称一块蛋糕松软芋泥细腻香软心中爆浆巧克力巧克力浓烈表面巧克力颗粒馅料很足枣泥蛋糕喜欢枣糕肯定喜欢苦涩感原味蛋糕相比原味单调甜" + 0.007*"芋泥蛋糕太好吃强烈推荐店里买半块外卖只能买整块原味蛋糕巧克力味道还行爱芋泥蛋糕买回来吃冰在冰箱吃冰两种口味店里座位买好带走" + 0.007*"黄黄胖胖可爱爱本来七点过后没七点半赶到失望没想到十分钟一锅ᵕ原味蛋糕芋泥上次吃罪恶买原味蓬松晃一晃抖动样子真可爱软软喜欢甜甜不腻拯救今晚踩雷悲伤心情" + 0.007*"运气超级买一堆瞬间卖完芋泥蛋糕不甜这是评价加多糖很甜芋泥细腻那种扎实口感配合蛋糕体很绝原味蛋糕原味口感好吃一口气吃完" + 0.007*"走完梅林绿道肚子饿康路没到饭点搜索发现这家蛋糕店人气高好奇心态打卡挺排分钟买芋泥蛋糕元一斤一块一斤期间进店观察三次发现店员动作慢服务态度饥饿营销排队期间店员提前询问购买口味告知等待时间值得表扬试后蛋糕湿口感松软甜度适中夹薄薄的一层芋泥图片网传中说厚厚的芋泥小时候那种老蛋糕味道性价比不高原味一斤口味近两年广深地区西饼店遍地开花古早味蛋糕无论是商场街边店铺号称添加配料面粉鸡蛋牛奶白糖价格便宜元一斤跑一趟长时间排队购买确实没" + 0.007*"面包松软原味好吃刚出锅味道"

# Topic: 5
# Words: 0.007*"一家小店卖蛋糕一位老奶奶口味很全切小块芋泥蛋糕芋泥蛋糕确实不错芋泥馅爆整体甜度不高奶味蛋糕体绵软弹性好吃爆浆巧克力巧克力酱爆浆吃倒巧克力味挺浓品质不错巧克力两块蛋糕一共感觉吉姆大师傅贵" + 0.007*"口味真的好吃贵是贵点芋泥巧克力真的好吃确实蛋黄没吃过试试她家雪媚娘真的好吃" + 0.007*"一句话味道不错值得等待超过十五分钟芋泥蛋糕一人限购一块一炉十几块样子特意买不到味道热乎乎好吃抹茶红豆还行家蛋糕新鲜出炉好吃常年排队" + 0.007*"确实好吃甜外卖" + 0.007*"环境喜欢吃传统面包这家店算是网红台湾面包店两种面包原味芋泥一对台湾老夫妇开年轻人弄卓悦汇梅林地铁站服务它家面包重量卖排队一会买两个半份面包原味和芋泥芋泥蛋糕芋泥厚实口感滑嫩原味蛋糕更喜欢原味多一些很浓鸡蛋牛奶味道" + 0.007*"两年前来排队超多人排队味道两年前好吃味道心心念念终于吃" + 0.007*"古早味味觉记忆坊福田挺有名蛋糕排半个小时终于买买半份芋泥半份巧克力芋泥蛋糕芋泥刚出炉找个地方赶紧坐下来试不错芋泥流心很香蛋糕体松软爆浆巧克力排久买一种总感觉不划算买巧克力巧克力刚出炉刚出炉香不错放冰箱隔天吃一种感觉总体不用排队更好" + 0.007*"最差体验周五下班排一个半小时半片碎不能自己选择味道态度巨差史上最差购物体验再也值得没玄乎不用排队人多欺客" + 0.007*"这家店火路过排队特地来买情况例外冷飕飕天气还好久排到想要芋泥蛋糕称重价格蛋糕三层厚厚的溢出芋泥口感细腻两层软软蛋糕下午茶不错" + 0.007*"收藏夹里久机会听到朋友坑蒙拐骗朋友带回来芋泥蛋糕不喜甜食抗拒真的好吃好吃连夜吃完一整块吃完一口停不下来芋泥口味建议多买吃买当天吃口感松软绵密爆浆巧克力好吃好吃好吃巧克力好吃原味蛋糕适合保存冷藏一晚口感松软绵密忘记拍照回事只能评论区顺图蛋糕吃完盒子留空盒证明"

# Topic: 6
# Words: 0.007*"梅林美食天堂古早味蛋糕店店铺很小看好多人排队抱试试看心情跟着排队芋泥猜家主推肉眼速度卖光下一锅出炉分钟热烤很香买芋泥蛋糕巧克力蛋糕蛋糕特别甜挺好吃芋泥口感奇妙两块蛋糕花价格算还行" + 0.007*"网友推荐收藏久天路过吃剩下两个口味蛋糕喜欢吃香芋点芋头味大雨选择店吃店面挺味道蛋糕松软口感微甜总体不错" + 0.007*"芋泥蛋糕上层蛋糕有芋泥味且绵密芋泥很纯下层蛋糕水分会少些好吃价格略贵原味蛋糕蛋香味浓郁蛋糕体绵密当天热热不错" + 0.007*"心中排名古早味蛋糕好吃要命甜蛋糕体软流心真的爱上环境店面并不大我会打电话老板问排队蛋糕问久芋泥蛋糕第二次回购不甜且软蛋糕体松软搭配贼芋泥稍带点颗粒好吃爆浆巧克力芋泥蛋糕点巧克力果断买流心爱巧克力爱好者必点" + 0.007*"特意买蛋糕买多种口味蛋糕芋泥原味芝士味枣泥味吃完芋泥好吃平均一块蛋糕十三块钱深圳十几二十蛋糕面包十三块大块蛋糕算性价比高" + 0.007*"说古早味蛋糕第一名名不虚传贵点没毛病爆浆巧克力一种口味试过巧克力最最好吃巧克力豆表皮一层巧克力浓郁蛋糕体巧克力做甜腻一大块配鲜奶吃早餐超级老板配送费尊贵" + 0.007*"爆浆巧克力喜欢巧克力香浓芋泥蛋糕芋泥不腻咸蛋黄蛋糕咸蛋黄腻刚吃还行凉" + 0.007*"放假朋友约安排吃吃喝喝行程地铁拐进去第一个街道直走美宜佳便利店旁边朋友收藏这家手工蛋糕说会排队个大早九点半店里完美不用排队芋泥蛋糕芋泥香甜细腻爆浆巧克力爆浆巧克力太甜原味蛋糕原味经典款好吃配壶茶冰美式刚刚总体好吃排队不太有" + 0.007*"吃饭顺路撞撞运气周末晚上确实人多工作日晚上多些外地人抢地盘三条友轮流排队买一块小芋泥一口回魂本来旁边喝凉茶一口喉咙舒服朋友说多巴胺分泌哈哈哈心心念念芋泥吃满嘴幸福冬天吃更妙" + 0.007*"时不时想起买店运气不用排队大部分时间排队味道超级棒适合老人孕妇孩子吃健康蛋糕店员店面小小的做东西专业店里卖种类几款无限回购蛋糕店这家有没有分店真希望家门口再开一家每次坐地铁买回几份分给想吃卖"

# Topic: 7
# Words: 0.007*"一二三四五六七深圳吃东西吃完笑嘻嘻识饮识食人生探店古早味味觉记忆坊别问好不好吃问超级好吃芋泥蛋糕迷你榴莲盒子蛋糕榴莲香一口榴莲一口奶油一口蛋糕太爽了" + 0.007*"爆浆巧克力刚烤诱人喜欢巧克力巧克力爆浆浓郁芋泥蛋糕最爱芋泥丰厚流心太香刚烤松软嫩滑忍不住店里吃一半当天吃不完回家放冰箱第二天好吃" + 0.007*"特意坐地铁买几块味道不错很甜蛋糕软巧克力热刚出炉软软香香的好吃肉松不错香芋味道不算浓倒本来想买瑞士卷品种少点下次试试原味枣泥" + 0.007*"真的好吃不甜非常适合家里老人孩子吃喜欢吃古早味蛋糕试一试" + 0.007*"很火一家小店能刷巧克力芋泥原味各要一块买完想半块三大块属实芋泥最贵重压秤芋泥贵很甜芋泥绵密吃" + 0.007*"蛋糕新鮮現烤香味濃厚路過聞到香氣現場排隊想吃饕客早早來排隊" + 0.007*"不用排队买体验感提升味道不错品尝" + 0.007*"梅林吃这家蛋糕中午点买芋泥蛋糕巧克力蛋糕芋泥刚出炉听朋友劝到手打开吃热松软芋泥绵密很甜真的好吃啊啊啊巧克力刚出炉流心巧克力腻一点好吃" + 0.007*"不用介绍深圳好吃鸡蛋糕吊打连锁店蛋糕体特别绵软湿润喜欢芋泥味儿巧克力味儿特别香一口气吃腻每次来到梅林买好像很快卖完下午晚点想点外卖" + 0.007*"有人排队耐不住好奇心中午人少来买门店设备房现场做面包甜度刚刚腻面包松软蓬松感觉小时候吃蛋糕吃奶香奶香小孩喜欢"

# Topic: 8
# Words: 0.007*"口味原料科技狠活性价比超级超级高转好几圈找到科技狠活蛋糕买三个原味鸡蛋蛋糕自吃送朋友帮忙评价蛋糕品质个人感觉味道观察店铺蛋糕材料确确实实真材实料添加科技狠活安心吃" + 0.007*"芋泥蛋糕最最喜欢一款芋泥口味很甜不腻真的超级好吃为啥选择送外卖一大早下着雨带孩子打着伞几站地铁买回来吃孩子超爱值得跑一趟" + 0.007*"卓越城办完事想买点点心带回去网上搜到这家店中午步行卓越城到买三个口味不负期望蛋糕口感绵密扎实巧克力香芋馅料好多一口超爱爆浆巧克力实物比网图更食欲" + 0.007*"超级无敌多人排队蛋糕老店朋友推荐一家店开很多年老店特别好吃排队排一个多钟增说时间人均时间时间点现烤现卖产品特别好吃排队久鸡蛋味面包味融合不错买芋泥面包吃天气炎热他会融化面包蛋糕吃美味味道排队排队小时他家店面少站排队如果说特别深圳打卡适合时间人来打卡" + 0.007*"超级无语服务态度说买原味先买买原味买说香芋出炉要命老板娘" + 0.007*"重点写每周一店休买吃吃坐店里吃站门口吃蹲马路牙子吃边走边吃买打包捂出水蒸气捂到蛋糕冷吃口感差一点半点推荐芋泥蛋糕爆浆巧克力刚出炉松软空气感咬了一口云朵一抿就化甜度恰到好处不甜不腻称重买半份一人食友好梅林土特产" + 0.007*"周六傍晚排队好久没买没想到生意火爆爱他家芋泥原味蛋糕口感稳定这家店家庭作坊老板沟通方式一如既往简单价格一份大份芋泥蛋糕多元一份大份原味蛋糕" + 0.007*"收藏久店没事干溜达出门买排队蛋糕刚烤热选评价芋泥巧克力买仔细看过评论很怕太甜蛋糕松软绵密孔洞细小湿度刚刚跟芋泥搭配和谐剩下冰箱当作冷藏版冰淇淋巧克力甜度比芋泥高尚可接受巧克力香味很足芋泥甜度怕甜接受程度确实大部分店铺蛋糕" + 0.007*"住梅林吃古早蛋糕店芋泥一绝快售罄时老板善意提醒排人多时协调限购粉丝善良大单买断黑粉周一休息别跑差" + 0.007*"爆浆巧克力爆浆巧克力巨好吃甜中不带腻软绵绵面包咬真香真好吃芋泥蛋糕芋泥芋泥量挺很香很甜好吃听说周末抹茶蛋糕可惜周末玩周五晚上确实排队"

# Topic: 9
# Words: 0.007*"吼吼吃蛋糕超级软很甜芋泥绵密狂炫三块疫情去过没开门跑空终于吃不枉坐车打卡店里服务态度哥哥买芋泥味下次试下巧克力味" + 0.007*"排队新鲜出炉推荐香芋蛋糕" + 0.007*"收藏很久很久终于吃大众卓悦汇有活动顺便吃这家古早味蛋糕星期五三点多去买没排队芋泥蛋糕新鲜出炉好吃芋很甜蛋糕整体松软爆浆巧克力巧克力浓郁巧克力味劣质那种巧克力香精味两个味道好吃可惜每次远顺便买来试试下次想试口味" + 0.007*"梅林居民区楼下一家小小的店面几年前吃没红出门办事带一块工作日下午排队有个跑腿小哥买特别一会儿东西确实好吃芋泥巧克力蛋糕香味特别浓郁东西味道好吃芋泥蛋糕味道不用抱太大期望店铺在家幸福专程打卡水平" + 0.007*"刚出炉味道不错芋泥不甜面包体松软不错巧克力刚出炉蛮好吃排队超过分钟没排队估计甘心看着队伍好像长出炉十几个没第二轮分钟很久推荐工作日排队周末排队真心建议" + 0.007*"这家店去过好几年特别喜欢吃芋泥口味蛋糕新鲜出炉特别好吃网络营销白天买不用排队晚上周末大排长龙特别多人味道好吃" + 0.007*"原味蛋糕想到家外卖早上点外卖芋泥咸蛋黄只能选择原味原味爱打开扑鼻而来蛋糕香味闻得新鲜家用料真的好吃口感南阳大师傅累劲家皮烤更干喜欢芋泥盒子尝到芋泥味古早蛋糕肯定芋泥盒子铺一层芋泥真的心情特别美妙瞬间乐开了花真的好吃" + 0.007*"五点钟正好卖完一批七点买第二批刚出炉吃第一感受辜负连续跑两趟芋泥温面包松软配牛奶奶茶一绝" + 0.007*"一家很小很小门店洗位置坐我家大众没留意总体性价比高好吃挺香特别家料真挺值得一试" + 0.007*"口味买芋泥口味很香软糯原料真材实料伦斤购买没进门闻到超级香环境很小店面买走那种"



In [3]:
import pandas as pd
from gensim import corpora, models
from gensim.models.ldamodel import LdaModel
import pyLDAvis.gensim_models as gensimvis
import pyLDAvis
import numpy as np
import re
from nltk.corpus import stopwords
from nltk.tokenize import word_tokenize
from tqdm import tqdm

# 加载Excel文件
file_path = '/data1/dxw_data/llm/RAG-mkt-kmeans/data3/cleaned_comments_dianping_cake.xlsx'
df = pd.read_excel(file_path)

# 文本预处理函数
def preprocess_text(text):
    # 移除标点符号和数字
    text = re.sub(r'\d+', '', text)
    text = re.sub(r'[^\w\s]', '', text)
    # 转小写
    text = text.lower()
    # 分词
    tokens = word_tokenize(text)
    # 移除停用词
    tokens = [word for word in tokens if word not in stopwords.words('chinese')]
    return tokens

# 对每条评论进行预处理
tqdm.pandas(desc="Preprocessing comments")
df['cleaned_tokens'] = df['comment'].progress_apply(preprocess_text)

# 创建词典和语料库
dictionary = corpora.Dictionary(df['cleaned_tokens'])
corpus = [dictionary.doc2bow(tokens) for tokens in df['cleaned_tokens']]

# 训练LDA模型
lda_model = LdaModel(corpus, num_topics=10, id2word=dictionary, passes=15)

# 输出主题
for idx, topic in lda_model.print_topics(-1):
    print(f"Topic: {idx}\nWords: {topic}\n")



Preprocessing comments: 100%|██████████| 800/800 [00:00<00:00, 1037.39it/s]


Topic: 0
Words: 0.006*"爆浆巧克力" + 0.005*"环境" + 0.004*"芋泥蛋糕" + 0.003*"不会很甜" + 0.003*"芋泥" + 0.003*"一块左右" + 0.002*"巧克力" + 0.002*"尤其是蛋糕新鲜出炉的时候" + 0.002*"每次路过这家古早味蛋糕" + 0.002*"排队的顾客不少都是住附近的街坊邻居"

Topic: 1
Words: 0.005*"环境" + 0.005*"芋泥蛋糕" + 0.005*"性价比" + 0.003*"经常要排队" + 0.002*"口味" + 0.002*"我觉得馅料不算很甜但是蛋糕体是比较甜的" + 0.002*"环境一般" + 0.002*"上下两层蛋糕胚" + 0.002*"本人比较喜欢中间那层芋泥但是超级少" + 0.002*"现场吃了一些剩下的回家放冰箱了"

Topic: 2
Words: 0.013*"环境" + 0.007*"服务" + 0.006*"芋泥蛋糕" + 0.003*"爆浆巧克力" + 0.002*"突然之前各个地方都开了海绵蛋糕店" + 0.002*"没有什么环境吧" + 0.002*"这次路过发现门口没什么人排队" + 0.002*"买完原味的继续在另一条队伍等待芋泥口味出炉" + 0.002*"但抖着颤颤巍巍的身躯上称" + 0.002*"和茶在口腔中谈一场腻腻歪歪的恋爱"

Topic: 3
Words: 0.013*"环境" + 0.010*"口味" + 0.010*"性价比" + 0.007*"原料" + 0.003*"服务" + 0.002*"入口即化" + 0.002*"下层口感要相对实在一些" + 0.002*"去到要排队" + 0.002*"蛋糕体上层湿润蓬松" + 0.002*"等到下一波芋泥出炉等了将近四十分钟"

Topic: 4
Words: 0.006*"环境" + 0.005*"duang" + 0.002*"榴莲就一般比较腻" + 0.002*"实则没那么贵" + 0.002*"朋友觉得原味有点腥" + 0.002*"今天来店里才知道原来外卖加价卖的" + 0.002*"巧克力爆浆" + 0.002*"店员看起来不太开心" + 0.002*"奥利奥盒子" + 0.002*"但也会说清楚注意事项"

To

In [None]:
# 根据上述主题和词汇，可以将评论分为以下几个主题：

# 1. **环境**
#    - 环境描述和评价
#    - 环境一般或较好

# 2. **食物口味**
#    - 芋泥蛋糕、爆浆巧克力等具体蛋糕的口味评价
#    - 入口即化、湿润蓬松等口感描述
#    - 特别提到的其他口味如榴莲、原味蛋糕等

# 3. **服务**
#    - 服务质量
#    - 店员态度
#    - 排队情况

# 4. **性价比**
#    - 食品的性价比评价
#    - 价格合理性

# 5. **原料和新鲜度**
#    - 原料的描述和评价
#    - 蛋糕的新鲜度

# 6. **综合评价**
#    - 总体评价
#    - 满意度
