## 1 加载包

In [1]:
library(stm)
library(tidyverse)
library(jiebaR)
library(quanteda)
library(showtext)
library(showtextdb)
# 自动使用 showtext 渲染
showtext_auto()

stm v1.3.7 successfully loaded. See ?stm for help. 
 Papers, resources, and other materials at structuraltopicmodel.com



── [1mAttaching core tidyverse packages[22m ──────────────────────── tidyverse 2.0.0 ──
[32m✔[39m [34mdplyr    [39m 1.1.4     [32m✔[39m [34mreadr    [39m 2.1.5
[32m✔[39m [34mforcats  [39m 1.0.0     [32m✔[39m [34mstringr  [39m 1.5.1
[32m✔[39m [34mggplot2  [39m 3.5.1     [32m✔[39m [34mtibble   [39m 3.2.1
[32m✔[39m [34mlubridate[39m 1.9.3     [32m✔[39m [34mtidyr    [39m 1.3.1
[32m✔[39m [34mpurrr    [39m 1.0.2     


── [1mConflicts[22m ────────────────────────────────────────── tidyverse_conflicts() ──
[31m✖[39m [34mdplyr[39m::[32mfilter()[39m masks [34mstats[39m::filter()
[31m✖[39m [34mdplyr[39m::[32mlag()[39m    masks [34mstats[39m::lag()
[36mℹ[39m Use the conflicted package ([3m[34m<http://conflicted.r-lib.org/>[39m[23m) to force all conflicts to become errors


Loading required package: jiebaRD



Package version: 4.0.2
Unicode version: 14.0
ICU version: 70.1



Parallel computing: 4 of 4 threads used.



See https://quanteda.io for tutorials and examples.



Loading required package: sysfonts



Loading required package: showtextdb



## 2 整理数据

In [2]:
#导入数据
data1 <- read.csv(file = "/kaggle/input/dou-data1007/douban_data.csv")


In [3]:
glimpse(data1)

Rows: 108,985
Columns: 10
$ 标题          [3m[90m<chr>[39m[23m "# 阿尔茨海默病：一份温馨的护理指南", ".", ".", "/", "/"…
$ year          [3m[90m<dbl>[39m[23m 2024, 2023, 2023, 2021, 2021, 2021, 2021, 2021, 2021, 20…
$ ip            [3m[90m<chr>[39m[23m "上海", "北京", "海南", "", "", "", "", "", "", "", "", …
$ text          [3m[90m<chr>[39m[23m "# 阿尔茨海默病：一份温馨的护理指南\n      #阿尔茨海默病…
$ diqu          [3m[90m<dbl>[39m[23m 1, 1, 1, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA, NA,…
$ zuwu          [3m[90m<int>[39m[23m 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0, 0,…
$ text1         [3m[90m<chr>[39m[23m "阿尔茨海默病一份温馨的护理指南阿尔茨海默病一份温馨的护…
$ text1_cut     [3m[90m<chr>[39m[23m "病 一份 护理 指南 病 一份 护理 指南 豆瓣 充满 文艺 气息…
$ text1_cleaned [3m[90m<chr>[39m[23m "病 一份 护理 指南 病 一份 护理 指南 豆瓣 充满 文艺 气息…
$ text2_cleaned [3m[90m<chr>[39m[23m "病 一份 护理 指南 病 一份 护理 指南 充满 气息 社区 分享…


In [4]:
# 从 data1 中选择指定列，并按标题、year 和 ip 合并相同的行，最后重命名列名
data <- data1 %>%
  select(标题, year, diqu, text2_cleaned) %>%
  group_by(标题, year, diqu) %>%
  summarise(
    text = paste(text2_cleaned, collapse = " "),  # 合并 text2_cleaned 并重命名为 text
    .groups = "drop"  # 解除分组
  )


In [5]:
glimpse(data)

Rows: 9,253
Columns: 4
$ 标题 [3m[90m<chr>[39m[23m "# 阿尔茨海默病：一份温馨的护理指南", ".", "/", "0", "00后提前经…
$ year [3m[90m<dbl>[39m[23m 2024, 2023, 2021, 2021, 2022, 2023, 2024, 2024, 2021, 2020, 2021,…
$ diqu [3m[90m<dbl>[39m[23m 1, 1, NA, NA, NA, 1, 1, 2, NA, NA, NA, 1, 2, 3, NA, 1, 2, 1, 2, 4…
$ text [3m[90m<chr>[39m[23m "病 一份 护理 指南 病 一份 护理 指南 充满 气息 社区 分享 感悟 知…


In [6]:
table(data$year,useNA="ifany")


2019 2020 2021 2022 2023 2024  NaN <NA> 
  41  548 1880 2579 2667 1506   30    2 

In [7]:
# 过滤掉 year 列中为 NaN 或 NA 的行
data <- data %>%
  filter(!is.na(year) & !is.nan(year))

# 检查结果
table(data$year, useNA = "ifany")


2019 2020 2021 2022 2023 2024 
  41  548 1880 2579 2667 1506 

In [8]:
table(data$diqu, useNA = "ifany")


   1    2    3    4 <NA> 
2436 1914  532  458 3881 

## 3 准备数据

In [9]:
# 4. Text processing using textProcessor (since the text is already segmented)
processed <- textProcessor(documents = data$text, 
                           metadata = data, 
                           removestopwords = FALSE,
                           removepunctuation = FALSE,
                           stem = FALSE,
                          wordLengths = c(2,Inf))



Building corpus... 
Converting to Lower Case... 
Removing numbers... 
Creating Output... 


In [10]:
# 5. Prepare documents for STM without removing low frequency terms
out <- prepDocuments(processed$documents, processed$vocab, processed$meta)
print(head(out$documents))  # View the first few processed documents

Removing 170 of 12986 terms (170 of 482905 tokens) due to frequency 
Your corpus now has 9026 documents, 12816 terms and 482735 tokens.

$`1`
     [,1] [,2] [,3] [,4] [,5] [,6] [,7] [,8] [,9] [,10] [,11] [,12] [,13] [,14]
[1,]   45  149  192  245  654  918 1054 1238 1320  1460  1478  1539  1629  1775
[2,]    2    2    2    1    2    1    1    1    1     1     1     1     1     1
     [,15] [,16] [,17] [,18] [,19] [,20] [,21] [,22] [,23] [,24] [,25] [,26]
[1,]  1867  2241  2289  2397  2474  2535  2759  2953  2987  3332  3719  3724
[2,]     2     1     1     5     1     2     1     1     1     1     1     1
     [,27] [,28] [,29] [,30] [,31] [,32] [,33] [,34] [,35] [,36] [,37] [,38]
[1,]  3731  4594  4604  4641  4642  4704  4750  4855  4879  4948  5112  5114
[2,]     1     1     1     1     1     2     2     1     1     1     1     2
     [,39] [,40] [,41] [,42] [,43] [,44] [,45] [,46] [,47] [,48] [,49] [,50]
[1,]  5161  5320  5598  5616  5742  5841  5844  5855  5861  5866  5959  5978
[2,]     1     2     1     1     2     1    15     1     1     3     1     3
     [,51] [,52] [,53] [,54] [,55] [,56] [,57] [,58] [,59] [,6

In [11]:
# out$documents格式为：每条文本分词对应词汇表vocab中的id，以及词频
head(out$documents, 5)
head(out$vocab, 200)
head(out$meta, 5)

0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20
45,149,192,245,654,918,1054,1238,1320,1460,⋯,11617,11794,11962,11984,11989,12311,12463,12495,12511,12806
2,2,2,1,2,1,1,1,1,1,⋯,2,1,1,2,1,2,1,1,1,2

0,1,2,3,4,5,6
5151,9246,10453,11183,11271,12231,12263
2,1,2,1,1,1,1

0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20
42,76,108,109,128,163,169,205,227,238,⋯,12424,12426,12495,12570,12580,12631,12651,12652,12653,12740
3,9,6,3,9,3,9,3,3,9,⋯,9,3,3,3,3,3,3,3,3,3

0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19,20
34,45,58,104,108,123,133,144,169,188,⋯,12160,12180,12339,12424,12441,12474,12600,12619,12662,12663
1,2,1,6,1,1,1,1,1,1,⋯,1,1,1,2,1,1,1,1,1,1

0,1,2,3,4,5,6,7,8,9,10,11,12,13,14,15,16,17,18,19
1068,3971,3984,4952,5114,5634,5818,5923,5954,6024,6416,7368,8549,8597,8877,9713,10702,11156,12005,12061
1,1,1,1,2,1,1,1,1,1,1,1,2,3,1,1,1,1,1,1


Unnamed: 0_level_0,标题,year,diqu,text
Unnamed: 0_level_1,<chr>,<dbl>,<dbl>,<chr>
1,# 阿尔茨海默病：一份温馨的护理指南,2024,1.0,病 一份 护理 指南 病 一份 护理 指南 充满 气息 社区 分享 感悟 知识 分享 病 护理 知识 希望 照顾 患有 疾病 亲人 朋友 提供 支持 病 病 一种 常见 神经 疾病 患者 记忆 思维 行为能力 疾病 患者 一种 照顾 家人 朋友 艰难 旅程 护理 原则 耐心 理解 患者 情况 独特 护理 耐心 理解 需求 感受 第一 确保 患者 环境 跌倒 意外 伤害 规律 患者 记忆 衰退 规律 感到 安心 情感 支持 给予 患者 爱和 支持 感到 尊重 专业 寻求 专业 医疗 护理 团队 护理 方案 护理 环境 布置 创造 熟悉 环境 明亮 色彩 清晰 患者 识别 方向 物品 选择 减少 患者 做出 选择 几套 固定 早餐 选项 沟通 技巧 简单 清晰 语言 患者 感到 困惑 焦虑 时 给予 安慰 肯定 记忆 数字 患者 记住 事件 身体 鼓励 患者 适量 身体 散步 简单 鼓励 患者 家人 朋友 社区 保持联系 参与 社交活动 认知 刺激 阅读 听 音乐 刺激 患者 思维 记忆 情绪 患者 情绪 抑郁 焦虑 情绪 照顾 病患者 一项 充满 人生 体验 过程 学会 耐心 同情 爱 希望 护理 指南 提供 实用 建议 心灵 慰藉 记住 孤单 社区 伸出 援手 面对 推荐 阅读 一本 病 小说 患者 角度 理解 疾病 一本 照顾 提供 实用 建议 经典 书籍 分享 故事 分享 知识 护理 经验 心得 评论 区 分享 爱 理解 发
2,.,2023,1.0,能力 帮忙 说话 没 能力 帮忙 闭嘴 键盘 识字 看不懂 张 图
3,/,2021,,一句 压力 妈 妈 压力 爸 根源 爸 解决 妈 想着 投靠 换 房子 小区 再租 一间 居室 妈 要死要活 把戏 二三十年 不太想 配合 纠结 常态 小时候 亲妈 欺负 不算 妈 出点 钱 换 大点 房子 回去 爸 爸 一家 责任 压 妈 两个 不到 爸 解决 女人 为难 女人 上说 睡 换 房子 住 空间 走 类似 妈 敏感 小气 打呼 隐晦 提过 赌气 睡 生气 解决 妈 伤心 生气 哭 自责 小事 充斥 加班 回家 妈 要死要活 把戏 二三十年 不太想 配合 直说 走 送 买 床 搁 客厅 腾出 休息 空间 爸 两个 体会 感受 妈 难 两条路 可走 回家 跟来 喘息 压抑 妈 关心 只能 忍受 难 五一 爱 回家 妈 控制 强 吵架 两个 肯定 两个 不住 住 近 车程 分钟 一线 没钱买 房 尴尬 上说 睡 换 房子 住 空间 走 说理 爸 不让 跳 广场 舞 开心 肯定 开心 不让 出去玩 感觉 希望 开心 妈 孝心 忘 妈 理解 记仇 快 岁 高 租 两个 房间 房子 住 社畜 压力 状态 换 房子 小区 再租 一间 居室 天 爸 照顾 妈 走 爸 劝 妈 附和 纠结 常态 小时候 亲妈 欺负 不算 妈 出点 钱 换 大点 房子 回去 爸 爸 一家 责任 压 妈 两个 不到 爸 解决 女人 为难 女人 妈 找 轻松 点 劲头 老家 找 帮 照顾 老年人 妈 老家 窒息 负责 做饭 早饭 妈 住 找对象 妈 哭 感觉 父母 生活习惯 逛街 带 妈 玩 想着 好玩 累 人间 惨剧 租 房子 一句 压力 妈 妈 压力 爸 根源 爸 解决 妈 想着 投靠 客厅 睡 睡 床 肯定 分开 睡 讲 条件 住 几点 回 回来 吃饭 告诉 不用 问 接受 回去 爸 住 回家 搬 家 妈 找 不到 忍 上班 听 领导 下班 听 妈 哭 二 闹 三 上吊 父母 子女 妈 套 施压 摆明 情绪 达成 目的 压根 父母 体谅 子女 样子 难听 点 吸血虫 心 单身 感觉 没法 解决 绝望 难 简单 多花钱 再租 一间 妈 租 妈 住 租房子 估计 闹 闹 妥协 懂 两个 房间 房子 聊聊 行 同事 社交 习惯 呆 全 爸 喊 回去 理解 妈 不想 照顾 奶奶 照顾 老年人 状况 干 事情 爸 奶奶 妈 委屈 租 两居室 妈 讲 生活习惯 两个 抑郁 保护 妈 日子 时间 爸 急 回去 难 婚女 不住 男人 压力 压榨 子女 妈 成年人 负担 情绪 建立 边界 感 妈 绑架 高手 哭 难受 难受 难受 赢 目的 锻炼身体 朋友 羽毛球 交际 不行 单位 团建 源头 爸 父母 照顾 控制 妈 妈 控制 爸 解决 折磨 两居室 分房 睡 解决 傻 想想 妈 特地 搬 找 玻璃心 不让 爸 表达 妈 老家 回去 分担 一点 爸 伴儿 爸 爸 妈 哄 回去 解放 没 钱 有钱 妈 讲 身体 搞垮 妈 帮不上忙 身体 事业 妈 根源 出 爸 照顾 爷爷奶奶 妈 责任 妈 退休 妈 神奇 喜欢 人管 双标 好惨 教 妈 反抗 爸 不让 跳 广场 舞 老 朋友 地方 玩 缺 朋友 照顾 爷奶 情况 儿媳妇 伺候 公婆 义务 妈 妈 出 主意 妈 成年人 妈 干涉 世界 妈 思考 子女 空间 时间 抛弃 妈 建立 社交圈子 找 跳跳舞 逛逛 街 精力 放在 妈 退休 投靠 妈 普通工人 退休金 两三千 钱 两 居 大胆 积蓄 可否 买房 改善 环境 减轻 压力 孝敬 妈 投靠 关系 主导地位 走 规划 干 答应 恢复 社交圈子 保证 心理健康 余力 照顾 感觉 焦虑 解除 花点 钱 租 房子 一张 床 不行 睡 状态 找 根源 爸 妈 实在 不想 爸 看能 换 两居室 睡 客厅 睡 一张 床 休息 接受 一点 意识 削减 控制 讲道理 爸 自由 开心 妈 子女 朋友 好惨 面对 情况 反抗 跑 妈 哭 硬 累 绑架 理想 方法 妈 爸 离婚 住 享受 半辈子 得不到 自由 快乐 没 办法 只能 租房子 找对象 遭遇 躺平 根源 妈 家 开心 婆婆 婚姻 口气 演变 掠夺 女儿 情绪 生存 资源 烦人 妈 本质 家 外姓 丈夫 家 阴影 一辈子 找 份 轻松 点 寄托 社交圈 退休年龄 早 一代人 光 帖子 窒息 小时候 子女 缠 妈 睡 照顾 妈 情绪 情绪 建议 照顾 情绪 妈 出 爸 快乐 爸 照顾 爸 父母 开 心想 投靠 喘 口气 只能 爸 入手 爸 妈 兴趣爱好 妈 独立 绑架 伺候 老年人 回家 妈 找 轻松 事情 一点 妈 妈 睡 嫌弃 睡觉 不安分 放假 呆 嫌弃 朋友 玩 找 常住 租 两居室 起码 作息 报备 事 玩 两三点 妈点 不到 电话 打来 妈 老伴 陪伴 生活空间 成年人 探望 居住 希望 理解 尊重 听 完 哭 总得 道理 班 跑 健身房 死活 不想 回家 冷漠 情况 妈 子女 照顾 给予 窒息 爱 妈 建议 沟通 换 两室 朋友 妈 睡 大点 客厅 讲 睡 住 租 两居室 买 二手 行 睡 一张 床 买 耳塞 妥协 一步 没到 公婆 住 大部分 父母 不适 合同 住 房间 办公 电话 妈 偷听 妈 想着 软弱 没 办法 爸 家住 生活习惯 饮食习惯 很大 开口 一句 话 上班 操心 吃 看着 时间 点 外卖 时间 紧 早饭 几次 口味 不吃 下班 回来 放在 餐桌上 朋友 吃饭 频率 降低 操心 饮食 心情 熬 带 四处 玩 提前 问 陪 应酬 时间 大部分 开销 出 买点 菜 洗 碗 挺累 租房 成本 逃脱 方式 嫌弃 找 出门 上班 包 饺子 事情 解放 好像 没 妈 控制 单身 女子女 两个 同住 肯定 妈 问 几点 回 家长 希望 女孩 回家 担心 打呼 头疼 建议 租 两 室 负担 重 朋友 感觉 爱 跳 广场 舞 担心 社交 妈 爸 奶奶 只能 妈 走走 心情 好多 没用 没了 房租 太太 贵 居室 三千多 租 两 室 爸 妈 照顾 爷奶 爱好 租 买 分开 睡 床 放 客厅 不用 屋 找 男朋友 一家人 含蓄 换 两 室 房子 妈 直说 不住 单身 一句 压力 妈 妈 压力 爸 根源 爸 解决 妈 想着 投靠 换 房子 小区 再租 一间 居室 妈 要死要活 把戏 二三十年 不太想 配合 纠结 常态 小时候 亲妈 欺负 不算 妈 出点 钱 换 大点 房子 回去 爸 爸 一家 责任 压 妈 两个 不到 爸 解决 女人 为难 女人 上说 睡 换 房子 住 空间 走 类似 妈 敏感 小气 打呼 隐晦 提过 赌气 睡 生气 解决 妈 伤心 生气 哭 自责 小事 充斥 加班 回家 妈 要死要活 把戏 二三十年 不太想 配合 直说 走 送 买 床 搁 客厅 腾出 休息 空间 爸 两个 体会 感受 妈 难 两条路 可走 回家 跟来 喘息 压抑 妈 关心 只能 忍受 难 五一 爱 回家 妈 控制 强 吵架 两个 肯定 两个 不住 住 近 车程 分钟 一线 没钱买 房 尴尬 上说 睡 换 房子 住 空间 走 说理 爸 不让 跳 广场 舞 开心 肯定 开心 不让 出去玩 感觉 希望 开心 妈 孝心 忘 妈 理解 记仇 快 岁 高 租 两个 房间 房子 住 社畜 压力 状态 换 房子 小区 再租 一间 居室 天 爸 照顾 妈 走 爸 劝 妈 附和 纠结 常态 小时候 亲妈 欺负 不算 妈 出点 钱 换 大点 房子 回去 爸 爸 一家 责任 压 妈 两个 不到 爸 解决 女人 为难 女人 妈 找 轻松 点 劲头 老家 找 帮 照顾 老年人 妈 老家 窒息 负责 做饭 早饭 妈 住 找对象 妈 哭 感觉 父母 生活习惯 逛街 带 妈 玩 想着 好玩 累 人间 惨剧 租 房子 一句 压力 妈 妈 压力 爸 根源 爸 解决 妈 想着 投靠 客厅 睡 睡 床 肯定 分开 睡 讲 条件 住 几点 回 回来 吃饭 告诉 不用 问 接受 回去 爸 住 回家 搬 家 妈 找 不到 忍 上班 听 领导 下班 听 妈 哭 二 闹 三 上吊 父母 子女 妈 套 施压 摆明 情绪 达成 目的 压根 父母 体谅 子女 样子 难听 点 吸血虫 心 单身 感觉 没法 解决 绝望 难 简单 多花钱 再租 一间 妈 租 妈 住 租房子 估计 闹 闹 妥协 懂 两个 房间 房子 聊聊 行 同事 社交 习惯 呆 全 爸 喊 回去 理解 妈 不想 照顾 奶奶 照顾 老年人 状况 干 事情 爸 奶奶 妈 委屈 租 两居室 妈 讲 生活习惯 两个 抑郁 保护 妈 日子 时间 爸 急 回去 难 婚女 不住 男人 压力 压榨 子女 妈 成年人 负担 情绪 建立 边界 感 妈 绑架 高手 哭 难受 难受 难受 赢 目的 锻炼身体 朋友 羽毛球 交际 不行 单位 团建 源头 爸 父母 照顾 控制 妈 妈 控制 爸 解决 折磨 两居室 分房 睡 解决 傻 想想 妈 特地 搬 找 玻璃心 不让 爸 表达 妈 老家 回去 分担 一点 爸 伴儿 爸 爸 妈 哄 回去 解放 没 钱 有钱 妈 讲 身体 搞垮 妈 帮不上忙 身体 事业 妈 根源 出 爸 照顾 爷爷奶奶 妈 责任 妈 退休 妈 神奇 喜欢 人管 双标 好惨 教 妈 反抗 爸 不让 跳 广场 舞 老 朋友 地方 玩 缺 朋友 照顾 爷奶 情况 儿媳妇 伺候 公婆 义务 妈 妈 出 主意 妈 成年人 妈 干涉 世界 妈 思考 子女 空间 时间 抛弃 妈 建立 社交圈子 找 跳跳舞 逛逛 街 精力 放在 妈 退休 投靠 妈 普通工人 退休金 两三千 钱 两 居 大胆 积蓄 可否 买房 改善 环境 减轻 压力 孝敬 妈 投靠 关系 主导地位 走 规划 干 答应 恢复 社交圈子 保证 心理健康 余力 照顾 感觉 焦虑 解除 花点 钱 租 房子 一张 床 不行 睡 状态 找 根源 爸 妈 实在 不想 爸 看能 换 两居室 睡 客厅 睡 一张 床 休息 接受 一点 意识 削减 控制 讲道理 爸 自由 开心 妈 子女 朋友 好惨 面对 情况 反抗 跑 妈 哭 硬 累 绑架 理想 方法 妈 爸 离婚 住 享受 半辈子 得不到 自由 快乐 没 办法 只能 租房子 找对象 遭遇 躺平 根源 妈 家 开心 婆婆 婚姻 口气 演变 掠夺 女儿 情绪 生存 资源 烦人 妈 本质 家 外姓 丈夫 家 阴影 一辈子 找 份 轻松 点 寄托 社交圈 退休年龄 早 一代人 光 帖子 窒息 小时候 子女 缠 妈 睡 照顾 妈 情绪 情绪 建议 照顾 情绪 妈 出 爸 快乐 爸 照顾 爸 父母 开 心想 投靠 喘 口气 只能 爸 入手 爸 妈 兴趣爱好 妈 独立 绑架 伺候 老年人 回家 妈 找 轻松 事情 一点 妈 妈 睡 嫌弃 睡觉 不安分 放假 呆 嫌弃 朋友 玩 找 常住 租 两居室 起码 作息 报备 事 玩 两三点 妈点 不到 电话 打来 妈 老伴 陪伴 生活空间 成年人 探望 居住 希望 理解 尊重 听 完 哭 总得 道理 班 跑 健身房 死活 不想 回家 冷漠 情况 妈 子女 照顾 给予 窒息 爱 妈 建议 沟通 换 两室 朋友 妈 睡 大点 客厅 讲 睡 住 租 两居室 买 二手 行 睡 一张 床 买 耳塞 妥协 一步 没到 公婆 住 大部分 父母 不适 合同 住 房间 办公 电话 妈 偷听 妈 想着 软弱 没 办法 爸 家住 生活习惯 饮食习惯 很大 开口 一句 话 上班 操心 吃 看着 时间 点 外卖 时间 紧 早饭 几次 口味 不吃 下班 回来 放在 餐桌上 朋友 吃饭 频率 降低 操心 饮食 心情 熬 带 四处 玩 提前 问 陪 应酬 时间 大部分 开销 出 买点 菜 洗 碗 挺累 租房 成本 逃脱 方式 嫌弃 找 出门 上班 包 饺子 事情 解放 好像 没 妈 控制 单身 女子女 两个 同住 肯定 妈 问 几点 回 家长 希望 女孩 回家 担心 打呼 头疼 建议 租 两 室 负担 重 朋友 感觉 爱 跳 广场 舞 担心 社交 妈 爸 奶奶 只能 妈 走走 心情 好多 没用 没了 房租 太太 贵 居室 三千多 租 两 室 爸 妈 照顾 爷奶 爱好 租 买 分开 睡 床 放 客厅 不用 屋 找 男朋友 一家人 含蓄 换 两 室 房子 妈 直说 不住 单身 一句 压力 妈 妈 压力 爸 根源 爸 解决 妈 想着 投靠 换 房子 小区 再租 一间 居室 妈 要死要活 把戏 二三十年 不太想 配合 纠结 常态 小时候 亲妈 欺负 不算 妈 出点 钱 换 大点 房子 回去 爸 爸 一家 责任 压 妈 两个 不到 爸 解决 女人 为难 女人 上说 睡 换 房子 住 空间 走 类似 妈 敏感 小气 打呼 隐晦 提过 赌气 睡 生气 解决 妈 伤心 生气 哭 自责 小事 充斥 加班 回家 妈 要死要活 把戏 二三十年 不太想 配合 直说 走 送 买 床 搁 客厅 腾出 休息 空间 爸 两个 体会 感受 妈 难 两条路 可走 回家 跟来 喘息 压抑 妈 关心 只能 忍受 难 五一 爱 回家 妈 控制 强 吵架 两个 肯定 两个 不住 住 近 车程 分钟 一线 没钱买 房 尴尬 上说 睡 换 房子 住 空间 走 说理 爸 不让 跳 广场 舞 开心 肯定 开心 不让 出去玩 感觉 希望 开心 妈 孝心 忘 妈 理解 记仇 快 岁 高 租 两个 房间 房子 住 社畜 压力 状态 换 房子 小区 再租 一间 居室 天 爸 照顾 妈 走 爸 劝 妈 附和 纠结 常态 小时候 亲妈 欺负 不算 妈 出点 钱 换 大点 房子 回去 爸 爸 一家 责任 压 妈 两个 不到 爸 解决 女人 为难 女人 妈 找 轻松 点 劲头 老家 找 帮 照顾 老年人 妈 老家 窒息 负责 做饭 早饭 妈 住 找对象 妈 哭 感觉 父母 生活习惯 逛街 带 妈 玩 想着 好玩 累 人间 惨剧 租 房子 一句 压力 妈 妈 压力 爸 根源 爸 解决 妈 想着 投靠 客厅 睡 睡 床 肯定 分开 睡 讲 条件 住 几点 回 回来 吃饭 告诉 不用 问 接受 回去 爸 住 回家 搬 家 妈 找 不到 忍 上班 听 领导 下班 听 妈 哭 二 闹 三 上吊 父母 子女 妈 套 施压 摆明 情绪 达成 目的 压根 父母 体谅 子女 样子 难听 点 吸血虫 心 单身 感觉 没法 解决 绝望 难 简单 多花钱 再租 一间 妈 租 妈 住 租房子 估计 闹 闹 妥协 懂 两个 房间 房子 聊聊 行 同事 社交 习惯 呆 全 爸 喊 回去 理解 妈 不想 照顾 奶奶 照顾 老年人 状况 干 事情 爸 奶奶 妈 委屈 租 两居室 妈 讲 生活习惯 两个 抑郁 保护 妈 日子 时间 爸 急 回去 难 婚女 不住 男人 压力 压榨 子女 妈 成年人 负担 情绪 建立 边界 感 妈 绑架 高手 哭 难受 难受 难受 赢 目的 锻炼身体 朋友 羽毛球 交际 不行 单位 团建 源头 爸 父母 照顾 控制 妈 妈 控制 爸 解决 折磨 两居室 分房 睡 解决 傻 想想 妈 特地 搬 找 玻璃心 不让 爸 表达 妈 老家 回去 分担 一点 爸 伴儿 爸 爸 妈 哄 回去 解放 没 钱 有钱 妈 讲 身体 搞垮 妈 帮不上忙 身体 事业 妈 根源 出 爸 照顾 爷爷奶奶 妈 责任 妈 退休 妈 神奇 喜欢 人管 双标 好惨 教 妈 反抗 爸 不让 跳 广场 舞 老 朋友 地方 玩 缺 朋友 照顾 爷奶 情况 儿媳妇 伺候 公婆 义务 妈 妈 出 主意 妈 成年人 妈 干涉 世界 妈 思考 子女 空间 时间 抛弃 妈 建立 社交圈子 找 跳跳舞 逛逛 街 精力 放在 妈 退休 投靠 妈 普通工人 退休金 两三千 钱 两 居 大胆 积蓄 可否 买房 改善 环境 减轻 压力 孝敬 妈 投靠 关系 主导地位 走 规划 干 答应 恢复 社交圈子 保证 心理健康 余力 照顾 感觉 焦虑 解除 花点 钱 租 房子 一张 床 不行 睡 状态 找 根源 爸 妈 实在 不想 爸 看能 换 两居室 睡 客厅 睡 一张 床 休息 接受 一点 意识 削减 控制 讲道理 爸 自由 开心 妈 子女 朋友 好惨 面对 情况 反抗 跑 妈 哭 硬 累 绑架 理想 方法 妈 爸 离婚 住 享受 半辈子 得不到 自由 快乐 没 办法 只能 租房子 找对象 遭遇 躺平 根源 妈 家 开心 婆婆 婚姻 口气 演变 掠夺 女儿 情绪 生存 资源 烦人 妈 本质 家 外姓 丈夫 家 阴影 一辈子 找 份 轻松 点 寄托 社交圈 退休年龄 早 一代人 光 帖子 窒息 小时候 子女 缠 妈 睡 照顾 妈 情绪 情绪 建议 照顾 情绪 妈 出 爸 快乐 爸 照顾 爸 父母 开 心想 投靠 喘 口气 只能 爸 入手 爸 妈 兴趣爱好 妈 独立 绑架 伺候 老年人 回家 妈 找 轻松 事情 一点 妈 妈 睡 嫌弃 睡觉 不安分 放假 呆 嫌弃 朋友 玩 找 常住 租 两居室 起码 作息 报备 事 玩 两三点 妈点 不到 电话 打来 妈 老伴 陪伴 生活空间 成年人 探望 居住 希望 理解 尊重 听 完 哭 总得 道理 班 跑 健身房 死活 不想 回家 冷漠 情况 妈 子女 照顾 给予 窒息 爱 妈 建议 沟通 换 两室 朋友 妈 睡 大点 客厅 讲 睡 住 租 两居室 买 二手 行 睡 一张 床 买 耳塞 妥协 一步 没到 公婆 住 大部分 父母 不适 合同 住 房间 办公 电话 妈 偷听 妈 想着 软弱 没 办法 爸 家住 生活习惯 饮食习惯 很大 开口 一句 话 上班 操心 吃 看着 时间 点 外卖 时间 紧 早饭 几次 口味 不吃 下班 回来 放在 餐桌上 朋友 吃饭 频率 降低 操心 饮食 心情 熬 带 四处 玩 提前 问 陪 应酬 时间 大部分 开销 出 买点 菜 洗 碗 挺累 租房 成本 逃脱 方式 嫌弃 找 出门 上班 包 饺子 事情 解放 好像 没 妈 控制 单身 女子女 两个 同住 肯定 妈 问 几点 回 家长 希望 女孩 回家 担心 打呼 头疼 建议 租 两 室 负担 重 朋友 感觉 爱 跳 广场 舞 担心 社交 妈 爸 奶奶 只能 妈 走走 心情 好多 没用 没了 房租 太太 贵 居室 三千多 租 两 室 爸 妈 照顾 爷奶 爱好 租 买 分开 睡 床 放 客厅 不用 屋 找 男朋友 一家人 含蓄 换 两 室 房子 妈 直说 不住 单身
4,0,2021,,建议 独立 父母 回去 住在一起 回去 感觉 像是 走 关键 住在一起 住在一起 买 新房子 父母 住 三年 住 不到 跑 一批 不想 住 住 契机 买 一套 小户型 住 三年 时间 占据 感觉 无力 经济 距离 完美 距离 可惜 太穷 难受 无聊 再租 房子 住 现实 好像 搞 住 工资水平 低 溜 找 妈 找 绑起来 建议 小区 买 一套 出钱 照顾 激励 奋斗 形势 房价 升值 父母 买 独生女 买房 父母 子女 只求 付出 求 回报 两代 住 不太好 毕业 经历 长 父母 照顾 伴随 吵过 经济 毕业 不动 父母 钱 钱 分开 住 见 好多 我会 教 抖 音 智能手机 健康 状态 点 好吃 分开 住 感情 消耗 琐碎 动 心思 找 年薪 倍 薪 找到 男朋友 快 三年 了比 开心 赚 恋爱 负担 攻略 吃 吃 买 买 分 攒 积蓄 好多 理解 情况 父母 家 买 房子 走路 分钟 分开 住 好几年 重病 父母 搬 照顾 半年 妈 增加 吵架 结婚 妈 怀疑 肯定 徘徊 解放 父母 伤害 大部分 父母 善良 大部分 妈 现实 父母 买房 买车 父母 提 住 干涉 婚姻 干涉 干涉 人生 只能 受 规矩 大部分 父母 吸 子女 血 吸 子女 血 父母 生病 要死 规矩 父母 倾尽 买房 善良 父母 私心 条件 父母 做好 自由 付出 付出 包括 情感 输出 时间 输出 条件 子女 买房 跟着 有钱 买房 买车 控制 挺强 岁 妈 儿女 有数 付出 句 话 干涉 婚姻 倒 两代 生活习惯 观念 难 金钱 好办 搬出去 难过 嫌弃 建议 三个 房子 还给 健康 风凉话 父母 缘分 浅 住在一起 神经病 大学 外省 读 上班 快 年 修复 感情 发现 难 改变 成 成熟 折磨 大三 钱 房子 车子 买 礼物 伤感 心理压力 模式 一分钱 愧疚 修复 性格 变得 年龄 变 不错 糟心 日子 身体 运气 找到 和谐 模式 承认 接受 子女 父母 幸福 放过 矫情 很好 父母 赚钱 提升 能力 想法 一家 三口 一年 见 几次 病 老 挣点 钱 办法 接到 找 近 房子 请 护工 下班 照应 舒服 舒服 买 套 住 楼上楼下 买 一套 买不起 买不起 平 父母 约定 三年 老家 房子 建 买不起 理解 纠结 人生 回 主动权 人生 父母 回去 钱 房子 卖 首付 还给 害 表达 小事 心烦 买 洗衣服 喜欢 洗完 澡 洗衣服 想着 第二天 下班 回来 洗 妈 看不惯 妈 舍不得 吃 食品 舍不得 扔 吃掉 吃坏 身体 花钱 难受 改不掉 妈 改不掉 怪 房子 回乡 阻拦 肯定 提 不行 搬出去 提 开心 气 差 三岁 代沟 父母 差 多岁 分开 住 住 只能 闭 一眼 选择性 眼瞎 办法 事情 不婚 父母 失败 告终 挣钱 买房 失败 丢脸 习惯 打压 心态 选择性 眼瞎 一点 技巧 时间 换上 换 换 滴 骂 开 电视 心态 崩溃 强大 住 父母 子女 一种 情况 适合 住在一起 一方 子女 小时候 父母 老 凑 住 例子 妈 快 疯 内裤 洗 晾 感觉 当成 成年人 性格 霸道 没 办法 改变 卖 房子 地方 买 两套 分开 住 父母 还给 买房 距离 楼上楼下 租 一套 父母 住 条件 买 一套 大龄 未婚 住 吵架 超过 父母 买 一份 百万 医疗 超过 超过 买 一份 险 住 不住 父母 做好 子女 分 离开 事情 不行 租 一套 房子 外地 父母 来住 一个月 烦死 了看 生活习惯 没错 钱 分开 住 时刻 找到 配偶 父母 气 怀疑 人生 安慰 父母 住 买不起 房子 所在城市 租房 妈 浪费 大龄 漂 小区 租房子 租 住 见面 地步 隔 几条 街 小区 租房子 住 行 实在 经济 实力 房子 独立 住 情况 只能 忍 房子 父母 出 首付款 外地 上班 妈 关系 蜜月 期 回来 住 破碎 父母 住 不来 住在一起 吵架 抑郁 搬出来 住 要死 父母 住 摆脱 控制 感觉 独生女 妈 控制 强 住 抑郁 卫生习惯 住 发 父母 住 不惯 难 独生子女 父母 有钱 适 老化 改造 专业 护理人员 安排 找 专业 解决 父母 没 感觉 两 老 超人
5,00后提前经历养老,2022,,父母 想法 希望 父母 事情 第一 时间 通知 苦点 报答 遗憾 照顾 外公 外婆 懂 生病 心疼 父母 讲道理 小辈 怕 懂事 恢复 希望 照顾 意义 找


## 4 searchk

In [12]:
#另一个notebook

## 5 拟合几个

In [13]:
stm_20 <- stm(documents = out$documents, vocab = out$vocab, K = 20, prevalence = ~year, data = out$meta, max.em.its = 75, verbose = FALSE)
summary(stm_20)

A topic model with 20 topics, 9026 documents and a 12816 word dictionary.


Topic 1 Top Words:
 	 Highest Prob: 独立, 控制, 不想, 吵架, 回家, 一点, 自私 
 	 FREX: 搬出去, 不理, 反抗, 远离, 吵架, 逃离, 住在一起 
 	 Lift: 寿宴, 干仗, 开厂, 管钱, 德性, 远点, 低气压 
 	 Score: 搬出去, 独立, 吵架, 窒息, 自私, 远离, 控制 
Topic 2 Top Words:
 	 Highest Prob: 父母, 子女, 选择, 人生, 想法, 希望, 照顾 
 	 FREX: 父母, 出国, 子女, 不育, 养儿防老, 选择, 生子 
 	 Lift: 上该, 共产主义, 客体, 私事, 细语, 晚育, 迁到 
 	 Score: 父母, 子女, 出国, 人生, 不育, 不婚, 独立 
Topic 3 Top Words:
 	 Highest Prob: 回去, 回家, 退休, 地方, 回来, 感觉, 一线 
 	 FREX: 接到, 开车, 加班, 一线, 保洁, 回去, 家乡 
 	 Lift: 一两点, 三四点, 偷听, 写字楼, 冲进来, 含蓄, 听得见 
 	 Score: 回去, 一线, 退休, 回家, 保洁, 开车, 小区 
Topic 4 Top Words:
 	 Highest Prob: 抱抱, 加油, 希望, 人生, 活着, 事情, 朋友 
 	 FREX: 加油, 抱抱, 坚强, 活着, 落户, 珍惜, 形婚 
 	 Lift: 生得, 项目经理, 挂失, 形婚, 很丧, 沼泽, 好事儿 
 	 Score: 加油, 抱抱, 人生, 坚强, 户口, 形婚, 节哀 
Topic 5 Top Words:
 	 Highest Prob: 体检, 身体, 喝酒, 医院, 医生, 健康, 抽烟 
 	 FREX: 戒烟, 戒酒, 喝酒, 抽烟, 套餐, 血脂, 体检中心 
 	 Lift: 体检中心, 倒入, 催吐, 内分泌科, 减退, 助听器, 取掉 
 	 Score: 体检, 戒烟, 喝酒, 血压, 血糖, 高血压, 糖尿病 
Topic 6 Top Words:
 	 Highest Prob: 子女, 儿子, 女儿, 重男轻女, 弟弟, 小孩, 不想 
 	 FREX: 二胎, 男孩, 不生, 再生, 重男轻

In [14]:
effects_20 <- estimateEffect(1:20 ~ year, stm_20, meta = out$meta)
summary(effects_20)


Call:
estimateEffect(formula = 1:20 ~ year, stmobj = stm_20, metadata = out$meta)


Topic 1:

Coefficients:
             Estimate Std. Error t value Pr(>|t|)
(Intercept)  1.847038   2.068908   0.893    0.372
year        -0.000885   0.001023  -0.865    0.387


Topic 2:

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept) 18.251175   2.079378   8.777   <2e-16 ***
year        -0.008988   0.001028  -8.742   <2e-16 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Topic 3:

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  8.311423   2.404068   3.457 0.000548 ***
year        -0.004079   0.001189  -3.431 0.000604 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Topic 4:

Coefficients:
             Estimate Std. Error t value Pr(>|t|)
(Intercept)  2.573549   2.124872   1.211    0.226
year        -0.001248   0.001051  -1.188    0.235


Topic 5:

Coefficients:
              Estimate Std. E

In [15]:
stm_10 <- stm(documents = out$documents, vocab = out$vocab, K = 10, prevalence = ~year, data = out$meta, max.em.its = 75, verbose = FALSE)
summary(stm_10)

A topic model with 10 topics, 9026 documents and a 12816 word dictionary.


Topic 1 Top Words:
 	 Highest Prob: 事情, 不想, 家庭, 朋友, 人生, 独生子女, 开心 
 	 FREX: 人生, 开心, 说话, 烦恼, 不耐烦, 事情, 人格 
 	 Lift: 强压, 炸毛, 反射, 枢纽, 语速, 贬义, 大嫂 
 	 Score: 家庭, 不想, 人生, 事情, 独生子女, 朋友, 独立 
Topic 2 Top Words:
 	 Highest Prob: 感觉, 退休, 时间, 亲戚, 经济, 上班, 情况 
 	 FREX: 红包, 上班, 洗衣机, 加班, 存钱, 退休, 失业 
 	 Lift: 假冒, 几线, 别动, 刷子, 半截, 好几件, 娇贵 
 	 Score: 退休, 上班, 衣服, 亲戚, 感觉, 经济, 焦虑 
Topic 3 Top Words:
 	 Highest Prob: 照顾, 回家, 抱抱, 加油, 办法, 家人, 生病 
 	 FREX: 加油, 抱抱, 陪陪, 照顾, 坚强, 辞职, 身心 
 	 Lift: 四周, 引流, 强健, 所欲, 撑下去, 整件事, 生得 
 	 Score: 照顾, 抱抱, 加油, 回家, 家人, 辞职, 护工 
Topic 4 Top Words:
 	 Highest Prob: 理解, 希望, 沟通, 父母, 方式, 原因, 关心 
 	 FREX: 公主, 姥爷, 关心, 理解, 反抗, 头发, 情感 
 	 Lift: 不办, 夫权, 接梗, 新娘, 染色, 移交, 舞台 
 	 Score: 理解, 父母, 关心, 方式, 希望, 公主, 姥姥 
Topic 5 Top Words:
 	 Highest Prob: 结婚, 房子, 买房, 家庭, 条件, 儿子, 男人 
 	 FREX: 彩礼, 男方, 女方, 扶贫, 冠姓, 买房, 倒贴 
 	 Lift: 冠姓, 三室, 三金, 下嫁, 个富, 买楼, 了不得 
 	 Score: 结婚, 买房, 房子, 男方, 儿子, 女方, 彩礼 
Topic 6 Top Words:
 	 Highest Prob: 离婚, 情绪, 关系, 奶奶, 感觉, 改变, 吵架 
 	 FREX: 证据, 继承人, 起诉, 法院, 心理医生, 离婚, 立遗嘱 
 	 Li

In [16]:
effects_10 <- estimateEffect(1:10 ~ year, stm_10, meta = out$meta)
summary(effects_10)


Call:
estimateEffect(formula = 1:10 ~ year, stmobj = stm_10, metadata = out$meta)


Topic 1:

Coefficients:
             Estimate Std. Error t value Pr(>|t|)    
(Intercept)  7.986648   1.179047   6.774 1.33e-11 ***
year        -0.003918   0.000583  -6.720 1.93e-11 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Topic 2:

Coefficients:
             Estimate Std. Error t value Pr(>|t|)  
(Intercept)  2.620145   1.557147   1.683   0.0925 .
year        -0.001255   0.000770  -1.630   0.1032  
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Topic 3:

Coefficients:
              Estimate Std. Error t value Pr(>|t|)    
(Intercept) -14.245307   2.363793  -6.026 1.74e-09 ***
year          0.007099   0.001169   6.073 1.31e-09 ***
---
Signif. codes:  0 ‘***’ 0.001 ‘**’ 0.01 ‘*’ 0.05 ‘.’ 0.1 ‘ ’ 1


Topic 4:

Coefficients:
              Estimate Std. Error t value Pr(>|t|)
(Intercept)  2.4828626  1.6644558   1.492    0.136
year        -0.0011898  0.0

In [17]:
# 将所有当前环境中的对象保存到指定位置
save.image('/kaggle/working/stm_douban.RData')


In [18]:
# List to store results for each model and its estimated effects
stm_models <- list()
effect_summaries <- list()

# Loop through topic numbers from 10 to 19
for (k in 10:19) {
  # Run the STM model
  stm_model <- stm(documents = out$documents, 
                   vocab = out$vocab, 
                   K = k, 
                   prevalence = ~year, 
                   data = out$meta, 
                   max.em.its = 75, 
                   verbose = FALSE)
  
  # Store the STM model in the list
  stm_models[[paste0("K_", k)]] <- stm_model
  
  # Print summary of the STM model (optional, you can remove this if not needed)
  print(paste("Summary for STM model with K =", k))
  print(summary(stm_model))
  
  # Estimate effects
  effects <- estimateEffect(1:k ~ year, stm_model, meta = out$meta)
  
  # Store the estimated effects summary in the list
  effect_summaries[[paste0("K_", k)]] <- summary(effects)
  
  # Print summary of the estimated effects (optional, you can remove this if not needed)
  print(paste("Summary of effects for K =", k))
  print(summary(effects))
}

# Access the models or effect summaries later if needed
# e.g., effect_summaries[["K_15"]]


[1] "Summary for STM model with K = 10"
A topic model with 10 topics, 9026 documents and a 12816 word dictionary.
Topic 1 Top Words:
 	 Highest Prob: 事情, 不想, 家庭, 朋友, 人生, 独生子女, 开心 
 	 FREX: 人生, 开心, 说话, 烦恼, 不耐烦, 事情, 人格 
 	 Lift: 强压, 炸毛, 反射, 枢纽, 语速, 贬义, 大嫂 
 	 Score: 家庭, 不想, 人生, 事情, 独生子女, 朋友, 独立 
Topic 2 Top Words:
 	 Highest Prob: 感觉, 退休, 时间, 亲戚, 经济, 上班, 情况 
 	 FREX: 红包, 上班, 洗衣机, 加班, 存钱, 退休, 失业 
 	 Lift: 假冒, 几线, 别动, 刷子, 半截, 好几件, 娇贵 
 	 Score: 退休, 上班, 衣服, 亲戚, 感觉, 经济, 焦虑 
Topic 3 Top Words:
 	 Highest Prob: 照顾, 回家, 抱抱, 加油, 办法, 家人, 生病 
 	 FREX: 加油, 抱抱, 陪陪, 照顾, 坚强, 辞职, 身心 
 	 Lift: 四周, 引流, 强健, 所欲, 撑下去, 整件事, 生得 
 	 Score: 照顾, 抱抱, 加油, 回家, 家人, 辞职, 护工 
Topic 4 Top Words:
 	 Highest Prob: 理解, 希望, 沟通, 父母, 方式, 原因, 关心 
 	 FREX: 公主, 姥爷, 关心, 理解, 反抗, 头发, 情感 
 	 Lift: 不办, 夫权, 接梗, 新娘, 染色, 移交, 舞台 
 	 Score: 理解, 父母, 关心, 方式, 希望, 公主, 姥姥 
Topic 5 Top Words:
 	 Highest Prob: 结婚, 房子, 买房, 家庭, 条件, 儿子, 男人 
 	 FREX: 彩礼, 男方, 女方, 扶贫, 冠姓, 买房, 倒贴 
 	 Lift: 冠姓, 三室, 三金, 下嫁, 个富, 买楼, 了不得 
 	 Score: 结婚, 买房, 房子, 男方, 儿子, 女方, 

In [19]:
# 将所有当前环境中的对象保存到指定位置
save.image('/kaggle/working/stm_douban1.RData')