## 留存分析

### 留存分析定义

用户留存关系到一个公司对新获取客户的掌控程度，关系到公司能否长久发展和存续下去。留存分析就是分析客户的参与情况/活跃程度的分析模型，留存不仅仅反映了用户粘性，更反映了公司渠道/产品的质量。

### 留存的概念辨析
#### 算法一：7日日留存率

$$\frac{第七天的活跃用户数}{第一天的活跃用户数} \times 100\%$$

只关心到特定日的留存情况，避免其他日数据的干扰。



#### 算法二：7日内留存率

$$\frac{第二天-第七天去重后}{第一天} \times 100\%$$

第二天-第七天去重后：把第二天到第七天的所有用户统计起来，而不是简单的数量相加

引入其他日数据，适用于有固定使用周期，且周期较长的业务。例如，用户只会在一周之内的特定时间活跃，学生只有在周末的时候才放假，这个时候用7日日留存率来评价去到质量就不太合理了，这时采用7日内留存率就更能描述渠道质量




<div align="center">
    <img src="./figures/留存率算法对比.png" width=70%>
</div>




### 为什么要看留存
1. 了解一个渠道的质量——日留存
   - 以天为单位衡量渠道来的用户当下和接下来的表现
   - 以 「x日日留存率」作为比较指标时，可以避免其他日数据的干扰

2. 观察整个大盘——周留存/与留存
    - 以 周/月 为计数单位，衡量产品的健康状况，观察用户的粘性
    - 务必去重！

### 正确认识留存

|**日留存** 了解一个渠道的质量 | **周/月留存** 观察整个大盘|
|---|---|
|7日日留存=$\frac{第七日活跃用户数}{第一日活跃用户数}$|次周周留存=$\frac{下周周活跃用户数}{当周周活跃用户数}$ *务必去重*|
|30日日留存=$\frac{第三十日活跃用户数}{第一日活跃用户数}$|次月月留存=$\frac{下月月活跃用户数}{当月月活跃用户数}$ *务必去重*|


## 精准留存

产品、运营、技术、市场等每个环节都会对留存造成影响，但是这种影响未必会直接体现在留存率数据上。

那么如何将不同的功能或内容对留存的影响区分出来呢？

一般采用精准留存区分开来，精准留存一般分为两种：
1. 过滤出进行过指定行为的用户，对这部分用户进行单独计算
2. 将用户分为不同的群体，观察不同群体之间的留存的差别（聚类分析划分群体）

#### 例子
阅读小说的用户的7日日留存率
<div align="center">
    <img src="./figures/精准留存1.png" width=70%>
</div>

阅读某一类型小说的用户的7日日留存率
<div align="center">
    <img src="./figures/精准留存2.png" width=70%>
</div>


阅读某类小说的留存率比大盘数据要好，反过来说有一部分的留存率没有大盘好。





## 留存分析应用场景

### 一、产品层面的应用场景

#### 1. 判断产品是否有长期价值（产品健康度评估）

* 通过 D1、D7、D30 留存判断产品是否具备持续吸引力。
  例子：
  * D1 留存低 → 首次体验不佳
  * D7 留存低 → 产品核心价值不足
  * D30 留存低 → 长期粘性弱

---

#### 2. 定位功能体验问题

通过对不同功能路径的用户进行留存对比，找到影响留存的关键因素。

例子：

* 做了“关注作者”的用户的 D7 留存明显更高
  → “关注”是关键行为，说明要强化关注入口或引导


---

#### 3. 产品改版前后效果评估

产品上线新功能、改 UI、改流程，都可以通过留存对比判断效果。

例子：

* 改版后 D1 留存上升 10% → 改版成功
* 改版后 D30 留存下降 → 需要紧急排查

---

### 二、运营层面的应用场景

#### 4. 渠道拉新质量评估

不同渠道的用户质量差异巨大，留存是衡量质量最客观的指标。

例子：

* 渠道 A：7 日留存 35%
* 渠道 B：7 日留存 8%
  → A 为高质量渠道，钱该投在 A

---

#### 5. 判断活动有效性（促活/促销/内容活动）

活动带来的是短期打开，还是能真正提升用户价值？
留存分析可以回答这个问题。

例：

* 刺激性强的红包活动：可能只有 D1 提升
* 内容型活动：可能提升 D7、D30 留存

用于判断活动 ROI。

---

#### 6. 用户生命周期管理（LTV 提升）

把用户按生命周期分层：

* 新用户（0–7天）
* 活跃用户（7–30天）
* 稍冷用户（30–60天）
* 流失用户（60天以上）

然后对每层用户做留存跟踪，识别哪一层出现问题。

---

#### 7. 精准召回 & 营销自动化

通过留存判断哪些用户处于流失边缘，提前干预。

例子：
系统自动触发：

* “3 天未活跃用户 → 推送内容/优惠券”
* “7 天未活跃用户 → 邮件召回”

留存率是营销自动化策略的重要触发条件。

---

### 三、增长层面的应用场景

#### 8. 用户价值评估（LTV、付费转化预测）

高留存用户 = 更高 LTV
留存分析可帮助识别高价值用户的典型路径、关键行为。

例子：

* 完成 2 次搜索的用户 D30 留存高
* 收藏 5 个商品的用户付费率更高
  → 可以将这些行为用作“激活任务”或“成长体系”

---

#### 9. 推荐系统策略优化

留存能作为推荐系统的优化指标，例如：

* 推荐内容是否能提升次日留存？
* 信息流算法调整后，用户是否更愿意回访？

留存分析帮助判断推荐策略是否提升产品粘性。

---

#### 留存分析的核心用途

> **留存分析用于判断产品价值是否被持续认可，并指导产品优化、渠道投放、运营策略和增长决策，是产品数据分析中最基础也最重要的分析方法之一。**



## 留存分析优缺点

### 一、留存分析的优点

#### 1. 反映产品核心价值是否被持续认可

* 留存比 DAU/MAU 更能说明用户是否真的持续使用产品。
* 如果留存率高，说明产品对用户有长期价值，而不仅仅是一次性吸引。

例子：一个 App 新增很多，但 7 日留存只有 5%，说明用户进来后发现没价值、很快流失。

---

#### 2. 帮助识别关键流失节点

* 通过观察 Day1、Day3、Day7、Day30 留存，可以定位产品问题发生的阶段。
* 有助于判断是否是新手引导问题、功能价值不足，还是长期粘性不够。

例子：

* D1 掉得多 → 可能是注册流程、首日体验差
* D7 掉得多 → 产品内容价值不足
* D30 掉得多 → 老用户缺乏长期激励

---

#### 3. 指导产品优化策略

留存分析可以：

* 定义“关键行为”（如关注、下单、完成任务）
* 识别“健康用户路径”
* 指导新手引导、推荐算法、推送策略的优化

简单说：留存分析能告诉产品经理“应该优化哪里”。

---

#### 4. 可用于衡量拉新质量

* 同样是新增 1000 用户，不同渠道带来的留存差异巨大。
* 帮助评估多个渠道的 ROI 和用户质量。

例：

* 渠道 A：7 日留存 35%
* 渠道 B：7 日留存 8%
  → 虽然拉新量一样，但渠道 A 质量明显更高。

---

#### 5. 是增长模型（AARRR）中的核心指标

AARRR 模型里，留存在最重要的位置：
**Acquisition → Activation → Retention → Revenue → Referral**
留存不好，后续收入、推荐、增长都无从谈起。

---

### 二、留存分析的缺点

#### 1. 只能告诉你“问题在哪”，不能告诉你“为什么”

比如：

* D1 留存很低，你知道用户流失了
  但留存数据无法告诉你：
* 是注册太复杂？
* 是 App 内容不吸引？
* 是目标用户不匹配？

需要结合用户访谈、漏斗分析、行为路径分析补充判断。

---

#### 2. 留存数据容易被活动干扰

促活活动、红包、新人补贴可能会带来短期留存率虚高。
优化策略可能会被误导。

例：一个游戏开服七天狂送金币，7 日留存很好，但未来留存骤降。

---

#### 3. 不同产品的留存标准差异巨大，难以横向对比

* 社交产品留存普遍高（如微信）
* 工具型产品留存中等
* 不强需求的内容产品留存低
  如果不了解行业特性，容易误判。

---

#### 4. 对数据依赖强，数据质量差时不可信

例如：

* 用户 ID 去重问题（如 UUID、设备号、账号体系不统一）
* 多端登录（Web/iOS/Android）导致用户被多次计数
* 事件埋点缺失导致数据偏差

数据问题会直接影响留存率准确性。

---

#### 5. 留存无法全面体现用户价值

* 有些产品使用频率低（如买机票、买房类 APP）
* 有些用户不常打开，但一打开就很高价值

此时仅靠留存判断用户价值可能有偏差。

---

#### 总结：一句话理解留存分析

> **留存分析是产品健康度的核心指标，但需要和行为路径、用户分群、渠道分析结合，才能真正指导产品优化。**


