## 路径分析定义

用户路径分析追踪用户从某个开始事件直到结束事件的行为路径，即对用户流向进行监测，可以用来衡量网站优化的效果或营销推广的效果，以及了解用户行为偏好。还可以以某一个事件为结束，看这个事件之前用户的行为是什么样子的。

与漏斗的差别，漏斗是分析某一个确定的流程，但是路径分析中并不需要有一个确定的一个流程。比如，在社交类和内容类的产品，用户的行为轨迹是非常随机的，难以把握一个确定的流程，就不能构成一个漏斗样的强步骤转化的流程。这时就会采用路径分析。

以下图为例，非常直观地表现了用户从Play song or video开始向其他页面的流转以及过程中的跳失量（跳失量由黑色表示）。

<div align="center">
    <img src="./figures/桑吉图1.png" width=70%>
</div>

自然而然，我们不由地要提一个问题，有时候我们也想知道，达到某页面或者执行某行为的用户都从哪里来，于是就有了桑基图的变种，可以理解为“逆向桑基图”。即设定一个终点，看看用户从哪里来，如下图所示。


<div align="center">
    <img src="./figures/桑吉图2.png" width=70%>
</div>


## 桑吉图分析

可以看到，桑基图能非常直观地展现用户行为路径，尤其是用户行为路径纷繁复杂的时候，桑基图能很直观地表现出用户的使用习惯，帮助我们了解用户行为，从而挖掘用户需求点，进一步提高产品体验。

### 桑基图可以在以下几个方面提高产品和用户的契合度：

- 找到主流流程，帮助确定转化漏斗中的关键步骤。
- 看用户主要流向了哪里，发现用户的兴趣点，寻找新的机会。
- 发现被用户忽略的产品价值点，修正价值点曝光方式。
- 发现用户的流失点。
- 找到有价值的用户群体。



#### 找出主流程，帮助确定漏斗中的关键步骤

如下图中，顺着将每一步中占比最高的流程找出来，得到主流程，即Play Song or Video → Favorite Song or Video → Share Song or Video → Search Song or Video → Select Song or Video

<div align="center">
    <img src="./figures/桑吉图3.png" width=70%>
</div>

#### 发现价值点

从图中可以发现，执行了search song的用户持续进行下一步操作的可能性很大，但在第二部没有选择search song的用户，第三部只有9.42%选择了search song。为了能让用户持续操作，我们可以加强曝光search song。


<div align="center">
    <img src="./figures/桑吉图4.png" width=70%>
</div>

#### 确定营收增长策略

Concert landing Screen中执行Purchase ticket动作的比例高达75.13%， 可以看出用户是对Concert landing Screen到Purchase ticket的转化率是极高的，可以发现用户对Purchase Concert ticket的兴趣是很高的，后续产品可以考虑增强这一块的投入。

<div align="center">
    <img src="./figures/桑吉图5.png" width=70%>
</div>

#### 发现用户流失点

图可以看出，每一步用户的累计跳失率是：15.82%， 29.61%， 41.64%， 52.19%，每一步的净跳失率就是：15.82%，13.79%（29.61%-15.82%），12.03%（41.64%-29.61%），10.55%（52.19%-41.64%）。第一步的的跳失率是最高的，结合之前的分析，产品侧可以考虑通过将search song放到首页来降低跳失率。

<div align="center">
    <img src="./figures/桑吉图6.png" width=70%>
</div>

## 桑吉图代码实现

### Tableau实现桑吉图
[Tableau实现桑吉图](https://www.bilibili.com/video/BV1vz4y1D7Jb/?spm_id_from=333.337.search-card.all.click&vd_source=62a21f026fe60108faad8418b1f5996d)



### python实现桑吉图


In [2]:

# Sankey 案例（Plotly）
import plotly.graph_objects as go

# 节点（步骤）
nodes = [
    "App Open", "View Product", "Add to Cart", "Product Browse", "Checkout", "Purchase"
]

# 边（流向）示例数据：source -> target (by node index), value = 流量/人数
links = dict(
    source=[0, 1, 2, 2, 4],  # indices of source nodes
    target=[1, 2, 4, 3, 5],  # indices of target nodes
    value =[500, 320, 220, 80, 150]
)

# 节点颜色（可根据需要修改）
node_colors = [
    "#17253b",  # App Open - dark blue
    "#2aa198",  # View Product - teal
    "#4da6ff",  # Add to Cart - light blue
    "#102233",  # Product Browse - dark
    "#7b55d6",  # Checkout - purple
    "#7b55d6"   # Purchase - purple
]

# 链接颜色（半透明）
link_colors = [
    "rgba(23,37,59,0.4)",
    "rgba(42,161,152,0.4)",
    "rgba(77,166,255,0.4)",
    "rgba(16,34,51,0.3)",
    "rgba(123,85,214,0.4)"
]

fig = go.Figure(data=[go.Sankey(
    arrangement = "snap",
    node = dict(
        pad = 20,
        thickness = 20,
        line = dict(color = "rgba(0,0,0,0.2)", width = 0.5),
        label = nodes,
        color = node_colors
    ),
    link = dict(
        source = links["source"],
        target = links["target"],
        value = links["value"],
        color = link_colors
    )
)])

fig.update_layout(title_text="用户行为 - Path Analysis（示例数据）", font_size=12, height=500, width=900)


