### 导入数据

In [1]:
import pandas as pd
import numpy as np
import json

In [2]:
# 等价于：data = pd.read_excel("life.xlsx",sheet_name=1)  1表示sheet的索引位置
df = pd.read_excel("life.xlsx",sheet_name="开支")  # 直接写名字
df

Unnamed: 0,父类,子类,数据
0,总费用,住宿,2580
1,总费用,餐饮,1300
2,总费用,交通,500
3,总费用,服装,900
4,总费用,红包,1300
5,住宿,房租,2000
6,住宿,水电,400
7,住宿,管理费,100
8,住宿,网络费,80
9,餐饮,外卖,800


### 确定全部节点

In [3]:
df['父类'].tolist()

['总费用',
 '总费用',
 '总费用',
 '总费用',
 '总费用',
 '住宿',
 '住宿',
 '住宿',
 '住宿',
 '餐饮',
 '餐饮',
 '餐饮',
 '交通',
 '交通',
 '交通',
 '交通',
 '服装',
 '服装',
 '服装',
 '服装',
 '红包',
 '红包']

In [4]:
df['子类'].tolist()

['住宿',
 '餐饮',
 '交通',
 '服装',
 '红包',
 '房租',
 '水电',
 '管理费',
 '网络费',
 '外卖',
 '聚餐',
 '饮料',
 '滴滴',
 '地铁',
 '公交',
 '共享单车',
 '衣服',
 '鞋子',
 '围巾',
 '袜子',
 '同学',
 '长辈']

In [5]:
# 将两个列表相加，在转成集合set进行元素去重，再转成列表

nodes = list(set(df['父类'].tolist() + df['子类'].tolist())) 
nodes

['房租',
 '地铁',
 '衣服',
 '总费用',
 '餐饮',
 '围巾',
 '共享单车',
 '住宿',
 '网络费',
 '交通',
 '袜子',
 '鞋子',
 '滴滴',
 '公交',
 '长辈',
 '聚餐',
 '外卖',
 '红包',
 '饮料',
 '服装',
 '水电',
 '同学',
 '管理费']

### 生成节点数据

In [6]:
# 节点列表数据

nodes_list = []
for i in nodes:
    dic = {}
    dic["name"] = i
    nodes_list.append(dic)

In [7]:
nodes_list

[{'name': '房租'},
 {'name': '地铁'},
 {'name': '衣服'},
 {'name': '总费用'},
 {'name': '餐饮'},
 {'name': '围巾'},
 {'name': '共享单车'},
 {'name': '住宿'},
 {'name': '网络费'},
 {'name': '交通'},
 {'name': '袜子'},
 {'name': '鞋子'},
 {'name': '滴滴'},
 {'name': '公交'},
 {'name': '长辈'},
 {'name': '聚餐'},
 {'name': '外卖'},
 {'name': '红包'},
 {'name': '饮料'},
 {'name': '服装'},
 {'name': '水电'},
 {'name': '同学'},
 {'name': '管理费'}]

### 生成全部链路数据

In [8]:
links_list = []

for i in range(len(df)):
    dic = {}
    dic['source'] = df.iloc[i,0]  # 父类
    dic['target'] = df.iloc[i,1]  # 子类
    dic['value'] = int(df.iloc[i,2])   # 数据值 : 使用int函数直接强制转换，防止json.dump()报错
    links_list.append(dic)

In [9]:
links_list

[{'source': '总费用', 'target': '住宿', 'value': 2580},
 {'source': '总费用', 'target': '餐饮', 'value': 1300},
 {'source': '总费用', 'target': '交通', 'value': 500},
 {'source': '总费用', 'target': '服装', 'value': 900},
 {'source': '总费用', 'target': '红包', 'value': 1300},
 {'source': '住宿', 'target': '房租', 'value': 2000},
 {'source': '住宿', 'target': '水电', 'value': 400},
 {'source': '住宿', 'target': '管理费', 'value': 100},
 {'source': '住宿', 'target': '网络费', 'value': 80},
 {'source': '餐饮', 'target': '外卖', 'value': 800},
 {'source': '餐饮', 'target': '聚餐', 'value': 300},
 {'source': '餐饮', 'target': '饮料', 'value': 200},
 {'source': '交通', 'target': '滴滴', 'value': 220},
 {'source': '交通', 'target': '地铁', 'value': 150},
 {'source': '交通', 'target': '公交', 'value': 80},
 {'source': '交通', 'target': '共享单车', 'value': 50},
 {'source': '服装', 'target': '衣服', 'value': 400},
 {'source': '服装', 'target': '鞋子', 'value': 300},
 {'source': '服装', 'target': '围巾', 'value': 150},
 {'source': '服装', 'target': '袜子', 'value': 50},
 {'source':

### demo-1_绘图

In [10]:
# 需要事先导入，否则jupyter notebook中可能不会出图
from pyecharts.globals import CurrentConfig, OnlineHostType
from pyecharts import options as opts
from pyecharts.charts import Sankey

nodes_list = [
 {'name': '围巾'},
 {'name': '长辈'},
 {'name': '网络费'},
 {'name': '服装'},
 {'name': '公交'},
 {'name': '同学'},
 {'name': '袜子'},
 {'name': '总费用'},
 {'name': '衣服'},
 {'name': '红包'},
 {'name': '交通'},
 {'name': '聚餐'},
 {'name': '滴滴'},
 {'name': '餐饮'},
 {'name': '管理费'},
 {'name': '水电'},
 {'name': '共享单车'},
 {'name': '外卖'},
 {'name': '房租'},
 {'name': '住宿'},
 {'name': '饮料'},
 {'name': '鞋子'},
 {'name': '地铁'}
]

links_list = [
 {'source': '总费用', 'target': '住宿', 'value': 2580},
 {'source': '总费用', 'target': '餐饮', 'value': 1300},
 {'source': '总费用', 'target': '交通', 'value': 500},
 {'source': '总费用', 'target': '服装', 'value': 900},
 {'source': '总费用', 'target': '红包', 'value': 1300},
 {'source': '住宿', 'target': '房租', 'value': 2000},
 {'source': '住宿', 'target': '水电', 'value': 400},
 {'source': '住宿', 'target': '管理费', 'value': 100},
 {'source': '住宿', 'target': '网络费', 'value': 80},
 {'source': '餐饮', 'target': '外卖', 'value': 800},
 {'source': '餐饮', 'target': '聚餐', 'value': 300},
 {'source': '餐饮', 'target': '饮料', 'value': 200},
 {'source': '交通', 'target': '滴滴', 'value': 220},
 {'source': '交通', 'target': '地铁', 'value': 150},
 {'source': '交通', 'target': '公交', 'value': 80},
 {'source': '交通', 'target': '共享单车', 'value': 50},
 {'source': '服装', 'target': '衣服', 'value': 400},
 {'source': '服装', 'target': '鞋子', 'value': 300},
 {'source': '服装', 'target': '围巾', 'value': 150},
 {'source': '服装', 'target': '袜子', 'value': 50},
 {'source': '红包', 'target': '同学', 'value': 800},
 {'source': '红包', 'target': '长辈', 'value': 500}
]

c = (
    Sankey()
    .add(
        "月度开支",
        nodes_list,
        links_list,
        linestyle_opt=opts.LineStyleOpts(opacity=0.5, curve=0.5, color="source"),
        label_opts=opts.LabelOpts(position="right"),
    )
    .set_global_opts(title_opts=opts.TitleOpts(title="月度开支桑葚图"))
)

c.render_notebook()

### demo-2_绘图

#### 生成字典数据

现将上面的nodes_list和links_list生成字典类型数据

In [11]:
data_dic = {}

data_dic["nodes"] = nodes_list
data_dic["links"] = links_list

In [12]:
data_dic 

{'nodes': [{'name': '围巾'},
  {'name': '长辈'},
  {'name': '网络费'},
  {'name': '服装'},
  {'name': '公交'},
  {'name': '同学'},
  {'name': '袜子'},
  {'name': '总费用'},
  {'name': '衣服'},
  {'name': '红包'},
  {'name': '交通'},
  {'name': '聚餐'},
  {'name': '滴滴'},
  {'name': '餐饮'},
  {'name': '管理费'},
  {'name': '水电'},
  {'name': '共享单车'},
  {'name': '外卖'},
  {'name': '房租'},
  {'name': '住宿'},
  {'name': '饮料'},
  {'name': '鞋子'},
  {'name': '地铁'}],
 'links': [{'source': '总费用', 'target': '住宿', 'value': 2580},
  {'source': '总费用', 'target': '餐饮', 'value': 1300},
  {'source': '总费用', 'target': '交通', 'value': 500},
  {'source': '总费用', 'target': '服装', 'value': 900},
  {'source': '总费用', 'target': '红包', 'value': 1300},
  {'source': '住宿', 'target': '房租', 'value': 2000},
  {'source': '住宿', 'target': '水电', 'value': 400},
  {'source': '住宿', 'target': '管理费', 'value': 100},
  {'source': '住宿', 'target': '网络费', 'value': 80},
  {'source': '餐饮', 'target': '外卖', 'value': 800},
  {'source': '餐饮', 'target': '聚餐', 'value': 300},
  

In [13]:
type(data_dic)

dict

#### 转成json数据

In [14]:
with open("sankey.json","w",encoding="utf-8") as f:
    # json.dump(data_dic, f)   写入一行数据
    json.dump(data_dic, f, indent=2, sort_keys=True, ensure_ascii=False)  # 写入多行数据

#### 读取json数据

In [15]:
with open("sankey.json", encoding="utf-8") as f:
    data_json = json.load(f) 

In [16]:
data_json

{'links': [{'source': '总费用', 'target': '住宿', 'value': 2580},
  {'source': '总费用', 'target': '餐饮', 'value': 1300},
  {'source': '总费用', 'target': '交通', 'value': 500},
  {'source': '总费用', 'target': '服装', 'value': 900},
  {'source': '总费用', 'target': '红包', 'value': 1300},
  {'source': '住宿', 'target': '房租', 'value': 2000},
  {'source': '住宿', 'target': '水电', 'value': 400},
  {'source': '住宿', 'target': '管理费', 'value': 100},
  {'source': '住宿', 'target': '网络费', 'value': 80},
  {'source': '餐饮', 'target': '外卖', 'value': 800},
  {'source': '餐饮', 'target': '聚餐', 'value': 300},
  {'source': '餐饮', 'target': '饮料', 'value': 200},
  {'source': '交通', 'target': '滴滴', 'value': 220},
  {'source': '交通', 'target': '地铁', 'value': 150},
  {'source': '交通', 'target': '公交', 'value': 80},
  {'source': '交通', 'target': '共享单车', 'value': 50},
  {'source': '服装', 'target': '衣服', 'value': 400},
  {'source': '服装', 'target': '鞋子', 'value': 300},
  {'source': '服装', 'target': '围巾', 'value': 150},
  {'source': '服装', 'target': '袜

#### 绘图

In [39]:
import json

from pyecharts import options as opts
from pyecharts.charts import Sankey

with open("sankey.json", "r", encoding="utf-8") as f:
    j = json.load(f)
c = (
    Sankey()
    .add(
        "月度开支",
        nodes=j["nodes"],
        links=j["links"],
        pos_top="20%",
        focus_node_adjacency=True,
        levels=[
            opts.SankeyLevelsOpts(
                depth=0,
                 itemstyle_opts=opts.ItemStyleOpts(color="#fbb4ae"),
                linestyle_opts=opts.LineStyleOpts(color="source", opacity=0.6),
            ),
            opts.SankeyLevelsOpts(
                depth=1,
#                 itemstyle_opts=opts.ItemStyleOpts(color="#b3cde3"),
                linestyle_opts=opts.LineStyleOpts(color="source", opacity=0.6),
            ),
            opts.SankeyLevelsOpts(
                depth=2,
#                 itemstyle_opts=opts.ItemStyleOpts(color="#ccebc5"),
                linestyle_opts=opts.LineStyleOpts(color="source", opacity=0.6),
            ),
        ],
        linestyle_opt=opts.LineStyleOpts(curve=0.5,color="source",opacity=0.6,type_="dotted"),
        label_opts=opts.LabelOpts(position="right")
    )
    .set_global_opts(
        title_opts=opts.TitleOpts(title="月度开支桑葚图"),
        tooltip_opts=opts.TooltipOpts(trigger="item", trigger_on="mousemove|click",is_show=True),
    )
)

c.render_notebook()