-
Notifications
You must be signed in to change notification settings - Fork 0
/
数据报表.txt
62 lines (46 loc) · 1.71 KB
/
数据报表.txt
1
2
3
4
5
6
7
8
9
10
11
12
13
14
15
16
17
18
19
20
21
22
23
24
25
26
27
28
29
30
31
32
33
34
35
36
37
38
39
40
41
42
43
44
45
46
47
48
49
50
51
52
53
54
55
56
57
58
59
60
# 离散的报表 -> BI报表
# 传统的BI -> ETL -> 数据仓库 -> OLAP ->可视化报表
# Hadoop 上面进行处理非结构化的数据,要在WEB,收集,车间屏幕等显示
# 传统报表 -> 表格,填报, Dashboard, 行示报表, 分组报表, 交叉报表 Excel高级套件,水晶报表
---
## 场景一:从Excel中生成图表,粘贴到PPT中把周报,日报,月报甚至年报呈现。
问题:1.手工错误;
2.资源压力大量的公式;
3.时效性数据缺乏管理;
4.安全性;
5. 很难加载数据模型
### ???数据质量,数据层级, 数据从属, 维度变化。-> 谁生成数据,谁更新数据,谁使用数据
---
## 场景二:虽然各种指标联动但是数据都是归集起来的,反映了变动的趋势和情况
问题:1. 数据无法落地到实际中
2. 落地的指标过于离散,点击率,付费率等,没有相应的统计预测指标
3. 钻取的深度不够
## 场景三: 数据导出反映等过慢,影响在上面的体验。
## 数据是散的,需要放到业务架构里
1. 业务层需要知道每日指标完成情况,等级排名多少。每日每周每月的数据
2. 固定周期的完成率,各地区的销售额,营销成本,组内业绩。
3. 关键指标,总营业额,市场增长率,重要的研发进度
## 数据需要落地
* 原因-> (转化率,交易单量,客单价表现而非说明) -> 品类,流量,渠道 ->...
## 数据源管理
## 图表类,表格类,表单类
### 主标题
### 副标题
### 坐标轴
### 图例
### 边框
### 图表类型
## 数据立方体的概念
### 切片和切块(Slice and Dice)-> 多维数据的简化
### 钻取(Drill) 向下钻取(Drill-down) 和向上(Drill-up) -> 在数据中移动
### 旋转(Rotate)/转轴(Pivot) -> 不同视角的数据
### 数据联动
## 自助式的BI报表,比如power bi, bdp, tableau, qlikview
## 开源报表 seal report pentaho
---
# 工具
## 数据导入模块(excel,txt,csv,数据库)
## 抽取转换工具etl cubes框架 pandas,作为一个简单的
## 表现,matplotlib,bokeh,seaborn等进行绘图同时输出
## 优化表现层:利用pandas numpy scipy scikit.learn keras 持久化对象后输出进行的批模型
## 表单需要进行相关的表单展示