1. HENGSHI SENSE 表格的显示和交互对数据模型的要求
对于常见的信息量较大,明细的、汇总的各种各样的数据集中在一张表中体现,格式复杂,信息量大,并蕴含复杂的统计运算的分析,HENGSHI SENSE 提供了中国式报表满足类似情况的分析需求,即衡石系统中的 表格 。
下面以 coffee分析1 为例,介绍目前HENGSHI SENSE 系统可视化中,表格的制作显示和交互对于数据模型的要求。
1.1. 表格基础信息介绍
表格详细设置在图表分类常用章节的表格中有详细介绍,不再一一赘述,这里主要介绍表格中主要项的意义。
1.1.1. 配置
维度
可视化分析中的分组依据。
例如:上图中的地区 和 省份,在表格中,位于最左侧的两列,将数据进行分组。
度量
按照维度分组后,每组数据中聚合计算的依据,需要设定聚合计算的方式。
例如:上图中的 数量 ,在表格中,位于右侧最上方,计算按照维度分组后,每组数据的数量汇总和。
对比维度
对比维度只能相对于单个的度量添加,在度量的下方,将度量的聚合值再次分组。
例如:上图中在度量 数量 下添加的对比维度 咖啡种类 ,位于 数量 的下方,将 数量 的值分组,每组分别汇总计算。
维度小计
可选择维度字段添加小计,按照其他维度分组计算当前所在维度的汇总值,以行的形式展示。
例如:上图中的维度小计为对维度 省份 添加的小计,则按照 地区 分组,每个分组中的 省份,计算一个汇总值。
度量小计
可选择对比维度、维度添加小计,按照其他的维度分组计算当前所在维度的汇总值,以列的形式展示。
例如:上图中度量小计为对对比维度 咖啡种类 添加的小计,在度量 数量 下对比维度列的最右侧,将按照 咖啡种类 分组后聚合出的 数量 值重新汇总。
1.1.2. 样式
参考值
参考值,依据度量添加,可根据不同的计算方式标注出图表中的异常数据。
1.1.3. 交互
每页条数
默认为1000,可自定义,当图表的总数据条数大于设置的每页条数时,会分页显示
时间漫游
默认关闭,勾选开启后,可拖动日期字段至时间漫游下的方框中,图表的下方会出现一条时间轴,方便拖动查看不同时间范围内的数据。具体的操作方法见时间漫游章节的具体介绍。
开启上卷下钻功能
勾选 开启上卷下钻 功能后,可将维度/对比维度从最底层的分组开始逐层收起,实现向上汇总、向下分组的展示。具体操作如下图所示:
内容识别
默认不勾选,可手动修改,包括 E-maile、链接、图片。勾选开启后,自动识别表格中各列的类型,例如:
链接:勾选后,链接可点击跳转至对应网址。
图片:勾选后,图片可在表格中展示。
表头过滤
从左侧图内指标分组中,添加维度字段至表头过滤,可以对该维度分组进行临时过滤分析。
拖动维度字段至表头过滤后,表格中表头行该字段名右下角有一个倒三角的表示,点击展开,列出所有分组,可进行零时过滤:
表格的基本信息介绍如上图所示,下面介绍适用表格做分析的场景以及表格的显示和交互对数据模型的要求。
1.2. 可视化的预期效果
1.2.1. 分析需求
以 coffee分析 为例,研究不同产品在各地区门店的销售情况,以及不同粒度上的汇总销售情况。主要考虑一下两方面的因素:
产品结构:咖啡层级信息
不同饮品类型下的各种饮料,又细分为不同的杯型,各杯型下又是具体的产品。
门店结构:门店层级信息
各大区不同省份下的不同门店
按照上述的关注因素,具体分析的需求为:
产品结构和门店结构分层级展示
产品结构、部门结构可按照层级逐级向上汇总、向下分组展示。
1.2.2. 预期效果
由第一章节的表格基本信息介绍,HENGSHI SENSE 中提供维度、对比维度两种分组信息。故在销售分析中,维度和对比维度支持了产品、门店的交叉分析。上卷下钻功能支持了按照产品、门店层级结构的向上汇总数据、向下查看详细数据的分析。
门店层级作为维度,产品层级作为对比维度:
产品层级作为维度,门店层级作为对比维度
根据不同粒度,向上汇总,向下分组
如上,对于各地区不同品类的咖啡销售,HENGSHI SENSE 可以提供两种表格结构:
- 部门作为维度,产品作为对比维度
- 产品作为维度,部门作为对比维度
实现了咖啡产品结构和门店结构逐层向下分类展示的分析需求。
开启上卷下钻,实现了关注粒度不同时,向上汇总和向下分组的分析需求。
但是要完成上述的效果图,即部门层级和产品层级做维度、对比维度,表格目前对数据模型有一定的要求。
1.3. 表格适应的数据模型
coffee分析的数据是分为多张表存储的,这也更贴近客户场景,比如销售数据属于销售部门,产品数据属于产品部门。
产品表
产品表中存储内容为每种产品的详细信息,该产品在产品结构树上每个层级属于哪种类型。
产品ID | 饮品种类 | 咖啡种类 | 杯型 | 产品名称 | 单价 |
---|---|---|---|---|---|
1001 | 咖啡 | 美式 | 大杯 | 美式-大杯 | 30 |
2002 | 咖啡 | 美式 | 小杯 | 美式-小杯 | 25 |
3009 | 咖啡 | 拿铁 | 中杯 | 拿铁-中杯 | 32 |
例如1001,在产品结构树上的信息为:
Level1 | Level2 | Level3 | Level4 |
---|---|---|---|
咖啡 | 美式 | 大杯 | 美式-大杯 |
明确每种产品在不同层级上的分组,才能在表格中将产品作为维度或对比维度,进行逐层展开的数据分析效果。如下图所示:
门店信息表
门店信息表中存储的内容为门店的详细信息,该门店在门店结构树上每个层级的所属情况。
门店 | 姓名 | 省份 | 地区 |
---|---|---|---|
杭州市 | 李四 | 浙江 | 华东 |
承德市 | 赵六 | 河北 | 华北 |
牡丹江市 | 王五 | 黑龙江 | 华北 |
例如 杭州市,在部门结构树上的信息为:
Level1 | Level2 | Level3 |
---|---|---|
华东 | 浙江 | 杭州市 |
明确每个门店在门店结构树上不同层级的分组,在表格中才可以通过按照部门逐层展开,展示数据。如下图所示:
销售表
销售表将每笔订单按照不同的产品种类拆分成多条数据,每条数据对应每笔订单中的一种产品。主要便于统计各产品的销售情况。如下表所示:
订单编号 | 订单日期 | 门店 | 产品ID | 顾客ID | 数量 |
---|---|---|---|---|---|
20000002 | 2020-01-01 | 北京市 | 3001 | 126 | 5 |
20000002 | 2020-01-01 | 天津市 | 3003 | 126 | 6 |
20000002 | 2020-02-10 | 西安市 | 3009 | 100 | 2 |
各表结构如上,我们要将数据信息汇总到一张宽表中,才能在可视化的过程中将销售数据、门店及产品运用到同一个表格中做分析。可以通过多表联合和数据模型两种方式实现数据信息的汇总。
我们建议大家使用数据模型,数据模型生成一张虚拟的宽表,该方式与多表联合为每一种关联分析建立一个数据集的方式相比,它能够提供给数据分析极大的自由度和敏捷性:随时编辑模型中的关联关系,新的模型关系能够立即影响分析结果。
建立数据模型后,即可完成以产品层级、部门层级分别作为维度和对比维度的分析。
1.4. 特殊数据结构
部分企业中的的数据不是按照上述的形式存储的,而是通过产品/部门的层级关系索引存储的。存储方式的差异导致了数据处理的复杂程度。
1.4.1. 数据结构
如果您所在企业的数据库中,将产品、部门的数据按层级关系索引存储。以部门的存储结构为例,部门关系是按照 部门ID和上级部门ID索引存储的:
id | parentid | name |
---|---|---|
1001 | null | 华东 |
2001 | 1001 | 浙江省 |
3001 | 2001 | 杭州市 |
销售记录中每条销售数据中记录了部门ID以及数量:
date | codename | code id | amount |
---|---|---|---|
20200107 | 杭州市 | 3001 | 3 |
20200109 | 杭州市 | 3001 | 5 |
上述的数据结构,在数据可视化时,适配表格进行数据分析,您需要在将数据接入HENGSHI SENSE前进行底层的预处理。
1.4.2. 接入HENGSHI SENSE 前的数据处理
如上所述,数据的schema格式:
所有门店为一个树型结构,每个门店通过ID 和ParentID记录其在门店结构树上的位置。需要通过ID和ParentID的对应关系将索引结构的存储表展开为打平层级结构表,梳理出门店的层级关系。
例如:树形结构的第三层中对应的为每个门店的具体信息,比如杭州市对应需要整合到三级分类中。杭州市所属的省份为浙江省,需要整合到二级分类中。
这样我们在后续可视化的过程中,才能将部门信息在表格中分层展示。
处理完成的表结构如下所示:
code id | Level 3 | Level 2 | Level 1 |
---|---|---|---|
3001 | 杭州市 | 浙江省 | 华东 |
1.5. 备注
脚注1:coffee分析 的数据以及分析场景在 高级计算使用说明中有详细说明。