1. HENGSHI SENSE 高级计算使用说明
图表中度量计算方式除常见的 求和、平均值、最大/最小值、去重、计数等外,目前HENGSHI SENSE 还提供9种高级计算方式:同/环比、留存率、活跃率、重复率、移动计算、累计计算、百分比、百分位、中位数等,并可根据不同业务场景的具体需求实现分析维度的定制。
1.1. coffee分析
首先说明,coffee分析的数据以及分析需求:
1.1.1. 数据
产品表
产品表中为咖啡的品类信息,包含:
字段 | 类型 | 描述 |
---|---|---|
产品id | 数字 | 每种咖啡的唯一标识 |
咖啡种类 | 文本 | 咖啡类型,包含:美式、拿铁、摩卡、卡布奇诺 |
杯型 | 文本 | 咖啡杯大小,包含:大、中、小 |
产品名称 | 文本 | 咖啡种类+杯型,例如:美式中杯 |
价格 | 数字 | 咖啡的单价,与产品id一一对应 |
杯型表
杯型表中信息为每中杯型及对应的容量
字段 | 类型 | 描述 |
---|---|---|
杯型 | 文本 | 咖啡杯大小,与产品表中的杯型一一对应 |
体积 | 文本 | 每种杯型的咖啡容量 |
门店信息表
门店信息表为门店的详细信息表:
字段 | 类型 | 描述 |
---|---|---|
门店 | 文本 | 门店所在市区 |
姓名 | 文本 | 每家门店的所属人 |
年龄 | 数字 | 门店所属人的年龄 |
省份 | 文本 | 每家门店所在的省份 |
地区 | 文本 | 每家门店所在地区 |
顾客信息表
顾客信息表为所有的顾客信息汇总:
字段 | 类型 | 描述 |
---|---|---|
顾客id | 数字 | 每位顾客的唯一标识 |
年龄阶层 | 文本 | 每位顾客的年龄阶段的大致划分 |
性别 | 文本 | 每位顾客的性别 |
销售数据表
销售数据表中信息为每笔订单的详细销售信息:
字段 | 类型 | 描述 |
---|---|---|
订单编号 | 文本 | 每笔订单的唯一标识号 |
订单日期 | 日期 | 每笔订单的发生时间 |
门店 | 文本 | 美的订单的发生门店,与门店信息表中的门店一一对应 |
产品ID | 数字 | 每中咖啡的唯一标识,与产品表中的产品id为一一对应的关系 |
顾客ID | 数字 | 每笔订单的点单客户ID,与顾客信息表中的顾客id一一对应 |
数量 | 数字 | 每笔订单的咖啡咖啡杯数 |
1.1.2. 数据处理
上述的5张表,通过之间关键字段的一一对应关系,做了数据模型:
关联关系分别为:
销售数据表 和 门店信息表
销售数据表 和 顾客信息表
销售数据表 和产品表
产品表 和 杯型表
1.1.3. 分析需求
- 以产品为维度分析
- 以时间为维度分析
- 产品和时间维度交叉分析
以下,以 coffee 分析 为例,详细介绍高级计算的各种计算方式。
1.2. 同/环比
度量的计算方式选择 求和、平均值、最大值、最小值、计数、去重时,点击计算方式后方的按钮,在展开的选择框中可以选择同/环比。
说明
同比 表示2个单位周期之间量的变化比,比如今年一月份与去年一月份的变化比。
环比 表示2个连续单位周期内的量的变化,比如本月与上月的变化比。
计算方法
同比 同比=(本期数-同期数)/ |同期数| ×100%
环比 环比=(本期数-上期数)/ 上期数×100%
使用说明
在度量高级计算中选择同/环比。在弹出同/环比设置窗口,进行自定设置。
例如:计算各地区2016年的环比
即,每个地区2016年的数据相对2015年的增长率如下图所示:
1.3. 百分比
度量的计算方式选择 求和、平均值、最大值、最小值、计数、去重时,点击计算方式后方的按钮,在展开的选择框中可以选择百分比。
说明
所选数值占总数的百分比。
计算方法
百分比 = 所选数值 / 总数 × 100%
使用方法
在度量的高级计算中选择百分比。
例如:计算各年龄阶段咖啡需求量占总需求量的百分比
如上述表格所示:中年群体对咖啡的需求量为55.47%,略高于青年群体。
1.4. 留存
说明
留存数和留存率体现了应用的质量和保留用户的能力。用户在某段时间内开始使用应用,经过一段时间后,仍然继续使用该应用的用户,被认作是留存用户。
限制条件
所选时间的结束时间小于活跃周期的开始时间。留存计算在所选时间内使用产品的用户,在经过一段时间后的留存周期内还在使用该应用。所以,如果两个时间段重合了,得出的留存率是百分之百,计算没有业务含义的
使用方法
在度量高级计算中选择留存,会弹出留存率设置窗口,进行自定义设置。可以设置留存率或留存数。
例如:检查2015年第一季度的所有客户在2016年的还光顾的比例:
1.5. 活跃
说明
在某段时间内使用该应用,向前推移一段时间,已经使用过该应用的用户,被认做是活跃用户。
限制条件:所选时间的开始时间大于活跃周期的结束时间。活跃计算在所选时间内使用产品的用户,在向前推移一段时间的活跃周期中已经使用过该应用了。所以如果两个时间段重合了,得出的活跃率是百分之百,计算没有业务含义的。
使用方法
在度量高级计算中选择活跃,会弹出活跃设置窗口,进行自定义设置。可以设置活跃率或活跃数。
例如:检查2016年的所有客户在上一年中已经出现过的人数占比
设置方法如上图所示,云南省、广西省、海南省和湖南省2016年的客户均为新增客户;北京和天津2016年的客户均为15年的老客户,没有新增客户。
1.6. 重复
说明
按条件计算重复率
按条件计算重复率即根据设置的条件,统计出符合条件的重复值。
例如:设置条件等于2,将统计出现次数为2次的数据,并计算其占总数的百分比。
按次数计算重复率
按次数计算重复率即统计出所有重复项,并对重复次数进行汇总。
例如:数据A项中出现了2次,B项中出现了3次,则重复数为 2 + 3 = 5 次。
使用方法
在度量高级计算中选择重复,会弹出留存率设置窗口,进行自定义设置。可以设置重复率或重复数。
例如:2015年不同省份各个省份中用户的重复率
1.7. 移动计算
说明
根据时间序列,逐项推移,依次对一定项数进行统计(求和、平均值、最小值、最大值,共4种计数方式)。
使用方法
维度选择日期字段,在度量高级计算中选择移动计算,在弹出的移动计算的窗口中,进行自定义设置。
例如:按照订单日期,计算每个月左右一个月的范围内的销售数量汇总。
1.8. 累计计算
说明
对全部时间范围内的数据进行统计(包括求和、平均值、最小值、最大值,共4种累计方式)。
使用方法
维度选择日期字段,在度量高级计算中选择累计计算。在弹出累计计算设置窗口,进行自定义设置。
例如:汇总每个月的销售数量
如下图所示:每个月中的数据会累计相加
1.9. 百分位数
说明
将指定的字段数据排序,计算相应的累计百分位,则某一百分位所对应数据的值即为该百分位的百分位数(包括无、百分比、同/环比、累计计算、移动计算六种计算方式)。
使用方法
在度量高级计算中选择百分位数。在弹出的窗口中,进行自定义设置。
例如:每个月对应85%的百分位数
在度量的计算方式中选择百分位数
,在展开的百分数选项中选择自定义
,在弹出的输入框只能够输入85:
如下图所示,各月销售量85%对应的百分位数:
1.10. 中位数
说明
将指定的字段数据排序后找出正中间的一个作为中位数(包括无、百分比、同/环比、累计计算、移动计算五种计算方式)。
使用方法
在度量高级计算中选择百分位数,在弹出窗口中选择50%,并对计算方式进行自定义设置。
例如:计算每个月销售量的百分位数
在度量的计算方式中选择百分位数
,在展开的百分数选项中选择50
:
如下图所示,各月销售量的中位数为: