主题
多表联合数据集
多表联合数据集是指将多个数据集进行联合生成新的数据集。
创建多表联合数据集
按照下面的步骤创建多表联合数据集。
1.新建数据集。 进入数据集页面,点击新建数据集,选择多表联合。
2.建立数据集之间的关联关系。 拖拽左侧的数据集表列到页面右侧的编辑区,选择关联字段和关联模式,建立数据集之间的关联关系。数据集可以通过多个字段进行关联。关联方式支持左连接、右连接、内连接、外连接。 点击预览数据确认结果。
提示
- 只支持同源数据集的多表联合。如果要对异源数据集进行多表联合,需要将数据集开启加速引擎,在引擎中进行多表联合。
- 支持的关联方式与数据集数据源类型支持的 join 类型一致。 mysql、amazon_aurora、memsql、tidb、mongodb 数据源支持3种关联方式:left join,right join,inner join。其他数据源支持4种关联方式:left join,right join,inner join 以及 full join。
3.设置过滤条件筛选数据。支持简单过滤和表达式过滤。
- 简单过滤: 用户通过选项设置过滤条件。当有多个过滤条件时,可以设置条件选取方式‘全部条件’或‘任一条件’。 全部条件指筛选的数据需要满足所有的过滤条件。 任一条件指筛选数据只要满足其中一个条件即可。
- 表达式过滤:用户通过表达式设置过滤条件,更加灵活的进行数据筛选。过滤表达式必须返回布尔值。 在表达式编辑区右侧是函数列表,供表达式使用。
4.设置多表联合数据集的数据结构。设置字段显示或隐藏,设置字段别名。 多表联合数据结构中展示了每个字段的来源数据集。点击界面右侧的“全部字段”可以查看生成数据集中重名的字段和字段的个数,点击字段可查看重名字段。
5.导入数据,完成数据集创建。
数据集复用
多表联合允许同一数据集多次拖入画布,如下图所示,支持在画布中修改数据集名称,保存后画布中的名称不随数据集的名称变化而变化。
数据集复用解决了包含层级维度表与自身进行多次关联的问题,无需通过复制数据集来解决,方便用户操作。
相关说明
- 数据集开启公共字典功能后,不能作为多表联合的基础表。 即第一个拖入编辑区的表。