1. 数据集管理
数据集列表有两种样式,一种是默认的卡片样式,一种是列表样式。
1.1. 数据集展示
1.1.1. 卡片样式

1.1.2. 列表样式
点击列表按钮切换到列表样式。
在列表样式中,还同时提供了访问热度和最近访问时间,以便用户掌握对资源的访问情况,还可以根据该数据清理长时间无人访问的资源。

1.1.3. 排序
数据集列表默认是按修改时间倒序排列的。
在列表样式中,可以点击表头列进行排序,比如下图中按照访问热度进行排序:

1.1.4. 搜索
在搜索框中输入字符,可以对数据集进行搜索。
1.2. 数据集操作
点击数据集的三点菜单,可以看见数据集常见操作。包括删除、重命名、创建副本、替换数据集、隐藏、显示。
1.2.1. 新建数据集
新建空白数据集
点击右上角的新建数据集按钮可以创建数据集,详见创建数据集。
导入数据集
点击右上角的新建数据集按钮,下拉菜单中选择导入数据集。 可以将其他应用或数据包中的数据集导入进来。
说明
- 仅本地文件、数据连接、SQL查询数据集支持该功能,所以导入数据集列表中不一定是该应用中全部数据集。
- 数据集导入后,数据集指标、数据集相关数据模型不会跟随着导入到新应用中。
- 应用设置的数据权限为使用者时,不能导入开启加速引擎的数据集。
- 可导入应用中一个或多个数据集。
1.2.2. 删除
删除数据集时,如果数据集已被关联模型或者图表引用,则无法删除,只能删除未被引用的数据集。
1.2.3. 重命名
可以将数据集重新命名使其更贴合业务逻辑。
1.2.4. 创建副本
创建数据集副本,生成一个新的数据集。
1.2.5. 复制到
复制到可以将数据集复制其他应用、数据包中。 实现数据集跨应用复用。
说明
- 仅本地文件、数据连接、SQL查询数据集支持该功能,其他数据集不支持。
- 数据集复制到其他应用时,数据集指标、数据集相关数据模型不会复制。
- 开启引擎的数据集复制到其他应用时,该应用数据权限必须是应用作者或数据集作者模式。
1.2.6. 替换数据集
对数据集进行替换,详见替换数据集。
1.2.7. 隐藏
对数据集进行加工后,一些中间数据集在作图时可能不再需要,那么可以将这些数据隐藏,作图时就看不到隐藏的数据集。
隐藏的数据集仍可以参与关联模型或者数据集加工,只是在仪表盘和图表页面看不到隐藏的数据集。
数据集进行隐藏后,三点菜单中的隐藏功能变为显示,可通过点击显示将数据集设置为可见状态。
1.2.8. 设为默认数据集
系统支持设置数据集为默认数据集,在图表制作过程中,会展示数据包中的默认数据集,减少做图时切换和查找数据集操作。

1.3. 数据集管理
数据探索之外的一个重要工作就是对数据进行预处理。在系统中,数据集管理页面就是实现这样一个功能的地方。 点击数据集,打开一个数据集。这里是一个二维表的结构,展示了dataset的数据,表头中包含了以下操作。

1.4. 字段选择
点击字段选择图标,弹出字段选择列表,选择用户关心的字段,然后点击应用,数据集页面就会显示所选字段的数据。
字段选择是临时的,刷新页面就会清除所选项。

1.5. 筛选数据
点击筛选数据图标,弹出数据筛选弹窗,在弹窗中添加筛选条件,然后点击确定应用。筛选数据也是临时的,刷新页面就会清除所选项。

1.6. 数据管理
数据管理中可以对数据集进行追加数据集、本地文件追加、编辑数据集、导出数据等操作。

1.6.1. 追加数据集
对于导入引擎的数据集,会有追加数据集菜单,详见数据集追加。
1.6.2. 本地文件追加
只有本地文件数据集才有本地文件追加菜单,详见本地文件追加。
1.6.3. 编辑数据集
对于SQL查询数据集、多表联合数据集、数据聚合数据集、合并数据集,会有编辑数据集菜单。
编辑数据集时,会有引用检查,已被其他地方引用的字段无法去除,必须保留。
1.6.4. 导出数据
当应用处于创作模式时,所有数据集数据集都可以导出。
1.7. 数据信息
数据信息里面展示了数据元信息,包括:
- 数据集名称
- 数据集类型:文字表明这个数据集的来源:数据连接、本地文件、SQL查询等,图标表明这个数据集的存储类型
- 数据连接: 数据集使用的数据连接
- 行数/列数/大小:显示目前数据集在系统所占用的空间情况
- 原始表:数据连接数据集的原始表名。
- 引擎表:存储类型为引擎连接的数据集在引擎中的表名。
- 开启加速引擎:关闭/开启加速引擎。
- 公共字典: 开启公共字典,不同数据源之间可以进行建模。
- 继承上游权限:开启后,对于转换数据集(多表联合、数据聚合、数据合并、行转列、列转行)可以继承上游数据集的权限设置。 如果当前数据集或它的下游数据集已经导入引擎,则继承上游权限功能失效。
- 更新时间:数据集内容更新的时间。
- 数据更新:
- 立即更新:对于导入引擎的数据集,会启动更新任务,从数据源重新检视数据,生成数据探索所需要的信息。对于直连数据集,立即更新会更新元数据信息。
- 更新计划:设置更新计划,详见更新计划。
- 更新状态:指最近一次执行数据更新操作的状态,有更新完毕、更新失败、等待更新、正在更新等状态。

1.8. 字段管理
字段管理主要是对字段进行操作,如字段分组、新建字段、字段类型修改等,详细说明参见字段管理。
1.9. 指标管理
指标管理对数据集指标进行操作,包括新建指标、指标分组等,详细说明参见指标管理。
results matching ""
No results matching ""
衡石文档
- 产品功能一览
- 发布说明
- 新手上路
- 安装与启动
- 系统管理员手册
- 数据管理员手册
- 分析人员手册
- 数据查看员手册
- API
- 最佳实践
- 衡石分析平台 API 手册
- 附录