1. 数据集管理

数据集列表有两种样式,一种是默认的卡片样式,一种是列表样式。

1.1. 数据集展示

1.1.1. 卡片样式

1.1.2. 列表样式

点击列表按钮切换到列表样式。 在列表样式中,还同时提供了访问热度最近访问时间,以便用户掌握对资源的访问情况,还可以根据该数据清理长时间无人访问的资源。

1.1.3. 排序

数据集列表默认是按修改时间倒序排列的。

在列表样式中,可以点击表头列进行排序,比如下图中按照访问热度进行排序:

1.1.4. 搜索

在搜索框中输入字符,可以对数据集进行搜索。

1.2. 数据集操作

点击数据集的三点菜单,可以看见数据集常见操作。包括删除、重命名、创建副本、替换数据集、隐藏、显示。

1.2.1. 新建数据集

点击右上角的新建数据集按钮可以创建数据集,详见创建数据集

1.2.2. 删除

删除数据集时,如果数据集已被关联模型或者图表引用,则无法删除,只能删除未被引用的数据集。

1.2.3. 重命名

可以将数据集重新命名使其更贴合业务逻辑。

1.2.4. 创建副本

创建数据集副本,生成一个新的数据集。

1.2.5. 替换数据集

对数据集进行替换,详见替换数据集

1.2.6. 隐藏

对数据集进行加工后,一些中间数据集在作图时可能不再需要,那么可以将这些数据隐藏,作图时就看不到隐藏的数据集。

隐藏的数据集仍可以参与关联模型或者数据集加工,只是在仪表盘和图表页面看不到隐藏的数据集。

数据集进行隐藏后,三点菜单中的隐藏功能变为显示,可通过点击显示将数据集设置为可见状态。

1.3. 数据集管理

数据探索之外的一个重要工作就是对数据进行预处理。在系统中,数据集管理页面就是实现这样一个功能的地方。 点击数据集,打开一个数据集。这里是一个二维表的结构,展示了dataset的数据,表头中包含了以下操作。

1.4. 字段选择

点击字段选择图标,弹出字段选择列表,选择用户关心的字段,然后点击应用,数据集页面就会显示所选字段的数据。

字段选择是临时的,刷新页面就会清除所选项。

1.5. 筛选数据

点击筛选数据图标,弹出数据筛选弹窗,在弹窗中添加筛选条件,然后点击确定应用。筛选数据也是临时的,刷新页面就会清除所选项。

1.6. 数据管理

数据管理中可以对数据集进行追加数据集、本地文件追加、编辑数据集、导出数据等操作。

1.6.1. 追加数据集

对于导入引擎的数据集,会有追加数据集菜单,详见数据集追加

1.6.2. 本地文件追加

只有本地文件数据集才有本地文件追加菜单,详见本地文件追加

1.6.3. 编辑数据集

对于SQL查询数据集、多表联合数据集、数据聚合数据集、合并数据集,会有编辑数据集菜单。

编辑数据集时,会有引用检查,已被其他地方引用的字段无法去除,必须保留。

1.6.4. 导出数据

当应用处于创作模式时,所有数据集数据集都可以导出。

1.7. 数据信息

数据信息里面展示了数据元信息,包括:

  • 数据集名称
  • 数据集类型:文字表明这个数据集的来源:数据连接、本地文件、SQL查询等,图标表明这个数据集的存储类型
  • 数据连接: 数据集使用的数据连接
  • 行数/列数/大小:显示目前数据集在系统所占用的空间情况
  • 原始表:数据连接数据集的原始表名。
  • 引擎表:存储类型为引擎连接的数据集在引擎中的表名。
  • 开启加速引擎:关闭/开启加速引擎。
  • 公共字典: 开启公共字典,不同数据源之间可以进行建模。
  • 立即更新:对于导入引擎的数据集,会启动更新任务,从数据源重新检视数据,生成数据探索所需要的信息。对于直连数据集,立即更新会更新元数据信息。
  • 更新计划:设置更新计划,详见更新计划

1.8. 字段管理

字段管理主要是对字段进行操作,如字段分组、新建字段、字段类型修改等,详细说明参见字段管理

1.9. 指标管理

指标管理对数据集指标进行操作,包括新建指标、指标分组等,详细说明参见指标管理

results matching ""

    No results matching ""

    字段管理