加速引擎

系统内置了高速 MPP 引擎，可以实现对亿级数据的即席分析，还可以将异构数据统一存储和建模，然后进行关联运算。

将数据集开启加速引擎，就会将数据集的数据导入到引擎中，对数据集进行查询时将会直接访问引擎表。

提示

目前大数据数据源不建议大规模导入引擎，比如 Hive，Spark，Impala，Presto，Max Compute，大数据集导入过程不支持流式复制，会占用大量内存，可能会卡死。允许这些数据源开启引擎是为了导入小表方便，这不意味着我们建议把这些数据源大规模导入引擎，这个不是最佳实践。建议这些数据源的数据集通过直连方式来使用，我们对直连的支持程度已经和引擎差不多了。

开启加速引擎

点击数据源信息菜单，弹出数据元信息窗口。打开开启加速引擎，系统会提示“请稍后，数据提取中……”，此时，系统会将数据集提取到引擎中。

完成之后，会在元信息中显示引擎表名称，如图所示：

提示

数据集大小超过系统配置的数据集缓存大小时不支持开启加速引擎。

关闭加速引擎

在数据元信息窗口中，关闭开启加速引擎。关闭加速引擎之后，数据集将返回直连原始表模式，此时，如果新字段使用了引擎支持但原始数据库不支持的函数，数据集就会加载失败。如果是新指标使用了引擎支持但原始数据看不支持的函数，则使用该指标的图标会出错。所以系统会弹出确认窗口，如下所示，点击确认可以关闭加速引擎：

更新计划

在更新计划中可以设置引擎表与数据集原始表的同步频率。

详见更新计划。

只有开启加速引擎后才支持的功能

非同源数据集多表联合
部分直连数据集不支持的函数：引擎支持文档中列出的所有函数，其他数据源不支持的函数，需要导入引擎才支持

加速引擎类型和相关数据源

系统支持使用内置引擎和外部引擎。

内置引擎即系统自带的加速引擎，包括 Greenplum、StarRocks、Apache Doris 三种类型，默认为 Greenplum。用户在系统安装时可以更改内置引擎类型。
外部引擎即用户使用自己的数据源作为加速引擎。目前支持开启加速引擎的数据源有：MySQL、PostgreSQL、Greenplum、Oracle、SQL Server、Spark SQL、TiDB、Amazon Redshift、MaxCompute PostgreSQL、DB2、Hive、Cloudera Impala、Presto、MongoDB、HBase、ClickHouse。

ClickHouse 物化视图

当系统的加速引擎为 Clickhouse 时，多表联合数据集导入引擎时可使用 Clickhouse 物化视图。该物化视图可实时更新数据集，不需要设置更新计划，提升了关联数据的查询性能。

使用 ClickHouse 物化视图要求多表联合数据集的数据源必须是 Clickhouse，并且要求与引擎在同一集群。由于 Clickhouse 的实现机制原因，只有左表更新时才会触发视图，进行数据更新。详细情况请参考ClickHouse 官网说明。

用户手册

ChatBot

数据集成

数据填报

创建数据集

数据集加工

函数列表

仪表盘创作

图表类控件

图表高级计算

功能类控件

展示类控件

应用设置

Data Agent

模型供应商

加速引擎 ​

开启加速引擎 ​

关闭加速引擎 ​

更新计划 ​

只有开启加速引擎后才支持的功能 ​

加速引擎类型和相关数据源 ​

ClickHouse 物化视图 ​