连接 ClickHouse
请参照如下步骤连接 ClickHouse 数据源。
1.在数据连接页面右上角点击新建数据连接。 2.在数据源种类中选择 ClickHouse 数据源。
3.按要求填写连接时数据源的参数。
- 名称: 连接的名称,需要唯一。
- 机器地址:数据库的地址,如果填了 url 字段,优先使用 url 里面的。
- 端口:数据库的端口,如果填了 url 字段,优先使用 url 里面的。
- 用户名:数据库的用户名。
- 密码:数据库的密码。
- 数据库:数据库名称,如果填了 url 字段,优先使用 url 里面的。
- 最大连接数:连接池最大连接数
- 优先使用数据库 comment 做数据集的标题: 优先显示表的名字还是表的注释。开启时显示标题,关闭时显示表注释。
- 数据网关:当连接通过数据网关进行时填需要写数据网关 ID。
- URL:数据库的 jdbc url。
- Cluster:仅输出使用,输出到指定的 cluster 中。该参数为空时只写本地表 MergeTree 引擎,该参数填写后会根据 cluster 基于本地 MergeTree 表生成分布式表。
- ClickHouse 输出是否使用表副本:仅输出使用,是否使用表副本。不使用副本则表引擎是 MergeTree,使用副本表引擎为 ENGINE = ReplicatedMergeTree('/clickhouse/tables/{database}/{table}/{shard}', '{replica}') order by %s settings allow_nullable_key=1
- ClickHouse 输出表引擎模板:默认为 ENGINE = ReplicatedMergeTree('/clickhouse/tables/{database}/{table}/{shard}', '{replica}') order by %s settings allow_nullable_key=1,用户也可以参照格式改写
- join_use_nulls:join_use_nulls 的设置,可以填0或者1,影响 join 的行为。
- 分层加载 schema 和表:关闭时同时加载 schema 和表。开启后分层加载 schema 和表,连接过程只加载 schema,快速地将数据源接入到系统中。
- 支持上传文件到指定路径:具体的路径表示文件上传的数据库名称。验证通过后,才能配置该参数。
- 支持操作已连接数据库:表示该连接可以在数据集成,批量同步,数据填报中选择为输出连接。需要用户自己保证对数据库有写权限。验证通过后,才能配置该参数。
- 只显示指定数据库/模式下的表:该项选中时并且 database 字段不为空,则只显示该 db 下面的表。
4.填好参数后,点击"验证"按钮,获取验证结果(验证 HENGSHI SENSE 和设置的数据连接的连通性,在未验证通过时不可添加)。
5.验证通过后支持数据集成输出
和支持上传文件到指定路径
由禁用变为启用。可选择是否开启这两项。
6.点击执行预置代码,弹出该数据源对应的预置代码,点击执行按钮。
7.点击"添加"按钮,添加设置的 ClickHouse 连接。
请注意
- 配置参数时带*的参数是必填参数,其他参数为选填。
- 连接数据源时,必须执行预置代码。不执行会导致数据分析过程中某些函数无法使用。此外,从4.4之前的版本升到4.4时,需要对系统中已经存在的数据连接执行预置代码。