连接 Cloudera Impala

请参照如下步骤连接 Cloudera Impala 数据源。

1.在数据连接页面右上角点击新建数据连接。 2.在数据源种类中选择 Cloudera Impala 数据源。

3.按要求填写连接时数据源的参数。

名称：连接的名称，需要唯一。
机器地址：数据库的地址，如果填了 url 字段，优先使用 url 里面的。
端口：数据库的端口，如果填了 url 字段，优先使用 url 里面的。
用户名：数据库的用户名。
密码：数据库的密码。
数据库：数据库名称，如果填了 url 字段，优先使用 url 里面的。
最大连接数：连接池最大连接数。
编码：数据库连接的编码设置。
优先使用数据库 comment 做数据集的标题：优先显示表的名字还是表的注释。开启时显示标题，关闭时显示表注释。
hadoop 认证方式：hadoop 认证方式，simple 是简单认证，无需额外信息，Kerberos 需要填额外的信息。
realmA：当 hadoop 认证方式为 kerberos 时，需要填写该项。
kdcA：当 hadoop 认证方式为 kerberos 时，需要填写该项。
realmB：当 hadoop 认证方式为 kerberos 时，需要填写该项。
kdcB：当 hadoop 认证方式为 kerberos 时，需要填写该项。
server principal：当 hadoop 认证方式为 kerberos 时，需要填写该项。
数据网关：当连接通过数据网关进行时填需要写数据网关 ID。
URL:数据库的 jdbc url。
额外 JDBC 参数：额外 JDBC 参数。建议使用 url 写完整 url。这个参数只添加在自动生成的 jdbc url 的后面。
分层加载 schema 和表：关闭时同时加载 schema 和表。开启后分层加载 schema 和表，连接过程只加载 schema，快速地将数据源接入到系统中。
支持上传文件到指定路径：具体的路径表示文件上传的数据库名称。验证通过后，才能配置该参数。
支持操作已连接数据库：表示该连接可以在数据集成，批量同步，数据填报中选择为输出连接。需要用户自己保证对数据库有写权限。验证通过后，才能配置该参数。
只显示指定数据库/模式下的表：该项选中时并且 database 字段不为空，则只显示该 db 下面的表。

4.填好参数后，点击"验证"按钮，获取验证结果(验证 HENGSHI SENSE 和设置的数据连接的连通性，在未验证通过时不可添加)。

5.点击执行预置代码，弹出该数据源对应的预置代码，点击执行按钮。

6.点击"添加"按钮，添加设置的 SQL Server 连接。

请注意

配置参数时带*的参数是必填参数，其他参数为选填。
连接数据源时，必须执行预置代码。不执行会导致数据分析过程中某些函数无法使用。此外，从4.4之前的版本升到4.4时，需要对系统中已经存在的数据连接执行预置代码。

AI 助手

连接数据源

Database

NoSQL/NewSQL

SQL on Hadoop

Cloud

Searching

Multi Dimensional Database

SaaS API

创建数据集

数据集管理

参数

仪表盘

控件设置

图表类控件

指标类

地图

表格

图表高级计算

展示类控件

功能类控件

过滤器

HENGSHI SENSE 嵌入式数据分析

数据权限有关实践

连接 Cloudera Impala

AI 助手

连接数据源

Database

NoSQL/NewSQL

SQL on Hadoop

Cloud

Searching

Multi Dimensional Database

SaaS API

控件设置

图表类控件

指标类

地图

表格

图表高级计算

过滤器

连接 Cloudera Impala ​

连接 Cloudera Impala