主题
连接 Cloudera Impala
请参照如下步骤连接 Cloudera Impala 数据源。
1.在数据连接页面右上角点击新建数据连接。 2.在数据源种类中选择 Cloudera Impala 数据源。
3.按要求填写连接时数据源的参数。
- 名称: 连接的名称,需要唯一。
- 机器地址:数据库的地址,如果填了 url 字段,优先使用 url 里面的。
- 端口:数据库的端口,如果填了 url 字段,优先使用 url 里面的。
- 用户名:数据库的用户名。
- 密码:数据库的密码。
- 数据库:数据库名称,如果填了 url 字段,优先使用 url 里面的。
- 最大连接数:连接池最大连接数。
- 编码:数据库连接的编码设置。
- 优先使用数据库 comment 做数据集的标题:优先显示表的名字还是表的注释。开启时显示标题,关闭时显示表注释。
- hadoop 认证方式:hadoop 认证方式,simple 是简单认证,无需额外信息,Kerberos 需要填额外的信息。
- realmA: 当 hadoop 认证方式为 kerberos 时,需要填写该项。
- kdcA: 当 hadoop 认证方式为 kerberos 时,需要填写该项。
- realmB:当 hadoop 认证方式为 kerberos 时,需要填写该项。
- kdcB:当 hadoop 认证方式为 kerberos 时,需要填写该项。
- server principal: 当 hadoop 认证方式为 kerberos 时,需要填写该项。
- 数据网关:当连接通过数据网关进行时填需要写数据网关 ID。
- URL:数据库的 jdbc url。
- 额外 JDBC 参数:额外 JDBC 参数。建议使用 url 写完整 url。这个参数只添加在自动生成的 jdbc url 的后面。
- 分层加载 schema 和表:关闭时同时加载 schema 和表。开启后分层加载 schema 和表,连接过程只加载 schema,快速地将数据源接入到系统中。
- 支持上传文件到指定路径:具体的路径表示文件上传的数据库名称。验证通过后,才能配置该参数。
- 支持操作已连接数据库:表示该连接可以在数据集成,批量同步,数据填报中选择为输出连接。需要用户自己保证对数据库有写权限。验证通过后,才能配置该参数。
- 只显示指定数据库/模式下的表:该项选中时并且 database 字段不为空,则只显示该 db 下面的表。
4.填好参数后,点击"验证"按钮,获取验证结果(验证 HENGSHI SENSE 和设置的数据连接的连通性,在未验证通过时不可添加)。
5.点击执行预置代码,弹出该数据源对应的预置代码,点击执行按钮。
6.点击"添加"按钮,添加设置的 SQL Server 连接。
请注意
- 配置参数时带*的参数是必填参数,其他参数为选填。
- 连接数据源时,必须执行预置代码。不执行会导致数据分析过程中某些函数无法使用。此外,从4.4之前的版本升到4.4时,需要对系统中已经存在的数据连接执行预置代码。