Skip to content

连接 Hive

请参照如下步骤连接 Hive 数据源。

1.在数据连接页面右上角点击新建数据连接。 2.在数据源种类中选择 Hive 数据源。

3.按要求填写连接时数据源的参数。

  • 名称: 连接的名称,需要唯一。
  • 机器地址:数据库的地址,如果填了 url 字段,优先使用 url 里面的。
  • 端口:数据库的端口,如果填了 url 字段,优先使用 url 里面的。
  • 用户名:数据库的用户名。
  • 密码:数据库的密码。
  • 数据库:数据库名称,如果填了 url 字段,优先使用 url 里面的。
  • 最大连接数:连接池最大连接数。
  • 优先使用数据库 comment 做数据集的标题:优先显示表的名字还是表的注释。开启时显示标题,关闭时显示表注释。
  • hive 执行引擎:hive 执行引擎,可选择 mr、tez、spark 三种引擎。
  • hadoop 认证方式:“hadoop 认证方式” 有三个选项,“simple”,“kerberos”,“tbds”,当选择 “kerberos” 或 “tbds” 时,上面的“用户名”和“密码”要填写对应 “kerberos” 或 “tbds” 系统中的用户名和密码。
  • realmA: 当 hadoop 认证方式为 kerberos 时,需要填写该项。
  • kdcA: 当 hadoop 认证方式为 kerberos 时,需要填写该项。
  • realmB:当 hadoop 认证方式为 kerberos 时,需要填写该项。
  • kdcB:当 hadoop 认证方式为 kerberos 时,需要填写该项。
  • server principal: 当 hadoop 认证方式为 kerberos 时,需要填写该项。
  • 数据网关:当连接通过数据网关进行时填需要写数据网关 ID。
  • URL:数据库的 jdbc url。
  • 分层加载 schema 和表:关闭时同时加载 schema 和表。开启后分层加载 schema 和表,连接过程只加载 schema,快速地将数据源接入到系统中。
  • 只显示指定数据库/模式下的表:该项选中时并且 database 字段不为空,则只显示该 db 下面的表。

4.填好参数后,点击"验证"按钮,获取验证结果(验证 HENGSHI SENSE 和设置的数据连接的连通性,在未验证通过时不可添加)。

5.点击执行预置代码,弹出该数据源对应的预置代码,点击执行按钮。

6.点击"添加"按钮,添加设置的 Hive 连接。

请注意

  1. 配置参数时带*的参数是必填参数,其他参数为选填。
  2. 连接数据源时,必须执行预置代码。不执行会导致数据分析过程中某些函数无法使用。此外,从4.4之前的版本升到4.4时,需要对系统中已经存在的数据连接执行预置代码。

衡石分析平台使用手册