主题
连接 Amazon Athena
请参照如下步骤连接 Amazon Athena 数据源。
1.在数据连接页面右上角点击新建数据连接。 2.在数据源种类中选择 Amazon Athena 数据源。
3.按要求填写连接时数据源的参数。
名称: 连接的名称,需要唯一。
用户名:IAM key。
密码:IAM 密码。
Catalog:AWS 元数据的 catalog,默认为 AwsDataCatalog。
区域:区域名字,比如 cn-north-1。
Amazon Athena s3查询结果输出路径:Amazon Athena s3 查询结果输出路径,比如
s3://athena-result/result/
。Workgroup: work group。
Amazon Athena s3输出表存储路径:Amazon Athena s3 输出表存储路径,仅用于输出的场景,比如
s3://athena/0-storage/
。数据库:数据库名称。
最大连接数:连接池最大连接数。
优先使用数据库 comment 做数据集的标题:优先显示表的名字还是表的注释。开启时显示标题,关闭时显示表注释。
数据网关:当连接通过数据网关进行时填需要写数据网关 ID。
URL:数据库的 jdbc url。
支持上传文件到指定路径:具体的路径表示文件上传的数据库名称。验证通过后,才能配置该参数。
支持操作已连接数据库:表示该连接可以在数据集成,批量同步,数据填报中选择为输出连接。需要用户自己保证对数据库有写权限。验证通过后,才能配置该参数。
只显示指定数据库/模式下的表:该项选中时并且 database 字段不为空,则只显示该 db 下面的表。
4.填好参数后,点击"验证"按钮,获取验证结果(验证 HENGSHI SENSE 和设置的数据连接的连通性,在未验证通过时不可添加)。
5.验证通过后支持数据集成输出
和支持上传文件到指定路径
由禁用变为启用,可选择是否开启这两项。
6.点击执行预置代码,弹出该数据源对应的预置代码,点击执行按钮。
7.点击"添加"按钮,添加设置的 Amazon Athena 连接。
请注意
- 配置参数时带*的参数是必填参数,其他参数为选填。
- 连接数据源时,必须执行预置代码。不执行会导致数据分析过程中某些函数无法使用。此外,从4.4之前的版本升到4.4时,需要对系统中已经存在的数据连接执行预置代码。