1. 概述编辑
Spark 是一种通用的大数据快速处理引擎,本文将介绍 FineBI 连接 Spark 的方法。
2. 操作步骤编辑
2.1 配置信息
驱动 | URL | Spark 版本 | 驱动下载 |
---|---|---|---|
org.apache.hive.jdbc.HiveDriver | jdbc:hive2://ip:port/dbname | V1.6 | |
V2.2 | |||
V2.3 |
连接 SPARK 有两种方式:
方法一:安装驱动隔离插件后,再连接数据库。
驱动隔离插件下载安装详情请参见:驱动隔离插件
方法二:不使用驱动隔离插件,直接连接数据库。
连接方式参见本文 2.2 节。但这种方式可能有 JAR 包之间的冲突从而导致连接失败。推荐用户用第一种方式。
2.2 连接步骤
1)根据数据库的版本下载对应 Spark 驱动包,并将该驱动包解压后放置到%FineBI%\webapps\webroot\WEB-INF\lib下,重启 FineBI 。
2)登录数据决策系统,选择管理系统>数据连接>数据连接管理,点击新建数据连接,在所有选项下选择SPARK,如下图所示:
3)点击确定进入数据连接配置页面,按照 2.1 节 配置信息,输入自身数据库的对应信息。
可选择 kerberos 认证。若选择 kerberos 认证,则需填入注册过 kdc 的客户端名称、keytab 密钥路径和 Kerberos 认证对应URL,参考 数据连接Kerberos认证 ,如下图所示:
注:连接前请检查 /etc/hosts 中的机器名对应 IP 是否为局域网 IP;
检查/etc/hostname 中机器名设置和 /etc/hosts 中是否配置一致;
检查 FineBI 所在机器 hosts 配置的 IP+ 机器名是否正确。
本地连接时需要配置 /etc/hosts 文件,添加远端映射:IP+机器名,例如: 192.168.5.206 centos-phoenix 。
若不选择 kerberos 认证,则跟其他数据库设置一致,选择填入连接池属性信息即可(连接池属性介绍可参考 配置数据连接),如下图所示:
2.3 测试连接
1)点击测试连接,若出现如下图的测试连接成功弹出框,则表示成功连接上数据库。如下图所示:
2)测试连接成功后点击右上角的保存按钮,该数据连接即添加成功。如下图所示: