历史版本1 :SPARK数据连接 返回文档
编辑时间:
内容长度:图片数:目录数:
修改原因:
1、描述编辑
Spark是一种通用的大数据快速处理引擎。Spark使用Spark RDD、 Spark SQL、 Spark Streaming、 MLlib、 GraphX成功解决了大数据领域中离线批处理、交互式查询、实时流计算、机器学习与图计算等最重要的任务和问题。Spark除了一站式的特点之外,另外一个最重要的特点,就是基于内存进行计算,从而让 它的速度可以达到MapReduce、Hive的数倍甚至数十倍。本章我们将介绍如何在FineBI中连接Spark数据库。
2、数据连接编辑
2.1 配置信息
驱动 | URL | 支持数据库版本 |
---|---|---|
org.apache.hive.jdbc.HiveDriver | jdbc:hive2://ip:port/dbname | 2.2.0 |
2.2 连接步骤
下载Spark的驱动包,并将该驱动包放置到FineBI文件夹%FineBI%\webapps\webroot\WEB-INF\lib下,重启服务器。
登录FineBI数据决策系统,选择管理系统>数据连接,点击“新建数据连接”选择更多数据连接,并在弹出框中选择SPARK,如下图:
点击确认进入数据连接配置页面,按照前面提供的配置信息,输入自身数据库的对应信息,可选择勾选kerberos认证。若勾选kerberos认证,则需填入注册过kdc的客户端名称、keytab密钥路径和Kerberos认证对应URL,参考数据连接Kerberos认证,如下图:
若不勾选kerberos认证,则跟其他数据库设置一致,选择填入编码转换和连接池属性信息即可(编码转换和连接池属性介绍可参考配置数据连接),如下图:
点击“测试连接”,若测试连接成功则表示成功连接上数据库。
测试连接成功后点击“保存”该数据连接即添加成功。