SPARK数据连接 FineReport帮助文档|报表开发|报表使用|学习教程

历史版本11 :SPARK数据连接返回文档

编辑时间:09-23 17:35 历史版本: 最新历史版本上一篇历史版本下一篇历史版本 内容长度:4651 图片数:6目录数:3 修改原因:更新支持的数据库版本

1、描述
2、数据连接
3、注意事项

1、描述编辑

Spark是一种通用的大数据快速处理引擎。Spark使用Spark RDD、 Spark SQL、 Spark Streaming、 MLlib、 GraphX成功解决了大数据领域中离线批处理、交互式查询、实时流计算、机器学习与图计算等最重要的任务和问题。Spark除了一站式的特点之外，另外一个最重要的特点，就是基于内存进行计算，从而让它的速度可以达到MapReduce、Hive的数倍甚至数十倍。本章我们将介绍如何在FineBI中连接Spark数据库。

2、数据连接编辑

2.1 配置信息

驱动	URL	支持数据库版本	驱动下载
org.apache.hive.jdbc.HiveDriver	jdbc:hive2://ip:port/dbname	1.6.0；	hive-spark1.6.rar
org.apache.hive.jdbc.HiveDriver	jdbc:hive2://ip:port/dbname	2.1；2.3；	Hadoop Hive.rar

2.2 连接步骤

根据数据库的版本下载对应Spark驱动包，并将该驱动包放置到FineBI文件夹%FineBI%\webapps\webroot\WEB-INF\lib下，重启FineBI。
登录FineBI数据决策系统，选择管理系统>数据连接，点击新建数据连接选择更多数据连接，并在弹出框中选择SPARK，如下图：
点击确定进入数据连接配置页面，按照前面提供的配置信息，输入自身数据库的对应信息。
a）可选择勾选kerberos认证。若勾选kerberos认证，则需填入注册过kdc的客户端名称、keytab密钥路径和Kerberos认证对应URL，参考数据连接Kerberos认证，如下图：
b）若不勾选kerberos认证，则跟其他数据库设置一致，选择填入连接池属性信息即可（连接池属性介绍可参考配置数据连接），如下图：
点击测试连接，若出现如下图的测试连接成功弹出框，则表示成功连接上数据库。
测试连接成功后点击右上角的保存按钮，该数据连接即添加成功。如下图：

3、注意事项编辑

Spark数据连接时，FineBI无法通过添加数据库表的方式取数，目前只能通过SQL数据集添加；