1、描述编辑
Impala 是 Cloudera 公司主导开发的新型查询系统,它提供 SQL 语义,能查询存储在 Hadoop 的 HDFS 和 HBase 中的 PB 级大数据。已有的 Hive 系统虽然也提供了 SQL 语义,但由于 Hive 底层执行使用的是 MapReduce 引擎,仍然是一个批处理过程,难以满足查询的交互性。相比之下,Impala 的最大特点也是最大卖点就是它的快速。本章我们将介绍如何在 FineBI 中连接 Apache Impala 数据库。
2、数据连接编辑
2.1 配置信息
驱动 | URL | 支持数据库版本 | 驱动下载链接 |
---|---|---|---|
com.cloudera.impala.jdbc41.Driver | jdbc:impala://ip:port/dbname | impala 2.3;impala 2.9;impala 2.10; | ImpalaJDBC41.rar |
2.1.1 数据库认证
若Impala数据库存在认证,则需要修改上述配置信息中的URL,在URL后加入 authmech 参数(数据库没有用户名密码时不需要加该参数),不同参数值代表了不同的认证,如下所示:
authmech | n |
---|---|
3 | username and password |
2 | username |
1 | kerberos |
0 | 不认证 |
URL格式为:jdbc:impala://ip:port/dbname;authmech=n;( n 可以等于0、1、2、3,分别代表上面的不用认证方式)
2.1.2 kerberos 认证
若数据库的认证方式为 kerberos 认证,除了要加 authmech 参数,URL 需要调整为:jdbc:impala://192.168.1.10:21050/default;AuthMech=1;KrbHostFQDN=hostalias;KrbServiceName=impala
其中:KrbHostFQDN 需要指定连接哪台服务器的 impala ,需要使用服务器的别名。
2.2 连接步骤
从上面下载链接中下载 Apache Impala 驱动压缩包,将解压后的所有 jar 包放置到%FineBI%\webapps\webroot\WEB-INF\lib下,重启 FineBI 。
登录数据决策系统,选择管理系统>数据连接>数据连接管理,点击新建数据连接,在所有选项下选择Apache Impala,如下图所示:
点击确定进入数据连接配置页面,按照前面提供的配置信息,输入自身数据库的对应信息。
a)可选择勾选 kerberos 认证。若勾选 kerberos 认证,则需填入注册过 kdc 的客户端名称、keytab 密钥路径和 Kerberos 认证对应 URL(上述2.1.2章节给出的 URL ),参考 数据连接Kerberos认证 ,如下图所示:
b)若不勾选 kerberos 认证,则跟其他数据库设置一致,按照前面提供的配置信息,输入数据库的对应信息,可选择填入高级设置信息(相关介绍可参考配置数据连接)。如下图所示,显示的为没有用户名、密码的配置。
点击测试连接,若出现如下图的测试连接成功弹出框,则表示成功连接上数据库。如下图所示:
测试连接成功后点击右上角的保存按钮,该数据连接即添加成功。如下图所示:
3、注意事项编辑
1. 连接 Apache Impala 数据库时,FineBI 在数据查询的时候忽略大小写,字段查询结果都为小写;
2. impala 不支持 date 类型,支持 timestamp ;
3. impala 不支持多个 distinct count ,多个去重记录数预览 sql 会报错;