BI/Spider参数- FineBI帮助文档 FineBI帮助文档

文档创建者：doreen0813

历史版本：58

最近更新：April陶于 2024-01-24

1. 概述

1.1 版本

FineBI 版本	功能变动
6.0	-
6.0.2	数据类型识别逻辑优化，对数据位数进行更准确的判断
6.0.3	新增BI参数「智能数据解释」新增BI参数「抽取查询超时时间」「Spider参数」更名为「抽取参数」
6.0.4	1）新增参数新增BI参数「Excel导出剩余磁盘空间」新增抽取参数「更新高性能时间区间」 2）删除参数删除抽取参数「Spark Driver端口」删除抽取参数「Spark blockManager端口」删除抽取参数「Spark动态调节功能」 3）参数分类优化，调整部分参数的分类「明细表导出并发线程数限制」、「多指标计算线程数」调整为BI参数-高级调优参数「spark日志输出等级」、「精简模式日期」调整为抽取参数-基础参数「spark本地模式临时文件路径」、「增量更新数据块整理计划」调整为抽取参数-高级调优参数
6.0.5	BI参数「智能数据解释」默认关闭
6.0.8	1）「抽取参数」更名为「Spider参数」 2）新增参数新增Spider参数「数据访问活跃周期（天）」新增Spider参数「数据创建活跃周期（天）」新增Spider参数「数据活跃度全局检查时间」 3）删除参数删除Spider参数「分析用户自助数据集磁盘占用大小（单元格）」
6.0.9	1）增加不合理计算的限制，分组后、左右合并后数据量过大，那么在组件/仪表板中进行计算的时候会被打断。 2）删除BI参数「多指标计算线程数」
6.0.14	「BI参数>高级调优参数」新增参数「手动预览提醒（秒）」

1.2 功能简介

FineBI 在系统管理里提供了配置一些 BI 参数和调优参数的功能，方便系统管理和项目实施人员简单快捷的了解当前系统配置，并在界面上进行快速设置。

管理员登录FineBI系统，进入「管理系统>系统管理>常规」，可以看到 BI参数和抽取参数配置的页面。如下图所示：

2. BI 参数

注：BI参数仅作用于FineBI功能，对FineReport无影响。

2.1 基础参数

参数	定义	默认值	修改后是否需要重启工程
数据类型识别	1）无论是否开启，有小数位数时字段始终被识别为数值类型 2）不开启数据类型识别时，超过15位的识别为文本类型，小于等于15位的识别为数值类型 3）开启数据类型识别后始终识别为数值类型(double)，double有效精度为15位(2^52)，所以当数值长度超过15位时就可能发生精度丢失的情况 4）在未开启参数的情况下添加的表（直连和分布式）：如果表没被编辑过，开启参数重启后，进入表编辑界面可以获取为数值字段类型，重新保存即可。如果表是被编辑过（5.1.5及以后是做过字段类型转换）的，开启参数重启后，进入表编辑界面依然会是文本类型，不会再读取为数值。	关闭	是
SQL参数控件过滤生效	控件绑定SQL参数功能与过滤功能是否同时生效默认关闭，表示不生效	关闭	否
中文排序	是否使用中文排序默认关闭，表示不使用中文排序开启后，抽取数据的表需要重新抽数详情参见：排序 1.4 节	关闭	是
数据访问量	数据访问量限制了可读入服务器内存的数据行数。并非所有大数据量计算场景都会将所有数据读入内存，FineBI Spider 引擎具有智能的内存使用策略，例如：执行过分组汇总后的数据行超过【设置值】，组件/仪表板中的计算会被打断。左右合并中较小的数据表，它的关联字段分组后若超过【设置值】行数，组件/仪表板中的计算会被打断。配置过低，将影响数据计算准确性。配置过高，系统有宕机风险。单位：行可配置区间：[0，10000000] 建议设置区间：[10000，1000000]，建议保持默认值	1000000	是
Excel 导出数据量限制	用户导出 Excel 时可能会超出数据量限制，提供该参数便于用户设置，超过限制导出将直接报错单位：单元格（行*列）配置范围：0-2000000000 建议配置范围：0-1000000000	空	否
Excel 导出剩余磁盘空间（G）	导出Excel时会进行磁盘空间检查，当磁盘空间小于限制值时，将中断导出行为。预防因磁盘占满导致宕机。触发该限制后，导出失败，系统弹窗报错：当前导出数据量过大，磁盘空间不足。已触发系统保护机制，导出中断。请及时清理磁盘空间，受【Excel导出磁盘空间检查】参数限制，磁盘空间限制：XXG 配置范围：5~无限制	5	否
直连查询超时时间（秒）	当仪表板中组件过多，组件查询时间会过长，或者仪表板中某个组件查询时间过长，导致后续 BI 请求被阻塞，容易误认为产品宕机。此时可设置直连查询超时时间，所有实时数据查询超时之后将会中止查询，防止异常慢查询阻塞其他正常查询。组件返回如下报错：组件查询时间超过Xmin，查询中断单位：秒建议配置范围：10-300 生效范围：BI直连除获取表结构之外的所有查询请求	180	否
智能数据解释	控制组件在不进行主动配置时，是否能进行智能数据解释，默认关闭。安装数据解释插件后此配置才生效关闭后，手动配置过的数据解释才能触发，以避免数据解释的滥用	关闭	否
抽取查询超时时间（秒）	当仪表板中组件过多，组件查询时间会过长，或者仪表板中某个组件查询时间过长，导致后续 BI 请求被阻塞，容易误认为产品宕机。此时可设置抽取查询超时时间，所有抽取数据查询超时之后将会中止查询，防止异常慢查询阻塞其他正常查询。组件返回如下报错：组件查询时间超过xxx，查询中断单位：秒建议配置范围：10-300	45	否

2.2 高级调优参数

参数	定义	默认值	修改后是否需要重启工程
明细表导出并发线程数限制	当多个用户同时导出数据量很大的 Excel 时，可能会超过并发数，影响用户使用，因此提供该参数，可设置同时进行明细表导出的用户数。超过限制导出，业务员需等待。配置范围：1-10 建议配置范围：1-5，建议保持默认值	3	是
手动预览提醒（秒）	单位为秒，默认为空，空代表不开启手动预览参数。配置参数后，所有组件请求数据查询时间超过设置的时长后，提示用户开启手动预览，但不强制为用户开启。降低对引擎的查询压力参数无需重启，配置后即生效。	空	否

参数

定义

默认值

修改后是否需要重启工程

明细表导出并发线程数限制

当多个用户同时导出数据量很大的 Excel 时，可能会超过并发数，影响用户使用，因此提供该参数，可设置同时进行明细表导出的用户数。超过限制导出，业务员需等待。

配置范围：1-10

建议配置范围：1-5，建议保持默认值

是

手动预览提醒（秒）

单位为秒，默认为空，空代表不开启手动预览参数。

配置参数后，所有组件请求数据查询时间超过设置的时长后，提示用户开启手动预览，但不强制为用户开启。降低对引擎的查询压力

参数无需重启，配置后即生效。

空

否

3. Spider参数

注：抽取参数仅作用于FineBI的抽取功能，对FineReport、FineBI实时数据无影响。

3.1 基础参数

参数	定义	默认值	修改后是否需要重启工程
自助数据集默认更新设置	自助数据集单表更新是否跟随父表更新详情请参见：自助数据集单表更新	跟随父表更新	是
Spark日志输出等级	spark日志输出等级，标准输出流，输出在 Tomcat 的 catalina.out 文件内或者 BI 的 nohup 文件内可选项为：INFO、WARN、ERROR、DEBUG。 INFO：打印错误类和基本执行日志 WARN：打印警告或提示类信息 ERROR：只打印错误类日志 DEBUG：打印所有日志	INFO	是
更新高性能时间区间	在配置的时间段内不限制更新资源池核心数占用。为不影响用户使用，建议配置到系统无人使用、更新任务频繁的时间段。注：重启BI工程后生效	空	否
精简模式日期	精简模式开启时，日期字段在进行数据抽取时，只提前生成少量分组类型，加快生成速度，减少占用空间未生成的分组在进行计算时可能会有性能损失	关闭	是（且需重新更新数据）
数据访问活跃周期（天）	数据集被访问后的持续活跃周期存在以下两种情况之一的数据集会被视为活跃： ● 数据集制作的仪表板/组件，在 x 天内被编辑或访问 ● 数据集的子表，在 x 天内被编辑且保存单位：天	14	是
数据创建活跃周期（天）	数据集被创建后的持续活跃周期数据集在被创建的 x 天内被视为活跃，超出则视为不活跃单位：天	7	是
数据活跃度全局检查时间	数据集活跃状态判断的检查时间。将在该时间统一检查数据集的访问、创建情况，刷新其活跃状态，从而将一部分数据集设置为不抽取。可选项为： ● 固定时间检查：每天XXX点检查，设置格式 hh:mm:ss ● 全局更新定时任务前检查	固定时间检查 00:00:00	是

3.2 高级调优参数

参数	定义	默认值	修改后是否需要重启工程
抽数压缩线程数	抽取数据时，分片（压缩&写入）线程的数量在内存很小（不超过4G）并且无法扩大内存的情况下，可以调小该线程，减轻内存压力配置过低，数据更新速度将会减缓。配置过高，数据更新时可能会影响其他任务的吞吐量建议保持默认值 8。建议设置区间：[4, 16]	8	是
抽数压缩线程队列大小	抽取数据时，未处理的分片等待队列长度在内存很小（不超过4G）并且无法扩大内存的情况下，可以调小队列长度，减轻内存压力配置过低，数据更新速度将会减缓配置过高，数据更新时可能会影响其他任务的吞吐量建议保持默认值 200 建议设置区间：[100, 200]	200	是
新增数据抽数任务执行线程数	新增数据的抽数任务同时执行的线程数在内存很小（不超过4G）并且无法扩大内存的情况下，可以调小该线程数，减轻内存压力配置过高，数据更新时可能会影响其他任务的吞吐量建议保持默认值 5 建议设置区间：[1, 5]	5	是
Spark本地模式临时文件路径	Spark写临时文件的目录，需给足一定的空间，修改至SSD挂载路径可提升Spark处理关联、SparkSql查询的性能注：集群版该参数无效，需要在服务器端配置。	null (Linux下实际为/tmp)	是
增量更新数据块整理计划	在这个时间段内，增量更新任务不会执行合并操作，提升增量更新的速度设置格式 hh:mm:ss-hh:mm:ss 示例 10:10:10-12:12:12	关闭	是

上一篇：加密算法

下一篇：BI缓存

有帮助
没帮助
只是浏览

中文（繁體） English 日本語

中文（简体）

BI/Spider参数