Python分析

编辑
文档创建者:doreen0813 (83193 )     浏览次数:2599次     编辑次数:14次     最近更新:doreen0813 于 2019-01-28     

目录:

1、描述编辑

视频学习:Python分析在线视频学习请查看【Python语言集成】

Python语言:Python和R语言一样,是常被用于数据挖掘的一种语言。因为相比于R语言具有更好的工程性,所以很多程序员属性的分析师,更趋向于使用python来进行数据挖掘。

                   根据近些年的使用数据来看,Python相比R语言具有更多的用户,相信帆软产品用户中,也一定有大量的python用户存在,希望可以用python进行数据挖掘。因此,在R语言之后,我们将python也集成于我们的数据挖掘功能之中,让python用户可以使用我们的产品进行数据挖掘。

注:1. 使用该数据挖掘下的Python分析功能需要2018.11.16日之后的FineBI5.0版本,若为之前的版本,可以参考5.0同版本升级进行换jar升级。  

2. python集成不同于R语言的集成,不需要连接入口,只需要在本地准备好python环境即可。且BI中执行python语句时不需要保证后台python服务器的开启状态。Python环境准备请参考Python分析环境准备

3. 使用前需要开启Python/R应用权限,仅管理员能使用。

2、Python分析操作编辑

2.1 Python分析

登录FineBI数据决策系统,创建自助数据集并进行自主数据加工后,在表处理操作流程处选择Python分析,如下图所示:

222

进入Python分析配置界面,界面分为编码区、日志区、数据区,如下图:

222

编码区:用来进行Python语言编译,可以运行Python代码,具有以下功能:

               --执行代码;

               --终止执行;

               --基本的文本操作:复制、粘贴、剪切、全选;支持快捷键操作;

               --代码过长出现滚动条可滚动预览;

               --代码保存于自助数据集中;

日志区:用来查看编译日志,具有以下功能:

               --日志自动输出(包括报错和中间函数或变量的数据预览);

               --清空日志;

               --日志过长有滚动条;

               --支持复制功能,日志太多可以让用户把日志拷贝到其他文件中;

数据区:用来预览挖掘处理后的数据,数据标准和自助数据集一致。

             若不写任何Python语言,数据区为空,下一节点无法调用数据,也无法保存,因此需要输入Python语言才能进行后续操作;

             当Python代码报错时,数据区报错,数据为空,下一节点无法调用数据,可保存自助数据集配置,但无法执行自助数据集。

数据区只展示主干数据(自助数据集流程的数据),该数据在Python语言编译区为一个数据框,承接上一步的数据后该数据有默认的数据框名称,只针对该数据框进行修改、变更时,该数据区变化。

其中在编码区,如下图,上一节点的数据会自动存储在PY_INPUT中,要是想把数据传给下一节点必须赋值给PY_OUTPUT,最关键的是必须满足data.frame的结构。

222

2.2 简单示例

比如我们使用Python读取系统中的excel文件(读取excel需要在python中加载xlrd模块),就可以输入如下编码,点击执行按钮,数据区即出现读取出来的数据。如下图:

222

若执行python代码过程中有任何错误,都会在日志区展示。如下图,报错为缺少xlrd模块,需要根据自身的代码需要加载对应模块。

222

解决报错日志显示的问题后,点击重新执行即可重新运行python编码。

Python分析配置完毕后,点击右下角的确定按钮即可保存该配置,进入自助数据集配置界面。若还想修改之前配置的Python分析,如下图,单击该编码框即可修改。

222

附件列表


主题: 数据加工
标签: 暂无标签 编辑/添加标签
如果您认为本文档还有待完善,请编辑

文档内容仅供参考,如果你需要获取更多帮助,付费/准付费客户请咨询帆软技术支持
关于技术问题,您还可以前往帆软社区,点击顶部搜索框旁边的提问按钮
若您还有其他非技术类问题,可以联系帆软传说哥(qq:1745114201

本文档是否有用? [ 去社区提问 ]