新增列

编辑
文档创建者:doreen0813 (83193 )     浏览次数:559次     编辑次数:6次     最近更新:doreen0813 于 2018-10-22     

目录:

1、描述编辑

新增列在线视频学习请查看【新增列】

很多时候我们想要得到不直接存在于数据库的数据,比如数据格式的转化、时间差等等,此时就可以使用新增列功能。业务人员在不影响原数据的情况下通过对现有数据列进行计算而得到的一个新的数据列,保存在业务包中以供后续业务分析使用。比如我们在统计合同的时候想要获取一个合同签约距今的时间差作为新的一列,就可以使用新增列的功能,下面我们详细介绍如何实现该功能。

2、步骤编辑

进入数据准备>我的自助数据集,点击添加自助数据集,如下图:

222

进入自助数据集配置界面,从业务包的数据表中选择需要的字段合同类型、总金额、购买数量、合同签约时间,右侧表格中即显示选择的字段,如下图:

注:此处只能选择已添加并进行数据更新的数据表,未更新的数据表不能用于创建自助数据集。

在添加完字段以后在最左侧的操作流程栏点击+,选择新增列,如下图:

进入新增列设置界面,可以修改新增列名,支持的新增列获取方式包含公式/函数、时间差、获取时间、所有值/组内、累计值/组内、排名/组内、分组赋值,详细的获取方式介绍可以查看第三章节。

此处我们获取一个合同签约时间距今时间差,在左侧获取方式栏选择时间差,右侧选择时间差的字段为系统时间和合同签约时间,时间差单位选为年。

点击确认保存,在数据预览框会出现新增的时间差这一列,如下图:

此时新增列即设置完毕,点击右上角的保存按钮即可以在业务包中看到我们刚刚新建的自助数据集,如下图:

3、新增列获取方式编辑

3.1 公式/函数

新增列支持使用公式/函数的方式对添加的字段进行处理,支持的函数类型参考函数章节。在新增列设置界面左侧的获取方式栏选择公式/函数后,右侧可以进行函数、运算符、字段类型的选择和公式框等,如下图:

选择需要处理的字段和对应处理的函数、运算符,就可以在公式框看到公式,公式添加完成后可以选择该新增列的字段类型,支持文本、数值、日期。若不选择,默认为自动类型,是系统根据生成的结果进行字段类型的字段自动判断。如下图,我们添加一个计算均价的公式,为该公式命名为均价,选择SUM函数求金额之和,并点击除法的运算符和数值字段中的购买数量添加到公式,该计算公式就添加成功了。同时可以为该公式选择字段类型为数值类型,如下图:

注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。

在公式添加完成以后点击确认保存,如下图,即可在数据预览框看到新增的数据列“均价”。

3.2 时间差

新增列支持使用时间差的方式获取,在新增列设置界面选择了时间差方式以后,界面右侧可以进行时间差计算公式和单位的选择,如下图:

时间差计算公式默认是第一个字段减去第二个字段的时间,上图中即为系统时间减去合同签约时间。第一个字段可选系统时间和已添加字段中的时间字段,如下图:

第二个字段可选仅为已添加字段中的时间字段,如下图:

时间差单位包含七种:年、季度、月、天、时、分、秒,如下图:

且无论选择什么时间差单位,计算以后的时间差字段均为整数,不会保留小数。例如想要新增一列用户注册到合同签约之前的时间差,以月为粒度,就可以在时间差计算公式第一个字段选择合同签约时间,第二个字段选择注册时间(因为默认是第一个字段减去第二个字段的时间差,所以我们选择合同签约时间减去注册时间),单位选择月,如下图:

点击确认保存后,在数据预览框就可以看到新增的时间差数据列,如下图:

注:新增时间差数据列生成的字段只能是数值类型,不提供切换数据类型功能。

3.3 获取时间

新增列支持使用获取时间方式添加,在新增列设置界面选择获取时间以后,右侧可以选择时间获取的字段来源和获取的粒度,如下图:

其中字段来源为已添加字段中的所有时间类型字段,如下图:

获取时间的粒度包含十五种:年份、季度、月份、星期、天、周数、时、分、秒、年季度、年月、年周数、年月日时、年月日时分、年月日时分秒,如下图:

例如我们想要新增一列合同签约的季度,为后续分析什么季度签约最多做准备。如下图,就可以在新增列中选择获取时间字段为合同签约时间,获取的时间粒度为季度。

点击确认保存,就可以在数据预览框看到新增的获取合同签约时间季度的字段列,如下图:

注:新增的获取时间数据列会根据选择的获取时间粒度类型自动判断,不需要进行字段类型的选择。如上面获取的合同签约季度为数值类型。

3.4 所有值/组内

新增列支持使用所有值/组内所有值的方式添加,所有值计算的是该指标在该表汇总所有值,组内所有值计算的是按照选择的分组方式组内所有值的汇总统计结果。在选择所有值/组内的方式后,设置界面右侧可以选择所有值或者组内所有值方式,取值字段和计算方式。

其中选择用来统计的字段仅支持数值类型,可选择的字段为已添加的数值类型字段,如下图:

统计方式包含四种:求和、求平均、求最大值、求最小值,如下图:

若选择统计组内所有值的话,还需要进行分组方式的选择,分组依据来源于已添加的除数值字段外的所有字段,如下图:

如果我们想要新增一列统计相同合同类型分组内的平均金额,就可以选择字段为组内所有值,数值来自总金额,统计方式为求平均,分组方式选择合同类型,生成的取值描述如下图所示:同一合同类型中的总金额求平均。

点击确认保存,在数据预览框就可以看到新增的相同合同类型平均金额,如下图:

3.5 累计值/组内

新增列支持使用累计值/组内累计值方式获取。累计值/组内累计值,计算的是该指标在该表所有值/组内所有值的累计统计结果,按照上一步数据的排序结果由上至下依次对当前指标进行累加。在选择累计值/组内方式以后,设置界面右侧可以选择字段、数据来源,如下图:

字段可以选择累计值或者组内累计值,取值来源仅能选择已添加字段中的数值类型字段,如下图:

若选择组内累计值的话,还需要进行分组方式的选择,分组依据来源于已添加的除数值字段外的所有字段,如下图:

如果我们想要新增一列获取合同类型的组内金额累计,就可以选择字段为组内累计值,数值来自总金额,分组方式选择合同类型,获取到的取值描述为同一合同类型中的总金额求累加,如下图:

点击确认保存,在数据预览框就可以看到新增的合同类型组内累计,如下图:

3.6 排名/组内

新增列支持使用排名/组内排名的方式获取,排名值/组内排名值,计算的是该指标在该表所有值/组内所有值的排名结果。列出该指标在全部数据/组内全部数据中的排名。在选择排名/组内方式以后,设置界面右侧可以选择字段、数据来源,如下图:

字段可以选择排名方式为:升序排名、降序排名、组内升序排名和组内降序排名,如下图:

取值来源仅能选择已添加字段中的数值类型字段,如下图:

若选择组内排名方式的话,还需要进行分组方式的选择,分组依据来源于已添加的除数值字段外的所有字段,如下图:

如果我们想要新增一列在同一合同类型内的合同金额升序排名,就可以选择字段为组内升序排名,数值来自总金额,分组方式为合同类型,获取到的取值描述为同一合同类型中的总金额有小到大求排名,如下图:

点击确认保存,在数据预览框就可以看到新增的合同类型组内升序排名,如下图:

3.7 分组赋值

分组赋值的赋值依据支持文本和数值两类字段。选择文本字段作为赋值依据时,分组名称将作为新增列的值;选择数值字段作为赋值依据时,分组的值作为新增列的值;

当选中文本字段作为赋值依据时,可对文本字段进行分组设置,并命名分组名称。比如我们为合同类型进行重分组,如下图:

则点击确认保存后,可以看到新增的合同类型新分组列。

若选中数值字段作为赋值依据时,分组赋值方式包括自定义和自动。自定义可以自行设置分组数值范围和分组名称,而自动则为默认设置分组。

自定义分组可自定义设置分组个数、各分组的范围、分组的名称,如下图,我们为总金额设置四个分组:十万以下、十万到一百万、一百万到一千万、一千万以上。

点击确认保存后,可以看到新增的金额分组赋值列。

自动分组可设置区间间隔,将根据数据最小值和最大值按照区间间隔分为若干组。如下图,我们为总金额设置自动分组赋值,区间间隔设为5000000,则该字段将会被分为9组。

点击确认保存后,可以看到新增的自动总金额分组赋值列。



新增列在线视频学习请查看【新增列】

附件列表


主题: 数据加工
标签: 暂无标签 编辑/添加标签
如果您认为本文档还有待完善,请编辑

文档内容仅供参考,如果你需要获取更多帮助,付费/准付费客户请咨询帆软技术支持
关于技术问题,您还可以前往帆软社区,点击顶部搜索框旁边的提问按钮
若您还有其他非技术类问题,可以联系帆软传说哥(qq:1745114201

本文档是否有用? [ 去社区提问 ]