新增列

  • 文档创建者:doreen0813
  • 编辑次数:7次
  • 最近更新:Roxy 于 2020-07-01
  • 1. 概述

    在线视频学习请参见:新增列

    适用人群:业务员/数据分析师

    1.1 应用场景

    在统计合同的时候想要获取一个合同签约距今的时间差作为新的一列,就可以使用此新增列的功能。本文以此为例,详细介绍如何实现。 

    1.2 功能介绍

    新增列是指业务人员在不影响原数据的情况下通过对现有数据列计算而得到的一个新的数据列,保存在业务包中以供后续业务分析使用。比如数据格式的转化、时间差、分组赋值等等,就可以使用新增列功能。

    注:自 2018.11.16 后的版本起,年周粒度的周计算逻辑采用 iso标准的周逻辑 ,每周开始的第一天为周日,每年包含 52 或 53 周,每年的第一周必须包含 1 月 4 日。从而保证每周都有7天的数据,更符合业务场景。周开始的时间可参考 常规参数 的 2.9 节修改。   

    2. 示例

    1)进入数据准备>我的自助数据集,点击添加表>自助数据集,如下图所示:

    2.png

    2)进入自助数据集配置界面,从业务包的数据表中选择需要的字段产品名称、合同金额、购买数量、合同签约时间,右侧表格中即显示选择的字段,如下图所示:

    3.png

    3)在最左侧的操作流程栏点击 + ,选择新增列,如下图所示:

    1.png

    4)进入新增列设置界面,可以修改新增列名,支持的新增列获取方式包含公式/函数、时间差、获取时间、所有值/组内、累计值/组内、排名/组内、分组赋值,详细的获取方式介绍详情参见本文第 3 章节,如下图所示:

    1.png

    5)此处为获取合同签约时间距今时间差,在左侧获取方式栏选择时间差,右侧选择时间差的字段为系统时间合同签约时间,时间差单位选为。如下图所示:

    1.png

    6)点击确定保存,在数据预览框会出现新增的时间差这一列,如下图所示:

    1.png

    7)此时新增列即设置完毕,点击右上角的保存按钮并更新数据,即可以在业务包中看到新建的自助数据集,如下图所示:

    222

    3. 新增列获取方式

    3.1 公式/函数

    1)新增列支持使用公式/函数的方式对添加的字段进行处理,支持的函数类型参考 函数 章节。在新增列设置界面左侧的获取方式栏选择公式/函数后,右侧可以进行函数、运算符、字段类型的选择和公式框等,如下图所示:

    1.png

    2)选择需要处理的字段和对应处理的函数、运算符,可以在公式框看到公式,公式添加完成后可以选择该新增列的字段类型,支持文本、数值、日期。若不选择,默认为自动类型,是系统根据生成的结果进行字段类型的字段自动判断。

    如下图,添加一个计算均价的公式,为该公式命名为均价,选择合同金额字段,点击除法的运算符和数值字段中的购买数量添加到公式,该计算公式添加成功。同时可以为公式选择字段类型为数值类型,如下图所示:

    1.png

    注:公式框中的函数、字段都需要点击左侧的选择区域选择,不能手动输入。

    3)在公式添加完成以后点击确定保存,如下图所示,即可在数据预览框看到新增的数据列「均价」。

    1.png

    3.2 时间差

    1)新增列支持使用时间差的方式获取,在新增列设置界面选择时间差方式后,界面右侧可以进行时间差计算公式和单位的选择,如下图所示:

    1.png

    2)时间差计算公式默认第一个字段减去第二个字段的时间,上图中即为系统时间减去合同签约时间。字段可选系统时间和已添加字段中的时间字段,如下图所示:

    1.png

    1.png

    3)时间差单位包含七种:年、季度、月、天、时、分、秒,如下图所示:

    1.png

    4)无论选择什么时间差单位,计算以后的时间差字段均为整数,不会保留小数。

    例如新增一列用户注册到合同签约之前的时间差,以月为粒度,可以在时间差计算公式第一个字段选择合同签约时间,第二个字段选择注册时间(默认是第一个字段减去第二个字段的时间差,所以选择合同签约时间减去注册时间),单位选择,如下图所示:

    1.png

    5)点击确定保存后,在数据预览框就可以看到新增的时间差数据列,如下图所示:

    1.png

    注:新增时间差数据列生成的字段只能是数值类型,不提供切换数据类型功能。

    3.3 获取时间

    1)新增列支持使用获取时间方式添加,在新增列设置界面选择获取时间以后,右侧可以选择时间获取的字段来源和获取的粒度,如下图所示:

    1.png

    2)其中字段来源为已添加字段中的所有时间类型字段,如下图所示:

    1.png

    3)获取时间的粒度包含 17 种:年份、季度、月份、月日、星期、日、周数、时、分、秒、年季度、年月、年周数、年月日、年月日时、年月日时分、年月日时分秒,如下图所示:

    1578277698731245.png

    4)例如新增一列合同签约的季度,为后续分析什么季度签约最多做准备。可以在新增列中选择获取时间字段为合同签约时间,获取的时间粒度为季度。如下图所示:

    1.png

    5)点击确定保存,在数据预览框看到新增的获取合同签约时间季度的字段列,如下图所示:

    1.png

    注:新增的获取时间数据列会根据选择的获取时间粒度类型自动判断,不需要进行字段类型的选择。如上面获取的合同签约季度为数值类型。

    3.4 所有值/组内

    1)新增列支持使用所有值/组内所有值的方式添加,所有值计算的是该指标在该表汇总所有值,组内所有值计算的是按照选择的分组方式组内所有值的汇总统计结果。在选择所有值/组内的方式后,设置界面右侧可以选择所有值或者组内所有值方式,取值字段和计算方式。如下图所示:

    1.png

    2)其中选择用来统计的字段仅支持数值类型,可选择的字段为已添加的数值类型字段,如下图所示:

    1.png

    3)统计方式包含四种:求和、求平均、求最大值、求最小值,如下图所示:

    1.png

    4)若选择统计组内所有值,还需要进行分组方式的选择,分组依据来源于已添加的除数值字段外的所有字段,如下图所示:

    1.png

    5)如果要新增一列统计相同产品分组内的平均金额,可以选择字段为组内所有值,数值来自合同金额,统计方式为求平均,分组方式选择产品名称,生成的取值描述如下图所示:同一产品名称中的总金额求平均。如下图所示:

    1.png

    6)点击确定保存,在数据预览框可以看到新增的相同产品名称的平均金额,如下图所示:

    1.png

    3.5 累计值/组内

    1)新增列支持使用累计值/组内累计值方式获取。累计值/组内累计值,计算的是该指标在该表所有值/组内所有值的累计统计结果,按照上一步数据的排序结果由上至下依次对当前指标进行累加。在选择累计值/组内方式以后,设置界面右侧可以选择字段、数据来源,如下图所示:

    1.png

    2)字段可以选择累计值或者组内累计值,取值来源仅能选择已添加字段中的数值类型字段,如下图所示:

    1.png

    3)若选择组内累计值,需要进行分组方式的选择,分组依据来源于已添加的除数值字段外的所有字段,如下图所示:

    1.png

    4)如果要新增一列获取产品名称的组内金额累计,就可以选择字段为组内累计值,数值来自合同金额,分组方式选择产品名称,获取到的取值描述为同一产品名称中的合同金额求累加,如下图所示:

    1.png

    5)点击确定保存,在数据预览框就可以看到新增的合同类型组内累计,如下图所示:

    1.png

    3.6 排名/组内

    1)新增列支持使用排名/组内排名的方式获取,排名值/组内排名值,计算的是该指标在该表所有值/组内所有值的排名结果。列出该指标在全部数据/组内全部数据中的排名。在选择排名/组内方式以后,设置界面右侧可以选择字段、数据来源,如下图所示:

    1.png

    2)字段可以选择排名方式为:升序排名、降序排名、组内升序排名和组内降序排名,如下图所示:

    1.png

    3)取值来源仅能选择已添加字段中的数值类型字段,如下图所示:

    1.png

    4)若选择组内排名方式,需要进行分组方式的选择,分组依据来源于已添加的除数值字段外的所有字段,如下图所示:

    1.png

    5)如果要新增一列在同一产品名称下的合同金额升序排名,就可以选择字段为组内升序排名,数值来自合同金额,分组方式为产品名称,获取到的取值描述为同一产品名称中的合同金额由小到大求排名,如下图所示:

    1.png

    6)点击确定保存,在数据预览框就可以看到新增的产品名称组内升序排名,如下图所示:

    1.png

    3.7 分组赋值

    分组赋值的赋值依据支持文本和数值两类字段。选择文本字段作为赋值依据时,分组名称将作为新增列的值;选择数值字段作为赋值依据时,分组的值作为新增列的值,如下图所示:

    1.png

    3.7.1 文本字段

    1)当选中文本字段作为赋值依据时,可对文本字段进行分组设置,并命名分组名称。比如为合同类型进行重分组,如下图所示:

    1578278512686906.png

    2)则点击确定保存后,可以看到新增的合同类型新分组列。如下图所示:

    1578279911529130.png

    3.7.2 数值字段

    1)若选中数值字段作为赋值依据时,分组赋值方式包括自定义和自动。自定义可以自行设置分组数值范围和分组名称,而自动则为默认设置分组。如下图所示:

    1578280100393171.png

    2)自定义分组可自定义设置分组个数、各分组的范围、分组的名称,为合同金额设置四个分组:十万以下、十万到一百万、一百万到一千万、一千万以上。如下图所示:

    1578280402823139.png

    3)点击确定保存后,可以看到新增的金额分组赋值列。如下图所示:

    1578280488376238.png

    4)自动分组可设置区间间隔,将根据数据最小值和最大值按照区间间隔分为若干组。为总金额设置自动分组赋值,区间间隔设为5000000,则该字段将会被分为 9 组。如下图所示:

    1578280637427224.png

    5)点击确定保存后,可以看到新增的自动合同金额分组赋值列。如下图所示:

    1578280710555068.png


    附件列表


    主题: 数据加工
    • 有帮助
    • 没帮助
    • 只是浏览
    • 评价文档,奖励 1 ~ 100 随机 F 豆!