1、概述编辑
1.1 应用场景
存在四张表 A,B,C,D,其中,B,C,D 分别与A 表为 N:1关联。如何将这几张表汇总成一张表,并进行次数统计?
四张表如如下图所示:
表间关联,以「单位」为关联依据,建立 A 表和其他表的 1:N 关联。如下图所示:
在自助数据集中处理,效果如下图所示:
1.2 实现思路
将数据上传后,通过自助数据集实现多表合并和统计场景:
1)在自助数据集内通过「选字段」添加 A 表字段。
3)通过左右合并将 B 表字段合并进数据集。
3)通过分组汇总对重复的数据进行合并,得到正确的统计结果。
4)分组汇总前可使用函数,统计合并字段的对应次数。
5)重复左右合并和分组汇总的组合操作,继续合并 C 表和 D 表,即可实现多表合并。
2. 上传数据编辑
示例使用的数据:多表合并示例数据.rar
1)新建「多表合并」的业务包。打开「数据准备>添加业务包」,添加业务包,并重命名为「多表合并」。如下图所示:
2)点开「多表合并」业务包,在下面添加数据表。如下图所示:
3)上传「设备信息」表,自动填入表名,展示数据效果,点击「确定」确认上传。如下图所示:
4)在「多表合并」业务包下,上传需要合并的几张 EXCEL 表「停运」、「故障」和「离线」,步骤同上。合并后效果如下图所示:
3. 添加关联编辑
为四张表添加关联,设置「设备信息」和其他三张表 1:N 的关联关系。
1)为「设备信息」添加关联,如下图所示:
2)建立「设备信息」表和「停运」表直接的「1:N」关联,完成点击「确定」,如下图所示:
3)继续添加「设备信息」表和剩余两张表「1:N」的关联。步骤同上,完成后如下图所示:
4. 添加自助数据集编辑
在自助数据集中,先添加「设备信息」字段,再对三张表中的字段进行汇总合并。
1)在「多表合并」业务包下,添加自助数据集。如下图所示:
5. 选字段编辑
自助数据集命名为「多表合并」,添加「设备信息」表的全部字段。如下图所示:
由于「设备信息」在关联中是 1 端的表,不能选择 N 端表的字段,因此需要左右合并完成操作。
6. 合并「停运」表编辑
自助数据集添加完「设备信息」表字段后,合并「停运」表的字段。
6.1 左右合并
1)使用「左右合并」,添加「停运」表的字段。如下图所示:
2)选择「数据列表/多表合并/停运」,添加表内全部字段,如下图所示:
3)使用「并集合并」保留所有数据。如下图所示:
6.2 分组汇总
合并后出现同一个单位数据同时存在了多条的结果。因此可在「左右合并」后加入「分组汇总」对数据进行单位的汇总,整理出三个单位的对应结果,从而避免多条数据。
1)在合并「停运时长」字段后,增加「分组汇总」,所示:
2)将合并表的合并字段「停运时长」,放入汇总栏求和,其他字段拖入分组栏。则多条数据汇总为一条,展示三个单位的数据信息。如下图所示:
6.3 统计次数
如果要统计「停运」表中的,各个单位停运次数,使用常规方法:重复拖入「停运时长」字段,统计「记录个数」是无法实现的。如下图所示:
若添加的合并的字段进行分组汇总时不存在空值,可使用此方法求次数。但如果表中的合并字段「停运时长」存在空值,任会记录个数 1 ,不能得出正确的停运次数统计。
因此求「停运次数」需要在左右合并和「分组汇总」中间添加步骤,通过 IF 函数对「停运时长」字段进行判断。
1)在「左右合并」和「分组汇总」中间「新增列」。对「停运时长」字段添加判断条件。如下图所示:
2)新增列后,输入公式:IF(停运时长=NULL,0,1)。判断每条记录,当停运时长为空时,显示 0 ,否则 为 1 。新增列名为「停运次数」。如下图所示:
添加公式后效果如下图所示:
3)返回「分组汇总」,汇总栏添加指标「停运次数」进行汇总求和,得出结果。如下图所示:
7. 合并「故障」表编辑
1)添加「左右合并」,使用「故障」表进行「并集合并」所有数据。步骤同上,参见本文 6.1 节。
2)对数据进行「分组汇总」,步骤同上,参见本文 6.2 节。效果如下图所示:
注:若数据量过大,可合并「停运表」后,保存数据集。再新建自助数据集进行合并「故障」表的操作。
若要统计故障次数,则步骤可参考本文 6.3 节。
8. 合并「离线」表编辑
使用「离线」表,继续重复第 7 节的操作,完成后点击「保存」完成多表合并。效果如下图所示:
9. 效果查看编辑
详情请参见本文 1.1 节。