历史版本4 :多表合并/统计场景 返回文档
编辑时间: 内容长度:图片数:目录数: 修改原因:

目录:

1、概述编辑

1.1 应用场景

存在四张表 A,B,C,D,其中,B,C,D 分别与A 表为 N:1关联。如何将这几张表汇总成一张表,并进行次数统计?

四张表如如下图所示:

2020-09-27_9-21-26.png

表间关联,以「单位」为关联依据,建立 A 表和其他表的 1:N 关联。如下图所示:

2020-09-27_9-33-20.png

在自助数据集中处理,效果如下图所示:

2020-09-27_9-44-27.png

1.2 实现思路

1)将数据上传后,通过自助数据集实现。

2)在自助数据集内,通过左右合并将所有表内所有数据进行合并。

3)通过分组汇总对重复的数据进行合并,得到正确的统计结果。

4)重复左右合并和分组汇总的组合操作,即可实现多表合并。

2. 上传数据编辑

示例使用的数据:多表合并示例数据.rar

1)新建「多表合并」的业务包。打开「数据准备>添加业务包」,添加业务包,并重命名为「多表合并」。如下图所示:

2020-09-25_10-16-44.png

2)点开「多表合并」业务包,在下面添加数据表。如下图所示:

2020-09-25_10-21-09.png

3)上传「设备信息」表,自动填入表名,展示数据效果,点击「确定」确认上传。如下图所示:

2020-09-25_10-27-43.png

4)步骤同上,在「多表合并」业务包下,上传需要合并的几张 EXCEL 表「停运」、「故障」和「离线」。如下图所示:

2020-09-25_10-30-58.png

3. 添加关联编辑

为四张表添加关联,设置「设备信息」和其他三张表 1:N 的关联关系。

1)为「设备信息」添加关联,如下图所示:

2020-09-25_10-50-58.png

2)建立「设备信息」表和「停运」表直接的「1:N」关联,完成点击「确定」,如下图所示:

2020-09-25_10-51-17.png

3)继续添加「设备信息」表和剩余两张表「1:N」的关联。步骤同上,完成后如下图所示:

2020-09-25_10-51-36.png

4. 添加自助数据集编辑

在自助数据集中,选择「设备信息」字段,对三种表进行左右合并。

1)在「多表合并」业务包下,添加自助数据集。如下图所示:

2020-09-25_11-10-05.png

5. 选字段编辑

自助数据集命名为「多表合并」,添加「设备信息」表的全部字段。如下图所示:

由于「设备信息」在关联中是 1 端的表,不能选择 N 端表的字段,因此需要左右合并完成操作。

2020-09-25_11-11-00.png

6. 合并「停运」表编辑

6.1 左右合并

1)使用「左右合并」,添加「停运」表的字段。如下图所示:

2020-09-25_11-30-14.png

2)选择「数据列表/多表合并/停运」,添加表内全部字段,如下图所示:

2020-09-25_11-30-27.png

3)使用「并集合并」保留所有数据。如下图所示:

合并后出现同一个单位数据同时存在了多条的结果。因此可在左右合并后,进行分组汇总,对数据进行整理。整理出三个单位的对应结果,避免多条数据。

2020-09-25_15-46-56.png

6.2 分组汇总

「左右合并」后加入「分组汇总」对数据进行单位的汇总,从而避免多条数据。

1)在合并「停运时长」字段后,增加「分组汇总」,所示:

2020-09-25_15-54-49.png

2)将合并表的合并字段「停运时长」,放入汇总栏求和,其他字段拖入分组栏。则多条数据汇总为一条,展示三个单位的数据信息。如下图所示:

2020-09-25_15-56-19.png

6.3 统计次数

如果要统计「停运」表中的,各个单位停运次数,再次拖入「停运时长」字段,统计「记录个数」,是无法实现的,如下图所示:

因为表中的「停运时长」存在空值,也会记为记录数 1 。若汇总的字段不存在空值,可使用此方法求次数。

2020-09-25_16-25-42.png


因此求「停运次数」需要在左右合并和「分组汇总」中间添加步骤,通过 IF 函数对「停运时长」字段进行判断。

1)在「左右合并」和「分组汇总」中间「新增列」。对「停运时长」字段添加判断条件。如下图所示:

2020-09-25_16-37-05.png

2)新增列后,输入公式:IF(停运时长=NULL,0,1)。判断每条记录,当停运时长为空时,显示 0 ,否则 为 1 。新增列名为「停运次数」。如下图所示:

2020-09-25_16-51-26.png

添加公式后效果如下图所示:

2020-09-25_16-54-06.png

3)返回「分组汇总」,汇总栏添加指标「停运次数」进行汇总求和,得出结果。如下图所示:

2020-09-25_16-54-41.png

7. 合并「故障」表编辑

1)添加「左右合并」,使用「故障」表进行「并集合并」所有数据。步骤同上,参见本文 6.1 节。

2)对数据进行「分组汇总」,步骤同上,参见本文 6.2 节。效果如下图所示:

注:若数据量过大,可合并「停运表」后,保存数据集。再新建自助数据集进行合并「故障」表的操作。

2020-09-25_17-20-16.png

若要统计故障次数,则步骤可参考本文 6.3 节。

8. 合并「离线」表编辑

使用「离线」表,继续重复第 7 节的操作,完成后点击「保存」完成多表合并。效果如下图所示:

2020-09-25_17-21-15.png

9. 效果查看编辑

详情请参见本文 1.1 节。