并集节点
并集是一种通过将一个数据集中的行附加于是另一个数据集中,合并数据的方法。与联接节点类似,它需要一个以上的数据来源,不同之处在于联接节点只能接受两个数据来源,而并集节点则可以接受两个或以上的数据来源。
在将数据合并时,如果不同的数据来源中存在同名字段,且类型相同,系统会自动将这种类型字段进行合并。
在进行并集操作时,要尽可能确保您合并的数据集具有相同的字段数、相同的字段名称,并且字段的数据类型相同。
添加并集节点
添加并集节点的方式与添加联接节点相同。第一种就是先创建一个并集节点,然后将其它分支节点拖动到这个创建好的并集节点的添加图标上,如下图所示:
第二种方式就是将一个分支节点拖动到需要合并的数据集所在节点之的并集图标之上。
合并字段
节点添加完成后,如果存在不匹配的字段,下方属性面板中会列出这些字段,如下图所示:
对于这些字段,我们需要手动对他们进行合并。
以上图为例,因为当前并集操作的数据集来源只有两个,所以在每个不匹配字段后有两个方格,填充了颜色的方格表示当前字段已经包含的数据集字段。
比如上面的Discount字段后方的两个方格,第一个方格颜色为绿色,表示它的值来自Orders_East数据集,另一个方格为白色,表示其未与另一个数据集中字段匹配上。下方其它字段也是同样的含义。
要手动合并字段方法也比较简单,我们只需要先选中目标字段,再点击要合并的字段即可,如果该字段可以与目标字段合并,会在字段名边显示出加号。如下图:
上图当中我们将Discount字段与Discounts两个字段进行了合并,将Product Name和Product两个字段进行了合并。
查看字段颜色
在右边的预览视图中,可以看到字段名下方的色条都由两个颜色构成。
这就表示当前并集字段由两上数据集构成,如果为该字段显示所有数据集的颜色,那么说明该字段的合并操作执行正确;如果有缺少一种表颜色,那么就表明有不匹配的字段。