清理节点
将数据集添加到画布后,鼠标移到节点上,节点右侧就会显示按钮,点击该按钮,在弹出的菜单中选择清理,即可在当前数据集节点后添加一个清理节点,如下图所示:
在清理节点中,您可以实现诸如筛选、添加、重命名、拆分或移除字段等清理操作来清理数据,除了在清理节点中提供了这些功能以外,在流程中的大多数其它类型的步骤中也可以执行类似的清理数据操作。
清理节点的功能繁多,大多数功能基本通过可视化操作界面一看就会,这里仅挑出一些典型功能进行介绍。
节点重命名
在画布上选中目标节点,然后在节点上点击鼠标右键,从弹出菜单中选择重命名,就可以实现对节点名称的重命名操作,如下图:
此操作适用于所有类型节点。
创建计算字段
在添加好清理节点,选中清理节点后,不选择任何列的情况下,下方工具栏上就会有筛选器和创建计算字段两个按钮。筛选器就是通过表达式对数据进行过滤,这个在之前有过介绍;这里介绍创建计算字段。
创建计算字段就是在现有数据列中创建一个新的列,新列的内容由具体的脚本决定。点击创建计算字段按钮,就会弹出创建计算字段的脚本配置窗口,如下图所示:
新创建的列默认会放置在最前面。上图中我们创建了一个名为New_Profit的字段,它的列值为行中profit值乘以2。
创建计算字段操作完成后,我们可以在下方的动作列表中看到这个刚创建的列动作,如下图:
实际上,在清理节点中几乎所有的对列及数据的操作,都会通过动作的方式记录下来。
列的删除和隐藏
要删除某个列,我们需要做的就是先选中它,可以选中一列,也可以按住ctrl或shift键选择多个列,选择完成后,在工具栏中就用出现针对当前选中列的操作按钮,其中就有删除列,如下图:
上图中,我们将file_name列删除,同样删除列的动作也会出现在动作列表中,通过选择某个动作,可看到生效动作的影响结果。
隐藏列的操作与删除列类似,选择目标列后,点击工具栏上的隐藏按钮即可,如下图:
上图中我们就将新创建的New_Profit列隐藏,列隐藏后可以看到列表中多个一列,用于显示隐藏后的列,同样点击边上的隐藏图标可实现对隐藏列的隐藏取消功能。
与删除列不同,列删除后在后续动作中就不能对其进行操作,对于隐藏的列,我们在动作中仍然可以对其进行操作,比如在表达式中仍然可以引用隐藏列,在输出节点仍然可以正常输出隐藏列。
列拆分
列拆分就是将一个的值,根据某个字段拆分成多个列。
下面的截图中就针对Custom ID列进行拆分,拆分时以-为分隔符。
可以看到,原列会被保留,拆分后的新列有两个,我们可以在列名上双击对新产生的列名进行修改。
移除字母
在这里的Sales列中,金额中包含字母,要去除字母也比较简单,如下图所示:
从上图中可以到,在列菜单中存在大量操作当前列数据的功能,其中就包含移除字母的操作,对应的我们也可以根据需要移除数字,标点符号等其它内容,具体这里不再赘述。