练习二
这个例子需要我们构建国际银行帐号信息(IBANs),提供的数据源文件中,所有需要的信息都在一个单独的字段当中,我们只需要按下图的格式把它们合并就好:
输入数据
输入数据共有两份,一份是银行交易数据列表,点击下载,该数据格式如下图所示:
另一份输入数据为SWIFT Bank Codes,点击下载 ,该份数据内容如下图所示:
需求
加载数据到BaskAdapt中。
在交易数据表中,有一个包含破折号名为Sort Code的字段,我们需要删除这些破折号,只保留一个6位数的字符串。
使用SWIFT银行代码查找表查找有关银行的其他信息,获取银行的SWIFT代码和校验码。
添加一个名为Country Code字段
- 注:国为所有这些交易都发生在UK,所以国家代码应该是GB。
- 创建一个名为IBAN的字段,字段内容就是由下图中几个字段拼接而成。
- 移除不需要的字段。
输出结果
输出结果如下图所示:
- 输出结果为两个字段
- 共100行数据
实现视频
操作步骤
加载输入数据
首先加载Transactions.csv文件和SwiftCodes.csv文件中的数据,如下图所示:
在输入节点中取消两数据源的file_name字段复选框,是因为这两个字段在后面的数据处理流程中不需要。
清理Transactions.csv文件中的数据
在Transactions.csv节点后添加一个清理节点。
去除Sort Code字段中的破折号
选中Sort Code字段,在该列操作菜单中选择清理->移除标点符号,如下图所示:
添加Country Code字段
该字段的值是一个静态的字符串GB,我们通过创建计算字段实现,如下图所示:
连接Transactions.csv文件和SwiftCodes.csv文件数据
这两份数据都有一个Bank的字段,通过连接节点使用Bank字段可以将这两份数据结合起来,如下图所示:
连接后,多出来的Bank_1字段不需要,所以这里将其移除。
添加IBAN字段
该字段内容由下图所示字段组成,我们还是通过创建计算字段实现。
在连接节点后面添加一个清理节点,添加IBAN字段的操作在这个节点中完成,操作如下图所示:
只保留Transaction ID和IBAN两个字段
按住ctrl键选中这两个字段,点击工具栏上按钮即可,如下图所示:
到此,所有操作完成,最后可以根据需要将数据输出到数据库表中,这里不再赘述。