如何用perl将表格中不同列的数据进行拼凑,然后将拼凑后的数据用“|”连接在一起?

最近写了一个perl脚本,实现的功能是将表格中其中两列的数据进行拼凑,然后将拼凑后的数据用“|”连接在一起。

表格内容如下:

员工号码员工姓名职位入职日期
1001张三销售1980/12/17 0:00:00
1002李四财务1981/02/20 0:00:00
1003王五经理1981/02/22 0:00:00
1004陈二会计1981/04/02 0:00:00

要求如下:

将员工姓名和入职日期用键值对的形式拼凑在一起,然后将拼凑后的数据用“|”连接在一起。

结果如下:

张三:1980/12/17 0:00:00|李四:1981/02/20 0:00:00|王五:1981/02/22 0:00:00|陈二:1981/04/02 0:00:00

脚本如下:

#!/usr/bin/perl
use strict;
my $line;
while(<>){
     s/\r\n//;
     if(/(\S+)\s+(\S+)\s+(\S+)\s+(.*)/){
     $line .=$2.':'.$4.'|';
     }
}
print "$line\n";

脚本执行的结果如下:

员工姓名:入职日期|张三:1980/12/17 0:00:00|李四:1981/02/20 0:00:00|王五:1981/02/22 0:00:00|陈二:1981/04/02 0:00:00|

基本上符合要求。

总结:

1. \s在perl中匹配空白字符。\S匹配的是非空白字符。本来一开始用的是\w,但\w默认匹配的是英文字符,数字和_。不匹配中文字符,所以在这里就用了\S来表示。

2. 这种需求在实际中还是蛮常见的,普通的数据库对于若干列之间的拼凑还是很容易实现的,但是如何将拼凑后的结果再次拼凑在一起,却是个挑战,perl很好的解决了这个问题。