如何用Perl截取报文?

在实际生产环境中,常常需要从后台日志中截取报文,报文的形式类似于

<InterBOSS>

...

...

...

</InterBOSS>

一个后台日志有多个报文,每个报文可由操作流水唯一确定。

以前用AWK写过一个,程序如下:

beginline=`awk 'BEGIN{i=0}{if($0~"<InterBOSS>") i=NR;if($0~"'$oprseq'"){print i;exit}}' $logname`
endline=`awk 'NR>'$beginline'{if($0~"</InterBOSS>"){print NR;exit}}' $logname`
awk 'NR>='$beginline'&&NR<='$endline'{print $0}' $logname

学了Perl以后,发现Perl很适合写类似逻辑的脚本,现改写如下:

#!/usr/bin/perl
use strict;
my $flag=0;
my $line;
while(<>){
   if(/<InterBOSS>/ or $flag eq 1){
      $line .=$_;
      $flag=1;
   }
   if(/<\/InterBOSS>/){
      $flag=0;
      if($line =~ $ARGV[0]){
         print $line;
         last;
         }
      $line='';
    }
}

思路是:

将每一个报文作为一个整体,放到$line中,然后验证给定的操作流水是否在$line中,如果在,则输出$line,如果不在,则将$line置为空,继续循环,直到遇到下一个报文的<InterBOSS>,$line才开始填充。

那么如何确保<InterBOSS>和</InterBOSS>之间的行填充到$line中呢?在这里,引入了一个变量$flag进行判断,默认为0,在遇到<InterBOSS>时,将其置为1,在遇到</InterBOSS>时,又将其置为0。判断是否填充的条件有两个:一、匹配<InterBOSS>,二、$flag等于1,两者只要符合一个即可,这样就可确保<InterBOSS>和</InterBOSS>之间的行填充到$line中。