perl学习之六:变量作用域

变量作用域

(一)包变量

$x = 1

这里,$x是个包变量。关于包变量,有2件重要的事情要了解:

1)假如没有其他申明,变量就是包变量;

2)包变量总是全局的。

全局意味着包变量在每个程序里总可访问到。在你定义了$x=1后,程序的任何其他部分,甚至在其他文件里定义的子程序,都能影响和修改$x的值。这点毫无例外;包变量总是全局的。

包变量被归类到族(叫做packages)。每个包变量的名字包括2部分。这2部分类似于变量自己的名字和族名。假如喜欢,你可以称呼美国副总统为'AL',但对其全名'Al Gore'来讲,这确实太短。类似的,$x有一个全名,其形式如$main::x。主要部分是包限定词,类似于'Al Gore'里的'Gore'部分。Al Gore和AL Capone是不同的人,尽管他们都叫做'AL'。同样的,$Gore::Al和$Capone::Al是不同的变量,$main::x and $DBI::x也是不同的变量。

允许指定变量名的包部分,假如这样做,perl会明确知道你指的是哪个变量。但为简洁起见,通常不会指定变量的包限定词。

1.当前包

假如你仅说$x,perl假设你指的是当前包里的变量$x。什么是当前包?通常情况下是指main,但你可以改变当前包,在程序里这样写:

package Mypackage;

从这点开始,当前包就是Mypackage。当前包做的唯一事情是,在你没有指定包名时,它影响对包变量的解释。假如当前包是Mypackage,这时$x实际指$Mypackage::x。假如当前包是main,这时$x实际指$main::x。

假如你在编写一个模块,假设模块名称是MyModule,你可能会将如下行放在模块文件的顶部:

package MyModule;

从这里开始,你在模块文件里使用的所有包变量将位于包MyModule里,你可以非常放心,这些变量不会与程序其他部分的变量冲突。不必担心你和DBI的作者是否会使用同一个变量$x,因为变量会被区分开,一个是$MyModule::x,另一个是$DBI::x。

记住包变量总是全局的。即使你不在DBI包里,甚至即使你从来没听说过DBI包,也没什么能阻止你读取或写入$DBI::errstr。你不必做任何特殊事情。$DBI::errstr象所有包变量一样,是个全局变量,它可全局访问到;你要做的唯一事是用全名来获取它。甚至可以这样写:

package DBI;

$errstr = 'Ha ha Tim!';

这样就修改了$DBI::errstr。

2.关于包变量的补充

1)若包名为空,则等同于main。所以对任何x来讲,$::x等同于$main::x。

2)某些变量总是强迫位于main包里。例如,假如你提及%ENV,perl假设你指%main::ENV,即使当前包不是main。假如你想要%Fred::ENV,就必须明确申明,即使当前包是Fred。其他特殊的变量包括INC,所有的单标点符号变量名例如$_,$$, @ARGV,以及STDIN, STDOUT, 和STDERR。

3)包名,而非变量名,可以包含::。你可以命名变量为$DBD::Oracle::x。这意味着变量x位于包DBD::Oracle里;它与包DBD没有任何关系。Isaac Newton与 Olivia Newton-John无关,并且Newton::Isaac也与Newton::John::Olivia无关。尽管它们看起来都以Newton开头,但实际上这有点欺骗性。Newton::John::Olivia位于Newton::John包里,而不是Newton里。

这是你要了解的关于包变量的所有东西。

包变量是全局的,这意味着它是危险的,因为不能保证某个人不会在背后来破坏它们。在Perl 4之前,所有的变量都是包变量,这点令人不安。所以perl 5增加了新的非全局变量。

(二)词法变量

Perl里其他类型的变量叫做词法变量或私有变量,因为它们是私有的。它们有时也叫做my变量,因为总是以my来申明它们。你也许很想叫它们local变量,因为它们的影响被局限在程序的一小部分里。但不要那样做,因为其他人可能以为你在谈论perl的local操作符。当你想要一个local变量时,请想到my,而不是local。

my $x;

如上申明创建了一个新变量,叫做x,它对程序的大部分完全不可访问,大部分是指在申明变量的代码块之外的地方。这个块叫做变量作用域。假如变量未在任何块里申明,它的作用域就是从申明它的地方开始,到文件的结尾。

也可以申明和初始化一个my变量,这样写:

my $x = 119;

也能同时申明几个变量:

my ($x, $y, $z, @args) = (5, 23, @_);

如下示例展示私有变量在哪里会很有用。考虑这个子程序:

sub print_report {

@employee_list = @_;

foreach $employee (@employee_list) {

$salary = lookup_salary($employee);

print_partial_report($employee, $salary);

}

}

假如lookup_salary碰巧也使用了名为$employee的变量,这个变量名和print_report使用的一样,事情就会变得糟糕。负责print_report和lookup_salary的2个程序员必须协作,以确保他们不使用相同的变量名。这点是痛苦的。事实上,即使是在一个中等大小的项目里,这点也令人无法忍受。

解决方法是:使用my变量:

sub print_report {

my @employee_list = @_;

foreach my $employee (@employee_list) {

my $salary = lookup_salary($employee);

print_partial_report($employee, $salary);

}

}

my @employee_list创建一个新的数组变量,它在print_report函数之外完全不可访问。 my $employee创建一个标量变量,它在foreach循环外完全不可访问。你不必担心程序里的其他函数会破坏这些变量,因为它们没这个能力;它们不知道这些变量在哪里,因为变量的名字在my申明的作用域之外有不同的意义。my变量有时也叫做词法变量,因为它们的作用域仅仅依赖于程序文本自身,不依赖于执行细节,例如以什么顺序来执行什么。仅通过检查源代码,就可以弄清楚它们的作用域。无论何时你看到一个变量,请在同一代码块里的先前位置找my申明。假如找到了,你可以确认该变量在代码块之外不可访问。假如在最内层的代码块里没有找到my声明,那就到上一层块里找,依此类推,直到找到为止。假如任何地方都没有my申明,那么这个变量是个包变量。

my变量并非包变量。它们不是包的一部分,并且没有包限定词。当前包不会因为变量的解释方式而受到影响。如下是个例子:

my $x = 17;

package A;

$x = 12;

package B;

$x = 20;

# $x is now 20.

# $A::x and $B::x are still undefined

在顶部的my $x=17的申明创建了一个新的名为x的词法变量,它的作用域持续到文件结尾。$x的新意义覆盖了默认的意义,默认意义是指$x是当前包的一个包变量。

package A改变了当前包,但因为$x指向了词法变量,而不是包变量,$x=12不会对$A::x有任何影响。类似的,在package B后,$x=20修改了词法变量,而不是任何包变量。

在文件结尾,词法变量$x值为20,包变量$main::x, $A::x, 和$B::x仍未定义。假如要使用它们,仍须通过全名来访问它们。

必须记住的是:

包变量是全局变量。

对私有变量,必须使用my申明。

1. local和my

几乎每个人都知道,有个local函数,它对本地变量有些影响。它到底是什么呢,与my有关系吗?答案简单而奇怪:

my创建本地变量,然而local不这样。

首先,local $x实际做的事是:它存储包变量$x的当前值在一个安全的地方,然后用一个新值替换它,假如没有指定新值,就使用undef代替。当控制离开当前块时,它也会恢复$x的旧值。它影响的是包变量,这个包变量获取了本地值。但包变量总是全局的,local申明的包变量亦无例外。为了显示其区别,请看这个:

$lo = 'global';

$m = 'global';

A();

sub A {

local $lo = 'AAA';

my $m = 'AAA';

B();

}

sub B {

print "B ", ($lo eq 'AAA' ? 'can' : 'cannot') ,

" see the value of lo set by A.\n";

print "B ", ($m eq 'AAA' ? 'can' : 'cannot') ,

" see the value of m set by A.\n";

}

结果会打印:

B can see the value of lo set by A.

B cannot see the value of m set by A.

发生了什么?在A函数里的local申明,给包变量$lo赋予了一个新的临时值AAA。旧值global会被存储起来,直到A返回,但在这点之前,A调用了B。B访问$lo的内容没有问题,因为$lo是包变量,包变量总是全局可见的,所以它能见到A设置的AAA值。

与之对照的是,my申明创建了一个新的词法作用域的变量叫做$x,它仅仅在A函数里可见。在A之外,$m保留它的旧意义:它指向包变量$m;其值仍是global。这是B所见到的变量。它不会见到AAA值,因为那个变量是个词法变量,仅仅存在于A里。

2.local有何好处?

因为local实际不创建本地变量,它并非很有用。在上述示例里,假如B碰巧修改了$lo的值,这样A设置的值就被覆盖掉。这点我们确实不想它发生。我们希望每个函数有它自己的变量,它们不会被其他函数触及到。这就是my所能做到的。

为什么会有local呢?答案90%是因为历史原因。早期的perl版本仅有全局变量。local非常容易执行,它作为对本地变量问题的局部解决方案而增加到perl4里。后来在perl5里做了更多工作,真正的本地变量被添加到该语言里。不同于local,新的本地变量以单词my来申明。之所以选择my,是因为它暗示着隐私,也因为它非常短;短小的单词也许会鼓励你使用它来代替local。my也比local运行更快。

何时使用my,以及何时使用local呢?

答案很简单:总使用my,绝不要使用local。

3.my变量的其他特性

每次控制抵达my申明,perl创建一个新的,初始的变量。例如,如下代码打印x=1 50次:

for (1 .. 50) {

my $x;

$x++;

print "x=$x\n";

}

每次遍历循环时,你得到一个新的$x,其值初始化为undef。

假如申明在循环之外,控制只会通过它一次,所以这里就只有一个变量:

{ my $x;

for (1 .. 50) {

$x++;

print "x=$x\n";

}

}

这会打印x=1, x=2, x=3, ... x=50.

可以利用这点来玩个游戏。假设有个函数,它需要从一个调用到下一个调用中记住某个值。例如,考虑一个随机数产生器。典型的随机数产生器(类似perl的rand函数)有个种子在其中。种子就是一个数。当请求随机数产生器来获取随机数时,该函数基于种子来执行某些运算,然后返回结果。它也会存储该结果,并将其作为下一次函数调用的种子。

如下是典型代码:

$seed = 1;

sub my_rand {

$seed = int(($seed * 1103515245 + 12345) / 65536) % 32768;

return $seed;

}

典型的输出:

16838

14666

10953

11665

7451

26316

27974

27550

这里有个问题,因为$seed是个全局变量,那意味着我们必须担忧某个人可能无意中修改它。或者别人有意破坏它,这就影响了程序的结果。假如该函数用于赌博程序中,并且别人破坏了它的随机数产生器,你想想会发生什么?

但是我们不能在函数里申明$seed为my变量:

sub my_rand {

my $seed;

$seed = int(($seed * 1103515245 + 12345) / 65536) % 32768;

return $seed;

}

假如这样做了,当每次调用my_rand时,$seed会被初始化为undef。我们实际需要的是,在每次调用my_rand时,$seed会保留其值。

如下是解决方法:

{ my $seed = 1;

sub my_rand {

$seed = int(($seed * 1103515245 + 12345) / 65536) % 32768;

return $seed;

}

}

申明在函数之外,所以它仅仅在程序编译时执行一次,而不是每次函数调用时都执行。但它是个my变量,并且其位于代码块里,所以它仅对块里的代码可见。my_rand是块里的唯一其他东西,所以$seed仅可被my_rand函数访问。

4.关于my变量的补充

1)不能对以标点符号命名的变量使用my申明,例如_, @_, 或$$。也不能对后台引用的变量$1, $2, ... 使用my申明。my的作者认为那会把事情搞糟。

2)明显的,不能申明my $DBI::errstr,因为那会有冲突:它认为包变量$DBI::errstr是个词法变量。但是可以申明local $DBI::errstr;它存储local $DBI::errstr的当前值,并在代码块结束处恢复它。

3)在perl 5.004及更高版本里,可以这样写:

foreach my $i (@list) {

它限制$i在循环范围内。类似的,

for (my $i=0; $i<100; $i++) {

限制了$i在for循环里。

(三)变量申明

假如你在编写某个函数,并且你想要它有私有变量,就必须使用my来申明变量。假如忘记了,会发生什么事?

sub function {

$x = 42; # Oops, should have been my $x = 42.

}

在该情形下,你的函数修改了全局包变量$x。假如你在其他地方要用到那个包变量,那对程序将是灾难。

最近版本的perl有针对这点的保护选项,你可以激活它。假如放置:

use strict 'vars';

在程序的顶部,perl将要求包变量有明确的包限定词。$x=42里的$x没有这样的限定词,所以程序甚至不会通过编译;代替的,编译器会异常中断,并输出如下错误消息:

Global symbol "$x" requires explicit package name at ...

假如你希望$x是个私有my变量,你可以回头增加my。假如你确实想使用全局包变量,你能回头改变它为:

$main::x = 42;

或其他相应的包。

use strict还有其他的检测选项,请看perldoc strict的更多细节。

现在假设你在编写Algorithms::KnuthBendix模块,你想使用strict vars保护模式,但假如任何时候你需要一遍又一遍的敲入$Algorithms::KnuthBendix::Error,你会觉得很烦。

你可以告诉strict vars生成一个例外:

package Algorithms::KnuthBendix;

use vars '$Error';

这样就在你使用短名字$Error时,避免了包变量$Algorithms::KnuthBendix::Error导致的strict vars失败。

如下写法,也可以在某个代码块里关闭strict vars:

{ no strict 'vars';

# strict vars is off for the rest of the block.

}

(四)总结

包变量总是全局的。它们有一个名字和一个包限定词。可以忽略包限定词,这样perl会使用默认的包,默认包可由package申明设定。对私有变量,请使用my。不要使用local,它已过时。

避免使用全局变量,因为它难以确保程序的2部分不会错误的使用对方的变量。

为了避免意外使用全局变量,请在程序里使用use strict 'vars'。它会检查并确保所有的变量要么是申明为私有的,要么明确使用了包限定词,要么明确使用use vars来申明。

(五)关于'our'的补充

perl 5.6.0介绍了一个新的our(...)申明。它的语法与my()相同,它是use vars的代替品。

如果不深究细节,our()就类似于use vars;它的唯一影响是申明变量,以便它们免除strict 'vars'的检查。然而相对于use vars,它可能有2个优势:语法不那么怪异,影响是词法作用域。也就是说,它让stict检查失效的范围仅仅在当前块之内:

use strict 'vars';

{

our($x);

$x = 1; # 这里使用全局变量$x没问题

}

$x = 2; # 这里使用$x通常引起编译时错误

所以使用use vars '$x'申明时,可以在任何地方使用全局变量$x。our($x)仅仅允许在程序的某些块里申明全局变量$x,假如意外的在其他地方使用它,仍会导致错误。