perl学习之六：变量作用域

2024-03-30 09:58•JavaScript•阅读 242

变量作用域

（一）包变量

$x = 1

这里，$x是个包变量。关于包变量，有2件重要的事情要了解：

1)假如没有其他申明，变量就是包变量；

2)包变量总是全局的。

全局意味着包变量在每个程序里总可访问到。在你定义了$x=1后，程序的任何其他部分，甚至在其他文件里定义的子程序，都能影响和修改$x的值。这点毫无例外；包变量总是全局的。

包变量被归类到族（叫做packages）。每个包变量的名字包括2部分。这2部分类似于变量自己的名字和族名。假如喜欢，你可以称呼美国副总统为'AL'，但对其全名'Al Gore'来讲，这确实太短。类似的，$x有一个全名，其形式如$main::x。主要部分是包限定词，类似于'Al Gore'里的'Gore'部分。Al Gore和AL Capone是不同的人，尽管他们都叫做'AL'。同样的，$Gore::Al和$Capone::Al是不同的变量，$main::x and $DBI::x也是不同的变量。

允许指定变量名的包部分，假如这样做，perl会明确知道你指的是哪个变量。但为简洁起见，通常不会指定变量的包限定词。

1.当前包

假如你仅说$x，perl假设你指的是当前包里的变量$x。什么是当前包？通常情况下是指main，但你可以改变当前包，在程序里这样写：

package Mypackage;

从这点开始，当前包就是Mypackage。当前包做的唯一事情是，在你没有指定包名时，它影响对包变量的解释。假如当前包是Mypackage，这时$x实际指$Mypackage::x。假如当前包是main，这时$x实际指$main::x。

假如你在编写一个模块，假设模块名称是MyModule，你可能会将如下行放在模块文件的顶部：

package MyModule;

从这里开始，你在模块文件里使用的所有包变量将位于包MyModule里，你可以非常放心，这些变量不会与程序其他部分的变量冲突。不必担心你和DBI的作者是否会使用同一个变量$x，因为变量会被区分开，一个是$MyModule::x，另一个是$DBI::x。

记住包变量总是全局的。即使你不在DBI包里，甚至即使你从来没听说过DBI包，也没什么能阻止你读取或写入$DBI::errstr。你不必做任何特殊事情。$DBI::errstr象所有包变量一样，是个全局变量，它可全局访问到；你要做的唯一事是用全名来获取它。甚至可以这样写：

package DBI;

$errstr = 'Ha ha Tim!';

这样就修改了$DBI::errstr。

2.关于包变量的补充

1)若包名为空，则等同于main。所以对任何x来讲，$::x等同于$main::x。

2)某些变量总是强迫位于main包里。例如，假如你提及%ENV,perl假设你指%main::ENV，即使当前包不是main。假如你想要%Fred::ENV，就必须明确申明，即使当前包是Fred。其他特殊的变量包括INC，所有的单标点符号变量名例如$_,$$, @ARGV，以及STDIN, STDOUT, 和STDERR。

3)包名，而非变量名，可以包含::。你可以命名变量为$DBD::Oracle::x。这意味着变量x位于包DBD::Oracle里；它与包DBD没有任何关系。Isaac Newton与 Olivia Newton-John无关，并且Newton::Isaac也与Newton::John::Olivia无关。尽管它们看起来都以Newton开头，但实际上这有点欺骗性。Newton::John::Olivia位于Newton::John包里，而不是Newton里。

这是你要了解的关于包变量的所有东西。

包变量是全局的，这意味着它是危险的，因为不能保证某个人不会在背后来破坏它们。在Perl 4之前，所有的变量都是包变量，这点令人不安。所以perl 5增加了新的非全局变量。

（二）词法变量

Perl里其他类型的变量叫做词法变量或私有变量，因为它们是私有的。它们有时也叫做my变量，因为总是以my来申明它们。你也许很想叫它们local变量，因为它们的影响被局限在程序的一小部分里。但不要那样做，因为其他人可能以为你在谈论perl的local操作符。当你想要一个local变量时，请想到my，而不是local。

my $x;

如上申明创建了一个新变量，叫做x，它对程序的大部分完全不可访问，大部分是指在申明变量的代码块之外的地方。这个块叫做变量作用域。假如变量未在任何块里申明，它的作用域就是从申明它的地方开始，到文件的结尾。

也可以申明和初始化一个my变量，这样写：

my $x = 119;

也能同时申明几个变量：

my ($x, $y, $z, @args) = (5, 23, @_);

如下示例展示私有变量在哪里会很有用。考虑这个子程序：

sub print_report {

@employee_list = @_;

foreach $employee (@employee_list) {

$salary = lookup_salary($employee);

print_partial_report($employee, $salary);

}

假如lookup_salary碰巧也使用了名为$employee的变量，这个变量名和print_report使用的一样，事情就会变得糟糕。负责print_report和lookup_salary的2个程序员必须协作，以确保他们不使用相同的变量名。这点是痛苦的。事实上，即使是在一个中等大小的项目里，这点也令人无法忍受。

解决方法是：使用my变量：

sub print_report {

my @employee_list = @_;

foreach my $employee (@employee_list) {

my $salary = lookup_salary($employee);

print_partial_report($employee, $salary);

}

my @employee_list创建一个新的数组变量，它在print_report函数之外完全不可访问。 my $employee创建一个标量变量，它在foreach循环外完全不可访问。你不必担心程序里的其他函数会破坏这些变量，因为它们没这个能力；它们不知道这些变量在哪里，因为变量的名字在my申明的作用域之外有不同的意义。my变量有时也叫做词法变量，因为它们的作用域仅仅依赖于程序文本自身，不依赖于执行细节，例如以什么顺序来执行什么。仅通过检查源代码，就可以弄清楚它们的作用域。无论何时你看到一个变量，请在同一代码块里的先前位置找my申明。假如找到了，你可以确认该变量在代码块之外不可访问。假如在最内层的代码块里没有找到my声明，那就到上一层块里找，依此类推，直到找到为止。假如任何地方都没有my申明，那么这个变量是个包变量。

my变量并非包变量。它们不是包的一部分，并且没有包限定词。当前包不会因为变量的解释方式而受到影响。如下是个例子：

my $x = 17;

package A;

$x = 12;

package B;

$x = 20;

# $x is now 20.

# $A::x and $B::x are still undefined

在顶部的my $x=17的申明创建了一个新的名为x的词法变量，它的作用域持续到文件结尾。$x的新意义覆盖了默认的意义，默认意义是指$x是当前包的一个包变量。

package A改变了当前包，但因为$x指向了词法变量，而不是包变量，$x=12不会对$A::x有任何影响。类似的，在package B后，$x=20修改了词法变量，而不是任何包变量。

在文件结尾，词法变量$x值为20，包变量$main::x, $A::x, 和$B::x仍未定义。假如要使用它们，仍须通过全名来访问它们。

必须记住的是：

包变量是全局变量。

对私有变量，必须使用my申明。

1. local和my

几乎每个人都知道，有个local函数，它对本地变量有些影响。它到底是什么呢，与my有关系吗？答案简单而奇怪：

my创建本地变量，然而local不这样。

首先，local $x实际做的事是：它存储包变量$x的当前值在一个安全的地方，然后用一个新值替换它，假如没有指定新值，就使用undef代替。当控制离开当前块时，它也会恢复$x的旧值。它影响的是包变量，这个包变量获取了本地值。但包变量总是全局的，local申明的包变量亦无例外。为了显示其区别，请看这个：

$lo = 'global';

$m = 'global';

A();

sub A {

local $lo = 'AAA';

my $m = 'AAA';

B();

}

sub B {

print "B ", ($lo eq 'AAA' ? 'can' : 'cannot') ,

" see the value of lo set by A.\n";

print "B ", ($m eq 'AAA' ? 'can' : 'cannot') ,

" see the value of m set by A.\n";

}

结果会打印：

B can see the value of lo set by A.

B cannot see the value of m set by A.

发生了什么？在A函数里的local申明，给包变量$lo赋予了一个新的临时值AAA。旧值global会被存储起来，直到A返回，但在这点之前，A调用了B。B访问$lo的内容没有问题，因为$lo是包变量，包变量总是全局可见的，所以它能见到A设置的AAA值。

与之对照的是，my申明创建了一个新的词法作用域的变量叫做$x，它仅仅在A函数里可见。在A之外，$m保留它的旧意义：它指向包变量$m；其值仍是global。这是B所见到的变量。它不会见到AAA值，因为那个变量是个词法变量，仅仅存在于A里。

2.local有何好处？

因为local实际不创建本地变量，它并非很有用。在上述示例里，假如B碰巧修改了$lo的值，这样A设置的值就被覆盖掉。这点我们确实不想它发生。我们希望每个函数有它自己的变量，它们不会被其他函数触及到。这就是my所能做到的。

为什么会有local呢？答案90%是因为历史原因。早期的perl版本仅有全局变量。local非常容易执行，它作为对本地变量问题的局部解决方案而增加到perl4里。后来在perl5里做了更多工作，真正的本地变量被添加到该语言里。不同于local，新的本地变量以单词my来申明。之所以选择my，是因为它暗示着隐私，也因为它非常短；短小的单词也许会鼓励你使用它来代替local。my也比local运行更快。

何时使用my，以及何时使用local呢？

答案很简单：总使用my，绝不要使用local。

3.my变量的其他特性

每次控制抵达my申明，perl创建一个新的，初始的变量。例如，如下代码打印x=1 50次：

for (1 .. 50) {

my $x;

$x++;

print "x=$x\n";

}

每次遍历循环时，你得到一个新的$x，其值初始化为undef。

假如申明在循环之外，控制只会通过它一次，所以这里就只有一个变量：

{ my $x;

for (1 .. 50) {

$x++;

print "x=$x\n";

}

这会打印x=1, x=2, x=3, ... x=50.

可以利用这点来玩个游戏。假设有个函数，它需要从一个调用到下一个调用中记住某个值。例如，考虑一个随机数产生器。典型的随机数产生器（类似perl的rand函数）有个种子在其中。种子就是一个数。当请求随机数产生器来获取随机数时，该函数基于种子来执行某些运算，然后返回结果。它也会存储该结果，并将其作为下一次函数调用的种子。

如下是典型代码：

$seed = 1;

sub my_rand {

$seed = int(($seed * 1103515245 + 12345) / 65536) % 32768;

return $seed;

}

典型的输出：

16838

14666

10953

11665

7451

26316

27974

27550

这里有个问题，因为$seed是个全局变量，那意味着我们必须担忧某个人可能无意中修改它。或者别人有意破坏它，这就影响了程序的结果。假如该函数用于赌博程序中，并且别人破坏了它的随机数产生器，你想想会发生什么？

但是我们不能在函数里申明$seed为my变量：

sub my_rand {

my $seed;

$seed = int(($seed * 1103515245 + 12345) / 65536) % 32768;

return $seed;

}

假如这样做了，当每次调用my_rand时，$seed会被初始化为undef。我们实际需要的是，在每次调用my_rand时，$seed会保留其值。

如下是解决方法：

{ my $seed = 1;

sub my_rand {

$seed = int(($seed * 1103515245 + 12345) / 65536) % 32768;

return $seed;

}

申明在函数之外，所以它仅仅在程序编译时执行一次，而不是每次函数调用时都执行。但它是个my变量，并且其位于代码块里，所以它仅对块里的代码可见。my_rand是块里的唯一其他东西，所以$seed仅可被my_rand函数访问。

4.关于my变量的补充

1)不能对以标点符号命名的变量使用my申明，例如_, @_, 或$$。也不能对后台引用的变量$1, $2, ... 使用my申明。my的作者认为那会把事情搞糟。

2)明显的，不能申明my $DBI::errstr，因为那会有冲突：它认为包变量$DBI::errstr是个词法变量。但是可以申明local $DBI::errstr；它存储local $DBI::errstr的当前值，并在代码块结束处恢复它。

3)在perl 5.004及更高版本里，可以这样写：

foreach my $i (@list) {

它限制$i在循环范围内。类似的，

for (my $i=0; $i<100; $i++) {

限制了$i在for循环里。

（三）变量申明

假如你在编写某个函数，并且你想要它有私有变量，就必须使用my来申明变量。假如忘记了，会发生什么事？

sub function {

$x = 42; # Oops, should have been my $x = 42.

}

在该情形下，你的函数修改了全局包变量$x。假如你在其他地方要用到那个包变量，那对程序将是灾难。

最近版本的perl有针对这点的保护选项，你可以激活它。假如放置：

use strict 'vars';

在程序的顶部，perl将要求包变量有明确的包限定词。$x=42里的$x没有这样的限定词，所以程序甚至不会通过编译；代替的，编译器会异常中断，并输出如下错误消息：

Global symbol "$x" requires explicit package name at ...

假如你希望$x是个私有my变量，你可以回头增加my。假如你确实想使用全局包变量，你能回头改变它为：

$main::x = 42;

或其他相应的包。

use strict还有其他的检测选项，请看perldoc strict的更多细节。

现在假设你在编写Algorithms::KnuthBendix模块，你想使用strict vars保护模式，但假如任何时候你需要一遍又一遍的敲入$Algorithms::KnuthBendix::Error，你会觉得很烦。

你可以告诉strict vars生成一个例外：

package Algorithms::KnuthBendix;

use vars '$Error';

这样就在你使用短名字$Error时，避免了包变量$Algorithms::KnuthBendix::Error导致的strict vars失败。

如下写法，也可以在某个代码块里关闭strict vars：

{ no strict 'vars';

# strict vars is off for the rest of the block.

}

（四）总结

包变量总是全局的。它们有一个名字和一个包限定词。可以忽略包限定词，这样perl会使用默认的包，默认包可由package申明设定。对私有变量，请使用my。不要使用local,它已过时。

避免使用全局变量，因为它难以确保程序的2部分不会错误的使用对方的变量。

为了避免意外使用全局变量，请在程序里使用use strict 'vars'。它会检查并确保所有的变量要么是申明为私有的，要么明确使用了包限定词，要么明确使用use vars来申明。

（五）关于'our'的补充

perl 5.6.0介绍了一个新的our(...)申明。它的语法与my()相同，它是use vars的代替品。

如果不深究细节，our()就类似于use vars；它的唯一影响是申明变量，以便它们免除strict 'vars'的检查。然而相对于use vars，它可能有2个优势：语法不那么怪异，影响是词法作用域。也就是说，它让stict检查失效的范围仅仅在当前块之内：

use strict 'vars';

{

our($x);

$x = 1; # 这里使用全局变量$x没问题

}

$x = 2; # 这里使用$x通常引起编译时错误

所以使用use vars '$x'申明时，可以在任何地方使用全局变量$x。our($x)仅仅允许在程序的某些块里申明全局变量$x，假如意外的在其他地方使用它，仍会导致错误。

上一篇 »Java学习之面向对象三
下一篇 »python --函数学习之全局变量和局部变量

perl学习之六：变量作用域

相关推荐

Java学习之手机编程软件

Lua 学习之基础篇九

Python和Lua的默认作用域以及闭包

DELPHI控件学习之TreeView

perl学习之：shift/unshift

perl学习之：函数总结

perl学习之：字符串函数

perl学习之：编译、执行与内存关系，转