TensorFlow 变量作用域变量管理共享变量

2024-04-08 18:03•数据库•阅读 2480

当我们的神经网络拥有很复杂的模块时，我们使用TensorFlow提供的变量作用域(tf.variable_scope)来管理这些变量。

变量作用域的两个核心方法：

tf.get_variable(<name>, <shape>, <initializer>): 通过所给的名字创建或是返回一个变量.
tf.variable_scope(<scope_name>, <reuse>): 通过 tf.get_variable()为变量名指定命名空间.

在上一篇文章中，我们已经有用到这两个方法，这一篇我们聚焦在这两方法的具体说明上。

tf.get_variable方法在创建初始化变量的时候与tf.Variable是完全一样的。

不过tf.get_variable可以通过tf.variable_scope生成的上下文管理器获取已经生成的变量值。

eg1:

import tensorflow as tf
with tf.variable_scope("foo"):
    v=tf.get_variable("v",[1],initializer=tf.constant_initializer(1.0))

with tf.variable_scope("foo"):
    v=tf.get_variable("v",[1])

执行这段代码，会报错。因为在命名空间foo中，name为v的变量已经存在。

在声明命名空间的时候，将reuse设置为True，这样tf.get_variable将直接获取已经声明的变量。

eg2:

import tensorflow as tf
with tf.variable_scope("foo"):
    v=tf.get_variable("v",[1],initializer=tf.constant_initializer(1.0))

with tf.variable_scope("foo", reuse=True):
    v1=tf.get_variable("v",[1])
    print(v==v1);

执行这段代码，输出为True

不过，reuse定义为True的时候，tf.get_variable只能获取已经拥有的变量。如果命名空间中没有定义这个变量就会报错。

比如讲上面代码的第二个命名空间名字改为bar再次执行就会报错。

eg3:

import tensorflow as tf
with tf.variable_scope("foo"):
    v=tf.get_variable("v",[1],initializer=tf.constant_initializer(1.0))

with tf.variable_scope("bar", reuse=True):
    v1=tf.get_variable("v",[1])
    print(v==v1);

执行这段代码会报错。

变量管理器还可以通过名称轻松访问变量。

eg4:

import tensorflow as tf
with tf.variable_scope("foo"):
    v = tf.get_variable("v",[1],initializer=tf.constant_initializer(1.0))
    print(v.name)

with tf.variable_scope("foo"):
    with tf.variable_scope("bar"):
        v1 = tf.get_variable("v",[1])
        print(v1.name);

with tf.variable_scope("",reuse=True):
    v2 = tf.get_variable("foo/v");
    print(v2==v)
    print(v2==v1)
    v3 = tf.get_variable("foo/bar/v")
    print(v3==v)
    print(v3==v1)

输出结果：

foo/v:0
foo/bar/v:0
True
False
False
True

灵活的使用变量管理器我们可以在复杂的神经网络结构中大大的提高代码的可读性。

了解了tf.variable_scope 和 tf.get_variable的作用和用法以后，再回过头读读之前的代码，领悟一下他们在神经网络结构中发挥了怎样的作用。

这里有一些指向怎么使用变量作用域的文件.特别是，他被大量用于时间递归神经网络和sequence-to-sequence模型,

File	What's in it?
`models/image/cifar10.py`	图像中检测对象的模型.
`models/rnn/rnn_cell.py`	时间递归神经网络的元方法集.
`models/rnn/seq2seq.py`	为创建`sequence-to-sequence`模型的方法集.

参考链接

http://wiki.jikexueyuan.com/project/tensorflow-zh/how_tos/variable_scope.html

《Tensorflow+实战Google深度学习框架》5.3节

上一篇 »PHP变量-----作用域、global、static等关键字
下一篇 »javascript作用域

TensorFlow 变量作用域 变量管理 共享变量

相关推荐

JavaScript变量的作用域和函数的作用域的区别

PHP作用域 递归 包含文件 错误处理 文件变成汇总

JavaScript变量和作用域

javascript闭包的作用、用法

JavaScript this 局部变量全局变量 作用域 作用域链 闭包

javascript变量作用域

javascript变量、作用域和内存问题

javascript的变量、作用域和内存问题

TensorFlow 变量作用域变量管理共享变量

PHP作用域递归包含文件错误处理文件变成汇总

JavaScript this 局部变量全局变量作用域作用域链闭包