tensorflow:模型的保存和训练过程可视化

在使用tf来训练模型的时候,难免会出现中断的情况。这时候自然就希望能够将辛辛苦苦得到的中间参数保留下来,不然下次又要重新开始。

保存模型的方法:

#之前是各种构建模型graph的操作(矩阵相乘,sigmoid操作等...)
saver=tf.train.Saver()#生成saver
with tf.Session() as sess:
    sess.run(tf.global_variables_initializer())#先对模型进行初始化
    #然后将数据丢入模型进行训练blabla
    #训练完之后,使用saver.save来保存
    saver.save(sess,\'save_path\file_name\')#file_name如果不存在的话,将会自动创建

将模型保存好以后,载入也比较方便。

saver=tf.train.Saver()
    with tf.Session() as sess:
        #参数可以进行初始化也可以不进行初始化,即使初始化了,初始化的值也会被restore的值覆盖
        sess.run(tf.global_variables_initializer())
        saver.restore(sess,\'save_path\file_name\')#会将已经保存的变量值restore到变量中

使用tensorboard来使训练过程可视化

tensorflow还提供了一个可视化工具,叫tensorboard.启动以后,可以通过网页来观察模型的结构和训练过程中各个参数的变化。

流程如下所示:

1.使用tf.scalar_summary来收集想要显示的变量

2.定义一个summary op,用来汇总多个变量

3.得到一个summary writer,指定写入路径

4.通过summary_str=sess.run()

#由之前的各种运算得到此批数据的loss
loss=......
#使用tf.scalar_summary来收集想要显示的变量,命名为loss
tf.scalar_summary(\'loss\',loss)
#定义一个summary op,用来汇总由scalar_summary记录的所有变量
merged_summary_op=tf.merge_all_summaries()
#生成一个summary writer对象,需要指定写入路径
summary_writer=tf.train.SummaryWriter(\'/tmp/logdir\',sess.graph)
#开始训练,分批喂数据
for i in range(batch_sum):
    #使用sess.run来得到merged_summary_op的返回值
    summary_str=sess.run(merged_summary_op)
    #使用summary writer将运行中的loss值传入
    summary_writer.add_summary(summary_str,i)

接下里,程序开始运行之后,到shell中运行:

$ tensorboard --logdir /tmp/logdir

开始运行tensorboard.接下来打开浏览器,进入127.0.0.1:6006 就能够看到loss值在训练中的变化值了。