JAVA高级面试进阶训练营视频教程

admin · 发表于 2021-5-18 07:05:06

搭建普通的卷积CNN网络。

nan表示的是无穷或者是非数值，比如说你在tensorflow中使用一个数除以0，那么得到的结果就是nan。

在一个matrix中，如果其中的值都为nan很有可能是因为采用的cost function不合理导致的。

当使用tensorflow构建一个最简单的神经网络的时候，按照tensorflow官方给出的教程：

https://www.tensorflow.org/get_started/mnist/beginners

http://wiki.jikexueyuan.com/project/tensorflow-zh/tutorials/mnist_beginners.html （中文教程）

具体的含义就不解释了。大概分为三个部分：1，导入数据集；2，搭建模型，并且定义cost function（也叫loss function）；3，训练。

对于过程1，我们采用的不是mnist数据集，而是自己定义了一个数据集，其中

对于过程2，我们使用最简单的CNN网络，然后定义cost function的方式是：

cross_entropy = -tf.reduce_sum(y_*tf.log(y))

对于过程3，我们也采用教程中的例子去训练。

但是在初始化W后就立刻查看W参数的结果，得到的结果都是nan，以下是输出W权重后的结果：

这个现象是由于cost function引起的：

cross_entropy = -tf.reduce_sum(y_*tf.log(y))

上面的语句中的y_是数据集的label。我们做的是显著性检测，就是数据集的ground truth。

并且这个label或者ground truth一定要是one hot类型的变量。

那什么是one hot类型的变量呢？

举一个例子：比如一个5个类的数据集，用0,1,2,3,4来表示5个类的标签，因此label=0,1,2,3,4。这时候有的人会把y_=0,1,2,3,4。直接输入到cost function——-tf.reduce_sum(y_*tf.log(y))中，那么这样会导致W参数初始化都是nan。

解决办法就是我们把label=0,1,2,3,4变为one hot变量，改变后的结果是：label=[1,0,0,0,0],[0,1,0,0,0],[0,0,1,0,0],[0,0,0,1,0],[0,0,0,0,1]，这样再输入到tf.reduce_sum(y_*tf.log(y))中，就是正确的了,如下图，我们采用的解决办法是第二种，具体参考下文。

那么本文提供两种方法来解决这个问题：

1，将y_从原来的类别数字变为one hot变量，使用

labels = tf.reshape(labels, [batch_size, 1])
indices = tf.reshape(tf.range(0, batch_size, 1), [batch_size, 1])
labels = tf.sparse_to_dense(
    tf.concat(values=[indices, labels], axis=1),
    [batch_size, num_classes], 1.0, 0.0)

将label转为one hot（batch_size是你每次抓取的训练集的个数）

2，换一个cost function，原来的cost function = -tf.reduce_sum(y_*tf.log(y))

使用的是交叉熵函数，现在我们换成二次代价函数 cost function = tf.reduce_sum(tf.square(tf.substract(y_,y)))

		自动登录	找回密码
密码			立即注册

JAVA高级面试进阶训练营视频教程	Java架构师系统进阶VIP课程	分布式高可用全栈开发微服务教程	Go语言视频零基础入门到精通	Java架构师3期(课件+源码)
Java开发全终端实战租房项目视频教程	SpringBoot2.X入门到高级使用教程	大数据培训第六期全套视频教程	深度学习（CNN RNN GAN）算法原理	Java亿级流量电商系统视频教程
互联网架构师视频教程	年薪50万Spark2.0从入门到精通	年薪50万！人工智能学习路线教程	年薪50万大数据入门到精通学习路线	年薪50万机器学习入门到精通教程
仿小米商城类app和小程序视频教程	深度学习数据分析基础到实战	最新黑马javaEE2.1就业课程	从 0到JVM实战高手教程	MySQL入门到精通教程

JAVA高级面试进阶训练营视频教程

Java架构师系统进阶VIP课程

解决tensorflow在训练的时候权重是nan问题

浏览过的版块