根本的原因都是网络深度太大,Ssigmod容易引起梯度消失,用relu改进。梯度爆炸的情况比较少。
发表评论:取消回复
名称(*)
邮箱
主页
正文(*)
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。