至于在实际训练中的小技巧:bert参数先训练,后又不训练,后面的几个epoch只是训练我们自己所接的网络结构的可以参考:bert在实际项目中的处理这篇文章。
一共是改两个地方:在下游任务代码中的,是第一处。
这是第二处:
发表评论:取消回复
名称(*)
邮箱
主页
正文(*)
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。