卯卯 | 炼就一手绝世刀法！

日出东海落西山，愁也一天，喜也一天。遇事不钻牛角尖，人也舒坦，心也舒坦！

2019-08-27 11:18:03

bert预训练过程记录

google根据中文的一部分数据已经为中文预训练了一个模型，bert-base-cased(12层，768，12头)，之所以要预训练是为了针对领域的数据有更好的拟合能力。例如法律方面的数据。预训练模型文件夹所包含的文件：用原始数据生成一句一行，隔行分段后，供130M数据，生成examples.tf_cored大概要1小时。后面用run_pretraining.py训练，大概10000步要一小时（设备信息：54G内存，16G显存。）,根据设备性能，我选着的是句子256个长-（经过解析源码：预训练阶

2019-08-27 10:52:48

bert模型的缺点

参考链接：https://www.jianshu.com/p/160c4800b9b5

‹‹ 1 ››

« 2019年8月 »
一	二	三	四	五	六	日
			1	2	3	4
5	6	7	8	9	10	11
12	13	14	15	16	17	18
19	20	21	22	23	24	25
26	27	28	29	30	31

控制面板: 您好，欢迎到访网站！
登录后台查看权限

搜索

最新留言

网站收藏

友情链接

卯卯 | 炼就一手绝世刀法！

日出东海落西山，愁也一天，喜也一天。遇事不钻牛角尖，人也舒坦，心也舒坦！

2019-08-27 11:18:03

bert预训练过程记录

作者:yangli | 分类:bert | 浏览:2120 | 评论:0

2019-08-27 10:52:48

bert模型的缺点

作者:yangli | 分类:未分类 | 浏览:1220 | 评论:0

Powered By Z-BlogPHP 1.5.2 Zero

转载请注明文章出处！！！！！