卯卯 | 炼就一手绝世刀法!

日出东海落西山,愁也一天,喜也一天。遇事不钻牛角尖,人也舒坦,心也舒坦!

命名实体识别标注总结

在之前学校的时候用人工标注数据,CRF++实现了一个关于招聘信息的命名实体识别。(前面的文章有写,自自行寻找。)参加工作以后发现之前虽然实现了命名实体识别,但是实体并没有识别到详细的类别上。因为自己目前在医疗行业,实际需求是不但要识别出哪些实体,还要识别出实体是属于哪个类别的实体。比如,心脏病是一个实体,还要识别出他是一个病DIS,那么标记就变成了:心 B-DIS脏 I-DIS病 E-DIS而不是之前的:心 B脏 I病 E这样在数据集准备的手段和方法就会有所差别,之前手工标注(职位要求:1,懂【

(三)用tf的VocabularyProcessor创建词汇表vocab——保存和加载(注意要用sublime,不然容易报错)

(二)用tf的VocabularyProcessor创建词汇表vocab——在NLP分类中经常会用到

学习的链接:https://www.jianshu.com/p/db400a569730 

(一)在NLP深度学习模型中有两个注意点——(1)生词的字的词典是要保存起来,实际应用时是要查这个词典的(2)在网络中的词嵌入是不用保存的,因为这是变量,在保存模型时已经保存好了这些变量。

1. 生词的字的词典是要保存起来,实际应用时是要查这个词典的。    1.1  在情感分类的项目中,我们是用的是from  tensorflow.contrib import learn里的learn包生成的字的编号词典。                1.2在命名实体识别(也就

跳坑日记Error: Fetch argument 0.82509553 has invalid type , must be a string or T

神经网络训练loss不下降原因集合——与自己训练的CNN文本分类loss不下降的总结(最后问题居然是发生在学习率上)

train loss与test loss结果分析train loss 不断下降,test loss不断下降,说明网络仍在学习; train loss 不断下降,test loss趋于不变,说明网络过拟合; train loss 趋于不变,test loss不断下降,说明数据集100%有问题; train loss 趋于不变,test loss趋于不变,说明学习遇到瓶颈,需要减小学习率或批量数目; train loss 不断上升,test loss不断上升,

tensorboard变量分析和tf.summary各种方法的使用(二)

 
«   2019年3月   »
123
45678910
11121314151617
18192021222324
25262728293031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
文章归档
网站收藏
友情链接
  • RainbowSoft Studio Z-Blog
  • 订阅本站的 RSS 2.0 新闻聚合

Powered By Z-BlogPHP 1.5.2 Zero

转载请注明文章出处!!!!!