2019-03-06 21:43:48
在之前学校的时候用人工标注数据,CRF++实现了一个关于招聘信息的命名实体识别。(前面的文章有写,自自行寻找。)参加工作以后发现之前虽然实现了命名实体识别,但是实体并没有识别到详细的类别上。因为自己目前在医疗行业,实际需求是不但要识别出哪些实体,还要识别出实体是属于哪个类别的实体。比如,心脏病是一个实体,还要识别出他是一个病DIS,那么标记就变成了:心 B-DIS脏 I-DIS病 E-DIS而不是之前的:心 B脏 I病 E这样在数据集准备的手段和方法就会有所差别,之前手工标注(职位要求:1,懂【
2019-03-06 16:29:35
学习的链接:https://www.jianshu.com/p/db400a569730
2019-03-06 15:45:54
1. 生词的字的词典是要保存起来,实际应用时是要查这个词典的。 1.1 在情感分类的项目中,我们是用的是from tensorflow.contrib import learn里的learn包生成的字的编号词典。 1.2在命名实体识别(也就
2019-03-04 12:56:04
train loss与test loss结果分析train loss 不断下降,test loss不断下降,说明网络仍在学习; train loss 不断下降,test loss趋于不变,说明网络过拟合; train loss 趋于不变,test loss不断下降,说明数据集100%有问题; train loss 趋于不变,test loss趋于不变,说明学习遇到瓶颈,需要减小学习率或批量数目; train loss 不断上升,test loss不断上升,