卯卯 | 炼就一手绝世刀法!

日出东海落西山,愁也一天,喜也一天。遇事不钻牛角尖,人也舒坦,心也舒坦!

命名实体识别标注总结

在之前学校的时候用人工标注数据,CRF++实现了一个关于招聘信息的命名实体识别。(前面的文章有写,自自行寻找。)参加工作以后发现之前虽然实现了命名实体识别,但是实体并没有识别到详细的类别上。因为自己目前在医疗行业,实际需求是不但要识别出哪些实体,还要识别出实体是属于哪个类别的实体。比如,心脏病是一个实体,还要识别出他是一个病DIS,那么标记就变成了:心 B-DIS脏 I-DIS病 E-DIS而不是之前的:心 B脏 I病 E这样在数据集准备的手段和方法就会有所差别,之前手工标注(职位要求:1,懂【

(三)用tf的VocabularyProcessor创建词汇表vocab——保存和加载(注意要用sublime,不然容易报错)

(二)用tf的VocabularyProcessor创建词汇表vocab——在NLP分类中经常会用到

学习的链接:https://www.jianshu.com/p/db400a569730 

(一)在NLP深度学习模型中有两个注意点——(1)生词的字的词典是要保存起来,实际应用时是要查这个词典的(2)在网络中的词嵌入是不用保存的,因为这是变量,在保存模型时已经保存好了这些变量。

1. 生词的字的词典是要保存起来,实际应用时是要查这个词典的。    1.1  在情感分类的项目中,我们是用的是from  tensorflow.contrib import learn里的learn包生成的字的编号词典。                1.2在命名实体识别(也就
«   2019年3月   »
123
45678910
11121314151617
18192021222324
25262728293031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
文章归档
网站收藏
友情链接
  • RainbowSoft Studio Z-Blog
  • 订阅本站的 RSS 2.0 新闻聚合

Powered By Z-BlogPHP 1.5.2 Zero

转载请注明文章出处!!!!!