卯卯 | 炼就一手绝世刀法!

日出东海落西山,愁也一天,喜也一天。遇事不钻牛角尖,人也舒坦,心也舒坦!

特定领域命名实体识别词典的准备

第一步:写好命名实体个标注的文档。第二步:从医疗网站上爬取相关信息,制作成上述文档约束的词典,留着备用。词典里的数据也可以是从教课书里某些地方确定是什么类型标注的。生成的词典可能还有少部分是错误的需要人大概的去检查看一下。

医学命名实体识别的难点

1、如何生成深度学习可用的标签数据——给大两的医疗文本打上实体类别的标签。(程序自动化打标签,分词技术)2、传统的基于规则和机器学习算法的实体识别准确率不高,如何提升。3、部分医疗实体名字特别长,如何获取更长的上下文依赖,让识别准确率更高。用膨胀的卷积神经网络4、类别不均衡,有些类别的词特别少,有些很多。有些词就是很少的,例如,一些修饰词就很少。5、未登录词如何处理。(药品的名字千千万,未必都收集齐了。)
«   2019年2月   »
123
45678910
11121314151617
18192021222324
25262728
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
文章归档
网站收藏
友情链接
  • RainbowSoft Studio Z-Blog
  • 订阅本站的 RSS 2.0 新闻聚合

Powered By Z-BlogPHP 1.5.2 Zero

转载请注明文章出处!!!!!