1、如何生成深度学习可用的标签数据——给大两的医疗文本打上实体类别的标签。(程序自动化打标签,分词技术)
2、传统的基于规则和机器学习算法的实体识别准确率不高,如何提升。
3、部分医疗实体名字特别长,如何获取更长的上下文依赖,让识别准确率更高。用膨胀的卷积神经网络
4、类别不均衡,有些类别的词特别少,有些很多。有些词就是很少的,例如,一些修饰词就很少。
5、未登录词如何处理。(药品的名字千千万,未必都收集齐了。)
1、如何生成深度学习可用的标签数据——给大两的医疗文本打上实体类别的标签。(程序自动化打标签,分词技术)
2、传统的基于规则和机器学习算法的实体识别准确率不高,如何提升。
3、部分医疗实体名字特别长,如何获取更长的上下文依赖,让识别准确率更高。用膨胀的卷积神经网络
4、类别不均衡,有些类别的词特别少,有些很多。有些词就是很少的,例如,一些修饰词就很少。
5、未登录词如何处理。(药品的名字千千万,未必都收集齐了。)
◎欢迎参与讨论,请在这里发表您的看法、交流您的观点。