2019-04-01 16:24:33
原理:将成词的词向量也加入到字向量到中。LSTM结构如下:所有能够加入到特征的词语的词向量预先训练好的。如果某个词语不在预先训练好的词向量文件(如下图)中,我们是没有特征加入进去的。
2019-04-01 15:57:30
CRF++的命名实体识别可以参考之前我写的blog。17年用的膨胀卷积神经网络,2018年bert (transfoemer ,attention机制)——+latticeLSTM(结构化的LSTM)目前NER最好的模型。
2019-04-01 15:55:05
序列标准问题-分词,命名实体识别,词性标准,短语块的识别(名词模块,动词模块),意图识别都是序列标准问题。占了接近NLP任务的1/3.