卯卯 | 炼就一手绝世刀法!

日出东海落西山,愁也一天,喜也一天。遇事不钻牛角尖,人也舒坦,心也舒坦!

N-GRAM语言模型算法

在特定领域我们需要利用该模型构建自己的分词和词性标注,已有的分词工具或词性标注工具在通用领域可能会很好,但是在特定领域效果会很差。前提假设:前后的两个词是有联系的(也是HMM的假设前提),通过条件概率来计算句子的合理性。一张词频表(含有大量的文本——我们的语料库,在中文中我们需要分词再做词频统计),第二张表则是一个关键词共现矩阵和Bi-GRAM计算。Tri-GRAM相似。另一例子:注:基于N-gram还出现了更多有价值的语言模型,如NNLM、CBOW等。
«   2018年7月   »
1
2345678
9101112131415
16171819202122
23242526272829
3031
控制面板
您好,欢迎到访网站!
  查看权限
网站分类
搜索
最新留言
文章归档
网站收藏
友情链接
  • RainbowSoft Studio Z-Blog
  • 订阅本站的 RSS 2.0 新闻聚合

Powered By Z-BlogPHP 1.5.2 Zero

转载请注明文章出处!!!!!