2018-07-20 17:01:51
解决方法:http://www.lfd.uci.edu/~gohlke/pythonlibs/#scipy下载numpy-1.14.5+mkl-cp35-cp35m-win_amd64.whl(因为我的是Python3.5所以注意选择你适合的)我将粘贴好的文件放在了D盘,cmd到路径位置进行安装。
2018-07-20 15:07:54
N-Gram的最根本是数学思想就是条件概率。结合上一篇的N-Gram,我们会了解到它的背后原理,利用这个原理,可以去计算哪些词或者字在语料中高频的连续出现在一起。实际应用:我们可以挖掘出病历文本中某些疾病的几个症状通常同时出现,以及所用药物同时出现。用于病历文本的知识挖掘。基于TF-IDF挖掘符合语言规范的N-Gram-即挖掘哪些词同时的高频出现在一起,哪些字同时的高频的出现在一起(注先去停用词)——停用词的去除方法可以参考《去噪音数据(停用词、形容词、动词等)-信息提取(利用hanlp词性识别