应用场景及介绍:Hanlp由模型与算法组成的java工具包,目标是普及自然语言处理在生产环境中的应用。
HanLp具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。
功能:中文分词 、词性标注、命名实体识别、依存句法分析(jieba是没有该功能的)、关键词提取、新词发现、短语提取、自动摘要、文本分类等。
hanlp运行环境安装:
1,因为是java的工具包,我们市需要一定的环境要求的:Java 环境(可以去java的官网下载适合的java安装包安装)和Visual C++(自行安装)。
2,在Anaconda3命令行下输入:conda install -c conda-forge jpype1
3,测试是否安装成功。
PS C:\Users\lenovo-pc\Anaconda3> python
Python 3.5.2 |Anaconda 4.1.1 (64-bit)| (default, Jul 5 2016, 11:41:13) [MSC v.1900 64 bit (AMD64)] on win32
Type "help", "copyright", "credits" or "license" for more information.
>>> from jpype import *
>>> startJVM(getDefaultJVMPath(),'-ea')
>>> java.lang.System.out.println('hello world')
hello world
>>> shutdownJVM()
JVM has been shutdown
hanlp安装下载相关的包:
1,下载hanlp的jar包-网址:https://github.com/hankcs/HanLP
2,新建一个文件夹。注意不要有中文
3,配置hanlp.properties文件。
代码测试: