如何编译运行HanLP自然语言处理包
master分支
对于master分支,编译方法如下:
git clone https://github.com/hankcs/HanLP.git
mvn install -DskipTests
·由于目前一些test不够规范,使用了硬编码路径下的资源,所以暂时跳过单元测试。
·该方法不会将src/main/resources目录下的任何资源(包括hanlp.properties)打包进jar,如果需要打包资源文件,请切换到portable分支。
portable分支
git checkout portable
然后将需要的data放入src/main/resources,最后执行:
mvn install -DskipTests
运行jar
目前jar包中有一些模块可以命令行执行,以感知机词法分析器为例。由于这些模块一般需要加载外部data,所以需要在运行时指定hanlp.properties。运行时,一个典型的目录结构如下:
·此处只列出了重要的目录。
·一个良好的实践是把hanlp.properties放到resources目录下。
命令行需要指定jar包和hanlp.properties所在的目录:
$ java -cp target/hanlp-1.6.0.jar:src/main/resources com.hankcs.hanlp.model.perceptron.Main -test \
<<< '华安集团胡花蕊来到纽约艺术博物馆参观'
[华安/nz 集团/n]/nt 胡花蕊/nr 来到/v [纽约/ns 艺术/n 博物馆/n]/ns 参观/v
·Windows用户请使用分号java -cp target/hanlp-1.6.0.jar;src/main/resources
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
【机器学习】融入ML的持续集成与持续交付框架
上期我们介绍了持续集成与持续交付的敏捷开发架构。随着机器学习的流行,越来越多的敏态业务除了要尽快上市,还要结合机器学习来尽快预测出市场发展。 在敏态交付的示意图中,开发和运维不再分家,应用被模块化地拆解开来,单元测试和集成测试周期被大大缩短。持续集成/持续交付作为其中衔接的环节,帮助了很多原来只懂开发的程序员了解了业务需求,提高了运维水平。 回过头来说说机器学习,它其实是一个对输入参数、算法选择和参数不断进行最优调试的过程。比如说我们对猫的种类通过图像识别来进行归类训练,输入的参数(或从图像识别到的参数)有:猫的发色、发量、体型、瞳距等等; 由于是监督学习的归类问题,可选择的算法也只有SVM,近似邻域和CART算法,结合调参,可以算出通过学习样本预测的数据准确度。 对于验证样本的目标准确度,我们可以设置一个预期值,比如95%,经过反复的调参之后,基本就可以得到准确的配参算法。由于机器学习发生在数据层,敏捷交付发生在应用层,因此在将数据训练结合到DevOps双曲环中一定是可以并行工作的。 在企业已有CI/CD平台的基础上,并行接入机器学习的API接口是最初级的对接方式,由数据科学家在集成...
- 下一篇
Window离线环境下如何安装pyhanlp
Hanlp在离线环境下的安装我是没有尝试过的,分享SunJW_2017的这篇文章就是关于如何在离线环境下安装hanlp的。我们可以一起来学习一下! HanLP是一款优秀的中文自然语言处理工具,可以实现包括分词、词性标注、实体识别在内容诸多功能,详情见其项目主页。另外,该工具包还提供了python3的接口,在线安装很方便,但有时需要部署在内网机等没有网络环境的机器上,比较繁琐,整理步骤如下: 1、安装jpype1,这是pyhanlp的依赖包,可以下载编译好的.whl文件,地址在这,选择对应自己python版本和操作系统版本的后,用pip install *.whl进行安装即可。 2、安装java环境,由于HanLP是用java开发的,因此调用python的接口时机器上应该配置了java环境,可以在网上搜索安装。 3、在pyhanlp的项目主页下载完整的.zip压缩包,解压后进入文件夹执行python setup.py install。 4、下载data-for-1.7.0.zip和hanlp-1.7.0.-release.zip,解压后分别获得data文件夹和hanlp.propert...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- 设置Eclipse缩进为4个空格,增强代码规范
- CentOS6,CentOS7官方镜像安装Oracle11G
- SpringBoot2整合Thymeleaf,官方推荐html解决方案
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- SpringBoot2全家桶,快速入门学习开发网站教程
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- CentOS7,CentOS8安装Elasticsearch6.8.6
- CentOS8,CentOS7,CentOS6编译安装Redis5.0.7
- MySQL8.0.19开启GTID主从同步CentOS8