ubuntu下pycharm调用Hanlp实践分享
ubuntu下pycharm调用Hanlp实践分享
前几天看了大快的举办的大数据论坛峰会的现场直播,惊喜的是hanlp2.0版本发布。Hanlp2.0版本将会支持任意多的语种,感觉还是挺好的!不过更多关于hanlp2.0的信息,可能还需要过一段时间才能看到,只能等一下了!下面分享一篇大神的文章,是关于在ubuntu下使用pycharm调用hanlp的实验。
以下为全文:
首先点击File,选择Settings,在Project 下点击Project Interpreter,并通过点击右边的加号:
搜索JPype,根据python版本选择你需要的JPype版本安装。
之后,在https://github.com/hankcs/HanLP/releases
网站下载hanlp.jar包、模型data包、配置文件hanlp.properties,新建一个文件夹Hanlp,
把hanlp.jar和hanlp.properties放进去;之后需要再新建一个文件夹hanlp,并将data放进去;
修改Hanlp下的路径为当前data的路径,由于我将data放在/home/javawork/hanlp下,因此:root=/home/javawork/hanlp/
接下来新建一个文件demo_hanlp.py,代码如下:
#! /usr/bin/env python2.7
#coding=utf-8
from jpype import *
# startJVM(getDefaultJVMPath(), "-Djava.class.path=home/javawork/Hanlp/hanlp-1.2.7.jar;home/javawork/Hanlp/", "-Xms1g", "-Xmx1g")
startJVM(getDefaultJVMPath(), "-Djava.class.path=/home/qinghua/javawork/Hanlp/hanlp-1.2.7.jar:/home/qinghua/javawork/Hanlp")
HanLP = JClass('com.hankcs.hanlp.HanLP')
# 中文分词
print(HanLP.segment('你好,欢迎在Python中调用HanLP的API'))
testCases = [
"商品和服务",
"结婚的和尚未结婚的确实在干扰分词啊",
"买水果然后来世博园最后去世博会"]
for sentence in testCases: print(HanLP.segment(sentence))
# 命名实体识别与词性标注
NLPTokenizer = JClass('com.hankcs.hanlp.tokenizer.NLPTokenizer')
print(NLPTokenizer.segment('中国科学院计算技术研究所的宗成庆教授正在教授自然语言处理课程'))
# 关键词提取
document = "水利部水资源司司长陈明忠9月29日在国务院新闻办举行的新闻发布会上透露," \
"根据刚刚完成了水资源管理制度的考核,有部分省接近了红线的指标," \
"有部分省超过红线的指标。对一些超过红线的地方,陈明忠表示,对一些取用水项目进行区域的限批," \
"严格地进行水资源论证和取水许可的批准。"
print(HanLP.extractKeyword(document, 2))
# 自动摘要
print(HanLP.extractSummary(document, 3))
# 依存句法分析
print(HanLP.parseDependency("徐先生还具体帮助他确定了把画雄鹰、松鼠和麻雀作为主攻目标。"))
shutdownJVM()
需要注意的是ubuntu的路径分割符为”:”,而window 为” ; ”
另附hanlp调用常见问题集:
github.com/hankcs/HanLP/issues?page=3&q=is%3Aissue+is%3Aopen
作者:imperfect00
低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
企业不容错过的2019八大人工智能和分析趋势
AI计划通过先进的计算算法在全球范围内为全球分配价值约2万亿美元的商业价值,这些算法可识别和优化人们无法区分的商业见解。最新趋势如下:1、人工智能与分析合并:合并人工智能算法和分析的应用将是变革性的,但却很复杂;因此,它需要对信息技术,数学和统计学有深入的了解。人工智能和机器学习算法可以自动化和优化分析方法,从而产生变革性的业务洞察力。2、决策自动化:企业资源规划中更重要的人工智能和机器学习将带来更智能的流程变更,而无需人为干预。人工智能,分析,ERP和CRM可以联合起来预测市场需求,从而实现更具成本效益的流程。3、数字双胞胎:新一年数字复制品的热潮表明更多公司将产生预测性见解,使他们能够在任何利润损失之前预测和解决问题。4、边缘计算:数字复制品的增加将帮助偏远地区的组织通过生产环境的实时建模找到附近的高功率处理器。5、混合现实:预计在未来两三年内,数据分析的虚拟和增强现实组合将迅速增加。增强现实,虚拟现实和混合现实的兴起正在导致增强分析,使用自然语言处理和机器学习。6、区块链繁荣:区块链是新一年中最受期待的技术之一,因为它依赖于共享的数字分类账,使任何人都无法入侵。这为组织实施这项技...
- 下一篇
FPGA架构和应用基础知识
FPGA代表现场可编程门阵列,它是一种半导体逻辑芯片,可编程成几乎任何类型的系统或数字电路,类似于PLD。PLD仅限于数百个门,但FPGA支持数千个门。FPGA架构的配置通常使用语言来指定,即HDL(硬件描述语言),其类似于用于ASIC(专用集成电路)的语言。与固定功能ASIC技术(如标准单元)相比,FPGA可提供许多优势。通常,ASIC需要数月才能制造出来,并且它们的成本将达到数千美元才能获得该设备。但是,FPGA的制造时间不到一秒钟,成本从几美元到一千美元不等。FPGA的灵活性在很大程度上降低了成本,功耗和延迟。与标准单元ASIC相比, FPGA需要20到35倍的面积,速度性能比ASIC慢3到4倍。本文介绍了FPGA的基础知识和FPGA架构模块,包括I / O焊盘,逻辑块和开关矩阵。FPGA是VLSI的一些新兴趋势领域。 FPGA架构通用FPGA架构由三种类型的模块组成。它们是I / O块或焊盘,开关矩阵/互连线和可配置逻辑块(CLB)。基本FPGA架构具有二维逻辑块阵列,其具有用于用户安排逻辑块之间的互连的装置。下面讨论FPGA架构模块的功能:CLB(可配置逻辑块)包括数字逻辑,...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2整合Redis,开启缓存,提高访问速度
- CentOS关闭SELinux安全模块
- CentOS7编译安装Cmake3.16.3,解决mysql等软件编译问题
- Docker快速安装Oracle11G,搭建oracle11g学习环境
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- 设置Eclipse缩进为4个空格,增强代码规范
- MySQL8.0.19开启GTID主从同步CentOS8
- SpringBoot2整合MyBatis,连接MySql数据库做增删改查操作
- Docker安装Oracle12C,快速搭建Oracle学习环境
- CentOS7安装Docker,走上虚拟化容器引擎之路