Jcseg 2.6.3 发布 - Java 轻量级开源自然语言处理包
Jcseg 是基于 mmseg 算法的一个轻量级中文分词器,同时集成了关键字提取,关键短语提取,关键句子提取和文章自动摘要等功能,并且提供了一个基于 Jetty 的 web 服务器,方便各大语言直接 http 调用,同时提供了最新版本的 lucene,solr 和 elasticsearch 的分词接口!
2.6.3 版本主要更新如下:
1、优化 mmseg 的过滤实现,主要是运行效率上的。
2、修复一个因为 “单字词条覆盖” 导致的 bug,这是一个隐藏很久的老 bug了,触发的情况会导致 “最大语素自由度” 的过滤异常,例如:
# 怀旧时,词条 “时” 本身比 “怀” 的语素自由度高,也就是这个且分结果应该如下: jcseg~tokenizer:complex>> 怀旧时 分词结果: 怀旧[0,2]/v 时[2,1]/nhf Done, total:3, tokens:2, in 0.00000sec # 这个 bug 出现的时候且分结果会是错误的,例如:怀/ 旧时/
3、词库更新:增加了一些新词条,例如 https 等。
2.6.3版本下载地址:
1、Gitee:https://gitee.com/lionsoul/jcseg/tree/v2.6.3-release
2、Github:https://github.com/lionsoul2014/jcseg/releases/tag/v2.6.3-release

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。
持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。
转载内容版权归作者及来源网站所有,本站原创内容转载请注明来源。
- 上一篇
Excelize 2.7.0 发布, 2023 年首个更新
Excelize 是 Go 语言编写的用于操作 Office Excel 文档基础库,基于 ECMA-376,ISO/IEC 29500 国际标准。可以使用它来读取、写入由 Microsoft Excel™ 2007 及以上版本创建的电子表格文档。支持 XLAM / XLSM / XLSX / XLTM / XLTX 等多种文档格式,高度兼容带有样式、图片(表)、透视表、切片器等复杂组件的文档,并提供流式读写 API,用于处理包含大规模数据的工作簿。可应用于各类报表平台、云计算、边缘计算等系统。入选 2020 Gopher China - Go 领域明星开源项目(GSP)、2018 年开源中国码云最有价值开源项目 GVP (Gitee Most Valuable Project),目前已成为 Go 语言最受欢迎的 Excel 文档基础库。 开源代码 GitHub:github.com/xuri/excelize Gitee:gitee.com/xurime/excelize 中文文档:xuri.me/excelize/zh-hans 2023年1月9日,社区正式发布了 2.7.0 版本...
- 下一篇
JFrog Artifactory 存在身份认证绕过漏洞
漏洞描述 JFrog Artifactory 是一个提供二进制文件和 artifacts 自动化管理的 DevOps 解决方案。 JFrog Artifactory 受影响版本存在身份认证绕过漏洞,未经身份验证的攻击者可通过发送特制请求升级身份特权。 漏洞名称 JFrog Artifactory 存在身份认证绕过漏洞 漏洞类型 不充分特权处理不恰当 发现时间 2023-01-09 漏洞影响广度 小 MPS编号 MPS-2022-4385 CVE编号 CVE-2022-0668 CNVD编号 - 影响范围 JFrog Artifactory@[7.0, 7.37.13) JFrog Artifactory@[6.0.5, 6.23.41) 修复方案 升级JFrog Artifactory到 6.23.41 或 7.37.13 或更高版本 参考链接 https://www.oscs1024.com/hd/MPS-2022-4385 https://nvd.nist.gov/vuln/detail/CVE-2022-0668 https://www.jfrog.com/confluence/...
相关文章
文章评论
共有0条评论来说两句吧...
文章二维码
点击排行
推荐阅读
最新文章
- SpringBoot2配置默认Tomcat设置,开启更多高级功能
- Red5直播服务器,属于Java语言的直播服务器
- CentOS7设置SWAP分区,小内存服务器的救世主
- CentOS7安装Docker,走上虚拟化容器引擎之路
- SpringBoot2编写第一个Controller,响应你的http请求并返回结果
- CentOS关闭SELinux安全模块
- CentOS7,CentOS8安装Elasticsearch6.8.6
- Jdk安装(Linux,MacOS,Windows),包含三大操作系统的最全安装
- Linux系统CentOS6、CentOS7手动修改IP地址
- Windows10,CentOS7,CentOS8安装MongoDB4.0.16