HanLP 1.8.2 发布,常规维护与修复
HanLP 1.8.2 现已发布。HanLP 是由一系列模型与算法组成的 Java 工具包,目标是普及自然语言处理在生产环境中的应用。HanLP 具备功能完善、性能高效、架构清晰、语料时新、可自定义的特点。 在提供丰富功能的同时,HanLP 内部模块坚持低耦合、模型坚持惰性加载、服务坚持静态提供、词典坚持明文发布,使用非常方便,同时自带一些语料处理工具,帮助用户训练自己的模型。
新版本具体更新内容如下:
- 调整公式,维特比分词准确率从94.49提升至94.69 https://bbs.hankcs.com/t/topic/136/61?u=hankcs
- 改进 HMM 采样函数 https://bbs.hankcs.com/t/topic/136/64?u=hankcs
- 支持禁用自动刷新词典缓存(CustomDictionaryAutoRefreshCache=false)fix #1655
- 修复CoreDictionary的reload方法
- 修订bigram模型
- 修订简繁映射表
- lve4的声母修正为ve fix #1644
- 修复 CustomDictionary.reload() fix #1635
- 数据包兼容data-for-1.7.5.zip
md5=1d9e1be4378b2dbc635858d9c3517aaa - Portable版同步升级到v1.8.1
<dependency>
<groupId>com.hankcs</groupId>
<artifactId>hanlp</artifactId>
<version>portable-1.8.1</version>
</dependency>