Friso 1.6.4 发布 - ANSI C开发的中文分词器
Friso 是使用 c 语言开发的一款开源的高性能中文分词器,使用流行的mmseg算法实现。完全基于模块化设计和实现,可以很方便的植入其他程序中, 例如:MySQL,PHP,并且提供了php5, php7, ocaml, lua的插件实现。源码无需修改就能在各种平台下编译使用,加载完 20 万的词条,内存占用稳定为 14.5M。 关于本次更新: Friso 最近的一次更新是2017年,之后除了bug修复,也没有再增加新的功能特性,同是17年Friso被嵌入了RediSearch作为对中文分词的支持,也发现有些开发者将Friso嵌入了Mysql数据中,近期邮件收到了很多的反馈,决定给Friso增加一些新的功能特性目标是让其更适合搜索。 与RediSearch的更紧密结合可以参考我给RediSearch提交的tokenizer的改造建议:https://github.com/RediSearch/RediSearch/issues/1084 Friso 1.6.4更新如下: 1、README完善了针对最新版本的详细的文档,各平台的编译,测试,配置,词库的管理等。 2、PHP5和PHP7扩展...

