vicword 1.4 发布,PHP 中文分词库
VicWord 一个纯php的分词 主要更新: 1. 添加默认词库路径 2. 词库不存在返回false,改为抛出异常。 码云地址: https://gitee.com/jitog/phpfenci github: https://github.com/lizhichao/VicWord 分词说明 含有3种切分方法 getWord 长度优先切分 。最快 getShortWord 细粒度切分。比最快慢一点点 getAutoWord 自动切分 。效果最好 三种分词结果对比 $fc = new VicWord('igb'); $arr = $fc->getWord('北京大学生喝进口红酒,在北京大学生活区喝进口红酒'); //北京大学|生喝|进口|红酒|,|在|北京大学|生活区|喝|进口|红酒 //$arr 是一个数组 每个单元的结构[词语,词语位置,词性,这个词语是否包含在词典中] 这里只值列出了词语 $arr = $fc->getShortWord('北京大学生喝进口红酒,在北京大学生活区喝进口红酒'); //北京|大学|生喝|进口...