HanLPTokenizer HanLP分词器
anlp在功能上的扩展主要体现在以下几个方面:•关键词提取•自动摘要•短语提取•拼音转换•简繁转换•文本推荐 下面是hanLP分词器的代码 注:使用maven依赖 com.hankcs hanlp portable-1.3.4 使用了java8进行处理 import java.util.ArrayList;import java.util.List;import java.util.stream.Collectors; import org.apache.commons.lang3.StringUtils; import com.hankcs.hanlp.seg.Segment;import com.hankcs.hanlp.seg.Dijkstra.DijkstraSegment;import com.hankcs.hanlp.seg.NShort.NShortSegment;import com.hankcs.hanlp.tokenizer.IndexTokenizer;import com.hankcs.hanlp.tokenizer.NLPTokenizer;impor...
