首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/698942

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

NLPIR大数据分词技术行业信息挖掘的推动者

随着计算机的日益普及,互联网的快速发展,文本的数量(电子邮件、新闻、网页、科技论文等)在不停的增长,因而对文本作智能化处理以获取所需信息的需求日益迫切。在这样的社会需求下,自然语言处理技术的地位和作用日益重要。分词作为自然语言处理的第一个步骤,是其他高层应用的基础,起着极其重要的作用。词是最小的能够独立活动的有意义的语言成分 。在中文中,词与词之间不存在分隔符,词 本身也缺乏明显的形态标记,因此,中文信息处理 的特有问题就是如何将汉语的字串分割为合理的词语序列,即中文分词,因而分词是中文自然语言处理的第一步,这是不同于其他语言的自然语言处理系统的重要特点,也是影响自然语言处理在中文信息处理中应用的重要因素。分词系统是中文信息处理中的一个主要组成部分,是中文自然语言理解、文献检索、搜索引擎以及文本挖掘系统中最基本的一部分。汉字的简体/繁体转换、信息检索和信息抽取、搜索引擎、Web文本挖掘、文本分类、文本校对等中文信息处理系统都首先需要分词作为其最基本的模块,因而对汉语词法分析技术的研究就显得至关重要。北京理工大学大数据搜索与挖掘实验室张华平主任研发的NLPIR大数据语义智能分析技术是满足...

中文编程兴起的必然性

看到国人创造中文编程语言的优势一文的评论后, 此文基于个人视野, 从几个方面阐述中文编程兴起的必然性和展望. 下面是一些近十几年中的相关趋势. 对代码可读性的重视将会从大公司向小公司逐渐普及 在这个2010年的Quara回答《What-is-Googles-internal-code-review-policy-process》中, Google已经把可读性审核作为代码审核的一部分包括在了标准软件开发过程中, 就算国内迟十年开始, 相信不少国内大公司已经开始进行了或多或少的可读性审核, 而且已经意识到了英文水平和对单词理解偏差造成的额外开发维护成本, 只是暂时没有找到更合适和成熟的开发途径而已. 这个需求只会随着国内团队开发的日益成熟和项目生命期的变长而越来越大. 开源软件/思想的推广 多数现有的中文编程语言/工具都是闭源的. 而趋势是新语言从成型就开源. 国人已经有不少这样的尝试, 虽然绝大多数是英文编程语言, 但也有开源的中文编程语言了(国人创造中文编程语言的优势最后列表). 随着更多的开发者参与到中文编程语言设计的开源项目中, 诞生现象级的中文语法的编程语言只是时间问题, 个人的...

相关文章

发表评论

资源下载

更多资源
优质分享App

优质分享App

近一个月的开发和优化,本站点的第一个app全新上线。该app采用极致压缩,本体才4.36MB。系统里面做了大量数据访问、缓存优化。方便用户在手机上查看文章。后续会推出HarmonyOS的适配版本。

腾讯云软件源

腾讯云软件源

为解决软件依赖安装时官方源访问速度慢的问题,腾讯云为一些软件搭建了缓存服务。您可以通过使用腾讯云软件源站来提升依赖包的安装速度。为了方便用户自由搭建服务架构,目前腾讯云软件源站支持公网访问和内网访问。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。