首页 文章 精选 留言 我的
优秀的个人博客,低调大师

微信关注我们

原文链接:https://yq.aliyun.com/articles/97435

转载内容版权归作者及来源网站所有!

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

《NLTK基础教程——用NLTK和Python库构建机器学习应用》——2.2 文本清理

本节书摘来异步社区《NLTK基础教程——用NLTK和Python库构建机器学习应用》一书中的第2章,第2.2节,作者:Nitin Hardeniya,更多章节内容可以访问云栖社区“异步社区”公众号查看。 2.2 文本清理 一旦我们将各种数据源解析成了文本形式,接下来所要面临的挑战就是要使这些原生数据体现出它们的意义。文本清理就泛指针对文本所做的绝大部分清理、与相关数据源的依赖关系、性能的解析和外部噪声等。从这个意义上来说,这些工作和我们在第1章——自然语言处理简介中调用html_clean()对HTML文档进行清理的工作是一样的。当然还有其他情况,如果我们要解析PDF文件,可能就需要清理掉一些不必要的干扰字符,移除非ASCII 字符等。总之在继续下一步骤之前,我们需要做一些清理以获得一个可以被进一步处理的干净文本。而对于像XML这样的数据源,我们可能就只需要关注一些特定的树元素即可。对于数据库,我们则有各种可操作的分离器,而且有时我们也只需要关注一些特定的列。总而言之,对于所有致力于净化文本、清理掉文本周围所有可能干扰的工作,我们称之为文本清理。数据再加工(data munging)、...

《人脸识别原理及算法——动态人脸识别系统研究》—第3章3.4节利用数学算子进行探测

本节书摘来自异步社区《人脸识别原理及算法——动态人脸识别系统研究》一书中的第3章3.4节利用数学算子进行探测,作者 沈理 , 刘翼光 , 熊志勇,更多章节内容可以访问云栖社区“异步社区”公众号查看。 3.4 利用数学算子进行探测人脸识别原理及算法——动态人脸识别系统研究上述两种特征探测方法,或多或少地都利用了特征的语义信息,所要探测的特征的物理意义都很明确,如眼睛、鼻子、嘴等,而California大学Santa Barbara分校的Manjunath、Shekhar和Von der Malsburg等人提出的方法是针对图像本身固有的结构特征,如纹理结构、边缘、对称结构等,利用图像的小波变换来进行特征提取[93]。 3.4.1 特征探测模型Manjunath、Shekhar和von der Malsburg等人[55, 93]认为,视觉皮层的细胞可以分成3类:简单的、复杂的以及超复杂的。其中超复杂视觉细胞具有端抑制特性,亦即细胞的接受域能够响应较短的线段以及线段的末端,并且当线段的长度增加时,响应程度减小。由此,可以根据视觉细胞所具有的端抑制特性,利用相应的小波变换函数来提取图像的局部...

相关文章

发表评论

资源下载

更多资源
Mario

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长,特征是大鼻子、头戴帽子、身穿背带裤,还留着胡子。与他的双胞胎兄弟路易基一起,长年担任任天堂的招牌角色。

Nacos

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称,一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集,帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring

Spring框架(Spring Framework)是由Rod Johnson于2002年提出的开源Java企业级应用框架,旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念,提供核心容器、应用上下文、数据访问集成等模块,支持整合Hibernate、Struts等第三方框架,其适用范围不仅限于服务器端开发,绝大多数Java应用均可从中受益。

Sublime Text

Sublime Text

Sublime Text具有漂亮的用户界面和强大的功能,例如代码缩略图,Python的插件,代码段等。还可自定义键绑定,菜单和工具栏。Sublime Text 的主要功能包括:拼写检查,书签,完整的 Python API , Goto 功能,即时项目切换,多选择,多窗口等等。Sublime Text 是一个跨平台的编辑器,同时支持Windows、Linux、Mac OS X等操作系统。

用户登录
用户注册