自然语言处理如何检查拼写错误？（Tensorflow实例教程&源代码）-低调大师

自然语言处理如何检查拼写错误？（Tensorflow实例教程&源代码）

2017-05-31 768

机器学习的一个最重要的问题就是，我们需要干净的数据。自然语言处理项目存在着一个问题——使用人类书写的文本。而不幸的是，我们并不擅长写作。想象一下，如果在Reddit上的有关帖子和评论的数据集中存在着许多拼写错误，这对于机器来说，是不是有些不好处理呢？

因此，制作一个拼写检查器将会是一个非常有价值的项目，这将有助于缓解这些问题。

我们即将用于此项目的模型与我在文章“亚马逊评论中的文本汇总”（https://medium.com/towards-data-science/text-summarization-with-amazon-reviews-41801c2210b）（都是seq2seq模型）中写的是很相似的，但是我添加了一些额外的代码行，以便可以使用grid search来调整整个架构和超参数，并且可以使用TensorBoard来分

微信关注我们

原文链接：https://yq.aliyun.com/articles/224003

转载内容版权归作者及来源网站所有！

低调大师中文资讯倾力打造互联网数据资讯、行业资源、电子商务、移动互联网、网络营销平台。持续更新报道IT业界、互联网、市场资讯、驱动更新,是最及时权威的产业资讯及硬件资讯报道平台。

停留在“玩具”层面的机器学习，该如何深入？

Drew Breuning，就职于美国大数据分析平台PlaceIQ。该公司是基于地理位置的大数据分析翘楚，2016年获阿里巴巴的投资。机器学习涉及概率论、统计学、逼近论、凸分析、算法复杂度理论等多个领域，它是人工智能的核心，观其本质，察其影响，一起来看Drew Breunig眼中的机器学习。时不时我们就会听到一些流行术语，如基因组编辑技术(CRISPR)、虚拟现实(VR)和机器学习(Machine Learning)等。由于曝光过于频繁，人们很容易就会失去兴趣。基因编辑技术可能会改变我们的生活，但是了解其工作原理并不能给你带来实质性的帮助。虚拟现实将会吞噬传统媒体，但是硬件要求跟不上，意味着真正投入日常使用还有待时日。科技界的弄潮儿都在关注？别忽略了机器学习。没错，机器学习能帮助我们开发出奇妙的的应用，但这不应该是我们去关注它的原

2017-05-31

739

（从左至右：崔磊、韦福如、周明、杨南）在电影《她（HER）》中有这样一幕：主人公是一位信件撰写人，人工智能操作系统萨曼莎在得到他的允许后阅读他的邮件资料，总结出需要保留和删除的邮件，帮助他修改信件草稿中的错字，并且与他探讨她喜爱的信件片段。与此同时，萨曼莎通过阅读主人公的海量信息来了解他，也通过阅读互联网上的海量数据来了解世界。阅读这项人类的基本能力，在众多科幻作品中也成了人工智能的入门标配。尽管人工智能的热点此起彼伏，但毫无疑问的是，自然语言处理始终是实现智能、自然人机交互愿景里一块重要的技术基石。而机器阅读理解则可以被视为是自然语言处理领域皇冠上的明珠，也是目前该领域的研究焦点之一。做机器阅读理解研究的学者想必对由斯坦福大学自然语言计算组发起的SQuAD（Stanford Question Answering Datase

2017-05-31

701

资源下载

更多资源

Mario

马里奥是站在游戏界顶峰的超人气多面角色。马里奥靠吃蘑菇成长，特征是大鼻子、头戴帽子、身穿背带裤，还留着胡子。与他的双胞胎兄弟路易基一起，长年担任任天堂的招牌角色。

Nacos

Nacos /nɑ:kəʊs/ 是 Dynamic Naming and Configuration Service 的首字母简称，一个易于构建 AI Agent 应用的动态服务发现、配置管理和AI智能体管理平台。Nacos 致力于帮助您发现、配置和管理微服务及AI智能体应用。Nacos 提供了一组简单易用的特性集，帮助您快速实现动态服务发现、服务配置、服务元数据、流量管理。Nacos 帮助您更敏捷和容易地构建、交付和管理微服务平台。

Spring

Spring框架（Spring Framework）是由Rod Johnson于2002年提出的开源Java企业级应用框架，旨在通过使用JavaBean替代传统EJB实现方式降低企业级编程开发的复杂性。该框架基于简单性、可测试性和松耦合性设计理念，提供核心容器、应用上下文、数据访问集成等模块，支持整合Hibernate、Struts等第三方框架，其适用范围不仅限于服务器端开发，绝大多数Java应用均可从中受益。

Rocky Linux

Rocky Linux（中文名：洛基）是由Gregory Kurtzer于2020年12月发起的企业级Linux发行版，作为CentOS稳定版停止维护后与RHEL（Red Hat Enterprise Linux）完全兼容的开源替代方案，由社区拥有并管理，支持x86_64、aarch64等架构。其通过重新编译RHEL源代码提供长期稳定性，采用模块化包装和SELinux安全架构，默认包含GNOME桌面环境及XFS文件系统，支持十年生命周期更新。