一文学会最常见的10种NLP处理技术(附资源&代码)
自然语言处理(NLP)是一种艺术与科学的结合,旨在从文本数据中提取信息。在它的帮助下,我们从文本中提炼出适用于计算机算法的信息。从自动翻译、文本分类到情绪分析,自然语言处理成为所有数据科学家的必备技能之一。
在这篇文章中,你将学习到最常见的10个NLP任务,以及相关资源和代码。
为什么要写这篇文章?
对于处理NLP问题,我也研究了一段时日。这期间我翻阅了大量资料,通过研究报告,博客和同类NLP问题的赛事内容学习该领域的最新发展成果,并应对NLP处理时遇到的各类状况。
因此,我决定将这些资源集中起来,打造一个对NLP常见任务提供最新相关资源的一站式解决方案。下方是文章中提到的任务列表及相关资源。那就一起开始吧。
目录:
- 词干提取
- 词形还原
- 词向量化
- 词性标注
- 命名实体消岐
- 命名实体识别
- 情感分析
- 文本语义相似分析
- 语种辨识
- 文本总结
1. 词干提取
什么是词干提取?
