众说纷纭,机器学习究竟是什么
所谓数据科学家,是指那些能够利用最合适的工具与方法完成自身工作的专业人士。最出色的数据科学家能够将自己完整的知识集与模式发现方案充分利用于统计分析工作当中。
我们应该如何对科学技术数据的积累总和进行查阅?通常来讲,这要用到所谓“高级分析”机制。这句话在表述上故意显得比较模糊,其核心在于将一切技术手段纳入其中——包括统计分析、数据挖掘、可预测模型、自然语言处理以及支持向量机等等。
在一般人的印象中,“数据挖掘”的涵盖范围很广、大部分相关工作似乎都能划归其下,包括对于隐私侵犯的关注以及应用程序监控等等。不过在我看来,这相当于所有能在空中飞翔的鸟类都称为“秃鹫”——明显并不准确。究其原因,数据挖掘的指向对象为结构化数据,这类方案通常会涉及到具体的技术机制,例如回归分析、决策树等等,而且一般不会被用于对非结构化数据进行内容分析。
与之类似“机器