《构建实时机器学习系统》一第3章 数据分析工具 Pandas 3.1 颠覆 R 的 Pandas
第3章
数据分析工具 Pandas
3.1 颠覆 R 的 Pandas
进行机器学习应用的第一步是理解和探索数据,为此我们需要一套交互性很强的软件。一款理想的数据分析软件可以轻松地从多个来源读取数据、进行预处理,并且还要具有优良的统计和可视化功能,Pandas 就是这样一款软件。
Pandas 是一款基于 Python 的数据分析和建模的开源软件包。2012 年两位笔者刚刚在亚马逊相识的时候,如日中天的 R工具正是机器学习和数据分析的主流,而基于Python 的数据分析工具 Pandas 正在默默无闻地发展壮大。到2016 年本书写作之时,Pandas 已经完全取代了 R,成为了主流业务中数据分析的必备软件。这样的成功与Pandas 的设计是密不可分的。这其中有以下两个方面的原因。
取材于 R,超越 R:Pandas 里处处都有R 的影子。