SOTON私人定制:利用Python进行数据分析(学习pandas)
pandas基础 Pandas借鉴了Numpy绝大部分设计思想,但与Numpy不同的是它更适合于处理表格类、异质性数据,而Numpy则是处理同质的数值数组。Pandas还能无缝与Numpy, SciPy, statsmodels, scikit-learn, matplotlib等包联用,构建了Python数据分析生态系统。 Pandas最主要的两类数据结构:Series, DataFrame,可以对应R语言的vector和data.frame,脑图如下 DataFrame基础功能 学习笔记如下: pandas的索引对象用于存放轴标签和其他元数据信息,索引对象不可修改,目的是安全的将该索对象传递给其他数据结构。、 reindex并不是修改原来的索引,而会在原来的基础上增加新的索引。 对DataFrame或Series修改形状,删除数据的操作默认返回新的数据结构。可以用inplace=True避免返回新的数据,不过这也通常会摧毁原来的数据。 明确loc和iloc的区别。如果你创建Series或DataFrame的index存在整数,那么细细体会下obj[:1],obj.loc[:1],o...