python处理数据的风骚操作[pandas 之 groupby&agg]
本文重点介绍了pandas中groupby、Grouper和agg函数的使用。这2个函数作用类似,都是对数据集中的一类属性进行聚合操作,比如统计一个用户在每个月内的全部花销,统计某个属性的最大、最小、累和、平均等数值。 其中,agg是pandas 0.20新引入的功能 groupby && Grouper 首先,我们从网上把数据下载下来,后面的操作都是基于这份数据的: import pandas as pd df = pd.read_excel("https://github.com/chris1610/pbpython/blob/master/data/sample-salesv3.xlsx?raw=True") df["date"] = pd.to_datetime(df['date']) df.head() (图片来自于jupyter notebook,强烈推荐使用它作为python的交互工具) 下面,我们统计'ext price'这个属性在每个月的累和(sum)值,resample只有在index为date类型的时候才能用: df.set_index('date...
