本文共 819 字,大约阅读时间需要 2 分钟。
agg()函数是聚合函数,
DataFrame.agg(func,axis = 0,* args,** kwargs ) @@@func : 实现某种统计功能的函数,如果要不同列用求不同统计量,则用字典{‘行名/列名’,‘函数名’}指定。import pandas as pdimport numpy as npdf1=pd.DataFrame({ 'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]})df1
df1.agg('mean')得到所有统计信息:
df1.describe()按行统计:
df1.agg('mean',axis=1)按行得到所有信息:
df1.T.describe() #先转置再统计
举例:
def diff_max_min(x): return x.max() - x.min()
df1.agg(diff_max_min,axis=1)
引用的例子:
df1=pd.DataFrame({ 'sex':list('FFMFMMF'),'smoker':list('YNYYNYY'),'age':[21,30,17,37,40,18,26],'weight':[120,100,132,140,94,89,123]})df1按“sex”和“smoker”进行分组,然后用agg()得到各分组的统计信息:
grouped=df1.groupby(['sex','smoker'])grouped.agg('mean')同样groupby之后也可以自定义的统计函数,此外describe()函数可以得到常见的各分组的统计信息:
grouped.describe()
转载地址:http://yvrti.baihongyu.com/