再来介绍pandas库里的pivot_table()函数。pivot_table()与pivot()比较类似。其官方定义如下所示:
DataFrame.pivot_table(values=None, index=None, columns=None, aggfunc='mean', fill_value=None, margins=False, dropna=True, margins_name='All')
我们依次解析:
values:可选参数,用来做集合的值,其用法与pivot的values类似。默认是显示所有的值。
index:必选参数,用来指定行索引。如果用数组做行索引,数据必须等长。
columns:必选参数,用来指定列索引。
aggfunc:聚合函数, pivot_table后新dataframe的值都会通过aggfunc进行运算。在上一讲pivot函数中的error问题(python不清楚要放什么值),在pivot_table会将多重值调用aggfunc函数后放在相应的位置上。默认的aggfunc函数为求平均。
fill_value:填充NA值。默认不填充
margins:添加行列的总计,默认不显示。
dropna:如果整行都为NA值,则进行丢弃,默认丢弃。
margins_name:在margins参数为ture时,用来修改margins的名称
dataframe df如下所示
设置value为D,行索引为A,列索引为B,其余为默认,函数如下所示
注意,在如果这里使用pivot函数就会报错,原因上一节已经讲过。
更改aggfuc函数时:
将values等设置为数组形式:
以上就是pivot_table的内容了,结合pivot函数,是否学会了如何使用?
本文暂时没有评论,来添加一个吧(●'◡'●)