pandas 笔记：pivot_table 数据透视表\pivot

news2026/5/4 11:20:46

1 基本使用方法

pandas.pivot_table(
    data, 
    values=None, 
    index=None, 
    columns=None, 
    aggfunc='mean', 
    fill_value=None, 
    margins=False, 
    dropna=True, 
    margins_name='All', 
    observed=False, 
    sort=True)

2 主要参数

data	DataFrame
values	要进行聚合的列
index	在数据透视表索引（index）上进行分组的键
columns	在数据透视表列（column）上进行分组的键
agg_func	聚合方式
fill_value	缺省值的填充方式，默认为NAN
margins	默认为False，设置为True之后，会计算一个总的value值

3 使用方法

3.0 导入数据

import pandas as pd
# Visual Python: Data Analysis > File
vp_df = pd.read_csv('https://raw.githubusercontent.com/visualpython/visualpython/main/visualpython/data/sample_csv/tips.csv')

import seaborn as sns
import numpy as np
vp_df.head()

3.1 基本使用

vp_df.pivot_table(index='day',
                 columns='time',
                 values='total_bill')

3.2 index

aggfunc默认按平均值聚合，values默认只显示可以按平均值聚合的数据

index为一列名字的效果如3.1所示，多列的话，效果如下

vp_df.pivot_table(index=['day','size'],
                 columns='time',
                 values='total_bill')

顺序不同，效果也不同

3.3 values

筛选需要显示的列

values 中一个元素的结果和3.1一样，如果是多个元素，那就是一个value的透视表之后接另一个：

vp_df.pivot_table(index='day',
                 columns='time',
                 values=['total_bill','size'])

3.4 columns

列索引

columns中一个元素的结果和3.1一样，如果是多个元素，那就是

vp_df.pivot_table(index='day',
                 columns=['time','size'],
                 values='total_bill')

3.5 aggfunc

聚合方式，默认为求平均

vp_df.pivot_table(index='day',
                 columns='time',
                 values='total_bill',
                 aggfunc=sum)

3.5.1 不同的列不同的聚合方式

vp_df.pivot_table(index='day',
                 columns='time',
                 values=['total_bill','size'],
                  aggfunc={'total_bill':sum,'size':min},
                 margins=True)

3.5 fill_value

vp_df.pivot_table(index='day',
                 columns='time',
                 values='total_bill',
                 fill_value='Not a Num')

3.6 margins

vp_df.pivot_table(index='day',
                 columns='time',
                 values='total_bill',
                  aggfunc=sum,
                 margins=True)

4 pivot

不同于pivot_table，pivot不会进行聚合操作，换言之，如果index中有重复值，那么pivot会报错

vp_df.pivot_table(index='day',
            columns='time',
           values='total_bill')

vp_df.pivot(index='day',
            columns='time',
           values='total_bill')

#ValueError: Index contains duplicate entries, cannot reshape

vp_df.pivot_table(index='tip',
            columns='time',
           values='total_bill')

本文来自互联网用户投稿，该文观点仅代表作者本人，不代表本站立场。本站仅提供信息存储空间服务，不拥有所有权，不承担相关法律责任。如若转载，请注明出处：http://www.coloradmin.cn/o/773421.html

如若内容造成侵权/违法违规/事实不符，请联系多彩编程网进行投诉反馈，一经查实，立即删除！

pandas 笔记：pivot_table 数据透视表\pivot

1 基本使用方法

2 主要参数

3 使用方法

3.0 导入数据

3.1 基本使用

3.2 index

3.3 values

3.4 columns

3.5 aggfunc

3.5.1 不同的列不同的聚合方式

3.5 fill_value

3.6 margins

4 pivot

相关文章

# Linux下替换删除文件中的颜色等控制字符的方法

【Java】一个简单的接口例子（帮助理解接口+多态）

人才输送｜我的“捷码低代码工程师”转型之路！

长城汽车Hi4技术品牌成果初现，大象转身必将势不可挡

文档翻译成中文怎么弄？今天分享文档翻译免费要怎么弄

【Linux -- 查看进程--ps,top,pstree】

深入理解Java虚拟机（三）垃圾收集器与内存分配策略

echarts图例对齐

【运维】shell监控脚本结合钉钉机器人实现服务及服务器监控告警

MySQL表关联更新

一本通12951917：装箱问题

Spring 的依赖注入

uniapp 小程序 picker 日期时间段选择（精确到年月日时分+周几）

人才输送｜捷码帮我走出求职迷茫期！

【贪心算法part01】| 455.分发饼干、376.摆动序列、53.最大子序和

决赛结束，颁奖在即：2023隐私计算大会暨“星河杯”隐私计算大赛颁奖典礼震撼来袭！

上海市静安区财政局领导带队调研合合信息，政企共话科技创新

【FPGA】Vivado 保姆级安装教程 | 从官网下载安装包开始到安装完毕 | 每步都有详细截图说明 | 支持无脑跟装

Linux--在vim中查看man手册中某个函数的库函数 !man 函数名

中国农机自动化：靠补贴喂养还是真市场需求？