Pandas索引器 loc 和 iloc 比较及代码示例
Pandas 索引器 loc 和 iloc 比较及代码示例以下是针对 Pandas 中loc和iloc的深度对比分析及代码示例结合核心差异、使用场景和底层机制展开说明一、核心差异解析特性loc (标签索引)iloc (位置索引)索引类型行/列标签字符串、日期等行/列整数位置从0开始切片行为包含结束标签闭区间不包含结束位置左闭右开布尔索引直接支持条件表达式更直观需先生成布尔数组再操作索引灵活性支持非整数标签如字符串索引仅支持整数位置二、关键场景代码示例1. 基础索引对比1234567891011importpandas as pd# 创建带自定义索引的DataFramedata{Age: [25,32,28,40],City: [北京,上海,广州,深圳]}dfpd.DataFrame(data, index[Alice,Bob,Charlie,David])# loc按标签选择 → 获取Bob行所有列print(df.loc[Bob])# 输出: Age 32, City 上海# iloc按位置选择 → 获取第1行所有列索引0为Aliceprint(df.iloc[1])# 输出: 同上Bob行Age 32City 上海Name: Bob, dtype: objectAge 32City 上海Name: Bob, dtype: object2. 切片行为差异12345# loc切片包含结束标签 → 选择Alice到Charlie行print(df.loc[Alice:Charlie])# 输出3行数据# iloc切片不包含结束位置 → 选择0至1行不含索引2print(df.iloc[0:2])# 仅输出Alice和Bob行Age CityAlice 25 北京Bob 32 上海Charlie 28 广州Age CityAlice 25 北京Bob 32 上海3. 布尔索引使用123456# loc直接条件筛选 → 年龄30的行print(df.loc[df[Age] 30])# 输出Bob和David行# iloc需分两步 → 先生成掩码再选择maskdf[Age] 30print(df.iloc[mask.values])# 需用.values转为数组Age CityBob 32 上海David 40 深圳Age CityBob 32 上海David 40 深圳4. 混合行列选择12345# loc选择多列 → 所有行 City列print(df.loc[:,City])# 输出城市列所有数据# iloc选择连续列 → 所有行 第1列列索引从0开始print(df.iloc[:,1])# 同上City列位置为1Alice 北京Bob 上海Charlie 广州David 深圳Name: City, dtype: objectAlice 北京Bob 上海Charlie 广州David 深圳Name: City, dtype: object三、高级技巧与性能1. 函数式索引12345# loc lambda → 筛选Age为偶数的行print(df.loc[lambdax: x[Age]%20])# 输出Bob(32), David(40)# iloc lambda → 筛选索引位置为奇数的行print(df.iloc[lambdax: [iforiinrange(len(x))ifi%21]])# 输出Bob行Age CityBob 32 上海Charlie 28 广州David 40 深圳Age CityBob 32 上海David 40 深圳2. 性能优化建议大型数据集优先用iloc整数位置计算更快复杂索引用loc避免位置计算错误如时间序列索引混合场景若需标签位置混合索引先重置索引再用iloc12df_resetdf.reset_index()df_reset.iloc[1:3,0:2]# 选择第1-2行第0-1列indexAge1Bob322Charlie28四、特殊场景处理1. 整数索引陷阱当行索引为整数时loc会优先识别为标签而非位置1234567df_int_indexpd.DataFrame({Value: [10,20]}, index[1,2])# loc尝试按标签访问 → 报错无标签0# df_int_index.loc[0] # KeyError# iloc按位置访问 → 正常print(df_int_index.iloc[0])# 输出索引1的行Value:10Value 10Name: 1, dtype: int642. 负索引支持仅iloc支持负数索引从末尾计数1print(df.iloc[-1])# 输出最后一行DavidAge 40City 深圳Name: David, dtype: object五、总结选择策略场景推荐方法原因已知行/列标签如列名为Ageloc直接标签访问语义清晰按行号/列号操作如前三行iloc位置计算高效时间序列数据日期索引loc避免位置漂移如df.loc[2023:2025]大数据集遍历iloc整数位置操作速度更快最佳实践优先用 loc 保证可读性性能敏感时切 iloc。始终通过 print(df.head()) 确认数据结构避免索引混淆。
本文来自互联网用户投稿,该文观点仅代表作者本人,不代表本站立场。本站仅提供信息存储空间服务,不拥有所有权,不承担相关法律责任。如若转载,请注明出处:http://www.coloradmin.cn/o/2477982.html
如若内容造成侵权/违法违规/事实不符,请联系多彩编程网进行投诉反馈,一经查实,立即删除!