当前位置: 首页 > news >正文

【Pandas】pandas DataFrame update

Pandas2.2 DataFrame

Combining comparing joining merging

方法描述
DataFrame.assign(**kwargs)用于向 DataFrame 添加新列或替换现有列的方法
DataFrame.compare(other[, align_axis, …])用于比较两个 DataFrame 的差异的方法
DataFrame.join(other[, on, how, lsuffix, …])用于**将两个 DataFrame 按列合并(默认按行索引对齐)**的方法
DataFrame.merge(right[, how, on, left_on, …])用于**基于一个或多个键将两个 DataFrame 进行数据库风格的合并(join)**的方法
DataFrame.update(other[, join, overwrite, …])用于就地(in-place)更新 DataFrame 中数据的方法

pandas.DataFrame.update()

pandas.DataFrame.update() 是一个用于就地(in-place)更新 DataFrame 中数据的方法。它会根据另一个 DataFrame 或 Series 的值来更新当前 DataFrame 中的对应位置数据。

默认情况下,它不会修改原始 DataFrame 的形状(即不新增列),只更新交集部分的数据。


####📌 方法签名

DataFrame.update(other, join='left', overwrite=True, filter_func=None, errors='ignore')

🔧 参数说明:
参数说明
other要用来更新当前 DataFrame 的另一个 DataFrame 或 Series
join合并方式,默认 'left'(仅更新索引匹配的行)
overwrite是否用 other 中的值覆盖当前 DataFrame 的值,默认 True
filter_func可选函数,用于过滤哪些值可以被更新
errorsother 和当前 DataFrame 列不匹配时的行为,可选 'ignore', 'raise'

✅ 返回值
  • 无返回值,该方法直接修改原始 DataFrame(in-place)

🧪 示例代码及结果
示例 1:基本使用(默认参数)
import pandas as pddf = pd.DataFrame({'A': [1, 2, 3],'B': [4, 5, 6]
})other = pd.DataFrame({'A': [10, 20, 30],'B': [40, 50, 60]
})# 更新 df
df.update(other)
print(df)
输出:
    A   B
0  10  40
1  20  50
2  30  60

示例 2:部分更新(只有部分列匹配)
df = pd.DataFrame({'A': [1, 2, 3],'B': [4, 5, 6]
})other = pd.DataFrame({'B': [40, 50, 60],'C': [70, 80, 90]
})df.update(other)
print(df)
输出:
   A   B
0  1  40
1  2  50
2  3  60

注意:列 C 不在 df 中,因此被忽略(因为 errors='ignore'


示例 3:不覆盖某些值(使用 overwrite=False
df = pd.DataFrame({'A': [1, 2, 3],'B': [4, 5, 6]
})other = pd.DataFrame({'A': [10, 20, 30],'B': [40, 50, 60]
})df.update(other, overwrite=False)
print(df)
输出:
   A  B
0  1  4
1  2  5
2  3  6

因为 overwrite=False,所以没有更新任何值。


示例 4:使用 filter_func 过滤更新条件
df = pd.DataFrame({'A': [1, 2, 3],'B': [4, 5, 6]
})other = pd.DataFrame({'A': [10, 20, 30],'B': [40, 50, 60]
})# 只更新大于 20 的值
df.update(other, filter_func=lambda x: x > 20)
print(df)
输出:
    A   B
0   1   4
1  20  50
2  30  60
🧠 应用场景
场景说明
数据修复替换错误或过时的数据
增量更新将新数据合并到现有数据集中
特征工程在已有特征基础上进行局部修正
数据同步同步两个数据源之间的差异
模型预测更新用模型输出替换旧标签或预测值

⚠️ 注意事项
  • update()in-place 操作,会直接修改原 DataFrame;
  • 默认行为是只更新交集列和交集索引;
  • 若列名不匹配,默认忽略(除非设置 errors='raise');
  • 不建议用于添加新列,更适合更新已有列;
  • filter_func 需要返回布尔值,用于控制是否更新某值;

✅ 总结对比
方法是否 in-place支持列新增更适合场景
df.update()数据更新、修复
df.merge()复杂连接、SQL 式 JOIN
df.join()索引对齐拼接
assign()添加/替换列,链式调用

如果你希望就地更新 DataFrame 中的部分数据而不改变其整体结构update() 是非常实用的方法。

http://www.lqws.cn/news/508609.html

相关文章:

  • 【Docker基础】Docker容器管理:docker stop详解
  • Vue.js:渐进式框架赋能现代Web开发
  • 蓝桥杯嵌入式学习(cubemxkeil5)
  • word中如何快速打出上标?
  • 20250624java面试总结
  • 第九节 CSS工程化-预处理技术对比
  • 大白话蓝牙中的RPC:Remote Procedure Call远程过程调用
  • 壁挂马桶品牌推荐:我的“瑞尔特瑞家HX5”沉浸式体验报告健康与洁净的硬核科技
  • 从设备自动化到智能管控:MES如何赋能牛奶饮料行业高效生产?
  • 2025年渗透测试面试题总结-2025年HW(护网面试) 10(题目+回答)
  • Flask(四) 模板渲染render_template
  • 用Rust写平衡三进制加法器
  • 调试HDMI音频能8通道播放声音
  • 开疆智能CCLinkIE转ModbusTCP网关连接川崎机器人配置案例
  • linux grep的一些坑
  • GelSight Mini视触觉传感器开发资源升级:触觉3D点云+ROS2助力机器人科研与医疗等应用
  • Flutter动画开发:从基础到高级实战
  • Luckysheet Excel xlsx 导入导出互相转换
  • css color 十六进制颜色透明度
  • Harmony状态管理 @Local和@Param
  • 机器人编程语言要如何选择?
  • 十二(1)、Webshell工具哥斯拉
  • Spring Boot 切面编程(AOP)详细教程
  • mongoose解析http字段值
  • 梳理React中的fiber架构
  • React Hooks详解
  • Kafka的消费消息是如何传递的?
  • IO多路复用——Select底层原理深度分析(流程图)
  • 【C/C++】趣味题目:二维数组地址
  • 【开源项目】比 PyInstaller 更方便:图形界面打包 Python 脚本的体验