当前位置: 首页 > news >正文

使用pandas实现合并具有共同列的两个EXCEL表

表1:

表2:

表1和表2,有共同的列“名称”,而且,表1的内容(行数)<=表2的行数。

目的,根据“名称”列的对应内容,将表2列中的“所处行业”填写到表1相应的位置。

实现代码:

import pandas as pdcsv_file_path_a = '表1.csv'  # 替换为你的CSV文件路径
csv_file_path_b = '表2.csv'  # 替换为你的CSV文件路径
df_a = pd.read_csv(csv_file_path_a, encoding='gbk')
df_b = pd.read_csv(csv_file_path_b, encoding='gbk')df_merged = pd.merge(df_a, df_b[['名称', '所处行业']], on='名称', how='left')
df_merged.to_csv('合并结果.csv', index=False, encoding='gbk')

结果(生成一个新的叫做“合并结果.csv”),如下图:

关键代码解释:

on='名称':以“名称”列为匹配键。how='left':保留第一个表(df1)中的所有行,只添加匹配上的“所处行业”。df2[['名称', '所处行业']]:只取 df2 中需要的列,避免多余列混入。

 

http://www.lqws.cn/news/66547.html

相关文章:

  • SystemVerilog—Interface语法(二)
  • 如何使用DAXStudio将PowerBI与Excel连接
  • STL解析——list的使用
  • 【设计模式-3.5】结构型——装饰器模式
  • sigmastar实现SD卡升级
  • 探索大语言模型(LLM):参数量背后的“黄金公式”与Scaling Law的启示
  • 【MATLAB代码】制导——平行接近法,三维,目标是运动的,订阅专栏后可直接查看MATLAB源代码
  • 百度蜘蛛池的作用是什么?技术@baidutopseo
  • deepseek问答记录:请讲解一下transformers.HfArgumentParser()
  • 【Linux】基础文件IO
  • 智慧零工平台后端开发实战:Spring Boot 3 + MyBatis-Flex 现代化架构
  • 【AI论文】表R1:表格推理的推理时间扩展
  • 深入了解linux系统—— 进程间通信之管道
  • 微服务常用日志追踪方案:Sleuth + Zipkin + ELK
  • ffmpeg 的视频格式转换 c# win10
  • 从 AMQP 到 RabbitMQ:核心组件设计与工作原理(二)
  • 【git-首次初始化本地项目、关联远程仓库】
  • 数字规则:进制转换与原码、反码、补码
  • Kotlin 扩展函数详解
  • SQL进阶之旅 Day 12:分组聚合与HAVING高效应用
  • 微软markitdown PDF/WORD/HTML文档转Markdown格式软件整合包下载
  • 智启未来:当知识库遇见莫奈的调色盘——API工作流重构企业服务美学
  • 【MySQL】事务
  • list类的详细讲解
  • JavaScript新特性structuredClone(),一行代码优化深拷贝策略
  • 数学分析——一致性(均匀性)和收敛
  • python打卡day42@浙大疏锦行
  • 湖北理元理律师事务所:个人债务管理的温度与精度
  • 劫持进程注入
  • 子串题解——和为 K 的子数组【LeetCode】