当前位置: 首页 > news >正文

python源码:执行pdf合并/分页/图片管理功能

前言

        不知道从何时开始,一些主流软件竟然对pdf合并/分页/图片管理等功能都开启了收费模式,属实是讨人烦了。

        这里给出python代码,实现如标题所述功能。

合并pdf

import PyPDF2def merge_pdfs(input_paths, output_path):# 创建一个 PdfMerger 对象merger = PyPDF2.PdfMerger()# 遍历输入的 PDF 文件路径列表for path in input_paths:# 将每个 PDF 文件添加到合并器中merger.append(path)# 将合并后的 PDF 保存到指定的输出路径merger.write(output_path)# 关闭合并器merger.close()# 定义要合并的 PDF 文件路径列表
input_pdfs = [r'A.pdf', r'B.pdf', r'C.pdf']
# 定义合并后输出的 PDF 文件路径
output_pdf = 'output_folder/output.pdf'# 调用合并函数
merge_pdfs(input_pdfs, output_pdf)

pdf分页 

import PyPDF2def split_pdf(input_pdf_path, output_pdf_path, start_page, end_page):# 打开输入的 PDF 文件with open(input_pdf_path, 'rb') as input_file:# 创建一个 PDF 阅读器对象pdf_reader = PyPDF2.PdfReader(input_file)# 创建一个 PDF 写入器对象pdf_writer = PyPDF2.PdfWriter()# 检查起始页和结束页是否在有效范围内if start_page < 0 or end_page >= len(pdf_reader.pages) or start_page > end_page:print("输入的页码范围无效。")return# 遍历指定的页码范围for page_num in range(start_page, end_page + 1):# 获取当前页page = pdf_reader.pages[page_num]# 将当前页添加到 PDF 写入器中pdf_writer.add_page(page)# 打开输出的 PDF 文件with open(output_pdf_path, 'wb') as output_file:# 将 PDF 写入器中的内容写入到输出文件中pdf_writer.write(output_file)print(f"已成功将第 {start_page + 1} 页到第 {end_page + 1} 页拆分为新的 PDF 文件:{output_pdf_path}")# 示例用法
input_pdf = r'A.pdf'  # 输入的 PDF 文件路径
output_pdf = r'output.pdf'  # 输出的 PDF 文件路径
start_page = 15  # 起始页码
end_page = 20  # 结束页码split_pdf(input_pdf, output_pdf, start_page - 1, end_page - 1)

图片管理

        图片转pdf 

from fpdf import FPDFdef png_to_pdf(png_path, pdf_path):# 创建一个新的PDF文档pdf = FPDF()# 添加一页pdf.add_page()# 将图像添加到PDF中pdf.image(png_path, x=10, y=10, w=180)# 保存PDF文件pdf.output(pdf_path, "F")# 使用示例
png_to_pdf('fecd8073b2f9aefb47d9c3e4aaba2e2.jpg', 'output.pdf')

        pdf图片拆出 

from pdf2image import convert_from_path# 请注意,pdf2image依赖poppler
# 需要在git上拉取(windows):https://github.com/oschwartz10612/poppler-windows/releases/latest
def convert_pdf_to_images(pdf_path, output_folder):images = convert_from_path(pdf_path)for i, image in enumerate(images):image.save(f"{output_folder}/page_{i + 1}.png", "PNG")# 使用示例
convert_pdf_to_images(r"output.pdf", r"save_path")
http://www.lqws.cn/news/480565.html

相关文章:

  • Linux 下的 socket
  • 如何用AI开发完整的小程序<9>—UI自适应与游戏页优化
  • Docker 高级管理——容器通信技术与数据持久化
  • Neo4j 中存储和查询数组数据的完整指南
  • 删除node并且重装然后重装vue
  • day039-nginx配置补充
  • 从 Cluely 融资看“AI 协同开发”认证:软件考试应该怎么升级?
  • 【unitrix】 4.0 类型级数值表示系统(types.rs)
  • 如何用AI开发完整的小程序<7>—让AI微调UI排版
  • 深度解析云计算网络架构:VLAN+OVS+Bonding构建高可靠虚拟化平台
  • Redis-CPP 5大类型操作
  • 深入解析C#数组协变与克隆机制
  • c#websocket心跳包自定义实现,支持异步操作的取消
  • C++——继承
  • 7.4.1_1B树
  • 从零开始手写redis(16)实现渐进式 rehash map
  • 《福格行为模型》
  • 鲲鹏服务器创建Zookeeper镜像实例
  • 【LLIE专题】NTIRE 2025 低照度图像增强第一名方案解读
  • C#设计模式-Builder-生成器-对象创建型模式
  • 编程江湖-设计模式
  • CentOS7中源码编译安装freeswitch
  • [project-based-learning] 开源贡献指南 | 自动化链接验证 | Issue模板规范
  • 系统思考:救火先放火
  • 详解Redis数据库和缓存不一致的情况及解决方案
  • sc4336p硬件设计上电时序
  • DeepSeek技术解析:开源大模型的创新突围之路
  • 基于Python Websockets的客户端程序,能够连接服务端、处理ping/pong、发送订阅请求并保持长连接
  • 《算法笔记》之二(笔记)
  • 基于split-Bregman算法的L1正则化matlab仿真,对比GRSR算法