办公自动化:Python-win32com自动将word文档转换成pdf格式!

CodeCosmicAegis
• 阅读 1987

在平常的办公中需要将word文件调整为pdf的格式,然后没有更好可用的免费软件可以使用,python为我们提供了win32com的插件可以轻松的将word转换为pdf的格式。

办公自动化:Python-win32com自动将word文档转换成pdf格式!

【阅读全文】

第三方库

# word文档处理器
from win32com.client import Dispatch

# 文件目录遍历器
from os import walk

word文档转换pdf

def wordToPdf(word_file):
    '''
    将word文件转换成pdf文件
    :param word_file: word文件
    :return:
    '''
    # 获取word格式处理对象
    word = Dispatch('Word.Application')
    # 以Doc对象打开文件
    doc_ = word.Documents.Open(word_file)
    # 另存为pdf文件
    doc_.SaveAs(word_file.replace(".docx", ".pdf"), FileFormat=17)
    # 关闭doc对象
    doc_.Close()
    # 退出word对象
    word.Quit()

支持多文件处理

def run(doc_path):
    '''
    主要逻辑处理、支持批量多文件处理
    :param word_file: word文件
    :return:
    '''
    # 遍历文件夹下面的所有文件
    for root, dirs, filenames in walk(doc_path):
        # 遍历当前文件名称、并校验是否是word文档
        for file in filenames:
            if file.endswith(".doc") or file.endswith(".docx"):
                # 如果当前文件是word文档则调用word转换函数
                wordToPdf(str(root + "\\" + file))

入口函数

if __name__ == "__main__":
    '''
    执行主要逻辑处理函数
    '''
    run('/usr/load/doc_files')

【往期精彩】

● pandas数据统计插件的连接函数concat()妙用,灵活处理数据对象!

● Git LFS 3.0.0 发布,对大文件进行版本控制的 Git 扩展

● python有序序列的字典序列推导式运用技巧!

● Django 4.0 alpha 1 发布

● python经典有序序列的list列表推导式实践运用

● python常用转义字符串总结:各种字符转义的不同、如何取消转义字符效果?

● 推荐一款python、excel集成的数据分析工具PyXLL-Jupyter!

● 如何使用python完成对WebService服务的调用?suds-py3插件安利一下!

● 介绍一款优秀的IDE Grid Studio,Excel深度集成python,直接编写并执行python代码块!

● python内置函数通过字符串的方式来执行函数代码块,类似java的反射机制相当强大!

● 十大开源软件基金会你知道哪些?

● python-Coverage 代码覆盖率统计工具,生成html代码报告

● 磨刀不误砍柴工,PyCharm开发工具的常规配置,充分提高开发效率!

● python-openpyxl Excel的单元格样式设置,包括字体、样式、宽高等等!

点赞
收藏
评论区
推荐文章
good123 good123
3年前
PDF转WORD为什么是历史难题
PDF转Word是一个非常非常普遍的需求,可谓人人忌危,为什么如此普遍的需求,却如此难行呢,还得看为什么会有这样的一个需求:PDF文档遵循iOS32000的规范是由Adobe公司推出的文档格式,之所以应用如此广泛,是因为PDF精确定位了每个字符的坐标、根据坐标绘制的各种形状,使用PDF格式传输和打印文档可以保证格式的一致性,然后很多PDF文件是可用于阅
Wesley13 Wesley13
3年前
java word导出pdf
整体思路就是:使用word模板引擎,将占位符(格式:{{title}})替换为查询出来的数据,再将替换完成的word转换为pdf!(https://oscimg.oschina.net/oscnet/76ac1bc3da6d1cec6f1c2f9406c8e07a768.jpg)doc转pdf源码:https://gitee.com/java
Wesley13 Wesley13
3年前
java使用Aspose向word模板写入数据
_Aspose.Words是一个商业.NET类库,可以使得应用程序处理大量的文件任务。Aspose.Words支持Doc,Docx,RTF,HTML,OpenDocument,PDF,XPS,EPUB和其他格式。使用Aspose.Words可以在不使用Microsoft.Word的情况下生成、修改、转换和打印文档。__1、Aspose在ma
Symbol卢 Symbol卢
4年前
markdwon常用语法
什么是markdwon?Markdown是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档。Markdown语言在2004由约翰·格鲁伯(英语:JohnGruber)创建。Markdown编写的文档可以导出HTML、Word、图像、PDF、Epub等多种格式的文档。Markdown编写的文档后缀为.md,.markdow
秋桐 秋桐
2年前
通过Java实现Word转PDF
Word转为PDF是非常常见的一种格式转换。通过转换可以将文档以更为稳定的格式进行保存,避免他人随意修改格式和内容。其实Word转PDF并不难,除了直接转换外也可以通过编程的方式来实现。网上相关的教程分享也很多。今天想介绍一个JavaWord组件——Fre
Stella981 Stella981
3年前
Mac python3 环境下 完善pdf转jpg脚本
由于样本图片数据都是保存在pdf里,想拿到样本必须先把图片从pdf中提取出来,算是数据清洗中的一点小小的积累吧。这里不得不吐槽一下公司存储图片的机制,业务员把jpg格式的照片放到word里,然后用工具把word保存为pdf,最后上传到公司服务器里,这简介反人类,不但丢失了图片头文件信息,还造成后期数据转换的大量时间资源的浪费,可能pdf格式会小一
Wesley13 Wesley13
3年前
ActiveReports 报表应用教程 (16)
ActiveReports 支持多种格式的报表导出,包括PDF、Excel、Word、RTF、HTML、Text、TIFF以及其它图片格式,用户可以将它们应用到Windows Forms、Web、WPF、Silverlight等应用系统中。在专业版的 ActiveReports 里,对PDF格式的数据输出又有了增强功能。现在用户可以将不可见的数字签名或者
SW SW
3年前
如何编辑 .md 文档 (基础)
如何编辑.md文档Markdown是一种轻量级标记语言,它允许人们使用易读易写的纯文本格式编写文档。Markdown语言在2004由约翰·格鲁伯(英语:JohnGruber)创建。Markdown编写的文档可以导出HTML、Word、图像、PDF、Epub等多种格式的文档。Markdown编写的文档后缀为.md,.markdow
子桓 子桓
2年前
mac电脑版Acrobat Pro DC 2021 安装 Acrobat Pro DC 2021 中文安装教程
AcrobatProDC2021支持多种文件格式的转换,包括Word、Excel、PowerPoint、HTML、图像等,用户可以将这些文件转换成PDF格式,以便于共享和分发。同时,该软件还支持OCR(光学字符识别)技术,可以将扫描的纸质文档转换成可编辑的
绣鸾 绣鸾
1年前
PDF Reader Pro 3.0 for mac(pdf阅读器)
是一款功能强大的PDF阅读和编辑工具。它支持在PDF文档中进行注释、批注和高亮显示,并可进行文本编辑、插入水印和数字签名等操作。此外,该软件还可以将PDF文档转换为其他格式,如Word、Excel和图片,并提供电子表格功能,可以对表格进行编辑和整理。PDF
下载就永久免费的日常软件,PDF,图片编辑,手机清理软件
日常学习,办公经常会使用pdf,图片编辑,手机清理软件,这些软件在需要时候很难找到合适,PDF有各种需求,格式转换,编辑,样式调整,解密等等,为了更高效地处理PDF文件和图片编辑,推荐使用一款全能的PDF和图片编辑软件。这种软件功能强大,支持各种格式的文件