在Linux中将.doc文件转换为.docx文件

原创 75阅读 · 时间2019年7月9日 17:28

在最近的项目中需要读取用户上传上来的文件,但是对于Python而言,只能读取.docx文件,而我们也不能强制要求用户上传上来的文件必须是.docx文件,所以就有了这一个开发需求。

-------------------------------------------------------------------------------------------------------

在Linux上转换文件,可以使用libreoffice这个包来处理。

1. 安装依赖包

sudo apt-get install libreoffice

2. 开始使用

可以通过subprocess来运行libreoffice,脚本代码如下:

subprocess.check_output(["soffice", "--headless",
                                  "--invisible", "--convert-to",
                                  "docx", filepath, "--outdir", docxpath])

其中filepath为要处理的.doc文件的绝对路径,docxpath为处理后的.docx文件的保存路径,两者都可以自行定义。

在pycharm运行程序之后,就可以看到在我们定义的文件保存路径中看到处理之后的程序。


评论

人生苦短,我学Python!

相关文章推荐 ?
近七日热文推荐 !
回到顶部