無(wú)論是在工作還是學(xué)習(xí)當(dāng)中,大家都會(huì)遇到這樣一個(gè)問(wèn)題,將“PDF當(dāng)中的內(nèi)容(文本和圖片)轉(zhuǎn)換為Word的格式”,也就是說(shuō)從只讀轉(zhuǎn)換成可編輯的格式。網(wǎng)上絕大多數(shù)的工具也都是收費(fèi)的,今天小編就給大家制作了一款批量將PDF文件轉(zhuǎn)換為Word的神器,使用起來(lái)也是相當(dāng)?shù)姆奖恪?br />
實(shí)現(xiàn)效果
我們首先來(lái)看一下出來(lái)的效果,如下圖所示
環(huán)境準(zhǔn)備
用到的模塊叫做pdf2docx,我們通過(guò)pip命令進(jìn)行下載,如下
pip install pdf2docx
后續(xù)我們還可以為py文件打包,用到的庫(kù)是pyinstaller
pip install pyinstaller
代碼實(shí)現(xiàn)
我們先簡(jiǎn)單地實(shí)現(xiàn)將單個(gè)PDF文檔轉(zhuǎn)換成Word文檔,代碼如下
那么上面的是單個(gè)PDF文件,要是涉及到是多個(gè)PDF文件,則需要用到遍歷上傳過(guò)來(lái)的每一個(gè)文件,用到for循環(huán)遍歷
def startAction(self):
output_path_1 = Path.joinpath(Path.home(), "Desktop")
output_path_2 = str(output_path_1) + "\\output"
if not os.path.exists(output_path_2):
os.mkdir(output_path_2)
for path_list in pdfPath_list:
print("路徑: ", path_list)
name = path_list.split("/")[-1].split(".")[0]
cv = Converter(path_list)
cv.convert(output_path_2 + "\\{}.docx".format(name), start=0, end=None)
cv.close()
msg_box = QMessageBox(QMessageBox.Information, '完成', '提取完成', QMessageBox.Yes)
msg_box.exec_()
上述的代碼,我們首先將指定好輸出的Word文檔的位置,這里小編設(shè)置的是在桌面,然后通過(guò)for循環(huán)去遍歷處理每一個(gè)PDF文檔,當(dāng)所有的步驟都完成的時(shí)候,提示我們已經(jīng)完成了。
當(dāng)然整個(gè)可視化界面當(dāng)中還有一個(gè)上傳文件的功能,代碼如下
# 選擇本地文件上傳
def uploadFiles(self):
global pdfPath_list # 這里為了方便別的地方引用文件路徑,將其設(shè)置為全局變量
pdfPath_list, fileType = QFileDialog.getOpenFileNames(self.ui, "上傳文件", r"路徑", "*.pdf;;All Files(*)")
# 顯示所選文件的路徑
self.ui.lineEdit.setText(",".join(pdfPath_list))
整體的代碼如下所示
from PySide2.QtWidgets import QApplication, QMessageBox, QFileDialog
from PySide2.QtUiTools import QUiLoader
from pdf2docx import Converter
from pathlib import Path
import os
class OCRQt:
def __init__(self):
self.ui = QUiLoader().load('pdf2word.ui')
self.ui.pushButton.clicked.connect(self.uploadFiles)
self.ui.pushButton_2.clicked.connect(self.startAction)
def uploadFiles(self):
........
........
def startAction(self):
.......
.......
if __name__ == '__main__':
app = QApplication([])
# 顯示創(chuàng)建的界面
MainWindow = OCRQt() # 創(chuàng)建窗體對(duì)象
MainWindow.ui.show() # 顯示窗體
app.exit(app.exec_()) # 程序關(guān)閉時(shí)退出進(jìn)程
審核編輯:劉清
-
PDF
+關(guān)注
關(guān)注
1文章
172瀏覽量
34350 -
python
+關(guān)注
關(guān)注
56文章
4825瀏覽量
86275
原文標(biāo)題:Python 如何實(shí)現(xiàn)一鍵批量將 PDF 文檔轉(zhuǎn) Word?
文章出處:【微信號(hào):AI科技大本營(yíng),微信公眾號(hào):AI科技大本營(yíng)】歡迎添加關(guān)注!文章轉(zhuǎn)載請(qǐng)注明出處。
發(fā)布評(píng)論請(qǐng)先 登錄
將YOLOv4模型轉(zhuǎn)換為IR的說(shuō)明,無(wú)法將模型轉(zhuǎn)換為TensorFlow2格式怎么解決?
Spire.Cloud.Word云端Word文檔處理SDK介紹

EE-133:將ADSP-218x的傳統(tǒng)架構(gòu)文件轉(zhuǎn)換為鏈接器描述文件

基于TPS40055的設(shè)計(jì)在15安培時(shí)將12V總線轉(zhuǎn)換為1.8V

base64字符串轉(zhuǎn)換為二進(jìn)制文件
通過(guò)數(shù)字隔離器將SPI轉(zhuǎn)換為GPIO

PDF文件批量打印源代碼
ADS8381一款18位、580 kHz模數(shù)轉(zhuǎn)換器數(shù)據(jù)表

ADS8471一款16位、1 MSPS模數(shù)轉(zhuǎn)換器數(shù)據(jù)表

DAC7742一款16位數(shù)模轉(zhuǎn)換器(DAC)數(shù)據(jù)表

ADS8325一款16位采樣模數(shù)(A/D)轉(zhuǎn)換器數(shù)據(jù)表

ADS8321一款16位采樣模數(shù)轉(zhuǎn)換器(ADC)數(shù)據(jù)表

ADS8371一款16位模數(shù)轉(zhuǎn)換器數(shù)據(jù)表

ADS8481一款18位、1 MSPS模數(shù)轉(zhuǎn)換器數(shù)據(jù)表

ADS8412一款16位、2 MHz模數(shù)轉(zhuǎn)換器數(shù)據(jù)表

評(píng)論