from pdf2image import convert_from_path
from docx import Document
from docx.shared import Inches,Cm
# 将PDF转换为图片
pages = convert_from_path('4.pdf', 200) # 200是DPI,可以根据需要调整
doc = Document()
# 计算图片在docx中应该显示的宽度
img_width = Cm(21-6.36-2) / 2 # 图片的宽度
# 将图片直接插入到docx文件中
for i in range(0, len(pages), 2):
paragraph = doc.add_paragraph() # 增加一个新的段落
run = paragraph.add_run()
for j in range(i, min(i + 2, len(pages))):
page = pages[j]
page.save(f'page_{j}.jpg') # 保存图片
run.add_picture(f'page_{j}.jpg', width=img_width) # 直接插入图片并调整宽度
doc.save('output.docx')
效果展示:
pdf为:
docx 为:
2024-3-31 01点18分